BR112014013832B1 - circuito integrado de baixa potência para analisar um fluxo de áudio digitalizado - Google Patents
circuito integrado de baixa potência para analisar um fluxo de áudio digitalizado Download PDFInfo
- Publication number
- BR112014013832B1 BR112014013832B1 BR112014013832-0A BR112014013832A BR112014013832B1 BR 112014013832 B1 BR112014013832 B1 BR 112014013832B1 BR 112014013832 A BR112014013832 A BR 112014013832A BR 112014013832 B1 BR112014013832 B1 BR 112014013832B1
- Authority
- BR
- Brazil
- Prior art keywords
- audio stream
- digitized audio
- computing device
- processor
- stream
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3293—Power saving characterised by the action undertaken by switching to a less power-consuming processor, e.g. sub-CPU
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/285—Memory allocation or algorithm optimisation to reduce hardware requirements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Abstract
CIRCUITO INTEGRADO DE BAIXA POTÊNCIA PARA ANALISAR UM FLUXO DE ÁUDIO DIGITALIZADO. Os exemplos revelam um circuito integrado de baixa potência para receber e digitalizar um fluxo de áudio. Adicionalmente, os exemplos proporcionam o circuito integrado de baixa potência para comparar o fluxo de áudio digitalizado com uma palavra-chave e armazenar o fluxo de áudio digitalizado em uma memória. Adicionalmente, os exemplos também revelam a partir do reconhecimento da palavra-chave no fluxo de áudio digitalizado, o circuito integrado de baixa potência transmite um sinal para um processador para aumentar a potência e analisar o fluxo de áudio digitalizado.
Description
[0001] Nos desenhos anexos, numerais semelhantes se referem aos componentes ou blocos semelhantes. A descrição detalhada seguinte faz referência aos desenhos, em que:
[0002] A Figura 1 é um diagrama de blocos de um dispositivo de computação exemplar incluindo um circuito integrado de baixa potência para analisar um fluxo de áudio e um processador para analisar um fluxo de áudio digitalizado em resposta à detecção de uma palavra-chave pelo circuito integrado.
[0003] A Figura 2 é um diagrama de blocos de um circuito integrado de baixa potência exemplar para analisar um fluxo de áudio e transmitir um sinal para um processador para aumentar a energia quando uma palavra- chave é detectada no fluxo de áudio;
[0004] A Figura 3 é diagrama de blocos de um dispositivo de computação exemplar para analisar um fluxo de áudio digitalizado e um servidor em comunicação com o dispositivo de computação para analisar um fluxo de texto gerado a partir do fluxo de áudio digitalizado;
[0005] A Figura 4 é um fluxograma de um método exemplar realizado em um dispositivo de computação para receber um fluxo de áudio e determinar uma resposta; e
[0006] A Figura 5 é um fluxograma de um método exemplar realizado em um dispositivo de computação para compactar um fluxo de áudio digitalizado e apresentar uma resposta.
[0007] No processamento de informação de áudio, um usuário tipicamente ativa o aplicativo para processar áudio mediante compressão de um botão e/ou recitando instruções. Ao lançar o aplicativo de processamento de áudio, o usuário adicionalmente precisa recitar instruções explícitas que ele desejaria que um dispositivo de computação realizasse. Assim, o processamento de instruções de fala a partir de um usuário, pode ser demorado e repetitivo. Além disso, monitorar continuamente as instruções a partir do consumidor consome muita energia, drenando a bateria.
[0008] Para tratar desses problemas, as modalidades exemplares aqui reveladas utilizam um circuito integrado de baixa potência para monitorar continuamente a ocorrência de uma palavra-chave em um fluxo de áudio (por exemplo, a fala do usuário), enquanto se baseando em um processador para análise mais completa da fala do usuário. Por exemplo, vários exemplos aqui revelados proporcionam o recebimento de um fluxo de áudio em um circuito integrado de baixa potência, digitalizando-se o fluxo de áudio, e analisando o fluxo de áudio digitalizado para reconhecer uma palavra-chave. Ao reconhecer a palavra-chave dentro do fluxo de áudio digitalizado, o circuito integrado envia um sinal para o processador para aumentar a potência. Ao aumentar a potência para o processador, o fluxo de áudio digitalizado é recuperado para determinar uma resposta. Isso diminui a quantidade de tempo consumido para que o usuário lance o aplicativo de processamento de áudio específico e impede a repetição da fala do usuário. Determinar a resposta a partir do fluxo de áudio recuperado impede que o usuário proporcione instruções explícitas adicionais para o dispositivo de computação realizar a análise de fala.
[0009] Adicionalmente, nos vários exemplos aqui revelados, ao aumentar a potência para o processador, o processador recupera o fluxo de áudio digitalizado a partir de uma memória e converte o fluxo de áudio digitalizado em um fluxo de texto. Após converter para o fluxo de texto, o processador determina uma resposta com base no texto dentro do fluxo de texto. Determinar a resposta a partir do fluxo de texto reduz o tempo para o usuário do dispositivo de computação instruir o dispositivo de computação. Adicionalmente ainda, o processador pode determinar a resposta apropriada, com base no contexto do fluxo de áudio. Adicionalmente, o dispositivo de computação determina qual aplicativo precisa executar para preencher a resposta para o usuário. Adicionalmente ainda, mediante aumento da potência para o processador ao reconhecer a palavra-chave dentro do fluxo de áudio digitalizado, o dispositivo de computação consome menos energia enquanto ouvindo a fala do usuário.
[0010] Em uma modalidade, o dispositivo de computação também pode determinar a resposta mediante recebimento da resposta a partir de um servidor ou a partir do processador. Em uma modalidade adicional, a memória mantém o fluxo de áudio digitalizado armazenado por um período de tempo predeterminado. Nessa modalidade, o processador pode recuperar o fluxo de áudio digitalizado em incrementos de tempo. Por exemplo, o processador pode recuperar o fluxo de áudio digitalizado completo ou pode recuperar um intervalo de tempo mais curto do fluxo de áudio digitalizado. A recuperação do fluxo de áudio digitalizado permite que o processador analise o contexto do fluxo de áudio para determinar a resposta apropriada.
[0011] Dessa maneira, modalidades exemplares aqui reveladas economizam o tempo de um usuário mediante prevenção de instruções de áudio repetitivas para um dispositivo de computação uma vez que o dispositivo de computação determina uma resposta apropriada com base no contexto do fluxo de áudio. Adicionalmente, o dispositivo de computação consome menos energia enquanto recebendo e processamento os fluxos de áudio.
[0012] Com referência agora aos desenhos, a Figura 1 é um diagrama de blocos de um dispositivo de computação exemplar 100 incluindo um circuito integrado de baixa potência 104 para receber um fluxo de áudio 102 e um módulo de digitalização 106 para digitalizar o fluxo de áudio para prover o fluxo de áudio digitalizado 114 a uma memória 112. Adicionalmente, o circuito integrado de baixa potência 104 inclui um módulo de comparar com palavra-chave 108 para comparar o fluxo de áudio digitalizado 114 com uma palavra-chave e, com base no reconhecimento da palavra- chave, transmitir um sinal 116 para um processador 118 para aumentar a potência 122. Adicionalmente ainda, o processador inclui um módulo de análise 120 para analisar o fluxo de áudio digitalizado 114. Modalidades do dispositivo de computação 100 incluem um dispositivo de cliente, computador pessoal, computador de mesa, laptop, um dispositivo móvel ou outro dispositivo de computação adequado para incluir componentes 104, 112 e 118.
[0013] O fluxo de áudio 102 é recebido pelo dispositivo de computação 100, especificamente, o circuito integrado de baixa potência 104. O fluxo de áudio 102 é um sinal analógico de entrada que é digitalizado 106 para prover o fluxo de áudio digitalizado 114. Modalidades do fluxo de áudio 102 incluem fala a partir de um usuário ou áudio a partir de outro dispositivo de computação. Por exemplo, pode haver vários dispositivos de computação 300 recebendo fluxos de áudio 102, os quais podem ser confusos. Assim, os dispositivos de computação podem designar um dispositivo como um ponto central para receber o fluxo de áudio 102. Nessa modalidade, o circuito integrado de baixa potência 104 opera como parte de uma rede ad-hoc que pode ser uma unidade central de um ou mais dispositivos de computação.
[0014] Por exemplo, o usuário pode discutir com outra pessoa a rota mais curta a partir de Nova Iorque para Los Angeles, Califórnia. Nesse exemplo, o fluxo de áudio seria a discussão da rota mais curta de Nova Iorque para Los Angeles. Em uma modalidade adicional, o fluxo de áudio 102 pode incluir um áudio para um período de tempo predeterminado. Por exemplo, o fluxo de áudio 102 pode incluir uns poucos segundos ou minutos quando recebido pelo circuito integrado de baixa potência 104. Nesse exemplo, o circuito integrado de baixa potência 104 pode distinguir o fluxo de áudio 102 dos outros fluxos de áudio 102.
[0015] O circuito integrado de baixa potência 104 inclui o módulo 106 para digitalizar o fluxo de áudio 102 e o módulo 108 para comparar o fluxo de áudio digitalizado 114 com a palavra-chave. O circuito integrado de baixa potência 104 é um circuito eletrônico com elementos de traço padronizados na superfície de um material que forma interconexões entre outros componentes eletrônicos. Por exemplo, o circuito integrado de baixa potência 104 forma conexões entre o processador 118 e a memória 112. Modalidades do circuito integrado de baixa potência 104 incluem um microchip, chipset, circuito eletrônico, chip, microprocessador, semicondutor, microcontrolador, ou outro circuito eletrônico capaz de receber fluxo de áudio 102 e transmitir sinal 116. O circuito integrado de baixa potência 104 pode monitorar continuamente o fluxo de áudio 102, utilizar o módulo de digitalização 106 para digitalizar o fluxo de áudio, e armazenar o fluxo de áudio digitalizado na memória 112. Como tal, modalidades adicionais do circuito integrado de baixa potência 104 incluem um transmissor, receptor, microfone ou outro componente adequado para receber o fluxo de áudio 102.
[0016] O fluxo de áudio digitalizado no módulo 106 para prover o fluxo de áudio digitalizado 114. O módulo de digitalização 106 converte o fluxo de áudio em uma representação de sinal de tempo discreto. Modalidades do módulo de digitalização 106 incluem um conversor de analógico para digital (ADC), dispositivo de conversão digital, instrução, firmware e/ou software operando em conjunto com o circuito integrado de baixa potência 104. Por exemplo, o módulo de digitalização 106 pode incluir um dispositivo eletrônico para converter uma voltagem analógica de entrada em um número digital proporcional à magnitude do sinal analógico.
[0017] Quando o fluxo de áudio 102 é digitalizado no módulo 106, ele é comparado com a palavra- chave no módulo 108. O fluxo de áudio 102 e no módulo 108, é comparado com a palavra-chave que opera como uma indicação para sinalizar 116 o processador 118 para aumentar a potência 122 e obter o fluxo de áudio digitalizado 114 para análise no módulo 120. Modalidades de 108 incluem uma instrução, processo, operação, lógica, algoritmo, técnica, função lógica, firmware e/ou software. Quando a palavra-chave é reconhecida, o circuito integrado de baixa potência 104 transmite o sinal 116 para aumentar a potência 122 para o processador 118.
[0018] Modalidades da palavra-chave incluem um sinal digital, sinal analógico, padrão, banco de dados, comandos, direções, instruções, ou outra representação para comparar no módulo 108. Por exemplo, o usuário de um dispositivo de computação pode discutir a diferença entre um camarão e um pitu comum amigo e subsequentemente desejar realizar uma pesquisa na rede para identificar a resposta. Como tal, o usuário pode declarar a palavra-chave predeterminada para desencadear o reconhecimento da palavra-chave por intermédio do módulo de comparar com palavra-chave 108 e análise subsequente da discussão anterior por intermédio do módulo de análise 120.
[0019] A palavra-chave pode incluir, por exemplo, uma frase, uma palavra-chave única, ou uma única palavra-chave que é privada para o usuário do dispositivo de computação. De acordo com o exemplo anterior, a palavra- chave pode ser a frase, “Computador, o que você acha?”. Nesse exemplo, a frase faz com que o circuito integrado de baixa potência 104 envie o sinal 116 ao processador 118 para obter o fluxo de áudio digitalizado 114 o qual poderia incluir o áudio antes ou após a frase. Assim, o usuário não precisa repetir as instruções uma vez que o processador 118 analisa o fluxo de áudio digitalizado 114 para determinar o contexto do fluxo de áudio 102 para uma resposta apropriada. Ainda assim, em um exemplo adicional, a palavra-chave única pode incluir “Shazam”. Assim, como um exemplo específico, quando o usuário fala a palavra “Shazam”, o circuito 104 pode detectar a palavra-chave e transmitir o sinal 116 para instruir o processador 118 para obter o fluxo de áudio digitalizado 114 e converter o fluxo em um fluxo de texto. Supondo que o fluxo de texto é uma instrução para compor uma mensagem de texto para a mãe do usuário, a resposta apropriada seria a de compor a mensagem de texto. Assim, como descrito acima, utilizando a palavra(s)-chave predeterminada, o circuito integrado de baixa potência 104 reconhece quando o usuário do dispositivo de computação precisa completar uma resposta adicional, tal como direções ou realizar uma busca na rede.
[0020] Em uma modalidade adicional do módulo 108, quando nenhuma palavra-chave é reconhecida dentro do fluxo de áudio digitalizado 114, o circuito integrado de baixa potência 104 continua a monitorar no sentido de outro fluxo de áudio 102 que seja digitalizado no módulo 106 e armazenado na memória 112. Ainda em uma modalidade adicional, o circuito integrado de baixa potência 104 compacta o fluxo de áudio digitalizado 114 e esse fluxo de áudio digitalizado compactado é usado para reconhecer a palavra-chave mediante comparação da mesma com a palavra- chave no módulo 108.
[0021] A memória 112 armazena e/ou mantém o fluxo de áudio digitalizado 114. Modalidades da memória 112 podem incluir um armazenador temporário de memória, cache, memória não volátil, memória volátil, memória de acesso aleatório (RAM), uma Memória de Leitura Programável Eletricamente Apagável (EEPROM), unidade de armazenamento, Memória de Leitura de Disco Compacto (CDDROM), ou outra memória capaz de armazenar e/ou manter o fluxo de áudio digitalizado 114.
[0022] O fluxo de áudio digitalizado 114 é armazenado na memória 112. As modalidades podem incluir o circuito integrado de baixa potência 104 compactando o fluxo de áudio 102 após o módulo de digitalização 106 obter um fluxo de áudio digitalizado compactado antes da colocação na memória 112. Embora a Figura 1 ilustre o fluxo de áudio digitalizado 114 armazenado na memória 112, o fluxo de áudio digitalizado também pode ser armazenado em uma memória no circuito integrado de baixa potência 104. Em uma modalidade adicional, o fluxo de áudio digitalizado 114 inclui uma quantidade de tempo predeterminada de um fluxo de áudio 102. Nessa modalidade, quando o fluxo de áudio 102 é recebido para um período de tempo predeterminado, tal como poucos segundos ou minutos, esse período de tempo predeterminado do fluxo de áudio 102 é digitalizado e armazenado na memória 112 para o processador 118 obter e/ou recuperar. Adicionalmente nessa modalidade, quando outro fluxo de áudio 102 é recebido pelo circuito integrado de baixa potência 104 e digitalizado, o fluxo de áudio digitalizado anterior na memória é substituído pelo fluxo de áudio digitalizado mais atual 114. Assim, o processador 118 obtém e/ou recupera o fluxo de áudio mais atual 102. Nessa modalidade, a memória opera como um armazenador temporário primeiro a entrar, primeiro a sair para prover o fluxo de áudio mais atual 102.
[0023] O sinal 116 é transmitido a partir do circuito integrado de baixa potência 104 para o processador 118 a partir do reconhecimento da palavra-chave dentro do fluxo de áudio digitalizado 114. O sinal 116 instrui o processador 118 a aumentar a potência 22 e analisar o fluxo de áudio digitalizado 114 a partir da memória 112. Modalidades do sinal 116 incluem uma comunicação, transmissão, sinal elétrico, instrução, sinal digital, sinal analógico ou outro tipo de comunicação para aumentar a potência 122 para o processador 118. Uma modalidade adicional do sinal 116 inclui uma interrupção transmitida para o processador 118 a partir do reconhecimento da palavra-chave dentro do fluxo de áudio digitalizado 114.
[0024] O processador 118 recebe o sinal 116 para aumentar a potência 122 e obtém o fluxo de áudio digitalizado 114 para análise no módulo 120. Modalidades do processador 118 podem incluir uma unidade de processamento central (CPU), unidade de processamento visual (VPU), microprocessador, unidade de processamento gráfico (GPU), ou outro dispositivo programável adequado para analisar 120 o fluxo de áudio digitalizado 114.
[0025] Quando o processador 118 obtém o fluxo de áudio digitalizado 114 a partir da memória 112, o processador analisa o fluxo de áudio digitalizado 114 no módulo 120. Modalidades do módulo de análise 120 incluem uma instrução, processo, operação, lógica, algoritmo, técnica, função lógica, firmware e/ou software que o processador 118 pode buscar, decodificar e/ou executar. Modalidades adicionais do módulo 120 incluem converter o fluxo de áudio digitalizado 114 em um fluxo de texto para determinar uma resposta apropriada com base no contexto do fluxo de áudio 112. Modalidades adicionais do módulo 120 incluem determinar uma resposta para apresentar ao usuário do dispositivo de computação 100 como será visto em figuras posteriores.
[0026] A fonte de energia 122 fornece energia elétrica na forma de potencial elétrico ao processador 118. Especificamente, a fonte de energia 122 aumenta energia elétrica para o processador 118 ao receber o sinal 116 a partir do circuito integrado de baixa potência 104. Ao aumentar a potência 122 para o processador 118, o processador 118 é despertado ou ativado para obter o fluxo de áudio digitalizado 114. Modalidades da fonte de energia 122 incluem um fornecimento de energia, dispositivo de gerenciamento de energia, bateria, meio de armazenamento de energia, sistema eletromecânico, energia solar, tomada de energia, ou outro dispositivo capaz de fornecer energia 122 ao processador 118. Em uma modalidade adicional, a fonte de energia 122 fornece energia elétrica ao dispositivo de computação 100.
[0027] Com referência agora à Figura 2, a mesma é um diagrama de blocos de um circuito integrado de baixa potência exemplar 204 para analisar um fluxo de áudio 202 e transmitir um sinal 216 para um processador para aumentar a energia quando uma palavra-chave é detectada no fluxo de áudio 202. O circuito integrado de baixa potência 204 inclui conjunto de circuitos 210 para produzir um fluxo de áudio digitalizado 214 utilizando um circuito de digitalização 206 e detecta a palavra-chave por intermédio de um conjunto de circuitos de comparação 208, e a partir do reconhecimento da palavra-chave no fluxo de áudio digitalizado 214, transmite um sinal 216.
[0028] O fluxo de áudio 202 é recebido pelo circuito integrado de baixa potência 204. O fluxo de áudio 202 pode ser similar em estrutura ao fluxo de áudio 102 da Figura 1.
[0029] O circuito integrado de baixa potência 204 inclui o conjunto de circuitos 210 para digitalizar o fluxo de áudio 202 e comparar o fluxo de áudio digitalizado 214 com uma palavra-chave. O circuito integrado de baixa potência 204 pode ser similar em funcionalidade e estrutura ao circuito integrado de baixa potência 104 como acima na Figura 1.
[0030] O conjunto de circuitos 110 inclui conjunto de circuitos de digitalização 206 e conjunto de circuitos de comparação 208. Modalidades do circuito 210 incluem lógica, conjunto de circuitos analógicos, conjunto de circuitos eletrônicos, conjunto de circuitos digitais, ou outro conjunto de circuitos capaz de digitalizar o fluxo de áudio 102 e comparar o fluxo de áudio digitalizado 214 com a palavra-chave. Em modalidades adicionais, o conjunto de circuitos inclui um aplicativo e/ou firmware que pode ser usado independentemente e/ou em conjunto com o circuito integrado de baixa potência 204 para buscar, decodificar e/ou executar o conjunto de circuitos 206 e 208.
[0031] O fluxo de áudio 202 é recebido e digitalizado pelo conjunto de circuitos 206 para produzir o fluxo de áudio digitalizado 214. O conjunto de circuitos de digitalização 206 é um tipo de conversão para o fluxo de áudio 202. Adicionalmente, o conjunto de circuitos de digitalização 206 pode ser similar em funcionalidade do módulo de digitalização 106 como descrito em conexão com a Figura 1.
[0032] O circuito integrado de baixa potência 204 recebe o fluxo de áudio 202 para digitalização no conjunto de circuitos 206 e produz o fluxo de áudio digitalizado 214. O fluxo de áudio digitalizado 214 pode ser similar em estrutura ao fluxo de áudio digitalizado 114 como descrito em conexão com a Figura 1. Adicionalmente, embora a Figura 2 ilustre o fluxo de áudio digitalizado 214 fora do circuito integrado de baixa potência 204, o fluxo de áudio digitalizado 214 também pode estar localizado dentro do circuito integrado de baixa potência 204. O fluxo de áudio digitalizado 214 localizado dentro do circuito integrado de baixa potência 204 é usado no conjunto de circuitos 208 para comparação com um teclado. Em outra modalidade, o fluxo de áudio digitalizado 214 é armazenado e/ou mantido em uma memória.
[0033] O conjunto de circuitos 208 incluído no conjunto de circuitos 210 do circuito integrado de baixa potência 204 compara o fluxo de áudio digitalizado 214 com a palavra-chave. Adicionalmente, 208 é usado para reconhecer a palavra-chave dentro do fluxo de áudio digitalizado 214 para transmitir o sinal 216 para aumentar a potência para o processador. O conjunto de circuitos de comparação 208 pode ser similar em funcionalidade ao módulo 108 como descrito em conexão com a Figura 1.
[0034] O sinal 216 instrui um dispositivo para aumentar a potência a partir do reconhecimento da palavra- chave dentro do fluxo de áudio digitalizado 214 por intermédio do conjunto de circuitos de comparação 208. O sinal 216 pode ser similar em estrutura e funcionalidade ao sinal 116 da Figura 1. Uma modalidade do sinal 216 inclui instruir um processador para aumentar a potência e analisar o fluxo de áudio digitalizado 214 a partir da memória. Nessa modalidade, o sinal 216 instrui o processador para obter o fluxo de áudio digitalizado 214 para analisar e determinar uma resposta com base no reconhecimento de palavra-chave no conjunto de circuitos 208.
[0035] A Figura 3 é um diagrama de blocos de um dispositivo de computação exemplar 300 para analisar um fluxo de áudio digitalizado 314 e um servidor 326 em comunicação com o dispositivo de computação 300 para analisar um fluxo de texto 324 gerado a partir do fluxo de áudio digitalizado 314. O dispositivo de computação 300 inclui um circuito integrado de baixa potência 304, uma memória 312, um processador 318, um dispositivo de saída 328, e o servidor 326. Especificamente, a Figura 3 ilustra o fluxo de texto 324 processado pelo servidor 326 ou pelo processador 318 para apresentar uma resposta a um usuário do dispositivo de computação no dispositivo de saída 324. O dispositivo de computação 300 pode ser similar em estrutura e funcionalidade ao dispositivo de computação 100 conforme descrito em conexão com a Figura 1.
[0036] O fluxo de áudio 302 é recebido pelo dispositivo de computação 300, especificamente, o circuito integrado de baixa potência 304. O fluxo de áudio 302 pode ser similar em estrutura ao fluxo de áudio 102 e 202 na Figura 1 e Figura 2, respectivamente.
[0037] O circuito integrado de baixa potência 304 inclui um módulo de digitalização 306 e um módulo de análise 308. Em uma modalidade, o circuito integrado de baixa potência 304 inclui conjunto de circuitos para compreender módulos 306 e 308. O circuito integrado de baixa potência 304 pode ser similar em estrutura e funcionalidade ao circuito integrado de baixa potência 104 e 204 descrito em conexão com a Figura 1 e Figura 2, respectivamente.
[0038] O fluxo de áudio 302 quando recebido pelo dispositivo de computação 300 é digitalizado 306 para produzir um fluxo de áudio digitalizado 314. O módulo de digitalização 306 pode ser similar em estrutura e funcionalidade ao módulo de digitalização 106 e conjunto de circuitos de digitalização 206 na Figura 1 e Figura 2, respectivamente. Em uma modalidade adicional, quando o fluxo de áudio 302 é digitalizado no módulo 306, o circuito integrado de baixa potência 304 transmite o fluxo de áudio digitalizado 314 para a memória 312 para armazenar e/ou manter.
[0039] Quando o fluxo de áudio 314 é digitalizado, o circuito integrado de baixa potência analisa o fluxo de áudio digitalizado 314 no módulo 308. Em uma modalidade, o módulo 308 compara uma palavra-chave com o fluxo de áudio digitalizado 114. Nessa modalidade, 308 inclui a funcionalidade do módulo de comparação 108 como acima na Figura 1.
[0040] A memória 312 armazena o fluxo de áudio digitalizado 314 a partir do circuito integrado de baixa potência 304. Em uma modalidade, a memória 312 mantém o fluxo de áudio digitalizado 314 recebido durante um período de tempo predeterminado. Por exemplo, o fluxo de áudio 302 pode ser monitorado para o tempo predeterminado de poucos segundos e, como tal, esses poucos segundos do fluxo de áudio 302 são digitalizados no módulo 306 e enviados para a memória 312. Nesse exemplo, a memória 312 armazena o fluxo de áudio digitalizado 314 dos poucos segundos a serem recuperados e/ou obtidos pelo processador 318 para análise ao receber o sinal 316. Além disso, nesse exemplo, quando outro fluxo de áudio 302 de poucos segundos é recebido e digitalizado, esse outro fluxo de áudio digitalizado 314 substitui o fluxo de áudio digitalizado 314. Isso permite que a memória 312 mantenha o fluxo de áudio mais recente 302 para o processador 318 obter e/ou recuperar. A memória 312 pode ser similar em estrutura e funcionalidade à memória 112 como descrito em conexão com a Figura 1.
[0041] O fluxo de áudio 302 é digitalizado 306 para produzir o fluxo de áudio digitalizado 314. O fluxo de áudio digitalizado 314 é armazenado e/ou mantido na memória 312. Em uma modalidade, o processador 318 obtém o fluxo de áudio digitalizado 314 para análise no módulo 320 ao receber o sinal 316. O fluxo de áudio digitalizado 314 pode ser similar em estrutura e funcionalidade ao fluxo de áudio digitalizado 114 e 214 como descrito em conexão com a Figura 1 e Figura 2 respectivamente.
[0042] O sinal 316 é uma transmissão a partir do circuito integrado de baixa potência 304 para o processador 316 para aumentar a potência 322. Em uma modalidade do sinal 316, o processador 316 é instruído para obter o fluxo de áudio digitalizado 314 para análise no módulo 320. O sinal 316 pode ser similar em estrutura e funcionalidade ao sinal 116 e 216 como descrito em conexão com a Figura 1 e Figura 2, respectivamente.
[0043] A fonte de energia 322 fornece energia elétrica ao processador 318 e/ou dispositivo de computação 300. A fonte de energia 322 pode ser similar em estrutura e funcionalidade à fonte de energia 122, como descrito em conexão com a Figura 1.
[0044] O processador 318 inclui o módulo de análise 320 e fluxo de texto 324. Especificamente, o processador 318 recebe o sinal 316 para aumentar a potência 322. Ao receber esse sinal 316, o processador 318 obtém o fluxo de áudio digitalizado 314 para análise no módulo 320. Em uma modalidade adicional, o processador 318 converte o fluxo de áudio digitalizado 314 para fluxo de texto 324. Nessa modalidade, o texto dentro do fluxo de texto 324 determina uma resposta para o dispositivo de computação 300. O fluxo de texto é uma sequência da sequência finita de símbolos ou representações a partir de um alfabeto, conjunto numerado ou conjunto alfanumérico. Por exemplo, o fluxo de áudio digitalizado 314 pode estar em uma linguagem binária, desse modo o processador transforma os bytes da representação binária em uma palavra. Em um exemplo adicional, o fluxo de áudio digitalizado 314 pode estar em uma linguagem representativa de palavras e/ou números, desse modo o processador 318 converte essa linguagem em texto que o processador 318 compreende. Modalidades da resposta incluem realizar uma busca na rede, discar um número telefônico, abrir um aplicativo, gravar texto, executar fluxo contínuo de mídia, compor uma mensagem de texto, ouvir uma orientação, ou falar orientações. Em uma modalidade adicional, o processador 318 determina a resposta para apresentar a um usuário do dispositivo de computação 300. O processador 318 pode ser similar em estrutura e funcionalidade ao processador 118 como descrito em conexão com a Figura 1.
[0045] O processador 318 analisa o fluxo de áudio digitalizado armazenado 314 no módulo 320. Modalidades do módulo de análise 320 incluem transmitir o fluxo de áudio digitalizado 314 obtido a partir da memória 314 para o servidor 326. Outras modalidades do módulo 320 incluem converter o fluxo de áudio digitalizado 314 obtido a partir da memória 312 para o fluxo de texto 324 e transmitir o fluxo de texto 324 para o servidor 326. Outras modalidades do módulo 320 incluem converter o fluxo de áudio digitalizado 314 para fluxo de texto 324 para determinar a resposta apropriada mediante análise do contexto do fluxo de áudio 302. Por exemplo, o fluxo de áudio digitalizado 314 pode ser convertido em fluxo de texto 324 no módulo 320 e o processador 318 pode utilizar um processamento de linguagem natural para analisar o texto dentro do fluxo de texto 324 para determinar a resposta apropriada com base no contexto do fluxo de áudio 302.
[0046] O fluxo de texto 324 inclui texto para determinar a resposta apropriada para o dispositivo de computação 300. Em uma modalidade, o fluxo de texto 324 é processado pelo processador para determinar a resposta apropriada a ser apresentada ao usuário do dispositivo de computação 300 no dispositivo de saída 328. Em outra modalidade, o fluxo de texto 324 é processado pelo servidor 326 para determinar a resposta apropriada que é transmitida ao dispositivo de computação 300. Nessa modalidade, a resposta é enviada a partir do servidor 326 para o dispositivo de computação 300. Em uma modalidade adicional, o dispositivo de computação 300 apresenta a resposta ao usuário do dispositivo de computação 300. Por exemplo, o fluxo de texto 324 pode incluir texto que discute o envio de uma mensagem de texto para a mãe. Assim, o texto dentro do fluxo de texto 324 determina o dispositivo de computação 300 para responder mediante composição da mensagem de texto para a mãe.
[0047] O servidor 326 proporciona serviços através de uma rede e pode incluir, por exemplo, um servidor de rede, um servidor de rede de área local (LAN), um servidor de arquivo, ou qualquer outro dispositivo de computação adequado para processar o fluxo de texto 324 para transmitir a resposta para o dispositivo de computação 300.
[0048] O dispositivo de saída 328 apresenta a resposta como determinado a partir do texto dentro do fluxo de texto 324 ao usuário do dispositivo de computação 300. Modalidades do dispositivo de saída 328 incluem um dispositivo de exibição, uma tela ou um altofalante para apresentar a resposta a um usuário do dispositivo de computação 300. Em conformidade com a mensagem de texto para o exemplo de mãe, o usuário do dispositivo de computação 300 pode ter um display que mostra a mensagem de texto sendo composta para a mãe e/ou altofalante para comunicar ao usuário a mensagem de texto.
[0049] Voltando-se agora para a Figura 4, um fluxograma de um método exemplar realizado em um dispositivo de computação para receber um fluxo de áudio e determinar uma resposta. Embora a Figura 4 seja descrita como sendo executada no dispositivo de computação 100 como na Figura 1, ela também pode ser executada em outros componentes adequados como será evidente para aqueles versados na arte. Por exemplo, a Figura 4 pode ser implementada na forma de instruções executáveis em um meio de armazenamento legível por máquina tal como a memória 112.
[0050] Na operação 402, o dispositivo de computação operando em conjunto com um circuito integrado de baixa potência recebe um fluxo de áudio. Em uma modalidade, o fluxo de áudio é de uma quantidade de tempo predeterminada. Por exemplo, o fluxo de áudio pode ser de poucos segundos ou milissegundos. Nessa modalidade, o dispositivo de computação pode monitorar o áudio continuamente. Em outras modalidades, o fluxo de áudio inclui ao menos um de uma fala a partir de um usuário ou áudio a partir do outro dispositivo de computação.
[0051] Na operação 404, o circuito integrado de baixa potência operando em conjunto com o dispositivo de computação digitaliza o fluxo de áudio recebido na operação 402 para produzir um fluxo de áudio digitalizado. Modalidades da operação 404 incluem o uso de um conversor analógico para digital (ADC), dispositivo de conversão digital, instrução, firmware e/ou software operando em conjunto com o circuito integrado de baixa potência. Modalidades de operação 404 incluem transmitir o fluxo de áudio digitalizado para uma memória. Modalidades adicionais de 404 incluem compactar o fluxo de áudio recebido na operação 402, enquanto outra modalidade de 404 inclui compactar o fluxo de áudio digitalizado.
[0052] Na operação 406, o fluxo de áudio digitalizado produzido na operação 404 é armazenado na memória. Modalidades da operação 406 incluem o armazenamento em memória e/ou manutenção do fluxo de áudio digitalizado. Em outra modalidade de operação 406, o fluxo de áudio recebido durante a quantidade de tempo predeterminada na operação 402 é digitalizada na operação 404, desse modo quando outro fluxo de dados é recebido na operação 402 e digitalizado na operação 404, esse fluxo de áudio digitalizado atual substitui o fluxo de áudio digitalizado anterior. Nessa modalidade, a memória mantém o fluxo de áudio digitalizado armazenado recebido durante o período de tempo predeterminado antes do tempo atual.
[0053] Na operação 408, o circuito integrado de baixa potência analisa o fluxo de áudio digitalizado produzido na operação 404. Modalidades da operação 408 incluem processar o fluxo de áudio digitalizado enquanto outras modalidades incluem comparar o fluxo de áudio digitalizado com uma palavra-chave. Nessas modalidades de operação 408, o circuito integrado de baixa potência processa o fluxo de áudio digitalizado para a palavra- chave. A partir do reconhecimento da palavra-chave dentro do fluxo de áudio digitalizado, o método se desloca para operação 410 para transmitir um sinal. Em uma modalidade adicional, se o circuito integrado de baixa potência não reconhece a palavra-chave dentro do fluxo de áudio digitalizado, o método retorna para a operação 402. Contudo, uma modalidade adicional inclui comparar o fluxo de áudio digitalizado como uma representação analógica ou digital que indica que o usuário do dispositivo de computação deseja uma resposta pelo dispositivo de computação. Ainda em uma modalidade adicional, as operações 402, 404, 406 e 408 ocorrem em paralelo. Por exemplo, se o dispositivo de computação analisa o fluxo de áudio digitalizado em 408, o circuito integrado continua a receber os fluxos de áudio na operação 402, digitalizando e armazenando o fluxo de áudio nas operações 404 e 406.
[0054] Na operação 410, o circuito integrado de baixa potência transmite o sinal para o processador para aumentar a potência. Especificamente, ao reconhecer a palavra-chave dentro do fluxo de áudio digitalizado, o circuito integrado de baixa potência transmite um sinal para o processador para aumentar a potência. Em uma modalidade de operação 410, o processador aumenta a potência ou a energia elétrica fornecida ao processador e/ou ao dispositivo de computação.
[0055] Na operação 412, o processador obtém o fluxo de áudio digitalizado armazenado a partir da memória na operação 406. Em uma modalidade de operação 412, a memória transmite o fluxo de áudio digitalizado para o processador, enquanto que em outra modalidade de operação 412, o processador recupera o fluxo de áudio digitalizado a partir da memória.
[0056] Na operação 414, o processador converte o fluxo de áudio digitalizado obtido na operação 412 em um fluxo de texto. Após converter o fluxo de áudio digitalizado em fluxo de texto, o processador analisa o texto dentro do fluxo de texto para determinar a resposta apropriada. Modalidades da operação 414 incluem usar fala para texto (STT), voz para texto, digital para texto, ou outro tipo de conversão de texto. Uma modalidade de operação adicional 414 inclui utilizar um processamento de linguagem natural após a conversão em fluxo de texto. Nessa modalidade, o dispositivo de computação processa o texto dentro do fluxo de texto para determinar uma resposta apropriada com base no contexto do fluxo de áudio recebido na operação 402. Por exemplo, ao detectar a palavra-chave dentro do fluxo de áudio digitalizado em 408, o processador obtém na operação 412, e o fluxo de áudio digitalizado é convertido em fluxo de texto na operação 414. Em um exemplo adicional, o fluxo de áudio pode incluir uma conversação com relação às direções entre dois locais, desse modo quando esse fluxo de áudio digitalizado é convertido na operação 412 para fluxo de texto, o processador pode determinar a resposta apropriada mediante análise do texto dentro do fluxo de texto.
[0057] Na operação 416, o processador determina a resposta com base no fluxo de texto produzido na operação 414. Modalidades da resposta incluem realizar uma busca na rede, discar um número telefônico, abrir um aplicativo, gravar texto, executar fluxo contínuo de mídia, compor uma mensagem de texto, relacionar direções, ou falar direções. Em uma modalidade, o texto dentro do fluxo de texto determina a resposta apropriada para o processador. Em uma modalidade adicional, a resposta é apresentada a um usuário do dispositivo de computação. Por exemplo, o fluxo de texto pode incluir fala perguntando como chegar à China e como tais direções para a China seria a resposta apropriada. Adicionalmente, nesse exemplo, um mapa apresentando listagem e/ou falando direções para China poderia ser incluído.
[0058] Com referência agora à Figura 5, um fluxograma de um método exemplar realizado em um dispositivo de computação para computar um fluxo de áudio digitalizado e apresentar uma resposta a um usuário do dispositivo de computação. Embora a Figura 5 seja descrita como executada no dispositivo de computação 300 como acima na Figura 3, ele pode ser executado em outros componentes adequados como será evidente para aqueles versados na arte. Por exemplo, a Figura 5 pode ser implementada na forma de instruções executáveis em um meio de armazenamento legível por máquina tal como memória 312.
[0059] Na operação 502, o dispositivo de computação compacta um fluxo de áudio digitalizado. Em uma modalidade, a operação 502 é realizada em conjunto com a operação 404 antes da operação 406 na Figura 4. Por exemplo, ao digitalizar o fluxo de áudio recebido, uma operação de circuito integrado de baixa potência em conjunto com o dispositivo de computação pode compactar o fluxo de áudio digitalizado para reduzir o tamanho de byte de dados no fluxo. Nesse exemplo, a compactação do fluxo de áudio digitalizado ocorre antes de ser armazenada em uma memória na operação 406. Em uma modalidade adicional, a operação 502 é realizada antes do recebimento do fluxo de áudio digitalizado na operação 412 na Figura 4. Por exemplo, o processador pode realizar operação 502 para compactar o fluxo de áudio digitalizado a partir da memória enquanto em outro exemplo, a memória pode compactar o fluxo de áudio digitalizado antes de o processador obter o fluxo de áudio digitalizado. Ainda em uma modalidade adicional da operação 502, o fluxo de áudio digitalizado compactado é analisado para reconhecer uma palavra-chave tal como na etapa 408 na Figura 4.
[0060] Na operação 504, o dispositivo de computação apresenta uma resposta ao usuário do dispositivo de computação. Modalidades da operação 504 incluem ocorrer durante ou após a operação 416 na Figura 4. Por exemplo, quando o processador determina a resposta apropriada, essa resposta pode ser apresentada ao usuário do dispositivo de computação. Em uma modalidade adicional, a resposta pode ser apresentada ao usuário em um dispositivo de saída, tal como uma tela de exibição ou altofalante, operando em conjunto com o dispositivo de computação. Por exemplo, quando o usuário discute a diferença entre um camarão e um pitu, o processador pode lançar um aplicativo de busca na rede, desse modo realizando uma busca na rede pela diferença entre camarão e pitu. A busca em rede realizada pode ser fornecida no dispositivo de exibição do dispositivo de computação para o usuário. Em um exemplo adicional, o dispositivo de computação recita de forma audível as diferenças entre o camarão e o pitu através deum altofalante para o usuário. Nessas modalidades, dispositivo de computação opera com um fluxo de áudio para determinar uma resposta mais propriamente do que o usuário instruindo o dispositivo de computação.
[0061] As modalidades descritas aqui em detalhe se referem à digitalização de um fluxo de áudio para detectar uma palavra-chave e com base no reconhecimento da palavra-chave dentro do fluxo de áudio digitalizado, transmitir um sinal para um processador para aumentar a potência e analisar adicionalmente o fluxo de áudio digitalizado para determinar uma resposta. Dessa maneira, modalidades exemplares economizam tempo do usuário ao prevenir instruções de áudio repetitivas para um dispositivo de computação, enquanto reduzindo o consumo de energia do dispositivo de computação.
Claims (15)
1. Método executado por um dispositivo de computação (100, 300) incluindo um circuito integrado de baixa potência (104, 204, 304) e um processador, o método caracterizado por compreender:receber (402) um fluxo de áudio (102, 202, 302);monitorar continuamente o fluxo de áudio através do circuito integrado de baixa potência;digitalizar (404) o fluxo de áudio;armazenar o fluxo de áudio digitalizado (114, 214, 314) em uma memória, em que armazenar o fluxo de áudio digitalizado compreende substituir um fluxo de áudio digitalizado anterior armazenado na memória pelo fluxo de áudio digitalizado;analisar (408), através do circuito integrado de baixa potência, o fluxo de áudio digitalizado armazenado para reconhecimento de uma palavra-chave;a partir do reconhecimento da palavra-chave dentro do fluxo de áudio digitalizado armazenado, transmitir (410) um sinal (116, 216, 316) para aumentar a potência (122, 322), através do circuito integrado de baixa potência (104, 204, 304), para o processador (118, 318);obter, pelo processador, o fluxo de áudio digitalizado armazenado a partir da memória; ealertar, pelo processador, o fluxo de áudio digitalizado armazenado para determinar (416) uma ação para o dispositivo de computação.
2. Método, de acordo com a reivindicação 1, caracterizado por compreender ainda converter o fluxo de áudio digitalizado armazenado, pelo processador, em um fluxo de texto (324), e em que a ação para o dispositivo de computação é baseada no fluxo de texto.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fluxo de áudio digitalizado armazenado compreender a palavra-chave, e a ação para o dispositivo de computação é determinada com base no fluxo de texto, correspondendo ao áudio antes da palavra-chave.
4. Método, de acordo com a reivindicação 1, caracterizado por compreender ainda:compactar (502) o fluxo de áudio digitalizado em um fluxo de áudio digitalizado compactado, em que a análise compreende analisar o fluxo de áudio digitalizado compactado para reconhecimento da palavra-chave.
5. Método, de acordo com a reivindicação 2, caracterizado pelo fluxo de texto compreender uma sequência de símbolos que o processador é configurado para compreender.
6. Método, de acordo com a reivindicação 1, caracterizado pela ação incluir pelo menos um de realizar uma busca na rede, discar um número telefônico, abrir um aplicativo, gravar texto, executar fluxo contínuo de mídia, compor uma mensagem de texto, listar direções, ou falar direções.
7. Método, de acordo com a reivindicação 1, caracterizado por compreender ainda:manter, na memória, o fluxo de áudio digitalizado recebido durante um período de tempo antes de um tempo atual.
8. Método, de acordo com a reivindicação 2, caracterizado por determinar a ação para o dispositivo de computação compreender:transmitir o fluxo de texto para um servidor;receber uma resposta a partir do servidor com base na análise do fluxo de texto pelo servidor, edeterminar a ação com base na análise da resposta pelo processador.
9. Método, de acordo com a reivindicação 1, caracterizado pelo fluxo de áudio incluir pelo menos um de fala a partir de um usuário, fala a partir de outro dispositivo de computação, e áudio a partir de outro dispositivo de computação.
10. Dispositivo de computação (100, 300) caracterizado por compreender um circuito integrado de baixa potência (104, 204, 304) e um processador (118, 318), o circuito integrado de baixa potência (104, 204, 304) configurado para:ao receber um fluxo de áudio (102, 202, 302), monitorar continuamente e digitalizar o fluxo de áudio;armazenar o fluxo de áudio digitalizado (114, 214, 314) em uma memória, em que armazenar o fluxo de áudio digitalizado compreende substituir um fluxo de áudio digitalizado anterior armazenado na memória pelo fluxo de áudio digitalizado;analisar o fluxo de áudio digitalizado armazenado para reconhecimento de uma palavra-chave;mediante reconhecimento da palavra-chave no fluxo de áudio digitalizado armazenado, aumentar a potência (122, 322) para o processador (118, 318); eo processador configurado para:obter o fluxo de áudio digitalizado armazenado a partir da memória; eanalisar o fluxo de áudio digitalizado armazenado (114, 214, 314) para determinar uma ação a ser realizada pelo dispositivo de computação.
11. Dispositivo de computação, de acordo com a reivindicação 10, caracterizado pelo fluxo de áudio digitalizado armazenado compreender a palavra-chave e áudio antes da palavra-chave, e em que a ação para o dispositivo de computação é determinada com base áudio antes da palavra-chave.
12. Dispositivo de computação, de acordo com a reivindicação 10, caracterizado por, antes de analisar o fluxo de áudio digitalizado, o processador ser ainda configurado para:transmitir o fluxo de áudio digitalizado ou um fluxo de texto gerado a partir do fluxo de áudio digitalizado para um servidor para determinar uma ação; ereceber uma resposta a partir do servidor indicando a ação a ser realizada pelo dispositivo de computação.
13. Dispositivo de computação, de acordo com a reivindicação 10, caracterizado pelo circuito integrado de baixa potência ser ainda configurado para:compactar o fluxo de áudio digitalizado para obter um fluxo de áudio digitalizado compactado, eanalisar o fluxo de áudio digitalizado compactado para reconhecer a palavra-chave.
14. Dispositivo de computação, de acordo com a reivindicação 10, caracterizado por compreender ainda:um dispositivo de saída para apresentar a resposta a um usuário do dispositivo de computação.
15. Dispositivo de computação, de acordo com a reivindicação 10, caracterizado por, para analisar o fluxo de áudio digitalizado para reconhecer a palavra-chave, o circuito integrado de baixa potência ser configurado para comparar o fluxo de áudio digitalizado com a palavra-chave.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2011/063804 WO2013085507A1 (en) | 2011-12-07 | 2011-12-07 | Low power integrated circuit to analyze a digitized audio stream |
Publications (3)
Publication Number | Publication Date |
---|---|
BR112014013832A2 BR112014013832A2 (pt) | 2017-06-13 |
BR112014013832A8 BR112014013832A8 (pt) | 2017-06-13 |
BR112014013832B1 true BR112014013832B1 (pt) | 2021-05-25 |
Family
ID=48574720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112014013832-0A BR112014013832B1 (pt) | 2011-12-07 | 2011-12-07 | circuito integrado de baixa potência para analisar um fluxo de áudio digitalizado |
Country Status (8)
Country | Link |
---|---|
US (4) | US9564131B2 (pt) |
EP (2) | EP2788978B1 (pt) |
JP (1) | JP2015501106A (pt) |
KR (5) | KR20160036104A (pt) |
CN (1) | CN104254884B (pt) |
BR (1) | BR112014013832B1 (pt) |
IN (1) | IN2014CN04097A (pt) |
WO (1) | WO2013085507A1 (pt) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9992745B2 (en) | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
US9564131B2 (en) | 2011-12-07 | 2017-02-07 | Qualcomm Incorporated | Low power integrated circuit to analyze a digitized audio stream |
US9704486B2 (en) * | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
US9697831B2 (en) * | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US20150074524A1 (en) * | 2013-09-10 | 2015-03-12 | Lenovo (Singapore) Pte. Ltd. | Management of virtual assistant action items |
US9245527B2 (en) | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
US10079019B2 (en) | 2013-11-12 | 2018-09-18 | Apple Inc. | Always-on audio control for mobile device |
US9460735B2 (en) * | 2013-12-28 | 2016-10-04 | Intel Corporation | Intelligent ancillary electronic device |
US9653079B2 (en) * | 2015-02-12 | 2017-05-16 | Apple Inc. | Clock switching in always-on component |
US10452339B2 (en) | 2015-06-05 | 2019-10-22 | Apple Inc. | Mechanism for retrieval of previously captured audio |
CN105869654B (zh) * | 2016-03-29 | 2020-12-04 | 阿里巴巴集团控股有限公司 | 音频消息的处理方法及装置 |
US10403279B2 (en) * | 2016-12-21 | 2019-09-03 | Avnera Corporation | Low-power, always-listening, voice command detection and capture |
US10276161B2 (en) * | 2016-12-27 | 2019-04-30 | Google Llc | Contextual hotwords |
US10319375B2 (en) | 2016-12-28 | 2019-06-11 | Amazon Technologies, Inc. | Audio message extraction |
US10121494B1 (en) * | 2017-03-30 | 2018-11-06 | Amazon Technologies, Inc. | User presence detection |
US11270198B2 (en) | 2017-07-31 | 2022-03-08 | Syntiant | Microcontroller interface for audio signal processing |
CN107895573B (zh) * | 2017-11-15 | 2021-08-24 | 百度在线网络技术(北京)有限公司 | 用于识别信息的方法及装置 |
WO2019133834A1 (en) * | 2017-12-28 | 2019-07-04 | Syntiant | Always-on keyword detector |
KR20210052035A (ko) * | 2019-10-31 | 2021-05-10 | 엘지전자 주식회사 | 저전력 음성 인식 장치 및 방법 |
US11269592B2 (en) * | 2020-02-19 | 2022-03-08 | Qualcomm Incorporated | Systems and techniques for processing keywords in audio data |
IT202000005875A1 (it) | 2020-03-19 | 2021-09-19 | Radio Dimensione Suono Spa | Sistema e metodo di arricchimento automatico di informazioni per flussi audio |
GB2605121A (en) * | 2021-02-08 | 2022-09-28 | Prevayl Innovations Ltd | An electronics module for a wearable articel, a systemm, and a method of activation of an electronics module for a wearable article |
IT202100017351A1 (it) | 2021-07-01 | 2023-01-01 | Artisti Riuniti S R L | Sistema e dispositivo di condivisione di contenuti artistico-teatrali in formato digitale tra account geolocalizzati |
US11915698B1 (en) * | 2021-09-29 | 2024-02-27 | Amazon Technologies, Inc. | Sound source localization |
Family Cites Families (98)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5278944A (en) | 1992-07-15 | 1994-01-11 | Kokusai Electric Co., Ltd. | Speech coding circuit |
JPH07121195A (ja) | 1993-10-25 | 1995-05-12 | Sony Corp | 音声処理用ディジタルシグナルプロセッサ |
JPH07244494A (ja) | 1994-03-04 | 1995-09-19 | Ricoh Co Ltd | 音声認識装置 |
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
US5721938A (en) | 1995-06-07 | 1998-02-24 | Stuckey; Barbara K. | Method and device for parsing and analyzing natural language sentences and text |
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
US5946050A (en) * | 1996-10-04 | 1999-08-31 | Samsung Electronics Co., Ltd. | Keyword listening device |
JP3726448B2 (ja) | 1997-03-12 | 2005-12-14 | セイコーエプソン株式会社 | 認識対象音声検出方法およびその装置 |
US6101473A (en) * | 1997-08-08 | 2000-08-08 | Board Of Trustees, Leland Stanford Jr., University | Using speech recognition to access the internet, including access via a telephone |
JP4827274B2 (ja) * | 1997-12-30 | 2011-11-30 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | コマンド辞書を使用する音声認識方法 |
GB2342828A (en) | 1998-10-13 | 2000-04-19 | Nokia Mobile Phones Ltd | Speech parameter compression; distributed speech recognition |
EP1058876B1 (en) * | 1999-01-06 | 2009-11-25 | Koninklijke Philips Electronics N.V. | Speech input device with attention span |
US6408272B1 (en) * | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
US6332120B1 (en) | 1999-04-20 | 2001-12-18 | Solana Technology Development Corporation | Broadcast speech recognition system for keyword monitoring |
US6393572B1 (en) | 1999-04-28 | 2002-05-21 | Philips Electronics North America Corporation | Sleepmode activation in a slave device |
JP2000315097A (ja) * | 1999-04-30 | 2000-11-14 | Canon Inc | 電子機器、その制御方法、及び記録媒体 |
US6594630B1 (en) | 1999-11-19 | 2003-07-15 | Voice Signal Technologies, Inc. | Voice-activated control for electrical device |
US8108218B1 (en) | 1999-12-13 | 2012-01-31 | Avaya Inc. | Methods and apparatus for voice recognition for call treatment modification on messaging |
KR100340045B1 (ko) | 1999-12-24 | 2002-06-12 | 오길록 | 저전력 음성 명령어 구동 휴대 정보단말 장치 및 그를 이용한 음성인식 방법 |
KR100447667B1 (ko) * | 2000-04-12 | 2004-09-08 | 이경목 | 음성 인식 기능을 갖는 컴퓨터와 학습용 인형들을 이용한 상호 대화 언어 학습 시스템 |
JP2002123283A (ja) | 2000-10-12 | 2002-04-26 | Nissan Motor Co Ltd | 音声認識操作装置 |
US20020077830A1 (en) | 2000-12-19 | 2002-06-20 | Nokia Corporation | Method for activating context sensitive speech recognition in a terminal |
ATE288615T1 (de) | 2001-03-14 | 2005-02-15 | Ibm | Verfahren und prozessorsystem zur audiosignalverarbeitung |
US8266451B2 (en) | 2001-08-31 | 2012-09-11 | Gemalto Sa | Voice activated smart card |
US6987947B2 (en) | 2001-10-30 | 2006-01-17 | Unwired Technology Llc | Multiple channel wireless communication system |
US6895257B2 (en) * | 2002-02-18 | 2005-05-17 | Matsushita Electric Industrial Co., Ltd. | Personalized agent for portable devices and cellular phone |
KR100594140B1 (ko) | 2002-04-13 | 2006-06-28 | 삼성전자주식회사 | 무선통신시스템의 패킷 데이터 서비스 방법 |
TWI225640B (en) | 2002-06-28 | 2004-12-21 | Samsung Electronics Co Ltd | Voice recognition device, observation probability calculating device, complex fast fourier transform calculation device and method, cache device, and method of controlling the cache device |
JP2004226698A (ja) * | 2003-01-23 | 2004-08-12 | Yaskawa Electric Corp | 音声認識装置 |
JP2004265217A (ja) | 2003-03-03 | 2004-09-24 | Nec Corp | 音声認識機能を有する移動通信端末とその端末を利用したキーワード検索方法 |
JP2006524357A (ja) * | 2003-03-17 | 2006-10-26 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音響装置の遠隔制御の方法 |
JP2004294946A (ja) | 2003-03-28 | 2004-10-21 | Toshiba Corp | 携帯型電子機器 |
JP4301896B2 (ja) | 2003-08-22 | 2009-07-22 | シャープ株式会社 | 信号分析装置、音声認識装置、プログラム、記録媒体、並びに電子機器 |
TWI222837B (en) | 2003-10-14 | 2004-10-21 | Design Technology Inc G | Audio signal compression processing device to with reduced power consumption |
TWI235358B (en) | 2003-11-21 | 2005-07-01 | Acer Inc | Interactive speech method and system thereof |
EP1562180B1 (en) | 2004-02-06 | 2015-04-01 | Nuance Communications, Inc. | Speech dialogue system and method for controlling an electronic device |
CN100365727C (zh) | 2004-03-26 | 2008-01-30 | 胡红 | 一种无线感应音频播放器 |
US20060074658A1 (en) * | 2004-10-01 | 2006-04-06 | Siemens Information And Communication Mobile, Llc | Systems and methods for hands-free voice-activated devices |
JP2008529101A (ja) | 2005-02-03 | 2008-07-31 | ボイス シグナル テクノロジーズ インコーポレイテッド | 移動通信装置の音声語彙を自動的に拡張するための方法及び装置 |
US20090222270A2 (en) | 2006-02-14 | 2009-09-03 | Ivc Inc. | Voice command interface device |
JP2007219207A (ja) * | 2006-02-17 | 2007-08-30 | Fujitsu Ten Ltd | 音声認識装置 |
JP2007255897A (ja) * | 2006-03-20 | 2007-10-04 | Clarion Co Ltd | ナビゲーションシステム並びに装置、その制御方法及び制御プログラム |
US7756708B2 (en) * | 2006-04-03 | 2010-07-13 | Google Inc. | Automatic language model update |
US8117268B2 (en) * | 2006-04-05 | 2012-02-14 | Jablokov Victor R | Hosted voice recognition system for wireless devices |
US20070254680A1 (en) | 2006-05-01 | 2007-11-01 | Shary Nassimi | Wirefree intercom having low power system and process |
KR100744301B1 (ko) * | 2006-06-01 | 2007-07-30 | 삼성전자주식회사 | 음성 인식을 이용하여 동작 모드를 전환하는 휴대 단말기및 그 방법 |
US8207936B2 (en) * | 2006-06-30 | 2012-06-26 | Sony Ericsson Mobile Communications Ab | Voice remote control |
EP1879000A1 (en) * | 2006-07-10 | 2008-01-16 | Harman Becker Automotive Systems GmbH | Transmission of text messages by navigation systems |
ATE426233T1 (de) | 2006-11-30 | 2009-04-15 | Harman Becker Automotive Sys | Interaktives spracherkennungssystem |
US8150044B2 (en) | 2006-12-31 | 2012-04-03 | Personics Holdings Inc. | Method and device configured for sound signature detection |
US9760146B2 (en) | 2007-01-08 | 2017-09-12 | Imagination Technologies Limited | Conditional activation and deactivation of a microprocessor |
WO2008095167A2 (en) | 2007-02-01 | 2008-08-07 | Personics Holdings Inc. | Method and device for audio recording |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8880405B2 (en) * | 2007-03-07 | 2014-11-04 | Vlingo Corporation | Application text entry in a mobile environment using a speech processing facility |
WO2008126355A1 (ja) * | 2007-03-29 | 2008-10-23 | Panasonic Corporation | キーワード抽出装置 |
US7774626B2 (en) | 2007-03-29 | 2010-08-10 | Intel Corporation | Method to control core duty cycles using low power modes |
EP1978765A1 (en) | 2007-04-02 | 2008-10-08 | BRITISH TELECOMMUNICATIONS public limited company | Power management scheme for mobile communication devices |
WO2008124786A2 (en) | 2007-04-09 | 2008-10-16 | Personics Holdings Inc. | Always on headwear recording system |
JP2008309864A (ja) | 2007-06-12 | 2008-12-25 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
CN101076099B (zh) | 2007-06-14 | 2010-06-09 | 北京中星微电子有限公司 | 一种视频录制的控制方法、装置和同步控制单元 |
US20090055005A1 (en) | 2007-08-23 | 2009-02-26 | Horizon Semiconductors Ltd. | Audio Processor |
US8725520B2 (en) | 2007-09-07 | 2014-05-13 | Qualcomm Incorporated | Power efficient batch-frame audio decoding apparatus, system and method |
CN101483683A (zh) | 2008-01-08 | 2009-07-15 | 宏达国际电子股份有限公司 | 手持装置及其语音识别方法 |
US8600740B2 (en) | 2008-01-28 | 2013-12-03 | Qualcomm Incorporated | Systems, methods and apparatus for context descriptor transmission |
US8050932B2 (en) | 2008-02-20 | 2011-11-01 | Research In Motion Limited | Apparatus, and associated method, for selecting speech COder operational rates |
US20090234655A1 (en) | 2008-03-13 | 2009-09-17 | Jason Kwon | Mobile electronic device with active speech recognition |
KR20090107365A (ko) | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
US20090259865A1 (en) | 2008-04-11 | 2009-10-15 | Qualcomm Incorporated | Power Management Using At Least One Of A Special Purpose Processor And Motion Sensing |
JP5327838B2 (ja) | 2008-04-23 | 2013-10-30 | Necインフロンティア株式会社 | 音声入力分散処理方法及び音声入力分散処理システム |
US8244528B2 (en) * | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
CA2665055C (en) | 2008-05-23 | 2018-03-06 | Accenture Global Services Gmbh | Treatment processing of a plurality of streaming voice signals for determination of responsive action thereto |
US8488799B2 (en) | 2008-09-11 | 2013-07-16 | Personics Holdings Inc. | Method and system for sound monitoring over a network |
JP2010136292A (ja) | 2008-12-08 | 2010-06-17 | Toshiba Corp | 画像処理装置 |
US20120010890A1 (en) * | 2008-12-30 | 2012-01-12 | Raymond Clement Koverzin | Power-optimized wireless communications device |
JP4809454B2 (ja) | 2009-05-17 | 2011-11-09 | 株式会社半導体理工学研究センター | 発話推定による回路起動方法及び回路起動装置 |
US20110066431A1 (en) | 2009-09-15 | 2011-03-17 | Mediatek Inc. | Hand-held input apparatus and input method for inputting data to a remote receiving device |
JP2011071937A (ja) | 2009-09-28 | 2011-04-07 | Kyocera Corp | 電子機器 |
US20110099507A1 (en) | 2009-10-28 | 2011-04-28 | Google Inc. | Displaying a collection of interactive elements that trigger actions directed to an item |
CN102118886A (zh) | 2010-01-04 | 2011-07-06 | 中国移动通信集团公司 | 一种语音信息的识别方法和设备 |
CN201752079U (zh) | 2010-01-15 | 2011-02-23 | 硕呈科技股份有限公司 | 待命模式的电源变动唤醒装置 |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
KR20110110434A (ko) | 2010-04-01 | 2011-10-07 | 삼성전자주식회사 | 저전력 오디오 재생장치 및 방법 |
KR101733205B1 (ko) | 2010-04-05 | 2017-05-08 | 삼성전자주식회사 | 오디오 디코딩 시스템 및 그것의 오디오 디코딩 방법 |
US9112989B2 (en) * | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US8359020B2 (en) | 2010-08-06 | 2013-01-22 | Google Inc. | Automatically monitoring for voice input based on context |
CN101968791B (zh) | 2010-08-10 | 2012-12-26 | 深圳市飘移网络技术有限公司 | 一种数据存储方法及装置 |
CN101938391A (zh) | 2010-08-31 | 2011-01-05 | 中山大学 | 一种处理语音的方法、系统、遥控器、机顶盒、云服务器 |
US8606293B2 (en) | 2010-10-05 | 2013-12-10 | Qualcomm Incorporated | Mobile device location estimation using environmental information |
US9443511B2 (en) | 2011-03-04 | 2016-09-13 | Qualcomm Incorporated | System and method for recognizing environmental sound |
US8798995B1 (en) | 2011-09-23 | 2014-08-05 | Amazon Technologies, Inc. | Key word determinations from voice data |
US8924219B1 (en) | 2011-09-30 | 2014-12-30 | Google Inc. | Multi hotword robust continuous voice command detection in mobile devices |
US9992745B2 (en) * | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
US9031847B2 (en) | 2011-11-15 | 2015-05-12 | Microsoft Technology Licensing, Llc | Voice-controlled camera operations |
US8666751B2 (en) * | 2011-11-17 | 2014-03-04 | Microsoft Corporation | Audio pattern matching for device activation |
US9564131B2 (en) | 2011-12-07 | 2017-02-07 | Qualcomm Incorporated | Low power integrated circuit to analyze a digitized audio stream |
DE102013001219B4 (de) * | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US10672387B2 (en) * | 2017-01-11 | 2020-06-02 | Google Llc | Systems and methods for recognizing user speech |
US10405082B2 (en) | 2017-10-23 | 2019-09-03 | Staton Techiya, Llc | Automatic keyword pass-through system |
-
2011
- 2011-12-07 US US14/363,783 patent/US9564131B2/en active Active
- 2011-12-07 KR KR1020167007578A patent/KR20160036104A/ko not_active Application Discontinuation
- 2011-12-07 JP JP2014545864A patent/JP2015501106A/ja not_active Withdrawn
- 2011-12-07 IN IN4097CHN2014 patent/IN2014CN04097A/en unknown
- 2011-12-07 KR KR1020207017179A patent/KR20200074260A/ko not_active Application Discontinuation
- 2011-12-07 KR KR1020147018606A patent/KR20140106656A/ko active Application Filing
- 2011-12-07 KR KR1020187036622A patent/KR20180137041A/ko active Application Filing
- 2011-12-07 CN CN201180076332.2A patent/CN104254884B/zh active Active
- 2011-12-07 KR KR1020217042960A patent/KR20220002750A/ko not_active Application Discontinuation
- 2011-12-07 BR BR112014013832-0A patent/BR112014013832B1/pt active IP Right Grant
- 2011-12-07 WO PCT/US2011/063804 patent/WO2013085507A1/en active Application Filing
- 2011-12-07 EP EP11877053.6A patent/EP2788978B1/en active Active
- 2011-12-07 EP EP20188767.6A patent/EP3748631B1/en active Active
-
2017
- 2017-01-06 US US15/400,817 patent/US10381007B2/en active Active
-
2019
- 2019-06-26 US US16/453,779 patent/US11069360B2/en active Active
-
2021
- 2021-06-14 US US17/347,434 patent/US11810569B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2788978B1 (en) | 2020-09-23 |
KR20180137041A (ko) | 2018-12-26 |
EP3748631B1 (en) | 2024-04-03 |
US20170116992A1 (en) | 2017-04-27 |
US9564131B2 (en) | 2017-02-07 |
KR20140106656A (ko) | 2014-09-03 |
BR112014013832A2 (pt) | 2017-06-13 |
JP2015501106A (ja) | 2015-01-08 |
KR20220002750A (ko) | 2022-01-06 |
WO2013085507A1 (en) | 2013-06-13 |
IN2014CN04097A (pt) | 2015-07-10 |
EP2788978A1 (en) | 2014-10-15 |
KR20160036104A (ko) | 2016-04-01 |
KR20200074260A (ko) | 2020-06-24 |
EP3748631A3 (en) | 2021-05-05 |
US10381007B2 (en) | 2019-08-13 |
US20150162002A1 (en) | 2015-06-11 |
US20190385612A1 (en) | 2019-12-19 |
US20210304770A1 (en) | 2021-09-30 |
CN104254884A (zh) | 2014-12-31 |
US11069360B2 (en) | 2021-07-20 |
EP3748631A2 (en) | 2020-12-09 |
BR112014013832A8 (pt) | 2017-06-13 |
CN104254884B (zh) | 2017-10-24 |
EP2788978A4 (en) | 2015-10-28 |
US11810569B2 (en) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112014013832B1 (pt) | circuito integrado de baixa potência para analisar um fluxo de áudio digitalizado | |
TWI525532B (zh) | Set the name of the person to wake up the name for voice manipulation | |
US10854199B2 (en) | Communications with trigger phrases | |
CN111566730A (zh) | 低功率设备中的语音命令处理 | |
CN109844857B (zh) | 具有语音能力的便携式音频装置 | |
WO2015100430A1 (en) | Methods and system for cue detection from audio input, low-power data processing and related arrangements | |
EP3444811B1 (en) | Speech recognition method and device | |
CN108055617B (zh) | 一种麦克风的唤醒方法、装置、终端设备及存储介质 | |
JP2021196599A (ja) | 情報を出力するための方法および装置 | |
US20130335223A1 (en) | Electronics theft deterrent system | |
CN106228047B (zh) | 一种应用程序图标处理方法及终端设备 | |
KR102177203B1 (ko) | 악성 코드 탐지 방법 및 컴퓨터 판독 가능한 저장매체 | |
CN106980640B (zh) | 针对照片的交互方法、设备和计算机可读存储介质 | |
JP6833659B2 (ja) | デジタル化された音声ストリームを分析するための低電力集積回路 | |
CN110874280B (zh) | 开机异常处理方法、装置、电子设备以及存储介质 | |
JP6728507B2 (ja) | デジタル化された音声ストリームを分析するための低電力集積回路 | |
JPWO2017221516A1 (ja) | 情報処理装置及び情報処理方法 | |
JP6867939B2 (ja) | 計算機、言語解析方法、及びプログラム | |
Liu et al. | Design and realization of dialect interaction system based on VAD | |
US20230205774A1 (en) | Global confidence classifier for information retrieval in contact centers | |
CN110956964A (zh) | 提供语音服务的方法、装置、存储介质和终端 | |
CN112328308A (zh) | 用于识别文本的方法和装置 | |
CN111345792A (zh) | 一种睡眠状态下的健康监控方法、装置及存储介质 | |
CN110825906A (zh) | 一种英语听力解析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 07/12/2011, OBSERVADAS AS CONDICOES LEGAIS. |