BR112017021673B1 - Método de controle de voz, meio não-transitório legível por computador e terminal - Google Patents
Método de controle de voz, meio não-transitório legível por computador e terminal Download PDFInfo
- Publication number
- BR112017021673B1 BR112017021673B1 BR112017021673-6A BR112017021673A BR112017021673B1 BR 112017021673 B1 BR112017021673 B1 BR 112017021673B1 BR 112017021673 A BR112017021673 A BR 112017021673A BR 112017021673 B1 BR112017021673 B1 BR 112017021673B1
- Authority
- BR
- Brazil
- Prior art keywords
- voice
- information
- activation
- recognition apparatus
- corresponds
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 230000004913 activation Effects 0.000 claims abstract description 230
- 230000003595 spectral effect Effects 0.000 claims description 3
- 230000003139 buffering effect Effects 0.000 abstract description 11
- 239000000872 buffer Substances 0.000 description 18
- 238000010586 diagram Methods 0.000 description 11
- 238000010079 rubber tapping Methods 0.000 description 10
- 238000000605 extraction Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
- H04M1/72454—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to context-related or environment-related conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/725—Cordless telephones
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Mobile Radio Communication Systems (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
MÉTODO DE RECONHECIMENTO DE VOZ, APARELHO DE ATIVAÇÃO DE VOZ, APARELHO DE RECONHECIMENTO DE VOZ, E TERMINAL. Modalidades da presente invenção fornecem um método de reconhecimento de voz e um terminal. O usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. O usuário não necessita de uma ajuda de uma tela sensível ao toque e também não necessita de inserir múltiplas instruções. O método inclui: escutar (301), por um aparelho de ativação de voz (101), informação de voz em um ambiente circundante; quando é determinado que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz, armazenar em buffer (301), pelo aparelho de ativação de voz (101), informação de voz, da primeira duração predefinida, obtida pela escuta, e transmitir um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz (102), onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a ler e reconhecer a informação de voz armazenada em buffer pelo aparelho de ativação de voz (101), após o aparelho de reconhecimento de voz ser habilitado; receber (302), pelo aparelho de reconhecimento de voz (102), o sinal de disparo transmitido pelo aparelho de ativação de voz; após receber (...).
Description
[001] A presente invenção refere-se ao campo de tecnologias de comunicações móveis e, em particular, a um método de reconhecimento de voz, a um aparelho de ativação de voz, a um aparelho de reconhecimento de voz, e a um terminal.
[002] No momento, com a crescente popularidade de um terminal portátil móvel, em particular, um telefone móvel, tecnologias de telas sensíveis ao toque estão também se tornando cada vez mais maduras. Embora as tecnologias de telas sensíveis ao toque facilitem uma operação de um usuário, múltiplas etapas de toques necessitam ser executadas para completar uma interação de chamada, e uma chamada pode ser perdida quando o usuário está dirigindo ou não é conveniente executar um toque.
[003] Portanto, funções tais como fazer uma chamada ou transmitir uma mensagem de SMS baseadas em tecnologias de reconhecimento de voz emergem. Além disso, no momento, como uma nova e importante tecnologia de interação com o usuário, o reconhecimento de voz é cada vez mais aplicado amplamente a terminais móveis.
[004] Contudo, serviços atuais, tais como fazer uma chamada ou transmitir uma mensagem de SMS, baseados em tecnologias de reconhecimento de voz, podem ser implementados apenas quando as tecnologias de telas sensíveis ao toque são usadas cooperativamente.
[005] Modalidades da presente invenção fornecem um método de reconhecimento de voz, um aparelho de ativação de voz, um aparelho de reconhecimento de voz, e um terminal. O usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. O usuário não necessita de uma ajuda de uma tela sensível ao toque e também não necessita de inserir múltiplas instruções.
[006] De acordo com um primeiro aspecto, uma modalidade da presente invenção fornece um método de reconhecimento de voz, e o método inclui: escutar, por um aparelho de ativação de voz, informação de voz em um ambiente circundante; e quando é determinado que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz, armazenar em buffer, pelo aparelho de ativação de voz, informação de voz, de primeira duração predefinida, obtida pela escuta, e transmitir um sinal de disparo, para disparar a habilitação de um aparelho de reconhecimento de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a ler e reconhecer a informação de voz armazenada em buffer pelo aparelho de ativação de voz, após o aparelho de reconhecimento de voz ser habilitado.
[007] Com referência ao primeiro aspecto, em um primeiro modo possível de implementação do primeiro aspecto, a determinação de que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz inclui: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[008] Com referência ao primeiro aspecto, em um segundo modo possível de implementação do primeiro aspecto, a determinação de que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz inclui: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, extrair um recurso de impressão de voz em um sinal de voz obtido pela escuta, determinar que o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, e determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[009] De acordo com um segundo aspecto, uma modalidade da presente invenção fornece um método de reconhecimento de voz, e o método inclui: receber, por um aparelho de reconhecimento de voz, um sinal de disparo transmitido por um aparelho de ativação de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a habilitar-se e reconhecer a primeira informação armazenada em buffer pelo aparelho de ativação de voz; após receber o sinal de disparo, habilitar-se, pelo aparelho de reconhecimento de voz, e escutar a segunda informação de voz da segunda duração predefinida; e reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz e a segunda informação de voz obtida pela escuta, para obter um resultado de reconhecimento.
[010] Com referência ao segundo aspecto, em um primeiro modo possível de implementação do segundo aspecto, após o aparelho de reconhecimento de voz obter o resultado de reconhecimento, o método ainda inclui: executar, pelo aparelho de reconhecimento de voz, correspondência entre o resultado de reconhecimento obtido e a informação de instrução de voz pré-armazenada; e executar, pelo aparelho de reconhecimento de voz, uma operação correspondente à informação de instrução de voz correspondente.
[011] Com referência ao segundo aspecto do primeiro modo possível de implementação do segundo aspecto, em um segundo modo possível de implementação do segundo aspecto, o método inclui ainda: quando é determinado que o sinal de disparo não é recebido novamente dentro da terceira duração predefinida após o sinal de disparo ser recebido, desabilitá-lo automaticamente, pelo aparelho de reconhecimento de voz.
[012] De acordo com um terceiro aspecto, uma modalidade da presente invenção fornece um método de reconhecimento de voz, e o método inclui: escutar, por um aparelho de ativação de voz, informação de voz em um ambiente circundante; e quando é determinado que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz, transmitir, pelo aparelho de ativação de voz, um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz.
[013] Com referência ao terceiro aspecto, em um primeiro modo possível de implementação do terceiro aspecto, a determinação de que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz inclui: quando a informação de voz obtida por escuta corresponder à informação de ativação de voz predeterminada, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[014] Com referência ao terceiro aspecto, em um segundo modelo possível de implementação do terceiro aspecto, a determinação de que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz inclui: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, extrair um recurso de impressão de voz em um sinal de voz obtido pela escuta, determinar que o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, e determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[015] De acordo com um quarto aspecto, uma modalidade da presente invenção fornece um método de reconhecimento de voz, e o método inclui: receber, por um aparelho de reconhecimento de voz, um sinal de disparo transmitido por um aparelho de ativação de voz; habilitar-se, pelo aparelho de reconhecimento de voz após recepção do sinal de disparo, e transmitir uma instrução de lembrete de voz a um usuário; e gravar, pelo aparelho de reconhecimento de voz, um sinal de voz inserido pelo usuário de acordo com a instrução de lembrete de voz, e executar reconhecimento sobre o sinal de voz para obter um resultado de reconhecimento.
[016] De acordo com um quinto aspecto, uma modalidade da presente invenção fornece ainda um aparelho de ativação de voz, e o aparelho inclui: um módulo de escuta, configurado para escutar informação de voz em um ambiente circundante; um módulo de determinação, configurado para determinar se a informação de voz obtida pela escuta do módulo de escuta corresponde a um modelo de ativação de voz; um módulo de armazenamento em buffer para: quando o módulo de determinação determinar que a informação de voz obtida pela escuta pelo módulo de escuta corresponde ao modelo de ativação de voz, armazenar em buffer informação de voz, da primeira duração predefinida, obtida pela escuta pelo módulo de escuta; e um módulo de transmissão, configurado para transmitir um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a ler e reconhecer a informação de voz armazenada em buffer pelo aparelho de ativação de voz, após o aparelho de reconhecimento de voz ser habilitado.
[017] Com referência ao quinto aspecto, em um primeiro modo possível de implementação do quinto aspecto, o módulo de determinação é especificamente configurado para: quando é determinado que a informação de voz obtida pela escuta corresponde à informação de ativação de voz predeterminada, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[018] Com referência ao quinto aspecto, em um segundo modo possível de implementação do quinto aspecto, o aparelho inclui ainda: um módulo de extração, configurado para: quando o módulo de determinação determinar que a informação de voz obtida pela escuta corresponde à informação de ativação de voz predeterminada, extrair um recurso de impressão de voz em um sinal de voz obtido pela escuta; onde o módulo de determinação é ainda configurado para: quando é determinado que o recurso de impressão de voz extraído pelo módulo de extração corresponde a um recurso de impressão de voz predeterminado, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[019] De acordo com um sexto aspecto, uma modalidade da presente invenção fornece um aparelho de reconhecimento de voz, que inclui: um módulo de recepção, configurado para receber um sinal de disparo transmitido por um aparelho de ativação de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a habilitar-se e reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz; um módulo de escuta, configurado para: após o módulo de recepção receber o sinal de disparo, habilitar-se e escutar segunda informação de voz de segunda duração predefinida; e um módulo de reconhecimento, configurado para reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz e a segunda informação de voz obtida pela escuta pelo módulo de escuta para obter um resultado de reconhecimento.
[020] Com referência ao sexto aspecto, em um primeiro modo possível de implementação do sexto aspecto, o aparelho inclui ainda: um módulo de correspondência, configurado para executar correspondência entre o resultado de reconhecimento obtido após o módulo de reconhecimento executar reconhecimento e informação de instrução de voz pré-armazenada; e um módulo de execução, configurado para executar uma operação correspondente à informação de instrução de voz correspondente.
[021] Com referência ao sexto aspecto ou ao primeiro modo possível de implementação do sexto aspecto, em um segundo modo possível de implementação do sexto aspecto, o aparelho inclui ainda: um módulo de inabilitação, configurado para: quando o sinal de disparo não for recebido novamente dentro da terceira duração predefinida após o sinal de disparo ser recebido, desabilitar o módulo de reconhecimento de voz.
[022] De acordo com um sétimo aspecto, uma modalidade da presente invenção fornece um aparelho de ativação de voz, que inclui: um módulo de escuta, configurado para escutar informação de voz em um ambiente circundante; um módulo de determinação, configurado para determinar se a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz; e um módulo de transmissão, configurado para: quando o módulo de determinação determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz, transmitir um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz.
[023] Com referência ao sétimo aspecto, em um primeiro modo possível de implementação do sétimo aspecto, o módulo de determinação é especificamente configurado para: quando é determinado que a informação de voz obtida pela escuta corresponde à informação de ativação de voz predeterminada, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[024] Com referência ao sétimo aspecto, em um segundo modo possível de implementação do sétimo aspecto, o aparelho inclui ainda: um módulo de extração, configurado para: quando o módulo de determinação determinar que a informação de voz obtida pela escuta corresponde à informação de ativação de voz predeterminada, extrair um recurso de impressão de voz em um sinal de voz obtido pela escuta; onde o módulo de determinação é ainda configurado para: quando é determinado que o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[025] De acordo com um oitavo aspecto, uma modalidade da presente invenção fornece um aparelho de reconhecimento de voz, que inclui: um módulo de recepção, configurado para receber um sinal de disparo transmitido por um aparelho de ativação de voz; um módulo de transmissão, configurado para: após o módulo de recepção receber o sinal de disparo, habilitar-se e transmitir uma instrução de lembrete de voz a um usuário; e um módulo de processamento, configurado para gravar um sinal de voz inserido pelo usuário de acordo com a instrução de lembrete de voz, e reconhecer o sinal de voz para obter um resultado de reconhecimento.
[026] De acordo com um nono aspecto, uma modalidade da presente invenção fornece um terminal, que inclui: um aparelho de ativação de voz e um aparelho de reconhecimento de voz; onde o aparelho de ativação de voz é configurado para: escutar informação de voz em um ambiente circundante; quando é determinado que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz, armazenar em buffer a primeira informação de voz obtida pela escuta dentro da primeira duração predefinida, e transmitir um sinal de disparo para disparar a habilitação do aparelho de reconhecimento de voz; e o aparelho de reconhecimento de voz é configurado para: após receber o sinal de disparo transmitido pelo aparelho de ativação de voz, habilitar-se e escutar a segunda informação de voz dentro da segunda duração predefinida, e reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz e a segunda informação obtida pela escuta para obter um resultado de reconhecimento.
[027] Com referência ao nono aspecto, em um primeiro modo possível de implementação do nono aspecto, o aparelho de ativação de voz é um processador digital de sinais DSP.
[028] Com referência ao nono aspecto do primeiro modo possível de implementação do nono aspecto, em um segundo modo possível de implementação do nono aspecto, o aparelho de reconhecimento de voz é um processador de aplicativos AP.
[029] Ao utilizar soluções fornecidas nas modalidades da presente invenção, um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. Além disso, as soluções são aplicáveis independentemente de o terminal estar em um estado de espera ou em um estado sem espera. Além disso, um aparelho de ativação de voz armazena em buffer informação de voz obtida pela escuta, e o aparelho de reconhecimento de voz escuta segunda informação de voz após ser habilitado, e reconhece a primeira informação de voz armazenada em buffer e a segunda informação de voz, de modo que uma perda de informação parcial de voz transmitida pelo usuário antes do aparelho de reconhecimento de voz estar habilitado pode ser evitada quando o aparelho de reconhecimento de voz inicia a obtenção de informação de voz após ser ativado.
[030] A FIG. 1 é um diagrama estrutural esquemático de um terminal de acordo com uma modalidade da presente invenção.
[031] A FIG. 2 é um fluxograma de um método de reconhecimento de voz de acordo com uma modalidade da presente invenção.
[032] A FIG. 3 é outro fluxograma de um método de reconhecimento de voz de acordo com uma modalidade da presente invenção.
[033] A FIG. 4 é ainda outro fluxograma de um método de reconhecimento de voz de acordo com uma modalidade da presente invenção.
[034] A FIG. 5 é ainda mais outro fluxograma de um método de reconhecimento de voz de acordo com uma modalidade da presente invenção.
[035] A FIG. 6 é um diagrama esquemático de um aparelho de ativação de voz de acordo com uma modalidade da presente invenção.
[036] A FIG. 7 é um diagrama esquemático de um aparelho de reconhecimento de voz de acordo com uma modalidade da presente invenção.
[037] A FIG. 8 é outro diagrama esquemático de um aparelho de ativação de voz de acordo com uma modalidade da presente invenção.
[038] A FIG. 9 é outro diagrama esquemático de um aparelho de reconhecimento de voz de acordo com uma modalidade da presente invenção.
[039] A FIG. 10 é um diagrama esquemático de um método de reconhecimento de voz de acordo com uma modalidade da presente invenção.
[040] Para tornar os objetivos, soluções técnicas e vantagens da presente invenção mais claros, a seguir descreve-se ainda a presente invenção em detalhe com referência aos desenhos anexos. Aparentemente, as modalidades descritas são meramente uma parte ao invés de todas as modalidades da presente invenção. Todas as outras modalidades obtidas por pessoas versadas na técnica baseadas nas modalidades da presente invenção sem esforços criativos deverão cair dentro do âmbito de proteção da presente invenção.
[041] Modalidades da presente invenção fornecem um método de reconhecimento de voz, um aparelho de ativação de voz, um aparelho de conhecimento de voz e um terminal. Um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. O usuário não necessita da ajuda de uma tela sensível ao toque e não necessita tão pouco inserir múltiplas instruções. O método e o aparelho são baseados em um mesmo conceito inventivo. Uma vez que os princípios para solucionar um problema pelo método e pelo aparelho são similares, a implementação do terminal, do aparelho e do método podem fazer referência uns aos outros, e não será fornecida descrição repetida.
[042] Uma modalidade da presente invenção fornece um terminal. Como mostrado na FIG. 1, o terminal inclui um aparelho de ativação de voz 101 e um aparelho de reconhecimento de voz 102.
[043] O aparelho de ativação de voz 101 pode ser implementado mediante utilização de um processador digital de sinais (Processador Digital de Sinais, DSP abreviado). O aparelho de reconhecimento de voz 102 pode ser implementado mediante utilização de um processador de aplicativos (Processador de Aplicativos, AP abreviado). O aparelho de reconhecimento de voz 102 pode ainda ser implementado mediante utilização de uma unidade central de processamento (Unidade Central de Processo, CPU abreviado).
[044] O aparelho de ativação de voz 101 é configurado para: escutar informação de voz em um ambiente circundante; quando é determinado que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz, armazenar em buffer a primeira informação de voz obtida pela escuta dentro da primeira duração predefinida, e transmitir um sinal de disparo para disparar a habilitação do aparelho de reconhecimento de voz.
[045] O aparelho de reconhecimento de voz 102 é configurado para: após receber o sinal de disparo transmitido pelo aparelho de ativação de voz, habilitar-se e escutar a segunda informação de voz dentro da segunda duração predefinida, e reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz e a segunda informação de voz obtida pela escuta, para obter um resultado de reconhecimento.
[046] Opcionalmente, quando é determinado que o sinal de disparo não é recebido novamente dentro da terceira duração predefinida após o sinal de disparo ser recebido, o aparelho de reconhecimento de voz 102 automaticamente se desabilita.
[047] Ao utilizar soluções fornecidas nesta modalidade da presente invenção, um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. Além disso, as soluções são aplicáveis independentemente de um terminal estar em um estado de espera ou em um estado sem espera. Além disso, um aparelho de ativação de voz armazena em buffer informação de voz obtida pela escuta, e um aparelho de reconhecimento de voz escuta segunda informação de voz após ser habilitado, e reconhece a primeira informação de voz armazenada em buffer e a segunda informação de voz, de modo que uma perda de informação parcial de voz transmitida pelo usuário antes do aparelho de reconhecimento de voz estar habilitado pode ser evitada quando o aparelho de reconhecimento de voz inicia a obtenção de informação de voz após ser ativado.
[048] Especificamente, geralmente após um DSP iniciar um sinal de disparo, após ser habilitado, um AP habilita um canal de gravação para executar gravação. Geralmente, a gravação é iniciada após o AP ser habilitado. Contudo, nesta solução, antes do AP ser habilitado, o DSP inicia a execução de gravação e armazenamento em buffer quando recebendo informação de ativação. Após ser habilitado, o AP continua a executar gravação para obter informação de voz, e em seguida reconhece informação de voz lida de um buffer de DSP e a informação de voz obtida após o AP ser habilitado. Em um cenário Hipotético, existe uma diferença de tempo entre ativar o DSP e transmitir uma instrução pelo DSP. Se a gravação for executada após o AP ser habilitado, apenas informação de voz após o AP ser habilitado pode ser gravada, e informação de voz dentro da diferença de tempo acima mencionada é perdida. Contudo, se a gravação for iniciada e armazenada em buffer quando o DSP for ativado, a informação de voz dentro da diferença de tempo acima mencionada pode ser obtida.
[049] Por exemplo, um ponto de tempo para iniciar a falar uma palavra de ativação é t0, um ponto de tempo para terminar de falar a palavra de ativação é t1, um ponto de tempo para iniciar a falar uma palavra de comando é t2 e um ponto de tempo para habilitar o AP é t3. O buffer inclui informação de voz de t0 a t3. Contudo, se a gravação for executada apenas quando o AP estiver habilitado, apenas informação de voz após t3 pode ser gravada, e informação de voz de t0 a t3 não pode ser gravada. Portanto, na solução fornecida nesta modalidade da presente invenção, pode ser obtida informação de voz após informação de voz usada para ativação, e a perda de informação de voz é evitada, melhorando deste modo o reconhecimento de voz.
[050] Opcionalmente, os modos a seguir podem ser especificamente usados para determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz:
[051] Um primeiro modo de implementação: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[052] Um usuário pode definir informação de ativação de voz no aparelho de ativação de voz de acordo com um lembrete em avanço, por exemplo: Alô, pequeno E. Alternativamente, informação de ativação de voz é predefinida em um terminal no momento da entrega de fábrica. Quando detectando informação de voz em um ambiente circundante, o aparelho de ativação de voz compara a informação de voz com informação de ativação de voz armazenada. Se as duas forem iguais, a informação de voz corresponde ao modelo de ativação de voz, e uma instrução de disparo é transmitida ao aparelho de reconhecimento de voz 102; ou se as duas forem diferentes, o aparelho de ativação de voz 101 pode descartar a informação de voz correntemente detectada e continuar a executar trabalho de detecção e determinação.
[053] Um segundo modo de implementação: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, é extraído um recurso de impressão de voz em um sinal de voz obtido pela escuta, o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, e a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[054] O recurso de impressão de voz inclui um ou mais dos seguintes recursos: um parâmetro acústico que reflete o recurso de impressão de voz, tal como uma entonação, um coeficiente de predição linear, um parâmetro de envelope espectral, uma razão harmônica de energia, uma frequência ressonante de pico e sua largura de banda, um cepstrum (também denominado cepstrum de potência), ou um coeficiente de cepstrum de coeficiente Mel (Coeficiente de Cepstrum de Frequência MEL, MFCC abreviado). Esta modalidade não está limitada aos parâmetros de recursos de impressão de voz acima mencionados.
[055] Um aparelho de configuração pode ser ainda incluído nesta modalidade da presente invenção. Um recurso de impressão de voz de um usuário é pré-extraído e armazenado no aparelho de ativação de voz. Por exemplo, o usuário pode gravar informação de voz dentro de um módulo de configuração de acordo com um lembrete, em seguida extrair um recurso de impressão de voz e armazenar o recurso de impressão de voz extraído no aparelho de ativação de voz.
[056] Ao utilizar as soluções fornecidas nesta modalidade da presente invenção, um recurso de impressão de voz é adicionado ao modelo de ativação, de modo que ruído em ambiente circundante e entrada de voz de outros usuários podem ser filtrados, e um aparelho de ativação de voz pode fornecer segurança confiável a um usuário.
[057] Opcionalmente, após o aparelho de reconhecimento de voz obter o resultado de reconhecimento, o aparelho de reconhecimento de voz executa correspondência entre o resultado de reconhecimento obtido e a informação de instrução de voz pré-armazenada; o aparelho de reconhecimento de voz controla a execução de uma operação que corresponde à informação de instrução de voz correspondente.
[058] A informação de instrução de voz é pré-armazenada no aparelho de reconhecimento de voz. O aparelho de reconhecimento de voz inclui múltiplas peças de informação de instrução de voz.
[059] Um módulo de execução que executa uma operação correspondente à informação de instrução de voz pode ser ainda incluído nesta modalidade da presente invenção. O aparelho de reconhecimento de voz pode transmitir uma instrução de execução ao módulo de execução que executa a operação correspondente à informação de instrução de voz. Por exemplo, é incluído um alto-falante, um aparelho emissor de luz, ou similar.
[060] Por exemplo, quando detectando que a informação de voz em um ambiente circundante satisfaz um modelo de ativação, um módulo de ativação de voz armazena em buffer a primeira informação de voz da primeira duração predefinida, tal como 2s, dispara um módulo de reconhecimento de voz para habilitar-se e escutar a segunda informação de voz, reconhece em seguida a informação da primeira informação de voz armazenada em buffer e a segunda informação de voz, e vagamente compara um resultado de reconhecimento com a informação de instrução de voz para determinar se a informação de voz corresponde a uma peça da informação de instrução de voz. Por exemplo, a informação de instrução de voz inclui informação de instrução de voz que instrui a tocar uma campainha ou MP3, tal como “Toque uma Campainha” ou “Toque um MP3”; ou inclui informação de instrução de voz que instrui a fazer uma pergunta, tal como “Onde está você?”; ou inclui informação de instrução de voz que instrui a acender um flash de câmera, tal como “ligar um flash de câmera”.
[061] Um dispositivo terminal tal como um telefone móvel pode ser procurado mediante utilização da solução fornecida nesta modalidade da presente invenção. Em casa, o telefone móvel é geralmente colocado aleatoriamente e leva algum tempo até encontrá-lo se for necessário usá-lo. Ao utilizar a solução fornecida nesta modalidade da presente invenção, “Alô, pequeno E, onde você está?” pode ser falado. Portanto, um módulo de ativação de voz no telefone móvel detecta a informação de voz, e executa correspondência entre a informação de voz e um modelo de ativação de voz (por exemplo, informação de ativação de voz é “Alô, pequeno E”). Quando a informação de voz corresponder ao modelo de ativação de voz, a informação de voz é armazenada em um Buffer, e um sinal de disparo é transmitido a um aparelho de reconhecimento de voz. O módulo de reconhecimento de voz habilita-se e inicia a escuta de informação de voz, reconhece em seguida a informação de voz armazenada em buffer e a informação de voz obtida pela escuta, para obter um resultado de reconhecimento (um resultado de texto é “Alô, pequeno E, onde você está?”), e executar correspondência entre o resultado de texto e informação de instrução de voz. Por exemplo, se a informação de instrução de voz que corresponde a “Alô, pequeno E, onde você está?” for tocar MP3, música MP3 será tocada para lembrar o usuário.
[062] Pode ser feita uma chamada mediante utilização da solução fornecida nesta modalidade da presente invenção. Independentemente de o telefone móvel estar em um estado em espera ou em um estado de tela travada, um módulo de ativação de voz do telefone móvel está sempre em um estado habilitado, de modo que a informação de voz transmitida por um usuário pode ser obtida pela escuta, por exemplo de “Alô, pequeno E, chame pequeno A”. Então, uma chamada pode ser feita diretamente, e não são necessárias quaisquer outras operações.
[063] Uma modalidade da presente invenção fornece ainda um método de reconhecimento de voz. Como mostrado na FIG. 2, o método inclui:
[064] Etapa 201: Um aparelho de ativação de voz escuta informação de voz em um ambiente circundante.
[065] Etapa 202: Quando é determinado que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz, o aparelho de ativação de voz armazena em buffer informação de voz, da primeira duração predefinida, obtida pela escuta, e transmite um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a ler e reconhecer a informação de voz armazenada em buffer pelo aparelho de ativação de voz, após o aparelho de reconhecimento de voz ser habilitado.
[066] Ao utilizar soluções fornecidas nesta modalidade da presente invenção, um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. Além disso, as soluções são aplicáveis independentemente de um terminal estar em um estado de espera ou em um estado sem espera. Além disso, a informação de voz obtida pela escuta é armazenada em buffer e o aparelho de reconhecimento de voz habilita-se e o aparelho de reconhecimento de voz escuta informação de voz, e em seguida reconhece a informação de voz armazenada em buffer e a informação de voz obtida pela escuta de modo que uma perda de informação parcial de voz pode ser evitada quando o aparelho de reconhecimento de voz começa a obter informação de voz após ser ativado, e o reconhecimento de voz é melhorado.
[067] Opcionalmente, os seguintes modos podem ser especificamente usados para determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[068] Um primeiro modo de implementação: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[069] Um segundo modo de implementação: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, é extraído um recurso de impressão de voz em um sinal de voz obtido pela escuta, o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, e a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[070] Uma modalidade da presente invenção fornece ainda um método de reconhecimento de voz. Como mostrado na FIG. 3, o método inclui:
[071] Etapa 301: Um aparelho de reconhecimento de voz recebe um sinal de disparo transmitido por um aparelho de ativação de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a habilitar-se e reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz.
[072] Etapa 302: Após receber o sinal de disparo, o aparelho de reconhecimento de voz está habilitado e o aparelho de reconhecimento de voz escuta a segunda informação de voz da segunda duração predefinida.
[073] Etapa 303: Reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz e a segunda informação de voz obtida pela escuta, para obter um resultado de reconhecimento.
[074] Ao utilizar soluções fornecidas nesta modalidade da presente invenção, um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. Além disso, as soluções são aplicáveis independentemente de um terminal estar em um estado de espera ou em um estado sem espera. Além disso, a informação de voz obtida pela escuta é armazenada em buffer, e um aparelho de reconhecimento de voz habilita-se e o aparelho de reconhecimento de voz escuta informação de voz, e em seguida reconhece a informação de voz armazenada em buffer e a informação de voz obtida pela escuta, de modo que uma perda de informação parcial de voz pode ser evitada quando o aparelho de reconhecimento de voz começa a obter informação de voz após ser ativado, e o reconhecimento de voz é melhorado.
[075] Opcionalmente, após o aparelho de reconhecimento de voz obter o resultado de reconhecimento, o método inclui ainda: executar, pelo aparelho de reconhecimento de voz, correspondência entre o resultado de reconhecimento obtido e informação de instrução de voz pré-armazenada; e controlar, pelo aparelho de reconhecimento de voz, a execução de uma operação correspondente à informação de instrução de voz correspondente.
[076] Opcionalmente, quando é determinado que o sinal de disparo não é novamente recebido dentro da terceira duração predefinida após o sinal de disparo ser recebido, o aparelho de reconhecimento de voz automaticamente desabilita-se.
[077] Uma modalidade da presente invenção fornece ainda um método de reconhecimento de voz. Como mostrado na FIG. 4, o método inclui:
[078] Etapa 401: Um aparelho de reconhecimento de voz escuta informação de voz em um ambiente circundante.
[079] Etapa 402: Quando é determinado que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz, o aparelho de ativação de voz transmite um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz.
[080] Opcionalmente, os seguintes modos podem ser especificamente usados para determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[081] Um primeiro modo de implementação: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[082] Um segundo modo de implementação: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, é extraído um recurso de impressão de voz em um sinal de voz obtido pela escuta, o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, e a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[083] Ao utilizar soluções fornecidas nesta modalidade da presente invenção, um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. Além disso, as soluções são aplicáveis independentemente de um terminal estar em um estado de espera ou em um estado sem espera. Além disso, a informação de voz obtida pela escuta é armazenada em buffer, e um aparelho de reconhecimento de voz habilita-se e escuta informação de voz, e em seguida reconhece a informação de voz armazenada em buffer e a informação de voz obtida pela escuta, de modo que uma perda de informação parcial de voz pode ser evitada quando o aparelho de reconhecimento de voz começa a obter informação de voz após ser ativado, e o reconhecimento de voz é melhorado.
[084] Uma modalidade da presente invenção fornece ainda um método de reconhecimento de voz. Como mostrado na FIG. 5, o método inclui:
[085] Etapa 501: Um aparelho de reconhecimento de voz recebe um sinal de disparo transmitido por um aparelho de ativação de voz.
[086] Etapa 502: Após receber o sinal de disparo, o aparelho de reconhecimento de voz habilita-se e transmite uma instrução de lembrete de voz a um usuário.
[087] Etapa 503: O aparelho de reconhecimento de voz grava um sinal de voz inserido pelo usuário de acordo com a instrução de lembrete de voz, e reconhece o sinal de voz para obter um resultado de reconhecimento.
[088] Ao utilizar soluções fornecidas nesta modalidade da presente invenção, um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. Além disso, as soluções são aplicáveis independentemente de um terminal estar em um estado de espera ou em um estado sem espera.
[089] Opcionalmente, após o aparelho de reconhecimento de voz reconhecer o sinal de voz para obter o resultado de reconhecimento, o método inclui ainda: executar, pelo aparelho de reconhecimento de voz, correspondência entre o resultado de reconhecimento obtido e a informação de instrução de voz pré-armazenada; e controlar, pelo aparelho de reconhecimento de voz, a execução de uma operação correspondente à informação de instrução de voz correspondente.
[090] Uma modalidade da presente invenção fornece ainda um aparelho de ativação de voz. Como mostrado na FIG. 6, o aparelho inclui: um módulo de escuta 601, configurado para escutar informação de voz em um ambiente circundante; um módulo de determinação 602, configurado para determinar se a informação de voz obtida pela escuta pelo módulo de escuta 601 corresponde a um modelo de ativação de voz; um módulo de buffer 603, configurado para: quando o módulo de determinação 602 determinar que a informação de voz obtida pela escuta pelo módulo de escuta 601 corresponde ao modelo de ativação de voz, armazenar em buffer informação de voz, da primeira duração predefinida, obtida pela escuta pelo módulo de escuta 601; e um módulo de transmissão 604, configurado para transmitir um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a ler e reconhecer a informação de voz armazenada em buffer pelo aparelho de ativação de voz, após o aparelho de reconhecimento de voz ser habilitado.
[091] Ao utilizar soluções fornecidas nesta modalidade da presente invenção, um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. Além disso, as soluções são aplicáveis independentemente de um terminal estar em um estado de espera ou em um estado sem espera. Além disso, a informação de voz obtida pela escuta é armazenada em buffer, e um aparelho de reconhecimento de voz habilita-se e escuta informação de voz, e em seguida reconhece a informação de voz armazenada em buffer e a informação de voz obtida pela escuta, de modo que uma perda de informação parcial de voz pode ser evitada quando o aparelho de reconhecimento de voz começa a obter informação de voz após ser ativado, e o reconhecimento de voz é melhorado.
[092] Opcionalmente, o módulo de determinação 602 é especificamente configurado para: quando é determinado que a informação de voz obtida pela escuta corresponde a informação de ativação de voz predeterminada, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[093] Opcionalmente, o aparelho ainda inclui: um módulo de extração, configurado para: quando o módulo de determinação 602 determinar que a informação de voz obtida pela escuta corresponde à informação de ativação de voz predeterminada, extrair um recurso de impressão de voz em um sinal de voz obtido pela escuta; e o módulo de determinação 602 é ainda configurado para: quando é determinado que o recurso de impressão de voz extraído pelo módulo de extração corresponde a um recurso de impressão de voz predeterminado, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[094] Uma modalidade da presente invenção fornece ainda um aparelho de reconhecimento de voz. Como mostrado na FIG. 7, o aparelho inclui: um módulo de recepção 701, configurado para receber um sinal de disparo transmitido por um aparelho de ativação de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a habilitar-se e reconhecer primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz; um módulo de escuta 702, configurado para: após o módulo de recepção 701 receber o sinal de disparo, habilitar-se e escutar segunda informação de voz da segunda duração predefinida; e um módulo de reconhecimento 703, configurado para reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz e a segunda informação de voz obtida pela escuta pelo módulo de escuta, para obter um resultado de reconhecimento.
[095] Ao utilizar soluções fornecidas nesta modalidade da presente invenção, um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. Além disso, as soluções são aplicáveis independentemente de um terminal estar em um estado de espera ou em um estado sem espera.
[096] Opcionalmente, o aparelho inclui ainda: um módulo de correspondência, configurado para executar correspondência entre o resultado de reconhecimento obtido após o módulo de reconhecimento 703 executar reconhecimento e a informação de instrução de voz pré-armazenada; e um módulo de execução, configurado para executar uma operação correspondente à informação de instrução de voz correspondente.
[097] Opcionalmente, o aparelho inclui ainda: um módulo de inabilitação, configurado para: quando o sinal de disparo não for recebido novamente dentro da terceira duração predefinida após o módulo de recepção receber o sinal de disparo, desabilitar o módulo de reconhecimento de voz.
[098] Ao utilizar soluções fornecidas nesta modalidade da presente invenção, um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. Além disso, as soluções são aplicáveis independentemente de um terminal estar em um estado de espera ou em um estado sem espera. Além disso, a informação de voz obtida pela escuta é armazenada em buffer, e um aparelho de reconhecimento de voz habilita-se e escuta informação de voz, e em seguida reconhece a informação de voz armazenada em buffer e a informação de voz obtida pela escuta, de modo que uma perda de informação parcial de voz pode ser evitada quando o aparelho de reconhecimento de voz começa a obter informação de voz após ser ativado, e o reconhecimento de voz é melhorado.
[099] Uma modalidade da presente invenção fornece ainda um aparelho de ativação de voz. Como mostrado na FIG. 8, o aparelho inclui: um módulo de escuta 801, configurado para escutar informação de voz em um ambiente circundante; um módulo de determinação 802, configurado para determinar se a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz; e um módulo de transmissão 803, configurado para: quando o módulo de determinação 802 determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz, transmitir um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz.
[100] Opcionalmente, o módulo de determinação 802 é especificamente configurado para: quando é determinado que a informação de voz obtida pela escuta corresponde à informação de ativação de voz predeterminada, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[101] Opcionalmente, o aparelho inclui ainda: um módulo de extração, configurado para: quando o módulo de determinação 802 determinar que a informação de voz obtida pela escuta corresponde à informação de ativação de voz predeterminada, extrair um recurso de impressão de voz em um sinal de voz obtido pela escuta; onde o módulo de determinação 802 é especificamente configurado para: quando é determinado que o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[102] Uma modalidade da presente invenção fornece um aparelho de reconhecimento de voz. Como mostrado na FIG. 9, o aparelho inclui: um módulo de recepção 901, configurado para receber um sinal de disparo transmitido por um aparelho de ativação de voz; um módulo de transmissão 902, configurado para: após o módulo de recepção 901 receber o sinal de disparo, habilitar- se e transmitir uma instrução de lembrete de voz a um usuário; e um módulo de processamento 903, configurado para gravar um sinal de voz inserido pelo usuário de acordo com a instrução de lembrete de voz, e reconhecer o sinal de voz, para obter um resultado de reconhecimento.
[103] Ao utilizar soluções fornecidas nesta modalidade da presente invenção, um usuário necessita transmitir apenas uma instrução, e requisitos do usuário podem ser satisfeitos. Além disso, as soluções são aplicáveis independentemente de um terminal estar em um estado de espera ou em um estado sem espera.
[104] No que segue abaixo, modalidades da presente invenção são especificamente descritas com referência a um processo de implementação de software, como mostrado na FIG. 10.
[105] A partir de uma perspectiva de software, um módulo de reconhecimento de voz pode ser dividido em uma camada de acionamento, uma camada de abstração de hardware de áudio (HAL de Áudio), uma camada de estrutura (Estrutura), um mecanismo de reconhecimento de voz (Serviço de VA), e configuração de aplicativos (Configuração).
[106] P1. Comunica um evento. Especificamente, a camada de acionamento comunica um evento de disparo à Estrutura após receber o sinal de disparo de um DSP.
[107] P2. Comunica o evento. Especificamente, a HAL de Áudio comunica o evento de disparo precedente ao Serviço de VA.
[108] P3. Fixa um parâmetro. Especificamente, é configurado para ler dados de um buffer.
[109] P4. Habilita o Serviço de VA.
[110] P5. O Serviço de VA transmite uma instrução de habilitar gravação à Estrutura.
[111] P6. A Estrutura transmite uma instrução de ler dados de áudio à HAL de Áudio após receber a instrução de habilitar gravação.
[112] P7. A HAL de Áudio habilita a leitura dos dados de Buffer após receber a instrução de ler dados de áudio transmitida pela Estrutura.
[113] P8. A HAL de Áudio transmite uma instrução de obter dados de Buffer a um acionador, de modo que o acionador transmita a instrução de obter dados de Buffer ao DSP, e em seguida o DSP transmite os dados de Buffer ao acionador.
[114] P9. O acionador comunica os dados de Buffer recebidos ao Serviço de VA.
[115] P10. O Serviço de VA executa processamento de reconhecimento nos dados de Buffer e nos dados gravados.
[116] P11. O Serviço de VA transmite uma instrução de parar gravação à Estrutura.
[117] P12. A Estrutura transmite uma instrução de parar a leitura de dados de áudio à HAL de Áudio, após receber a instrução de parar de gravar.
[118] P13. A HAL de Áudio desabilita leitura para os dados de Buffer após receber a instrução de parar a leitura de dados de áudio transmitida pela Estrutura.
[119] P14. A HAL de Áudio transmite uma instrução de parar a obtenção de dados de Buffer ao acionador.
[120] Pessoas versadas na técnica deverão compreender que as modalidades da presente invenção podem ser fornecidas como um método, um sistema, ou um produto de programa de computador. Portanto, a presente invenção pode usar uma forma de apenas modalidades de hardware, apenas modalidades de software, ou modalidades com uma combinação de software e hardware. Além disso, a presente invenção pode usar uma forma de um produto de programa de computador que é implementado em um ou mais meios de armazenamento utilizáveis por computador (incluindo uma memória de disco, um CD-ROM, uma memória ótica, e similares, mas sem se limitar a estes) que incluem código de programa utilizável por computador.
[121] A presente invenção é descrita com referência aos fluxogramas e/ou diagramas de blocos do método, do dispositivo (sistema), e do produto de programa de computador de acordo com as modalidades da presente invenção. Deverá ser entendido que instruções de programa de computador podem ser usadas para implementar cada processo e/ou cada bloco nos fluxogramas e/ou nos diagramas de blocos. Estas instruções de programa de computador podem ser fornecidas a um computador de uso geral, um computador dedicado, um processador embutido, ou um processador de qualquer outro dispositivo programável de processamento de dados para gerar uma máquina, de modo que as instruções executadas por um computador ou um processador de qualquer outro dispositivo programável de processamento de dados gerem um aparelho para implementar uma função específica em um ou mais processos nos fluxogramas e/ou em um ou mais blocos nos diagramas de blocos.
[122] Estas instruções de programa de computador podem ser armazenadas em uma memória legível por computador que possa instruir o computador ou qualquer outro dispositivo programável de processamento de dados a trabalhar em um modo específico, de modo que as instruções armazenadas na memória legível por computador gerem um artefato que inclua um aparelho de instruções. O aparelho de instruções implementa uma função específica em um ou mais processos nos fluxogramas e/ou em um ou mais blocos nos diagramas de blocos.
[123] Estas instruções de programa de computador podem ser carregadas para um computador ou outro dispositivo programável de processamento de dados, de modo que uma série de operações e etapas sejam executadas no computador ou no outro dispositivo programável, gerando deste modo processamento implementado em computador. Portanto, as instruções executadas no computador ou no outro dispositivo programável fornecem etapas para implementação de uma função específica em um ou mais processos dos fluxogramas e/ou em um ou mais blocos nos diagramas de blocos.
[124] Embora algumas modalidades da presente invenção tenham sido descritas, pessoas versadas na técnica podem fazer mudanças e modificações àquelas modalidades desde que aprendam o conceito básico da invenção. Portanto, as reivindicações a seguir destinam-se a ser consideradas como abrangendo as modalidades e todas as mudanças e modificações que caiam dentro do âmbito da presente invenção.
[125] Obviamente, pessoas versadas na técnica podem fazer diversas modificações e variações às modalidades da presente invenção sem divergir do espírito e âmbito das modalidades da presente invenção. A presente invenção destina-se a cobrir estas modificações e variações desde que caiam dentro do âmbito de proteção definido pelas reivindicações a seguir e suas tecnologias equivalentes.
[126] A seguir são fornecidas outras modalidades da presente invenção. Deverá ser observado que a numeração usada na seção a seguir não necessariamente necessita corresponder à numeração usada nas seções anteriores.
[127] Modalidade 1. Um método de reconhecimento de voz, que compreende: escutar, por um aparelho de ativação de voz, informação de voz em um ambiente circundante; e quando é determinado que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz, armazenar em buffer, pelo aparelho de ativação de voz, informação de voz, da primeira duração predefinida, obtida pela escuta, e transmitir um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a ler e reconhecer a informação de voz armazenada em buffer pelo aparelho de ativação de voz, após o aparelho de reconhecimento de voz ser habilitado.
[128] Modalidade 2. O método de acordo com a modalidade 1, onde a determinação de que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz compreende: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[129] Modalidade 3. O método de acordo com a modalidade 1, onde a determinação de que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz compreende: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, extrair um recurso de impressão de voz em um sinal de voz obtido pela escuta, determinar que o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, e determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[130] Modalidade 4. Um método de reconhecimento de voz, que compreende: receber, por um aparelho de reconhecimento de voz, um sinal de disparo transmitido por um aparelho de ativação de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a habilitar-se e reconhecer primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz; após receber o sinal de disparo, habilitar-se, pelo aparelho de reconhecimento de voz, e escutar a segunda informação de voz da segunda duração predefinida; e reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz e a segunda informação de voz obtida pela escuta, para obter um resultado de reconhecimento.
[131] Modalidade 5. O método de acordo com a modalidade 4, onde após o aparelho de reconhecimento de voz obter o resultado de reconhecimento, o método compreende ainda: executar, pelo aparelho de reconhecimento de voz, correspondência entre o resultado de reconhecimento obtido e a informação de instrução de voz pré-armazenada; e executar, pelo aparelho de reconhecimento de voz, uma operação correspondente à informação de instrução de voz correspondente.
[132] Modalidade 6. O método de acordo com a modalidade 4 ou 5, que compreende ainda: quando é determinado que o sinal de disparo não é novamente recebido dentro da terceira duração predefinida após o sinal de disparo ser recebido, desabilitar-se automaticamente, pelo aparelho de reconhecimento de voz.
[133] Modalidade 7. Um método de reconhecimento de voz, que compreende: escutar, por um aparelho de ativação de voz, informação de voz em um ambiente circundante; e quando é determinado que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz, transmitir, pelo aparelho de ativação de voz, um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz.
[134] Modalidade 8. O método de acordo com a modalidade 7, onde a determinação de que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz compreende: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[135] Modalidade 9. O método de acordo com a modalidade 7, onde a determinação de que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz compreende: quando a informação de voz obtida pela escuta corresponder à informação de ativação de voz predeterminada, extrair um recurso de impressão de voz em um sinal de voz obtido pela escuta, determinar que o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, e determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[136] Modalidade 10. Um método de reconhecimento de voz, que compreende: receber, por um aparelho de reconhecimento de voz, um sinal de disparo transmitido por um aparelho de ativação de voz; habilitar-se, pelo aparelho de reconhecimento de voz após receber o sinal de disparo, e transmitir uma instrução de lembrete de voz a um usuário; e gravar, pelo aparelho de reconhecimento de voz, um sinal de voz inserido pelo usuário de acordo com a instrução de lembrete de voz, e executar reconhecimento no sinal de voz para obter um resultado de reconhecimento.
[137] Modalidade 11. Um aparelho de ativação de escuta, que compreende: um módulo de escuta, configurado para escutar informação de voz em um ambiente circundante; um módulo de determinação, configurado para determinar se a informação de voz obtida pela escuta pelo módulo de escuta corresponde a um modelo de ativação de voz; um módulo de armazenamento em buffer para: quando o módulo de determinação determinar que a informação de voz obtida pela escuta pelo módulo de escuta corresponde ao modelo de ativação de voz, armazenar em buffer informação de voz, da primeira duração predefinida, obtida pela escuta pelo módulo de escuta; e um módulo de transmissão, configurado para transmitir um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a ler e reconhecer a informação de voz armazenada em buffer pelo aparelho de ativação de voz, após o aparelho de reconhecimento de voz ser habilitado.
[138] Modalidade 12. O aparelho de acordo com a modalidade 11, onde o módulo de determinação é especificamente configurado para: quando é determinado que a informação de voz obtida pela escuta corresponde a informação de ativação de voz predeterminada, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[139] Modalidade 13. O aparelho de acordo com a modalidade 11, que compreende ainda: um módulo de extração, configurado para: quando o módulo de determinação determinar que a informação de voz obtida pela escuta corresponde à informação de ativação de voz predeterminada, extrair um recurso de impressão de voz em um sinal de voz obtido pela escuta; onde o módulo de determinação é ainda configurado para: quando é determinado que o recurso de impressão de voz extraído pelo módulo de extração corresponde a um recurso de impressão de voz predeterminado, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[140] Modalidade 14. Um aparelho de reconhecimento de voz, que compreende: um módulo de recepção, configurado para receber um sinal de disparo transmitido por um aparelho de ativação de voz, onde o sinal de disparo é usado para instruir o aparelho de reconhecimento de voz a habilitar-se e reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz; um módulo de escuta, configurado para: após o módulo de recepção receber o sinal de disparo, habilitar-se e escutar segunda informação de voz de segunda duração predefinida; e um módulo de reconhecimento, configurado para reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz e a segunda informação de voz obtida pela escuta pelo módulo de escuta para obter um resultado de reconhecimento.
[141] Modalidade 15. O aparelho de acordo com a modalidade 14, que compreende ainda: um módulo de correspondência, configurado para executar correspondência entre o resultado de reconhecimento obtido após o módulo de reconhecimento executar reconhecimento e informação de instrução de voz pré-armazenada; e um módulo de execução, configurado para executar uma operação correspondente à informação de instrução de voz correspondente.
[142] Modalidade 16. O aparelho de acordo com a modalidade 14 ou 15, que compreende ainda: um módulo de inabilitação, configurado para: quando o sinal de disparo não for recebido novamente dentro da terceira duração predefinida após o sinal de disparo ser recebido, desabilitar o módulo de reconhecimento de voz.
[143] Modalidade 17. Um aparelho de ativação de voz, que compreende: um módulo de escuta, configurado para escutar informação de voz em um ambiente circundante; um módulo de determinação, configurado para determinar se a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz; e um módulo de transmissão, configurado para: quando o módulo de determinação determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz, transmitir um sinal de disparo para disparar a habilitação de um aparelho de reconhecimento de voz.
[144] Modalidade 18. O aparelho de acordo com a modalidade 17, onde o módulo de determinação é especificamente configurado para: quando é determinado que a informação de voz obtida pela escuta corresponde à informação de ativação de voz predeterminada, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[145] Modalidade 19. O aparelho de acordo com a modalidade 17, que compreende ainda: um módulo de extração, configurado para: quando o módulo de determinação determinar que a informação de voz obtida pela escuta corresponde à informação de ativação de voz predeterminada, extrair um recurso de impressão de voz em um sinal de voz obtido pela escuta; onde o módulo de determinação é especificamente configurado para: quando é determinado que o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, determinar que a informação de voz obtida pela escuta corresponde ao modelo de ativação de voz.
[146] Modalidade 20. Um aparelho de reconhecimento de voz, que compreende: um módulo de recepção, configurado para receber um sinal de disparo transmitido por um aparelho de ativação de voz; um módulo de transmissão, configurado para: após o módulo de recepção receber o sinal de disparo, habilitar-se e transmitir uma instrução de lembrete de voz a um usuário; e um módulo de processamento, configurado para gravar um sinal de voz inserido pelo usuário de acordo com a instrução de lembrete de voz, e reconhecer o sinal de voz para obter um resultado de reconhecimento.
[147] Modalidade 21. Um terminal, que compreende: um aparelho de ativação de voz e um aparelho de reconhecimento de voz; onde o aparelho de ativação de voz é configurado para: escutar informação de voz em um ambiente circundante; quando é determinado que a informação de voz obtida pela escuta corresponde a um modelo de ativação de voz, armazenar em buffer a primeira informação de voz obtida pela escuta dentro da primeira duração predefinida, e transmitir um sinal de disparo para disparar a habilitação do aparelho de reconhecimento de voz; e o aparelho de reconhecimento de voz é configurado para: após receber o sinal de disparo transmitido pelo aparelho de ativação de voz, habilitar-se e escutar a segunda informação de voz dentro da segunda duração predefinida, e reconhecer a primeira informação de voz armazenada em buffer pelo aparelho de ativação de voz e a segunda informação obtida pela escuta para obter um resultado de reconhecimento.
[148] Modalidade 22. O terminal de acordo com modalidade 21, onde o aparelho de ativação de voz é processador digital de sinais DSP.
[149] Modalidade 23. O terminal de acordo com modalidade 21 ou 22, onde o aparelho de reconhecimento voz é um processador de aplicativos AP.
Claims (25)
1. Método de controle de voz, caracterizado por ser aplicado a um terminal que compreende um aparelho de ativação de voz (101) e um aparelho de reconhecimento de voz (102), o método compreendendo: escutar (301), pelo aparelho de ativação de voz, uma primeira informação de voz em um ambiente circundante, em que a primeira informação de voz compreende uma informação de ativação e uma primeira parte de uma palavra de comando, em que a informação de ativação é usada para habilitar o aparelho de reconhecimento de voz; habilitar, pelo aparelho de ativação de voz, o aparelho de reconhecimento de voz de acordo com a informação de ativação; escutar, pelo aparelho de reconhecimento de voz, uma segunda informação de voz, em que a segunda informação de voz compreende uma segunda parte da palavra de comando; obter, pelo aparelho de reconhecimento de voz uma informação de instrução de voz de acordo com a primeira informação de voz e com a segunda informação de voz, em que a informação de instrução de voz corresponde à palavra de comando, a palavra de comando compreendendo a primeira parte da palavra de comando e a segunda parte da palavra de comando.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a habilitação, pelo aparelho de ativação de voz, do aparelho de reconhecimento de voz de acordo com a informação de ativação, compreende: gerar, pelo aparelho de ativação de voz, um sinal de disparo para habilitar o aparelho de reconhecimento de voz em um caso em que determina que a informação de ativação corresponde a um modelo de ativação de voz.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que determinar que a informação de ativação corresponde a um modelo de ativação de voz compreende: em um caso em que a informação de ativação corresponde a uma informação de voz de ativação predeterminada, determinar que a informação de ativação corresponde a um modelo de ativação de fala.
4. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que determinar que a informação de ativação corresponde a um modelo de ativação de voz compreende: em um caso em que a informação de ativação corresponde a uma informação de voz de ativação predeterminada, extrair um recurso de impressão de voz na informação de ativação, em um caso em que o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, determinar que a informação de ativação corresponde a um modelo de ativação de voz.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o recurso de impressão de voz inclui um ou mais dos seguintes recursos: entonação, um coeficiente de predição linear, um parâmetro de envelope espectral, uma razão harmônica de energia, uma frequência ressonante de pico e sua largura de banda, um cepstrum, ou um coeficiente de cepstrum de coeficiente Mel.
6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a obtenção, pelo aparelho de reconhecimento de voz, de uma informação de instrução de voz de acordo com a primeira informação de voz e a segunda informação de voz compreende: obter, pelo aparelho de reconhecimento de voz, um resultado de reconhecimento de acordo com a primeira informação de voz e com a segunda informação de voz, em que o resultado de reconhecimento compreende informação de palavra de comando; obter, pelo aparelho de reconhecimento de voz, a informação de instrução de voz que corresponde ao resultado de reconhecimento por correspondência entre o resultado de reconhecimento obtido e uma informação de instrução de voz pré-armazenada.
7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que a informação de ativação é ouvida em um primeiro período pelo aparelho de despertar por voz, a primeira parte da palavra de comando é ouvida em um segundo período pelo aparelho de despertar por voz; a segunda informação de voz é ouvida em um terceiro período pelo aparelho de reconhecimento de voz.
8. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que ouvir, pelo aparelho de ativação de voz, uma primeira informação de voz em um ambiente circundante compreende: ouvir a primeira informação de voz em um ambiente circundante em um estado de espera; ou ouvir a primeira informação de voz em um ambiente circundante em um estado não de espera; ou ouvir a primeira informação de voz em um ambiente circundante em um estado de tela travada.
9. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que compreende ainda: enviar, pelo aparelho de ativação de voz, o sinal de disparo para o aparelho de reconhecimento de voz para habilitar o aparelho de reconhecimento de voz.
10. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que compreende ainda: controlar, pelo aparelho de reconhecimento de voz, a execução de uma operação correspondente a uma informação de instrução de voz correspondente.
11. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que compreende ainda: ao determinar que a informação de voz usada para habilitar o aparelho de reconhecimento de voz não é recebida novamente dentro de uma duração predefinida após habilitar o aparelho de reconhecimento de voz, automaticamente desabilitar, pelo próprio aparelho de reconhecimento de voz.
12. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que o aparelho de ativação de voz é um processador de sinal digital (DSP).
13. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que o aparelho de reconhecimento de voz é um processador de aplicativo (AP).
14. Terminal, compreendendo: um ou mais processadores; e uma memória armazenando instruções, o terminal caracterizado pelo fato de quando as instruções são executadas pelo um ou mais processadores, elas fazem com que o terminal de controle de voz execute o método definido em qualquer uma das reivindicações 1 a 13.
15. Meio não-transitório legível por computador tendo instruções utilizáveis por computador armazenadas no mesmo para execução por um processador, caracterizado pelo fato das instruções fazerem com que o processador execute o método definido em qualquer uma das reivindicações 1 a 13.
16. Terminal, caracterizado por compreender: um aparelho de ativação de voz (101) e um aparelho de reconhecimento de voz (102); onde o aparelho de ativação de voz (101) é configurado para escutar uma primeira informação de voz em um ambiente circundante, em que a primeira informação de voz compreende uma informação de ativação e uma primeira parte de uma palavra de comando, em que a informação e ativação é usada para habilitar o aparece de reconhecimento de voz; o aparelho de ativação de voz é também configurado para habilitar o aparelho de reconhecimento de voz de acordo com a informação de ativação; o aparelho de reconhecimento de voz (102) é configurado para escutar uma segunda informação de voz, em que a segunda informação de voz compreende uma segunda parte da palavra de comando; o aparelho de reconhecimento de voz é também configurado para obter uma informação de instrução de voz de acordo com a primeira informação de voz e com a segunda informação de voz, em que a informação de instrução de voz corresponde à palavra de comando, a palavra de comando compreendendo a primeira parte da palavra de comando e a segunda parte da palavra de comando.
17. Terminal, de acordo com a reivindicação 16, caracterizado pelo fato de que o aparelho de ativação de voz é configurado para determinar que a informação de ativação corresponde a um modelo de ativação de voz, em um caso em que a informação de ativação corresponde a uma informação de fala de ativação predeterminada.
18. Terminal, de acordo com a reivindicação 16, caracterizado pelo fato de que o aparelho de ativação de voz é configurado para: em um caso em que a informação de ativação corresponde a uma informação de voz de ativação predeterminada, extrair um recurso de impressão de voz na informação de ativação, em um caso em que o recurso de impressão de voz extraído corresponde a um recurso de impressão de voz predeterminado, determinar que a informação de ativação corresponde a um modelo de ativação de voz.
19. Terminal, de acordo com a reivindicação 18, caracterizado pelo fato de que o recurso de impressão de voz inclui um ou mais dos seguintes recursos: entonação, um coeficiente de predição linear, um parâmetro de envelope espectral, uma razão harmônica de energia, uma frequência ressonante de pico e sua largura de banda, um cepstrum, ou um coeficiente de cepstrum de coeficiente Mel.
20. Terminal, De Acordo Com A Reivindicação 16, Caracterizado Pelo Fato De Que O Aparelho De Reconhecimento de Voz É Configurado Para: Obter Um Resultado De Reconhecimento De Acordo Com A Primeira Informação De Voz E Com A Segunda Informação De Voz, Em Que O Resultado De Reconhecimento Compreende Informação De Palavra De Comando; Obter A Informação De Instrução De Voz Que Corresponde Ao Resultado De Reconhecimento Por Correspondência Entre O Resultado De Reconhecimento Obtido E Uma Informação De Instrução De Voz Pré-armazenada.
21. Terminal, de acordo com qualquer uma das reivindicações 16 a 20, caracterizado pelo fato de que a informação de ativação é ouvida em um primeiro período pelo aparelho de despertar por voz, a primeira parte da palavra de comando é ouvida em um segundo período pelo aparelho de despertar por voz; a segunda informação de voz é ouvida em um terceiro período pelo aparelho de reconhecimento de voz.
22. Terminal, de acordo com qualquer uma das reivindicações 16 a 20, caracterizado pelo fato de que o aparelho de ativação de voz é configurado para: ouvir a primeira informação de voz em um ambiente circundante em um estado de espera; ou ouvir a primeira informação de voz em um ambiente circundante em um estado não de espera; ou ouvir a primeira informação de voz em um ambiente circundante em um estado de tela travada.
23. Terminal, de acordo com qualquer uma das reivindicações 16 a 20, caracterizado pelo fato de que o aparelho de reconhecimento de voz é configurado para: automaticamente desabilitar ao determinar que a informação de voz usada para habilitar o aparelho de reconhecimento de voz não é recebida novamente dentro de uma duração predefinida após habilitar o aparelho de reconhecimento de voz.
24. Terminal, de acordo com qualquer uma das reivindicações 16 a 20, caracterizado pelo fato de que compreende ainda um módulo de execução; em que o aparelho de reconhecimento de voz é também configurado para enviar uma instrução de execução que corresponde à informação de instrução de voz para o módulo de execução; o módulo de execução é configurado para executar uma operação correspondente à instrução de execução.
25. Terminal, de acordo com qualquer uma das reivindicações 16 a 20, caracterizado pelo fato do aparelho de ativação de voz ser um processador digital de sinais (DSP) e o aparelho de reconhecimento de voz ser um processador de aplicativos (AP).
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2015/076342 WO2016161641A1 (zh) | 2015-04-10 | 2015-04-10 | 语音识别方法、语音唤醒装置、语音识别装置及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112017021673A2 BR112017021673A2 (pt) | 2018-07-10 |
BR112017021673B1 true BR112017021673B1 (pt) | 2023-02-14 |
Family
ID=57071774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112017021673-6A BR112017021673B1 (pt) | 2015-04-10 | 2015-04-10 | Método de controle de voz, meio não-transitório legível por computador e terminal |
Country Status (8)
Country | Link |
---|---|
US (2) | US10943584B2 (pt) |
EP (1) | EP3282445A4 (pt) |
JP (1) | JP6564058B2 (pt) |
CN (1) | CN106463112B (pt) |
AU (3) | AU2015390534B2 (pt) |
BR (1) | BR112017021673B1 (pt) |
CA (1) | CA2982196C (pt) |
WO (1) | WO2016161641A1 (pt) |
Families Citing this family (103)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
CN107181869A (zh) * | 2017-06-06 | 2017-09-19 | 上海传英信息技术有限公司 | 移动终端和利用语音识别开启移动终端应用的方法 |
CN107358951A (zh) * | 2017-06-29 | 2017-11-17 | 阿里巴巴集团控股有限公司 | 一种语音唤醒方法、装置以及电子设备 |
CN116364076A (zh) * | 2017-07-04 | 2023-06-30 | 阿里巴巴集团控股有限公司 | 一种处理方法、控制方法、识别方法及其装置和电子设备 |
US11361763B1 (en) * | 2017-09-01 | 2022-06-14 | Amazon Technologies, Inc. | Detecting system-directed speech |
CN110800045B (zh) * | 2017-10-24 | 2024-09-20 | 北京嘀嘀无限科技发展有限公司 | 用于不间断应用唤醒和语音识别的系统和方法 |
CN107808670B (zh) * | 2017-10-25 | 2021-05-14 | 百度在线网络技术(北京)有限公司 | 语音数据处理方法、装置、设备及存储介质 |
CN108062949A (zh) * | 2017-12-11 | 2018-05-22 | 广州朗国电子科技有限公司 | 语音控制跑步机的方法及装置 |
CN111819626B (zh) * | 2018-03-07 | 2024-07-30 | 华为技术有限公司 | 一种语音交互的方法及装置 |
CN110299137B (zh) * | 2018-03-22 | 2023-12-12 | 腾讯科技(深圳)有限公司 | 语音交互方法和装置 |
US10818288B2 (en) * | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
JP7186375B2 (ja) * | 2018-03-29 | 2022-12-09 | パナソニックIpマネジメント株式会社 | 音声処理装置、音声処理方法および音声処理システム |
CN108563468B (zh) * | 2018-03-30 | 2021-09-21 | 深圳市冠旭电子股份有限公司 | 一种蓝牙音箱数据处理的方法、装置及蓝牙音箱 |
CN108492827B (zh) * | 2018-04-02 | 2019-07-30 | 百度在线网络技术(北京)有限公司 | 应用程序的唤醒处理方法、装置及存储介质 |
CN108538291A (zh) * | 2018-04-11 | 2018-09-14 | 百度在线网络技术(北京)有限公司 | 语音控制方法、终端设备、云端服务器及系统 |
EP3786945B1 (en) * | 2018-04-12 | 2023-07-19 | Spotify AB | Voice-based authentication |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
CN108735210A (zh) * | 2018-05-08 | 2018-11-02 | 宇龙计算机通信科技(深圳)有限公司 | 一种语音控制方法及终端 |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10777196B2 (en) * | 2018-06-27 | 2020-09-15 | The Travelers Indemnity Company | Systems and methods for cooperatively-overlapped and artificial intelligence managed interfaces |
CN109215646B (zh) * | 2018-08-15 | 2021-08-17 | 北京百度网讯科技有限公司 | 语音交互处理方法、装置、计算机设备及存储介质 |
CN110853632A (zh) * | 2018-08-21 | 2020-02-28 | 蔚来汽车有限公司 | 基于声纹信息的语音识别方法及智能交互设备 |
CN109446533B (zh) * | 2018-09-17 | 2020-12-22 | 深圳市沃特沃德股份有限公司 | 蓝牙翻译机、蓝牙翻译的交互方式及其装置 |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
CN109243447A (zh) * | 2018-10-12 | 2019-01-18 | 西安蜂语信息科技有限公司 | 语音发送触发方法及装置 |
JP7242248B2 (ja) * | 2018-10-31 | 2023-03-20 | キヤノン株式会社 | 電子機器、その制御方法、およびそのプログラム |
CN109545207A (zh) * | 2018-11-16 | 2019-03-29 | 广东小天才科技有限公司 | 一种语音唤醒方法及装置 |
CN109243462A (zh) * | 2018-11-20 | 2019-01-18 | 广东小天才科技有限公司 | 一种语音唤醒方法及装置 |
CN109448720A (zh) * | 2018-12-18 | 2019-03-08 | 维拓智能科技(深圳)有限公司 | 便民服务自助终端及其语音唤醒方法 |
CN111383633B (zh) * | 2018-12-29 | 2023-08-01 | 深圳Tcl新技术有限公司 | 语音识别连续性控制方法、装置、智能终端及存储介质 |
CN109448725A (zh) * | 2019-01-11 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 一种语音交互设备唤醒方法、装置、设备及存储介质 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
CN109979466B (zh) * | 2019-03-21 | 2021-09-17 | 广州国音智能科技有限公司 | 一种声纹身份同一性鉴定方法、装置及计算机可读存储介质 |
US11776538B1 (en) * | 2019-04-01 | 2023-10-03 | Dialog Semiconductor B.V. | Signal processing |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
CN110225386B (zh) * | 2019-05-09 | 2021-09-14 | 海信视像科技股份有限公司 | 一种显示控制方法、显示设备 |
CN110232916A (zh) * | 2019-05-10 | 2019-09-13 | 平安科技(深圳)有限公司 | 语音处理方法、装置、计算机设备及存储介质 |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US12045353B2 (en) * | 2019-05-29 | 2024-07-23 | Denso Corporation | System and method for enhancing vehicle occupant voice data privacy |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11227599B2 (en) | 2019-06-01 | 2022-01-18 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
CN110223687B (zh) * | 2019-06-03 | 2021-09-28 | Oppo广东移动通信有限公司 | 指令执行方法、装置、存储介质及电子设备 |
CN112216277A (zh) * | 2019-07-12 | 2021-01-12 | Oppo广东移动通信有限公司 | 通过耳机进行语音识别的方法、耳机、语音识别装置 |
CN110265031A (zh) * | 2019-07-25 | 2019-09-20 | 秒针信息技术有限公司 | 一种语音处理方法及装置 |
EP3792912B1 (en) * | 2019-09-11 | 2021-11-03 | Oracle International Corporation | Improved wake-word recognition in low-power devices |
CN111292510A (zh) * | 2020-01-16 | 2020-06-16 | 广州华铭电力科技有限公司 | 一种城市电缆被外力破坏的识别预警方法 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
IT202000015973A1 (it) * | 2020-07-02 | 2022-01-02 | Voiceme S R L | Sistema elettronico e metodo per abilitare il pagamento di un bene o servizio per mezzo di comandi vocali |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN112037784B (zh) * | 2020-08-14 | 2023-10-20 | 南京创维信息技术研究院有限公司 | 显示设备语音控制方法、显示设备和存储介质 |
CN112363851A (zh) * | 2020-10-28 | 2021-02-12 | 广东小天才科技有限公司 | 智能终端的语音唤醒方法、系统、智能手表及存储介质 |
CN112581956A (zh) * | 2020-12-04 | 2021-03-30 | 海能达通信股份有限公司 | 一种双模终端的语音识别方法及双模终端 |
TWI765485B (zh) * | 2020-12-21 | 2022-05-21 | 矽統科技股份有限公司 | 外接式語音喚醒裝置及其控制方法 |
CN114254076B (zh) * | 2021-12-16 | 2023-03-07 | 天翼爱音乐文化科技有限公司 | 一种多媒体教学的音频处理方法、系统及存储介质 |
CN114283793A (zh) * | 2021-12-24 | 2022-04-05 | 北京达佳互联信息技术有限公司 | 一种语音唤醒方法、装置、电子设备、介质及程序产品 |
WO2024125032A1 (zh) * | 2022-12-12 | 2024-06-20 | 海信视像科技股份有限公司 | 一种语音控制方法及终端设备 |
Family Cites Families (79)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774859A (en) * | 1995-01-03 | 1998-06-30 | Scientific-Atlanta, Inc. | Information system having a speech interface |
US5857172A (en) * | 1995-07-31 | 1999-01-05 | Microsoft Corporation | Activation control of a speech recognizer through use of a pointing device |
US20050091057A1 (en) * | 1999-04-12 | 2005-04-28 | General Magic, Inc. | Voice application development methodology |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US6591239B1 (en) * | 1999-12-09 | 2003-07-08 | Steris Inc. | Voice controlled surgical suite |
JP2004516517A (ja) * | 2000-12-20 | 2004-06-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 発話による対話言語の設定 |
US7610199B2 (en) | 2004-09-01 | 2009-10-27 | Sri International | Method and apparatus for obtaining complete speech signals for speech recognition applications |
KR100690740B1 (ko) | 2004-11-24 | 2007-03-09 | 엘지전자 주식회사 | 이동 통신 단말기의 슬립 모드 전환 방법 |
US20080140397A1 (en) * | 2006-12-07 | 2008-06-12 | Jonathan Travis Millman | Sequencing for location determination |
US8600741B2 (en) * | 2008-08-20 | 2013-12-03 | General Motors Llc | Method of using microphone characteristics to optimize speech recognition performance |
US9070282B2 (en) * | 2009-01-30 | 2015-06-30 | Altorr Corp. | Smartphone control of electrical devices |
KR20110031797A (ko) | 2009-09-21 | 2011-03-29 | 삼성전자주식회사 | 휴대 단말기의 입력 장치 및 방법 |
US20110165541A1 (en) * | 2010-01-02 | 2011-07-07 | Yong Liu | Reviewing a word in the playback of audio data |
CN102196096A (zh) | 2011-05-19 | 2011-09-21 | 青岛海信移动通信技术股份有限公司 | 一种移动终端执行特定操作的方法、移动终端及通信系统 |
US8768707B2 (en) * | 2011-09-27 | 2014-07-01 | Sensory Incorporated | Background speech recognition assistant using speaker verification |
US8452597B2 (en) * | 2011-09-30 | 2013-05-28 | Google Inc. | Systems and methods for continual speech recognition and detection in mobile computing devices |
US9992745B2 (en) | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
US9117449B2 (en) * | 2012-04-26 | 2015-08-25 | Nuance Communications, Inc. | Embedded system for construction of small footprint speech recognition with user-definable constraints |
KR20130133629A (ko) * | 2012-05-29 | 2013-12-09 | 삼성전자주식회사 | 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 |
CN102905029A (zh) * | 2012-10-17 | 2013-01-30 | 广东欧珀移动通信有限公司 | 一种手机及智能语音寻找手机的方法 |
US9646610B2 (en) * | 2012-10-30 | 2017-05-09 | Motorola Solutions, Inc. | Method and apparatus for activating a particular wireless communication device to accept speech and/or voice commands using identification data consisting of speech, voice, image recognition |
US9275637B1 (en) * | 2012-11-06 | 2016-03-01 | Amazon Technologies, Inc. | Wake word evaluation |
KR20140060040A (ko) * | 2012-11-09 | 2014-05-19 | 삼성전자주식회사 | 디스플레이장치, 음성취득장치 및 그 음성인식방법 |
US9704486B2 (en) * | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
CN103871408B (zh) * | 2012-12-14 | 2017-05-24 | 联想(北京)有限公司 | 一种语音识别方法及装置、电子设备 |
CN103095911B (zh) * | 2012-12-18 | 2014-12-17 | 苏州思必驰信息科技有限公司 | 一种通过语音唤醒寻找手机的方法及系统 |
CN103021413A (zh) * | 2013-01-07 | 2013-04-03 | 北京播思软件技术有限公司 | 语音控制方法及装置 |
DE102013001219B4 (de) | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US9818407B1 (en) * | 2013-02-07 | 2017-11-14 | Amazon Technologies, Inc. | Distributed endpointing for speech recognition |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US9842489B2 (en) * | 2013-02-14 | 2017-12-12 | Google Llc | Waking other devices for additional data |
US20150348538A1 (en) * | 2013-03-14 | 2015-12-03 | Aliphcom | Speech summary and action item generation |
KR101505127B1 (ko) * | 2013-03-15 | 2015-03-26 | 주식회사 팬택 | 음성 명령에 의한 오브젝트 실행 장치 및 방법 |
WO2014144579A1 (en) * | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US9703350B2 (en) * | 2013-03-15 | 2017-07-11 | Maxim Integrated Products, Inc. | Always-on low-power keyword spotting |
US9202463B2 (en) * | 2013-04-01 | 2015-12-01 | Zanavox | Voice-activated precision timing |
EP2816554A3 (en) * | 2013-05-28 | 2015-03-25 | Samsung Electronics Co., Ltd | Method of executing voice recognition of electronic device and electronic device using the same |
US20140358552A1 (en) * | 2013-05-31 | 2014-12-04 | Cirrus Logic, Inc. | Low-power voice gate for device wake-up |
US20140365225A1 (en) * | 2013-06-05 | 2014-12-11 | DSP Group | Ultra-low-power adaptive, user independent, voice triggering schemes |
JP2015011170A (ja) | 2013-06-28 | 2015-01-19 | 株式会社ATR−Trek | ローカルな音声認識を行なう音声認識クライアント装置 |
WO2015005927A1 (en) * | 2013-07-11 | 2015-01-15 | Intel Corporation | Device wake and speaker verification using the same audio input |
CN103338311A (zh) * | 2013-07-11 | 2013-10-02 | 成都西可科技有限公司 | 一种智能手机锁屏界面启动app的方法 |
US9548047B2 (en) * | 2013-07-31 | 2017-01-17 | Google Technology Holdings LLC | Method and apparatus for evaluating trigger phrase enrollment |
JP2015041123A (ja) * | 2013-08-20 | 2015-03-02 | 株式会社リコー | 画像形成装置 |
JP6312053B2 (ja) | 2013-09-06 | 2018-04-18 | 株式会社ユピテル | システム及びプログラム |
US10134395B2 (en) | 2013-09-25 | 2018-11-20 | Amazon Technologies, Inc. | In-call virtual assistants |
US8775191B1 (en) * | 2013-11-13 | 2014-07-08 | Google Inc. | Efficient utterance-specific endpointer triggering for always-on hotwording |
CN103595869A (zh) * | 2013-11-15 | 2014-02-19 | 华为终端有限公司 | 一种终端语音控制方法、装置及终端 |
CN103594089A (zh) * | 2013-11-18 | 2014-02-19 | 联想(北京)有限公司 | 一种语音识别方法及电子设备 |
US9443522B2 (en) | 2013-11-18 | 2016-09-13 | Beijing Lenovo Software Ltd. | Voice recognition method, voice controlling method, information processing method, and electronic apparatus |
CN103632667B (zh) * | 2013-11-25 | 2017-08-04 | 华为技术有限公司 | 声学模型优化方法、装置及语音唤醒方法、装置和终端 |
CN104143326B (zh) * | 2013-12-03 | 2016-11-02 | 腾讯科技(深圳)有限公司 | 一种语音命令识别方法和装置 |
US11138971B2 (en) * | 2013-12-05 | 2021-10-05 | Lenovo (Singapore) Pte. Ltd. | Using context to interpret natural language speech recognition commands |
GB2524222B (en) * | 2013-12-18 | 2018-07-18 | Cirrus Logic Int Semiconductor Ltd | Activating speech processing |
GB2523984B (en) * | 2013-12-18 | 2017-07-26 | Cirrus Logic Int Semiconductor Ltd | Processing received speech data |
US20150221307A1 (en) | 2013-12-20 | 2015-08-06 | Saurin Shah | Transition from low power always listening mode to high power speech recognition mode |
CN105934791B (zh) * | 2014-01-31 | 2019-11-22 | 惠普发展公司,有限责任合伙企业 | 语音输入命令 |
US20180108001A1 (en) * | 2014-03-24 | 2018-04-19 | Thomas Jason Taylor | Voice triggered transactions |
US20150302856A1 (en) * | 2014-04-17 | 2015-10-22 | Qualcomm Incorporated | Method and apparatus for performing function by speech input |
US10770075B2 (en) * | 2014-04-21 | 2020-09-08 | Qualcomm Incorporated | Method and apparatus for activating application by speech input |
CN103929540A (zh) * | 2014-04-25 | 2014-07-16 | 浙江翼信科技有限公司 | 一种消息操作方法及装置 |
US9466290B2 (en) * | 2014-05-06 | 2016-10-11 | Honeywell International Inc. | Systems and methods for aviation communication monitoring using speech recognition |
HUE039773T2 (hu) * | 2014-06-11 | 2019-02-28 | Huawei Tech Co Ltd | Eljárás és terminál egy alkalmazás szolgáltatás gyorsindítására |
KR102208477B1 (ko) * | 2014-06-30 | 2021-01-27 | 삼성전자주식회사 | 마이크 운용 방법 및 이를 지원하는 전자 장치 |
US20160012827A1 (en) * | 2014-07-10 | 2016-01-14 | Cambridge Silicon Radio Limited | Smart speakerphone |
US20160055847A1 (en) * | 2014-08-19 | 2016-02-25 | Nuance Communications, Inc. | System and method for speech validation |
US9354687B2 (en) * | 2014-09-11 | 2016-05-31 | Nuance Communications, Inc. | Methods and apparatus for unsupervised wakeup with time-correlated acoustic events |
US9335966B2 (en) * | 2014-09-11 | 2016-05-10 | Nuance Communications, Inc. | Methods and apparatus for unsupervised wakeup |
US9582296B2 (en) * | 2014-09-18 | 2017-02-28 | International Business Machines Corporation | Dynamic multi-user computer configuration settings |
CN104301109B (zh) * | 2014-09-24 | 2017-06-06 | 飞天诚信科技股份有限公司 | 一种语音动态令牌的工作方法 |
KR102299330B1 (ko) * | 2014-11-26 | 2021-09-08 | 삼성전자주식회사 | 음성 인식 방법 및 그 전자 장치 |
US9653079B2 (en) | 2015-02-12 | 2017-05-16 | Apple Inc. | Clock switching in always-on component |
KR102346302B1 (ko) * | 2015-02-16 | 2022-01-03 | 삼성전자 주식회사 | 전자 장치 및 음성 인식 기능 운용 방법 |
US10192546B1 (en) * | 2015-03-30 | 2019-01-29 | Amazon Technologies, Inc. | Pre-wakeword speech processing |
US10026399B2 (en) * | 2015-09-11 | 2018-07-17 | Amazon Technologies, Inc. | Arbitration between voice-enabled devices |
CN105204963A (zh) * | 2015-09-28 | 2015-12-30 | 北京奇虎科技有限公司 | 数据缓存方法及装置 |
TWI557599B (zh) * | 2015-11-05 | 2016-11-11 | 宏碁股份有限公司 | 語音控制方法及語音控制系統 |
US9728188B1 (en) * | 2016-06-28 | 2017-08-08 | Amazon Technologies, Inc. | Methods and devices for ignoring similar audio being received by a system |
US10074371B1 (en) * | 2017-03-14 | 2018-09-11 | Amazon Technologies, Inc. | Voice control of remote device by disabling wakeword detection |
-
2015
- 2015-04-10 EP EP15888197.9A patent/EP3282445A4/en active Pending
- 2015-04-10 BR BR112017021673-6A patent/BR112017021673B1/pt active IP Right Grant
- 2015-04-10 JP JP2017553159A patent/JP6564058B2/ja active Active
- 2015-04-10 WO PCT/CN2015/076342 patent/WO2016161641A1/zh unknown
- 2015-04-10 AU AU2015390534A patent/AU2015390534B2/en active Active
- 2015-04-10 CA CA2982196A patent/CA2982196C/en active Active
- 2015-04-10 CN CN201580023412.XA patent/CN106463112B/zh active Active
-
2017
- 2017-10-10 US US15/729,097 patent/US10943584B2/en active Active
-
2019
- 2019-11-20 AU AU2019268131A patent/AU2019268131A1/en not_active Abandoned
-
2021
- 2021-02-17 US US17/178,009 patent/US11783825B2/en active Active
- 2021-12-16 AU AU2021286393A patent/AU2021286393B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2016161641A1 (zh) | 2016-10-13 |
AU2015390534A1 (en) | 2017-11-30 |
CA2982196C (en) | 2022-07-19 |
US11783825B2 (en) | 2023-10-10 |
AU2019268131A1 (en) | 2019-12-12 |
CA2982196A1 (en) | 2016-10-13 |
JP6564058B2 (ja) | 2019-08-21 |
EP3282445A1 (en) | 2018-02-14 |
EP3282445A4 (en) | 2018-05-02 |
AU2015390534B2 (en) | 2019-08-22 |
JP2018517919A (ja) | 2018-07-05 |
CN106463112A (zh) | 2017-02-22 |
AU2021286393A1 (en) | 2022-01-20 |
US20180033436A1 (en) | 2018-02-01 |
US20210287671A1 (en) | 2021-09-16 |
AU2021286393B2 (en) | 2023-09-21 |
CN106463112B (zh) | 2020-12-08 |
US10943584B2 (en) | 2021-03-09 |
BR112017021673A2 (pt) | 2018-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112017021673B1 (pt) | Método de controle de voz, meio não-transitório legível por computador e terminal | |
JP6811758B2 (ja) | 音声対話方法、装置、デバイス及び記憶媒体 | |
JP6857699B2 (ja) | 音声対話設備のウェイクアップ方法、装置、設備、記憶媒体、及びプログラム | |
TWI525532B (zh) | Set the name of the person to wake up the name for voice manipulation | |
CN106448678B (zh) | 用于在电子装置中执行语音命令的方法和设备 | |
EP3274988B1 (en) | Controlling electronic device based on direction of speech | |
CN103021409B (zh) | 一种语音启动拍照系统 | |
CN104247280A (zh) | 话音控制的通信连接 | |
WO2016201767A1 (zh) | 一种语音控制方法、装置及计算机存储介质 | |
CN110473556B (zh) | 语音识别方法、装置和移动终端 | |
JP6817386B2 (ja) | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 | |
TW201337722A (zh) | 音樂播放裝置及其控制方法 | |
CN108766438A (zh) | 人机交互方法、装置、存储介质及智能终端 | |
CN103227721A (zh) | 启动应用的系统和方法 | |
CN110727821A (zh) | 防止设备被误唤醒的方法、装置、系统和计算机存储介质 | |
WO2016082344A1 (zh) | 一种语音控制的方法、装置及存储介质 | |
CN108093350A (zh) | 麦克风的控制方法和麦克风 | |
WO2017024835A1 (zh) | 语音识别方法及装置 | |
CN105573709A (zh) | 语音输入设备控制方法及系统 | |
US11699438B2 (en) | Open smart speaker | |
JP7258007B2 (ja) | 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末 | |
CN112992133A (zh) | 声音信号控制方法、系统、可读存储介质和设备 | |
CN213691430U (zh) | 一种用于声音控制的装置 | |
EP4264598B1 (en) | A computer implemented method and an apparatus for silence detection in speech recognition | |
CN111028832B (zh) | 麦克风静音模式控制方法、装置及存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B25A | Requested transfer of rights approved |
Owner name: HONOR DEVICE CO., LTD. (CN) |
|
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 10/04/2015, OBSERVADAS AS CONDICOES LEGAIS |