BR112014027494B1 - aparelho de processamento, método de processamento, programa, mídia de gravação de informação legível por computador e sistema de processamento - Google Patents

aparelho de processamento, método de processamento, programa, mídia de gravação de informação legível por computador e sistema de processamento Download PDF

Info

Publication number
BR112014027494B1
BR112014027494B1 BR112014027494-0A BR112014027494A BR112014027494B1 BR 112014027494 B1 BR112014027494 B1 BR 112014027494B1 BR 112014027494 A BR112014027494 A BR 112014027494A BR 112014027494 B1 BR112014027494 B1 BR 112014027494B1
Authority
BR
Brazil
Prior art keywords
noise
amplitude spectrum
estimate
processing apparatus
noise amplitude
Prior art date
Application number
BR112014027494-0A
Other languages
English (en)
Other versions
BR112014027494A2 (pt
Inventor
Akihito Aiba
Junichi Takami
Original Assignee
Ricoh Company, Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Company, Ltd filed Critical Ricoh Company, Ltd
Publication of BR112014027494A2 publication Critical patent/BR112014027494A2/pt
Publication of BR112014027494B1 publication Critical patent/BR112014027494B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/0332Details of processing therefor involving modification of waveforms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

aparelho de processamento, método de processamento, programa, mídia de gravação de informação legível por computador e sistema de processamento. aparelho de processamento estima um espectro de amplitude de ruído incluído em um sinal sonoro. o aparelho de processamento inclui uma parte de cálculo de espectro de amplitude configurada para calcular um espectro de amplitude do sinal sonoro para cada um dos quadros obtidos da divisão do sinal sonoro em unidades de tempo; e uma parte de estimativa de espectro de amplitude de ruído, configurada para estimar o espectro de amplitude de ruído do ruído detectado do quadro. a parte de estimativa de espectro de amplitude de ruído inclui uma primeira parte de estimativa configurada para estimar o espectro de amplitude de ruído com base em uma diferença entre o espectro de amplitude, calculado pela parte de cálculo de espectro de amplitude e o espectro de amplitude do quadro que ocorre antes que o ruído seja detectado e uma segunda parte de estimativa configurada para estimar o espectro de amplitude de ruído com base em uma função de atenuação obtida dos espectros de amplitude de ruído dos quadros que ocorrem após o ruído ser detectado.

Description

Campo da Invenção
[0001] A presente invenção se refere a um aparelho de processamento, um método de processamento, um programa, um meio de gravação de informação legível em computador e um sistema de processamento.
Antecedentes da Invenção
[0002] Há, por exemplo, aparelhos eletrônicos, tais como uma câmera de vídeo, uma câmera digital, um gravador de IC e assim por diante e um sistema de conferência para transmitir/ receber som e assim por diante entre aparelhos/ dispositivos via uma rede e realização de uma conferência, cada um empregando uma tecnologia de redução de ruído de sons gravados, transmitidos e/ou recebidos de modo que os sons podem ser ouvidos claramente.
[0003] Como um método de redução de ruído de um som introduzido, um aparelho de supressão de ruído ou semelhante é conhecido, por exemplo, pelo qual um som com ruído suprimido é obtido como uma saída um som misturado com ruído como uma entrada, usando um método de subtração de espectro (por exemplo, veja o Pedido de Patente Japonês Exposto N° 2011-257643).
[0004] De acordo com o método de subtração de espectro mencionado acima, é possível reduzir um ruído gerado constantemente, tal como um som de um condicionador de ar, por exemplo. Contudo, há um caso onde é difícil reduzir vários tipos de ruído gerados de repente, como, por exemplo, um som gerado de um bater de teclado de um computador pessoal, um som gerado ao bater em uma mesa ou um som gerado ao clicar o topo de uma caneta esferográfica.
Sumário da Invenção
[0005] De acordo com um aspecto da presente invenção, um aparelho de processamento, que estima um espectro de amplitude de ruído incluído em um sinal sonoro tem uma parte de cálculo de espectro de amplitude, configurada para calcular um espectro de amplitude do sinal sonoro para cada um dos quadros obtidos da divisão do sinal sonoro em unidades de tempo; e uma parte de estimativa de espectro de amplitude de ruído, configurada para estimar um espectro de amplitude de ruído do ruído detectado do quadro. A parte de estimativa de espectro de amplitude de ruído inclui uma primeira parte de estimativa e uma segunda parte de estimativa. A primeira parte de estimativa é configurada para estimar o espectro de amplitude de ruído com base em uma diferença entre o espectro de amplitude calculado pela parte de cálculo de espectro de amplitude e o espectro de amplitude do quadro que ocorre antes de o ruído ser detectado. A segunda parte de estimativa é configurada para estimar o espectro de amplitude de ruído dos quadros que ocorrem após o ruído ser detectado.
[0006] Outros objetivos, características vantagens da presente invenção se tornarão mais evidentes da descrição detalhada seguinte, quando lida em conjunto com os desenhos anexos.
Breve Descrição dos Desenhos
[0007] A figura 1 é um diagrama em blocos ilustrando uma configuração funcional de um aparelho de processamento de acordo com uma primeira concretização;
[0008] A figura 2 ilustra um sinal sonoro introduzido no aparelho de processamento de acordo com a primeira concretização;
[0009] A figura 3 ilustra uma configuração de hardware do aparelho de processamento de acordo com a primeira concretização;
[0010] A figura 4 é um diagrama em blocos ilustrando uma configuração funcional de uma parte de estimativa de espectro de amplitude de ruído do aparelho de processamento de acordo com a primeira concretização;
[0011] A figura 5 ilustra um método de estimativa de espectro de amplitude de ruído no aparelho de processamento de acordo com a primeira concretização;
[0012] A figura 6 ilustra um fluxograma de um processo de estimativa de um espectro de amplitude de ruído no aparelho de processamento de acordo com a primeira concretização;
[0013] A figura 7 é um diagrama em blocos mostrando outro exemplo da configuração funcional da parte de estimativa de espectro de amplitude de ruído no aparelho de processamento de acordo com a primeira concretização;
[0014] A figura 8 é um diagrama em blocos ilustrando uma configuração funcional de um sistema de processamento de acordo com a segunda concretização;
[0015] A figura 9 ilustra uma configuração de hardware do sistema de processamento de acordo com a segunda concretização;
[0016] A figura 10 é um diagrama em blocos ilustrando uma configuração funcional de um aparelho de processamento de acordo com uma terceira concretização;
[0017] A figura 11 ilustra uma configuração de hardware do aparelho de processamento de acordo com a terceira concretização;
[0018] A figura 12 é um diagrama em blocos ilustrando uma configuração funcional de uma parte de estimativa de espectro de amplitude de ruído do aparelho de processamento de acordo com a terceira concretização;
[0019] A figura 13 ilustra um fluxograma de um processo de estimativa de um espectro de amplitude de ruído no aparelho de processamento de acordo com a terceira concretização;
[0020] A figura 14 é um diagrama em blocos mostrando outro exemplo da configuração funcional da parte de estimativa de espectro de amplitude de ruído no aparelho de processamento de acordo com a terceira concretização;
[0021] A figura 15 é um diagrama em blocos ilustrando uma configuração funcional de um sistema de processamento de acordo com uma quarta concretização; e
[0022] A figura 16 ilustra uma configuração de hardware do sistema de processamento de acordo com a quarta concretização.
Descrição de Concretizações
[0023] Abaixo, concretizações da presente invenção serão descritas usando figuras. Nas respectivas figuras, os mesmos numerais/ letras de referência são dados aos mesmos elementos/ componentes e descrição duplicada pode ser omitida.
Primeira Concretização < Configuração Funcional do Aparelho de Processamento>
[0024] A figura 1 é um diagrama em blocos ilustrando uma configuração funcional de um aparelho de processamento 100 de acordo com uma primeira concretização.
[0025] Conforme mostrado na figura 1, o aparelho de processamento 100 inclui um terminal de entrada IN, uma parte de conversão de espectro de frequência 101, uma parte de detecção de ruído A 102, uma parte de detecção de ruído B 103, uma parte de estimativa de espectro de amplitude de ruído 104, uma parte de subtração de espectro de ruído 105, uma parte de conversão inversa de espectro de frequência 106 e um terminal de saída OUT.
[0026] Um sinal sonoro é introduzido no terminal de entrada IN do aparelho de processamento 100. Conforme mostrado na figura 2, o sinal sonoro Sis dividido em respectivas unidades de tempo “u” (por exemplo, cada unidade de tempo “u” sendo 10 ms ou semelhante) é introduzida no terminal de entrada IN. É notado que, daqui em diante, os segmentos em que o sinal sonoro Sis é dividido em respectivas unidades de tempo “u” serão referidos como "quadros”. Deve ser notado que o sinal sonoro Sis é um sinal correspondendo a um som introduzido ia um dispositivo de entrada, tal como, por exemplo, um microfone, para entrada de um som e pode incluir um outro som que não a voz.
[0027] A parte de conversão de espectro de frequência 101 converte o sinal sonoro Sis introduzido no terminal de entrada IN em um espectro de frequência e sai o espectro de frequência Sif. A parte de conversão de espectro de frequência 101 converte o sinal sonoro no espectro de frequência usando, por exemplo, transformação rápida de Fourier (FFT).
[0028] A parte de detecção de ruído A 102 determina se o ruído 102 está incluído no sinal sonoro Sis introduzido e envia o resultado da detecção de ruído para a parte de estimativa de espectro de amplitude de ruído 104 como informação de detecção A IdA.
[0029] A parte de detecção de ruído B 103 determina se ruído está incluído no espectro de frequência Sif enviado da parte de conversão de espectro de frequência 101 e envia o resultado da detecção de ruído para a parte de estimativa de espectro de amplitude de ruído 104 como informação de detecção B IdB.
[0030] A parte de estimativa de espectro de amplitude de ruído 104 estima um espectro de amplitude Seno de ruído (daqui em diante referido como “espectro de amplitude de ruído”) incluído no espectro de frequência Sif saído da parte de conversão de espectro de frequência 101 com base na informação de detecção A IdA saída da parte de detecção de ruído A 102 e a informação de detecção B IdB, saída da parte de detecção de ruído B 103.
[0031] A parte de subtração de espectro de ruído 105 subtrai o espectro de amplitude de ruído Seno enviado da parte de estimativa de espectro de amplitude de ruído 104 do espectro de frequência Sif enviado da parte de conversão de espectro de frequência 101 e envia o espectro de frequência Sof em que o ruído foi assim reduzido.
[0032] A parte de conversão inversa de espectro de frequência 106 converte o espectro de frequência Sof em que o ruído foi assim reduzido enviado da parte de subtração de espectro de ruído 105 em um sinal sonoro Sos e envia o sinal sonoro Sos. A parte de conversão inversa de espectro de frequência 106 converte o espectro de frequência Sof no sinal sonoro Sos, usando, por exemplo, uma transformação inversa de Fourier.
[0033] O terminal de saída OUT envia ondas sísmicas Sos em que o ruído foi assim reduzido enviado da parte de conversão inversa de espectro de frequência 106. <Configuração de Hardware de Aparelho de Processamento>
[0034] A figura 3 ilustra uma configuração de hardware do aparelho de processamento 100.
[0035] Conforme mostrado na figura 3, o aparelho de processamento 100 inclui um controlador 110, uma I/F de rede 115, uma parte de I/F de meio de gravação 116, um terminal de entrada IN e um terminal de saída OUT. O controlador 110 inclui uma CPU 111, uma HDD (Hard Disk Drive - Unidade de Disco Rígido) 112, uma ROM (Read Only Memory - Memória de Leitura Somente) 113 e uma RAM (Random Access Memory - Memória de Acesso Randômico) 114.
[0036] A CPU 111 inclui uma unidade lógica e aritmética, lê um programa e dados de um dispositivo de armazenamento, tal como HDD 112 ou ROM 113 na RAM 114, executa processos e, desse modo, realiza as respectivas funções do aparelho de processamento 100. A CPU 111, desse modo, funciona como partes da parte de conversão de espectro de frequência 101, parte de detecção de ruído A 102, parte de detecção de ruído B 103, parte de estimativa de espectro de amplitude de ruído 104, parte de subtração de espectro de ruído 105, parte de conversão inversa de espectro de frequência 106 (mostrada na figura 1) e assim por diante.
[0037] O HDD 112 é um dispositivo de armazenamento não volátil que armazena programas e dados. Os programas e dados armazenados incluem um OS (Operating System - Sistema Operacional) que é software básico controlando a totalidade do aparelho de processamento 100, software de aplicação, proporcionando várias funções no OS e assim por diante. O HDD 112 funciona como uma parte de armazenamento de espectro de amplitude 45, uma parte de armazenamento de espectro de amplitude de ruído 46 (descrita mais tarde) e assim por diante.
[0038] A ROM 113 é uma memória semicondutora não volátil de (dispositivo de armazenamento) que tem uma capacidade de armazenar programas e dados, mesmo após o suprimento de energia ser desligado. A ROM 113 armazena programas e dados, mesmo após o suprimento de energia ser desligado. A ROM 113 armazena programas e dados tal como um BIOS (Basic Input/ Output System) a ser executado, quando o aparelho de processamento 100 é iniciado, configurações de OS, configurações de rede e assim por diante. A RAM 114 é uma memória semicondutora volátil (dispositivo de armazenamento) para armazenar, temporariamente, programas e dados.
[0039] A parte de I/F de rede 115 é uma interface entre um dispositivo periférico tendo uma função de comunicação, conectada via uma rede construída por um curso de transmissão de dados, tal como um circuito cabeado e/ou sem fio. Como uma LAN (Local Area Network - Rede de Área Local), uma WAN (Wide Area Network - Rede de Longa distância) ou semelhante e o aparelho de processamento 100.
[0040] A parte de I/F de meio de gravação 116 é uma interface para um meio de gravação. O aparelho de processamento 100 tem uma capacidade de ler e/ou escrever informação de/ para um meio de gravação 117, usando a parte de I/F de meio de gravação 116.Exemplos específicos do meio de gravação 117 incluem um disco flexível, um CD, um DVD (Digital Versatile Disk), um cartão de memória SD e uma memória USB (memória Universal Serial Bus).
<Processamento de Som de Aparelho de Processamento>
[0041] A seguir, processamento de som realizado pelas respectivas partes do aparelho de processamento 100 será descrito em detalhes.
<< Detecção de Ruído de Sinal Sonoro Introduzido>>
[0042] A parte de detecção de ruído A 102 (veja a figura 1) determina se o sinal sonoro introduzido Sis inclui ruído baseado, por exemplo, em uma flutuação de energia do sinal sonoro Sis introduzido. Nesse caso, a parte de detecção de ruído A 102 calcula a energia do sinal sonoro Sis introduzido para cada quadro e calcula a diferença entre a energia do quadro (quadro alvo de detecção de ruído) pela que deve ser determinado se o ruído está incluído e se a energia do quadro ocorre imediatamente antes do quadro alvo de detecção de ruído.
[0043]A potência “p” do sinal sonoro introduzido noquadro entre tempos t1 e t2 pode ser obtida da fórmula (1) a seguir, onde x(t) denota o valor do sinal sonoro introduzido em um tempo t:
Figure img0001
[0044] A flutuação de energia pode ser obtida da fórmula (2) a seguir, onde “pk” denota a energia do quadro alvo de detecção de ruído e “pk-1” denota a energia do quadro ocorrendo imediatamente antes do quadro alvo de detecção de ruído:
Figure img0002
[0045] A parte de detecção de ruído A 102 compara, por exemplo, a flutuação de energia Δpk obtida da fórmula (2) com um limite predeterminado e determina que o ruído está incluído no sinal sonoro introduzido Sis no quadro alvo de detecção de ruído, quando a flutuação de energia Δpk excede o limite, e nenhum ruído é incluído no sinal sonoro introduzido Sis no quadro alvo de detecção de ruído, quando a flutuação de energia Δpk não excede o limite. A parte de detecção de ruído A 102 envia a informação de detecção A IdA, indicando o resultado da determinação.
[0046] Alternativamente, a parte de detecção de ruído A 102 pode determinar se ruído está incluído no sinal sonoro introduzido com base, por exemplo, na magnitude de um erro preditivo linear. Nesse caso, a parte de detecção de ruído A 102 calcula o erro preditivo linear do quadro alvo de detecção de ruído, como segue:
[0047] Por exemplo, os valores x dos respectivos quadros do sinal sonoro introduzido serão expressos como segue:
Figure img0003
[0048] Nesse momento, os coeficientes preditivos lineares ótimos na (n - 0 a N-1) são obtidos, para serem usados para predição do valor Xk+i do sinal sonoro em um certo quadro usando os valores x1 a xk dos quadros até o quadro que ocorre imediatamente antes do determinado quadro pela fórmula a seguir:
Figure img0004
[0049] Em seguida, o erro preditivo linear ek+i é obtido pela fórmula a seguir como a diferença entre o valor predito xAk+i assim obtido da fórmula acima e o valor real Xk+1:
Figure img0005
[0050] Esse erro indica o erro entre o valor predito e o valor realmente medido. Desse modo, a parte de detecção de ruído A 102 compara o erro preditivo linear ek+i com um limite predeterminado e determina que ruído está incluído no sinal sonoro introduzido Sis no quadro alvo de detecção de ruído quando o erro preditivo linear ek+1 excede o limite e nenhum ruído é incluído no sinal sonoro introduzido Sis no quadro alvo de detecção de ruído, quando o erro preditivo linear ek+1 não excede o limite. A parte de detecção de ruído A 102 envia a informação de detecção A IdA, indicando o resultado da determinação.
<<Detecção de Ruído de Espectro de Frequência>>
[0051] A parte de detecção de ruído B 103 determina se ruído está incluído no espectro de frequência enviado da parte de conversão de espectro de frequência 101.
[0052] Por exemplo, a parte de detecção de ruído B 103 determina se ruído está incluído no espectro de frequência Sif com base na magnitude de uma flutuação de energia de uma certa banda de frequência do espectro de frequência Sif. Nesse caso, a parte de detecção de ruído B 103 calcula a soma total da energia do espectro em uma banda de alta frequência do quadro alvo de detecção e obtém a diferença entre o valor assim obtido do quadro alvo de detecção e o valor correspondente do quadro ocorrendo imediatamente antes do quadro alvo de detecção.
[0053] Então, por exemplo, a parte de detecção de ruído B 103 compara a diferença assim obtida da soma total da energia do espectro na banda de alta frequência entre o quadro alvo de detecção e o quadro ocorrendo imediatamente antes do quadro alvo de detecção com um limite predeterminado. Então, por exemplo, a parte de detecção de ruído B 103 determina que ruído é incluído no sinal sonoro introduzido Sis no quadro alvo de detecção de ruído quando a diferença da soma total da energia do espectro na banda de alta frequência excede o limite e nenhum ruído está incluído no sinal sonoro introduzido Sis no quadro alvo de detecção de ruído, quando a diferença da soma total da energia doo espectro na banda de alta frequência não excede o limite. A parte de detecção de ruído B 103 envia a informação de detecção B IdB indicando o resultado da determinação.
[0054] Alternativamente, a parte de detecção de ruído B 103 pode determinar se ruído está incluído no espectro de frequência por meio de uma comparação com uma quantidade característica que foi modelada estatisticamente para cada frequência de ruído a ser detectada. Nesse caso, a parte de detecção de ruído B 103 pode detectar ruído usando, por exemplo, um MFCC (Mel Frequency Cepstrum Coefficient) e um modelo de ruído.
[0055] O MFCC é uma quantidade característica considerando a natureza do sentido de audição dos seres humanos e é bem usada no reconhecimento de voz ou semelhante. Um procedimento de cálculo de MFCC inclui, para um espectro de frequência obtido de FFT, (1) obtenção do valor absoluto; (2) realização de filtragem usando um banco de filtros tendo intervalos iguais na escala de Mel(uma escala de tom de um som de acordo com o sentido de audição dos seres humanos) e obtenção da soma dos espectros das respectivas bandas de frequências; (3) cálculo do logaritmo; (4) realização de transformação discreta de co-seno (DCT); e (5) extração de componentes de baixa ordem.
[0056] O modelo de ruído é um obtido de modelagem de uma característica de ruído. Por exemplo, uma característica de ruído. Por exemplo, uma característica de ruído é modelada usando um Gaussian Mixture Model (GMM - Modelo de Mistura Gaussiano) ou semelhante e os seus parâmetros são estimados usando quantidades características (por exemplo, MFCC) extraídas de um banco de dados de ruídos previamente coletados. Em um caso de GMM, pesos, médias, covariância e/ou semelhantes de respectivas distribuições gaussianas multidimensionais são usados como os parâmetros do modelo.
[0057] A parte de detecção de ruído B 103 extrai MFCC do espectro de frequência Sif introduzido e calcula a probabilidade do modelo de ruído. A probabilidade do modelo de ruído indica a probabilidade de que o MFCC extraído corresponda ao modelo de ruído. Isto é, como a probabilidade do modelo de ruído é maior, a probabilidade de que o sinal sonoro introduzido corresponda ao ruído é maior.
[0058] A probabilidade L pode ser obtida da fórmula (3) a seguir, no caso onde o processo é realizado para GMM:
Figure img0006
[0059] Aqui, X denota o vetor de MFCC, Wk denota o peso da k-th distribuição e Nk denota a k-th distribuição gaussiana multidimensional. A parte de detecção de ruído B 103obtém a probabilidade L da fórmula (3). Então, por exemplo, quando a probabilidade L obtida é maior do que um limite predeterminado, a parte de detecção de ruído B 103 determina que ruído está incluído no sinal sonoro introduzido no quadro alvo de detecção. Por outro lado, quando a probabilidade obtida é menor do que ou igual ao limite predeterminado, a parte de detecção de ruído B 103 determina que nenhum ruído está incluído no sinal sonoro introduzido no quadro alvo de detecção. Então, a parte de detecção de ruído B 103 envia a informação de detecção B IdB, indicando o resultado da determinação.
[0060] É notado que pelo aparelho de processamento 100 de acordo com a primeira concretização, a detecção de ruído é realizada pelas duas partes de detecção de ruído, isto é, a parte de detecção de ruído A 102 e a parte de detecção de ruído B 103. Contudo, uma concretização da presente invenção não está assim limitada. A detecção de ruído pode ser realizada por três ou mais das partes de detecção de ruído em lugar das duas.
<< Estimativa de Espectro de Amplitude>>
[0061] Em seguida, um método de estimativa de um espectro de amplitude de ruído pela parte de estimativa de espectro de amplitude de ruído 104 será descrito.
[0062] A figura 4 ilustra uma configuração funcional da parte de estimativa de espectro de amplitude de ruído 104 de acordo com a primeira concretização.
[0063] Conforme mostrado na figura 4, a parte de estimativa de espectro de amplitude de ruído 104 inclui uma parte de cálculo de espectro de amplitude 41, uma parte de determinação 42, uma parte de controle de armazenamento A 43, uma parte de controle de armazenamento B 44, uma parte de armazenamento de espectro de amplitude 45, uma parte de armazenamento de espectro de amplitude 46, uma parte de estimativa de espectro de amplitude de ruído A 47a e uma parte de estimativa de espectro de amplitude de ruído B 47b.
[0064] A parte de cálculo de espectro de amplitude 41 calcula um espectro de amplitude Sa do espectro de frequência Sif obtido da conversão do sinal sonoro introduzido Sis pela parte de conversão de espectro de frequência 101e envia o espectro de amplitude As. A parte de cálculo de espectro de amplitude 41, por exemplo, calcula o espectro de amplitude A de um espectro de frequência X (número complexo) de uma certa frequência pela fórmula (4) a seguir:
Figure img0007
[0065] Na parte de determinação 42, a informação de detecção A IdA da parte de detecção de ruído A 102 e a informação de detecção B IdB da parte de detecção de ruído B 103 são introduzidas e, com base na informação de detecção A IdA e na informação de detecção B IdB, a parte de determinação 42 envia um sinal de execução 1 Se1 para a parte de estimativa de espectro de amplitude de ruído A 47a ou envia um sinal de execução 2 Se2 para a parte de estimativa de espectro de amplitude de ruído B 47b.
[0066] A parte de estimativa de espectro de amplitude de ruído A 47a ou a parte de estimativa de espectro de amplitude de ruído B 47b estima, com base no sinal de execução 1 Se1 ou no sinal de execução 2 Se2 enviado pela parte de determinação 42, um espectro de amplitude de ruído Seno do espectro de amplitude Sa calculado pela parte de cálculo de espectro de amplitude 41.
(Estimativa de Espectro de Amplitude de Ruído pela Parte de Estimativa de Espectro de Amplitude de Ruído A)
[0067] A parte de estimativa de espectro de amplitude de ruído A 47a realiza a estimativa de espectro de amplitude de ruído Seno, quanto tendo recebido o sinal de execução 1 Se1 da parte de determinação 42.
[0068] Quando tendo recebido o sinal de execução 1 Se1 da parte de determinação 42, a parte de estimativa de espectro de amplitude de ruído A 47a obtém o espectro de amplitude Sa do quadro correntemente processado (daqui em diante, referido, simplesmente, como o “quadro corrente”) da parte de cálculo de espectro de amplitude 41 e um espectro de amplitude passado Spa, armazenado na parte de armazenamento de espectro de amplitude 45 Em seguida, a parte de estimativa de espectro de amplitude de ruído A 47a estima o espectro de amplitude de ruído Seno usando a diferença entre o espectro de amplitude Sa do quadro corrente e o espectro de amplitude passado Spa.
[0069] Por exemplo, a parte de estimativa de espectro de amplitude de ruído A 47a estima o espectro de amplitude de ruído Seno usando a diferença entre o espectro de amplitude Sa do quadro corrente e o espectro de amplitude passado (Spa) do quadro que ocorre imediatamente antes do último quadro em que ruído é gerado. Alternativamente, por exemplo, a parte de estimativa de espectro de amplitude de ruído A 47a pode estimar o espectro de amplitude de ruído Seno usando a diferença entre o espectro de amplitude do quadro corrente e a média do espectro de amplitude de múltiplos quadros, imediatamente antes do último quadro em que ruído é gerado.
[0070] Como será descrito a seguir usando a figura 6 (fluxograma), a parte de estimativa de espectro de amplitude de ruído A 47a estima o espectro de amplitude de ruído Seno em um caso onde ruído é detectado no quadro corrente ou o quadro corrente é incluído dentro dos quadros contados após o ruído ter sido detectado mais recentemente. No caso onde ruído é detectado no quadro corrente, “o último quadro em que ruído é gerado” mencionado acima corresponde ao quadro corrente. No caso onde o quadro corrente é incluído dentro de n quadros após o ruído ter sido detectado mais recentemente, o “último quadro em que ruído é gerado” mencionado acima corresponde ao quadro em que o ruído foi detectado mais recentemente.
[0071] A fim de reduzir as áreas de armazenamento, a parte de armazenamento de espectro de amplitude 45, de preferência, armazena apenas o espectro (ou espectros) de amplitude Sa a ser usado para a estimativa realizada pela parte de estimativa de espectro de amplitude de ruído A 47a.
[0072] A parte de controle de armazenamento A 43 controla o espectro (ou espectros) de amplitude a ser armazenado pela parte de armazenamento de espectro de amplitude 45. Por exemplo, na parte de controle de armazenamento A 43, um armazenamento temporário para armazenar um ou múltiplos quadros de espectro (ou espectros) de amplitude é proporcionado. Então, é possível reduzir as áreas de armazenamento a serem usadas pela parte de armazenamento de espectro de amplitude 45, como um resultado da parte de controle de armazenamento A 43 realizando controle, de modo que o espectro (ou espectros) de amplitude armazenado pelo armazenamento temporário é(são) armazenado(s) na parte de armazenamento de espectro de amplitude 45 em uma maneira de sobrescrição em um caso onde ruído é detectado do quadro corrente.
(Estimativa de Espectro de Amplitude de Ruído pela Parte de Estimativa de Espectro de Amplitude B)
[0073] Quando tendo recebido o sinal de execução 2 Se2 da parte de determinação 42, a parte de estimativa de espectro de amplitude de ruído B 47b estima o espectro de amplitude de ruído Seno com base em uma função de atenuação obtida dos espectros de amplitude de ruído estimados após o ruído ser detectado.
[0074] Como será descrito mais tarde usando a figura 6 (fluxograma), a parte de estimativa de espectro de amplitude de ruído B 47b estima o espectro de amplitude de ruído Seno em um caso onde nenhum ruído é detectado no quadro corrente e o quadro corrente não está incluído dentro de n quadros contados após o ruído ter sido detectado mais recentemente.
[0075] A parte de estimativa de espectro de amplitude de ruído B 47b supõe que a amplitude de ruído se atenua exponencialmente e obtém uma função que se aproxima da amplitude de ruído estimada em múltiplos quadros que ocorrem imediatamente após o ruído ser detectado pela parte de detecção de ruído A 102 ou a parte de detecção de ruído B 103 .
[0076] A figura 5 mostra um exemplo em que os valores das amplitudes A1, A2 e A3 de três quadros que ocorrem após ruído ser detectado são plotados em um gráfico em que a abscissa denota o tempo “t” e a ordenada denota o logaritmo da amplitude A de ruído.
[0077] A parte deestimativa de espectro de amplitude de ruído B 47b primeiro obtém a inclinação de uma função linear aproximada para as amplitudes A1, A2 e A3 dos múltiplos quadros que ocorrem na e após a geração do ruído usando a fórmula (5) a seguir:
Figure img0008
[0078] A amplitude A do ruído se atenua de acordo com a inclinação “a” obtida da fórmula (5), quadro por quadro. Desse modo, a amplitude Am do ruído do m-th quadro após a detecção do ruído pode ser obtida da fórmula (6) a seguir:
Figure img0009
[0079] Desse modo, a parte de estimativa de espectro de amplitude de ruído B 47b pode estimar o espectro de amplitude de ruído Seno com base na função de atenuação obtida do espectro de amplitude de ruído dos múltiplos quadros que ocorrem após a detecção do ruído.
[0080] É notado que a função de atenuação mostrada na fórmula (6) é obtida, de preferência, das amplitudes dos múltiplos quadros que são o último quadro do qual a parte de detecção de ruído A 102 ou a parte de detecção de ruído B 103 detecta o ruído e os quadros subsequentes. O número dos múltiplos quadros a serem usados para obter a função de atenuação pode ser determinada apropriadamente. Ainda, embora a função de atenuação seja suposta como sendo a função exponencial na concretização, a função de atenuação não está assim limitada. Alternativamente, a função de atenuação pode ser obtida como outra função tal como uma função linear.
[0081] Ainda, como a amplitude do ruído do quadro ocorre antes de o quadro corrente ser usado para a estimativa com a fórmula (6), é preferível usar a amplitude do ruído do quadro que ocorre após a detecção do ruído e imediatamente antes do quadro corrente.
[0082] Quando tendo recebido o sinal de execução 2 Se2 da parte de determinação 42, a parte de estimativa de espectro de amplitude de ruído B 47b obtém da parte de armazenamento de espectro de amplitude de ruído 46 os espectros de amplitude de ruído Spn (veja a figura 4) estimados no tempo passado necessário para se obter o espectro de amplitude de ruído do quadro corrente pelo método mencionado acima.
[0083] A parte de armazenamento de espectro de amplitude de ruído 46 armazena os espectros de amplitude de ruído Seno estimados pela parte de estimativa de espectro de amplitude de ruído A 47a ou pela parte de estimativa de espectro de amplitude de ruído B 47b. A fim de reduzir as áreas de armazenamento, é preferível armazenar na parte de armazenamento de espectro de amplitude de ruído 46 apenas os espectros de amplitude de ruído a serem usados para a estimativa do espectro de amplitude de ruído Seno pela parte de estimativa de espectro de amplitude de ruído B 47b. Os espectros de amplitude de ruído Spn a serem usados para a estimativa do espectro de amplitude de ruído Seno pela parte de estimativa de espectro de amplitude de ruído B 47b são, como mencionado acima, os espectros de amplitude de ruído dos múltiplos quadros que ocorrem após a detecção do ruído (para obtenção da função de atenuação e o espectro de amplitude de ruído do quadro que ocorre imediatamente antes do quadro corrente (para obtenção do espectro de amplitude de ruído do quadro corrente, usando a função de atenuação) .
[0084] A parte de controle de armazenamento B 44 realiza o controle de modo que apenas os espectros de amplitude de ruído necessários para obtenção da função de atenuação e o espectro de amplitude de ruído necessário para obtenção do espectro de amplitude de ruído do quadro corrente usando a função de atenuação são armazenados na parte de armazenamento de espectro de amplitude de ruído 46.
[0085] Por exemplo, as áreas de armazenamento são proporcionadas na parte de armazenamento de espectro de amplitude de ruído 46 para armazenamento dos múltiplos quadros (por exemplo, três) que ocorrem após o ruído ser detectado e o espectro de amplitude de ruído do quadro que ocorre imediatamente antes do quadro corrente. A parte de controle de armazenamento B 44 realiza o controle de modo que, de acordo com o período de tempo decorrido após o ruído ser detectado, o espectro de amplitude de ruído Seno estimado pela parte de estimativa de espectro de amplitude de ruído A 47a são armazenados nas respectivas áreas de armazenamento da parte de armazenamento de espectro de amplitude de ruído 46 na maneira de sobrescrição. Por meio desse controle, é possível reduzir as áreas de armazenamento a serem usadas pela parte de armazenamento de espectro de amplitude de ruído 46 .
[0086] Como descrito acima, na parte de estimativa de espectro de amplitude de ruído 104, qualquer uma, dentre a parte de estimativa de espectro de amplitude de ruído A 47a e a parte de estimativa de espectro de amplitude de ruído B 47b, estima o espectro de amplitude de ruído Seno com base no sinal de execução 1 ou 2 (Se1 ou Se2) enviado pela parte de determinação 42 .
(Processo de Estimativa de Espectro de Amplitude de Ruído pela Parte de Estimativa de Espectro de Amplitude de Ruído)
[0087] A figura 6 ilustra um fluxograma do processo de estimativa do espectro de amplitude de ruído Seno pela parte de estimativa de espectro de amplitude de ruído 104 de acordo com a primeira concretização.
[0088] Quando o espectro de frequência Sif foi introduzido na parte de estimativa de espectro de amplitude de ruído 104 da parte de conversão de espectro de frequência 101, a parte de cálculo de espectro de amplitude 41 calcula o espectro de amplitude Sa do espectro de frequência Si, na etapS1. A seguir, na etapa S2, a parte de determinação 42 determina partir da informação de detecção A IdA e da informação de detecção B IdB se qualquer uma dentre a parte de detecção de ruído A 102 e a parte de detecção de ruído B 103 detectou ruído do som introduzido.
[0089] Quando ruído é incluído no quadro do sinal sonoro introduzido Sis (etapa S2 SIM), a parte de controle de armazenamento A 43 armazena o espectro de amplitude (ou espectros), temporariamente armazenados no armazenamento temporário, na parte de armazenamento de espectro de amplitude 45, na etapa S3.
[0090] A seguir, na etapa S4, a parte de determinação 42 envia o sinal de execução 1 Se1 e a parte de estimativa de espectro de amplitude de ruído A 47a estima o espectro de amplitude de ruído Seno na etapa S5. Em seguida, na etapa S6, a parte de controle de armazenamento B 44 armazena o espectro de amplitude de ruído Seno estimado pea47a na parte de armazenamento de espectro de amplitude de ruído 46 na área de armazenamento correspondendo ao tempo decorrido desde a última detecção do ruído na maneira de sobreposição e o processo é acabado.
[0091] Em um caso onde nenhum ruído é incluído no quadro do sinal sonoro introduzido (etapa S2 NÃO), a parte de determinação 42 determina se o quadro correntemente processado está incluído dentro de n quadros contados após a última detecção de ruído, na etapa S7. Em um caso onde o quadro correntemente processado está incluído dentro de n quadros contados após a última detecção de ruído (etapa S7 SIM) , a parte de estimativa de espectro de amplitude de ruído A 47a estima o espectro de amplitude de ruído Seno nas etapas S4 a S6 e o processo é acabado.
[0092] Em um caso onde o quadro correntemente processado não está incluído dentro de n quadros contados após a última detecção de ruído (etapa S7 NÃO), a parte de determinação 42 envia o sinal de execução Se2, na etapa S8. Em seguida, na etapa S9, a parte de estimativa de espectro de amplitude de ruído B 47b estima o espectro de amplitude de ruído Seno. Depois disso, na etapa S6, a parte de controle de armazenamento B 44 armazena o espectro de amplitude de ruído Seno estimado pela parte de estimativa de espectro de amplitude de ruído B 47b na parte de armazenamento de espectro de amplitude de ruído 46 e o processo está acabado.
[0093] Desse modo, a parte de estimativa de espectro de amplitude de ruído 104 estima o espectro de amplitude de ruído Seno do ruído incluído no som introduzido por qualquer uma dentre a parte de estimativa de espectro de amplitude de ruído A 47a e a parte de estimativa de espectro de amplitude de ruído B 47b e as duas partes de estimativa de espectro de amplitude de ruído 47a e 47b estimam o espectro de amplitude de ruído Seno nos diferentes métodos. Desse modo, pelo fornecimento das duas partes de estimativa de espectro de amplitude de ruído 47a e 47b estimando o espectro de amplitude de ruído Seno nos diferentes métodos, é possível estimar o espectro de amplitude de ruído Seno do ruído incluído no som introduzido, independente do tipo e/ou do tempo de geração do ruído.
[0094] É notado que, conforme mostrado na figura 7, na parte de estimativa de espectro de amplitude de ruído 104, as partes de estimativa de espectro de amplitude de ruído A a N (47a a 47n) para estimar o espectro de amplitude de ruído Seno com base na informação de detecção A IdA e na informação de detecção B IdB.
[0095] No caso da figura 7, como um dos métodos diferentes de estimativa do espectro de amplitude de ruído Seno das partes de estimativa de espectro de amplitude de ruído A a N, outros que não aqueles das partes de estimativa de espectro de amplitude de ruído A e B (47a e 47b) mostrados na figura 4, um método de estimativa do espectro de amplitude de ruído Seno usando a diferença entre o espectro de amplitude do quadro corrente e o espectro de amplitude da média de múltiplos espectros e amplitude obtidos antes da detecção mais recente de ruído pode ser usada, por exemplo. Alternativa ou adicionalmente, também é possível usar um método de obtenção do espectro de amplitude de ruído Seno usando a função de atenuação para ser uma função linear ou semelhante (em lugar da função exponencial mencionada acima) obtida de espectros de amplitude de ruído estimados na e após a geração de ruído mais recente, por exemplo.
[0096] No caso da figura 7, a parte de determinação 42 é ajustada para selecionar o método apropriado de estimativa do espectro de amplitude de ruído Seno de acordo com a(s) magnitude(s) de uma flutuação de energia e/ou um erro preditivo linear obtido pela parte de detecção de ruído A 102 e incluído na informação de detecção B Ida ou a probabilidade obtida pela parte de detecção de ruído B 103 e incluído na informação de detecção B IdB e enviam sinais de execução 1 a N (Se1 a Sen).
<<Subtração de Espectro de Ruído>>
[0097] A parte de subtração de espectro de ruído 105 do aparelho de processamento 100 subtrai um espectro de frequência de ruído obtido do espectro de amplitude de ruído Seno estimado pela parte de estimativa de espectro de amplitude de ruído 104 do espectro de frequência Sif obtido da conversão pela parte de conversão de espectro de frequência 101 e envia um espectro de frequência de ruído reduzido Sof.
[0098] Um espectro de frequência SA de um som (o espectro de frequência de ruído reduzido Sof) pode ser obtido da fórmula (7) a seguir, onde X denota um espectro de frequência (o espectro de frequência Sif) e DA denota um espectro de frequência estimado de ruído (obtido do espectro de amplitude de ruído Seno):
Figure img0010
[0099] Na fórmula (7) acima, “1” denota o número de quadro e “k” denota o número de espectro.
[0100] Desse modo, a parte de subtração de espectro de ruído 105 subtrai o espectro de amplitude de ruído Seno do espectro de frequência (Sif), obtém o espectro de frequência de ruído reduzido Sof e envia o espectro de frequência de ruído reduzido Sof para a parte de conversão inversa de espectro de frequência 106.
[0101] Como descrito acima, no aparelho de processamento 100 de acordo com a primeira concretização, as múltiplas partes são proporcionadas para estimar o espectro de amplitude de ruído Seno (partes de estimativa de espectro de amplitude de ruído) nos diferentes métodos, a parte de estimativa de espectro de amplitude de ruído adequada é selecionada com base no resultado da detecção de ruído do som introduzido e o espectro de amplitude de ruído Seno é estimado. Desse modo, independente do tipo e do tempo de geração de ruído, o aparelho de processamento 100 pode estimar o espectro de amplitude de ruído Seno de ruído incluído no som introduzido com alta precisão e envia o sinal sonoro obtido da redução do ruído do som introduzido.
[0102] É notado que o aparelho de processamento 100 de acordo com a primeira concretização pode ser aplicado a um aparelho eletrônico ou semelhante que grava um som introduzido ou transmite um som de entrada para outro aparelho. Exemplos específicos do aparelho eletrônico ou semelhante incluem uma câmera de vídeo, uma câmera digital, um gravador de IC, um telefone celular, um terminal de conferência (um terminal para uma conferência de vídeo) e assim por diante.
Segunda Concretização
[0103] Em seguida, uma segunda concretização será descrita usando figuras. É notado que para os mesmos elementos/ componentes que aqueles da primeira concretização descrita acima, os mesmos numerais de referência/ letras são dados e descrição em duplicata será omitida.
<Configuração Funcional de Sistema de Processamento>
[0104] A figura 8 é um diagrama em blocos ilustrando uma configuração funcional de um sistema de processamento 300 de acordo com a segunda concretização. Conforme mostrado na figura 8, o sistema de processamento 300 inclui aparelhos de processamento 100 e 200 conectados via uma rede 400.
[0105] O aparelho de processamento 100 inclui uma parte de conversão de espectro de frequência 101, uma parte de detecção de ruído A 102, uma parte de detecção de ruído B 103, uma parte de estimativa de espectro de amplitude de ruído 104, uma parte de subtração de espectro de ruído 105, uma parte de conversão inversa de espectro de frequência 106, uma parte de entrada/ saída de som 10 7 e uma parte de transmissão/ recepção 108.
[0106] A parte de entrada/ saída de som 107, por exemplo, coleta um som (voz e/ou semelhante) que ocorre em torno do aparelho de processamento 100 e emite um sinal sonoro ou envia um som (voz e/ou semelhante) com base em um sinal sonoro introduzido.
[0107] A parte de transmissão/ recepção 108 transmite dados, tais como um sinal sonoro do qual ruído é reduzido pelo aparelho de processamento 100, para outro aparelho conectado via a rede 400. Ainda, a parte de transmissão/ recepção 108 recebe dados tais como dados de som de outro aparelho conectado via a rede 400.
[0108] Conforme descrito acima para a primeira concretização, no aparelho de processamento 100 de acordo com a segunda concretização, as múltiplas partes são proporcionadas para estimar o espectro de amplitude de ruído Seno (partes de estimativa de espectro de amplitude de ruído) nos diferentes métodos, a parte de estimativa de espectro de amplitude de ruído adequada é selecionada com base no resultado da detecção de ruído do som introduzido e o espectro de amplitude de ruído Seno é estimado. Desse modo, independente do tipo e/ou do tempo de geração de ruído, o100 pode estimar o espectro de amplitude de ruído Seno de ruído incluído no som introduzido com alta precisão e enviar o sinal sonoro obtido da redução do ruído do som introduzido.
[0109] Ainda, o aparelho 200 conectado ao aparelho de processamento 100 via a rede 400 inclui uma parte de entrada/ saída de som 201 e uma parte de transmissão/ recepção 202.
[0110] A parte de entrada/ saída de som 201, por exemplo, coleta um som (voz e/ ou semelhante) que ocorre em torno do aparelho de processamento 200 e gera um sinal sonoro ou envia um som (voz e/ou semelhante) com base em um sinal sonoro introduzido.
[0111] A parte de transmissão/ recepção 202 transmite dado, como um sinal sonoro obtido pela parte de entrada/ saída de som 201 para outro aparelho conectado via a rede 400. Ainda, a parte de transmissão/ recepção 202 recebe dados como um dado sonoro de outro aparelho conectado via a rede 400.
<Configuração de hardware do sistema de processamento>
[0112] A figura 9 ilustra uma configuração de hardware do sistema de processamento 300 de acordo com a segunda concretização.
[0113] O sistema de processamento 300 inclui um controlador 110, uma parte de I/F de rede 115, uma parte de I/F de meio de gravação 116 e um dispositivo de entrada/ saída de som 118. O controlador 110 inclui uma CPU 111, umHDD 112, uma ROM 113 e uma RAM 114.
[0114] O dispositivo de entrada/ saída de som 118 inclui, por exemplo, um microfone coletando um som (voz e/ou semelhante) ocorrendo em torno do aparelho de processamento 100 e gerando um sinal sonoro, um alto-falante enviando um sinal sonoro para o lado de fora e/ou semelhante.
[0115] A parte de processamento 200 inclui uma CPU 211, um HDD 212, uma ROM 213, uma RAM 214, uma parte de I/F de rede 215 e um dispositivo de entrada/ saída de som 216.
[0116] A CPU 211 inclui uma unidade lógica e aritmética, lê um programa e dados de um dispositivo de armazenamento, como o HDD 212 ou ROM 213, na RAM 214, executa processos e, assim, desempenha as respectivas funções do aparelho de processamento 200.
[0117] O HDD 212 é um dispositivo de armazenamento não volátil armazenando programas e dados. Os programas e dados armazenados incluem um OS (Operating System - Sistema Operacional) que é software básico controlando a totalidade do aparelho de processamento 200, software de aplicativo, proporcionando várias funções no OS e assim por diante.
[0118] A ROM 213 é uma memória semicondutora não volátil (dispositivo de armazenamento) que tem uma capacidade de armazenamento de um(ns) programa(s) e/ou dados mesmo após o suprimento de energia ser desligado. A ROM 213 armazena programas e dados, como um BIOS (Basic Input/ Output System - Sistema Básico de Entrada/ Saída) a serem executados quando o aparelho de processamento 200 é iniciado, configurações de OS, configurações de rede e assim por diante. A RAM 214 é uma memória semicondutora volátil (dispositivo de armazenamento) para armazenar, temporariamente, programa(s) e/ou dados.
[0119] A parte de I/F de rede 215 é uma interface entre um(ns) dispositivo(s) periférico(s) tendo uma função e comunicação, conectada via a rede 400 construída por um curso e transmissão de dados, como um circuito cabeado e/ou sem fio, como uma LAN (Local Área Network - Rede de Área Local), uma WAN (Wide Área Network - Rede de Longa Distância) ou semelhante e o próprio aparelho de processamento 200.
[0120] O dispositivo de entrada/ saída de som 216 inclui, por exemplo, um microfone coletando um som (voz e/ou semelhante) que ocorre em torno do aparelho de processamento 200 e gerando um sinal sonoro, um alto-falante enviando um sinal sonoro para o lado de fora e/ou semelhante.
[0121] No sistema de processamento 300, por exemplo, o aparelho de processamento 100 pode gerar um sinal sonoro do qual ruído é reduzido, de um sinal introduzido, incluindo um som (voz e/ou semelhante) pronunciado pelo usuário do aparelho de processamento 100 e transmitir o sinal sonoro gerado para o aparelho de processamento 200 via a parte de transmissão/ recepção 108. O aparelho de processamento 200 recebe o sinal sonoro do qual ruído é assim reduzido transmitido do aparelho de processamento 100, via a parte de transmissão/ recepção 202 e envia o sinal sonoro para o lado de fora via a parte de entrada/ saída de som 201. O usuário do aparelho de processamento 200, assim, recebe o sinal sonoro do qual ruído é reduzido do aparelho de processamento 100 e, assim, pode capturar, claramente, o som pronunciado pelo usuário do aparelho de processamento 100.
[0122] Ainda, por exemplo, o aparelho de processamento 200 pode obter um sinal sonoro incluindo um som (voz) pronunciado pelo usuário do aparelho de processamento 200 via a parte de entrada/ saída de som 201 do aparelho de processamento 200 e transmitir o sinal sonoro para o aparelho de processamento 100 via a parte de transmissão/ recepção 202. Nesse caso, o aparelho de processamento 100 pode reduzir o ruído do sinal sonoro recebido via a parte de transmissão/ recepção 108 através da realização de estimativa do espectro de amplitude de ruído e assim por diante e enviar o sinal sonoro via a parte de entrada/ saída de som 107. Desse modo, o usuário do aparelho de processamento 100 pode capturar claramente o som pronunciado pelo usuário do aparelho de processamento 200 com um resultado do aparelho de processamento 100 enviando o sinal sonoro recebido após a redução do ruído.
[0123] Desse modo, no sistema de processamento 300 de acordo com a segunda concretização, é possível gerar um sinal sonoro obtido da redução de ruído de um sinal sonoro introduzido para a parte de entrada/ saída de som 107 ou um sinal sonoro recebido via a parte de transmissão/ recepção 108 do aparelho de processamento 100, com base no espectro de amplitude de ruído estimado. Desse modo, é possível realizar conversação, gravação e/ou semelhante por um som claro obtido do ruído que está sendo reduzido, entre os usuários do aparelho de processamento 100 e do aparelho de processamento 200 conectados via a rede 400.
[0124] É notado que o número dos aparelhos de processamento incluídos no sistema de processamento 300, por exemplo, não está limitado aqueles da segunda concretização. O sistema de processamento 300 pode incluir três ou mais aparelhos de processamento. Ainda, o sistema de processamento 300, de acordo com a segunda concretização, pode ser aplicado a um sistema em que, por exemplo, múltiplos PCs, PDAS, telefones celulares, terminais de conferência e/ou semelhantes transmitem/ recebem um som ou semelhante.
Terceira Concretização
[0125] Em seguida, uma terceira concretização será descrita usando figuras. É notado que para os mesmos elementos/ componentes que aqueles da primeira e segunda concretizações descritas acima, os mesmos números de referência/ letras são dados e descrição em duplicata será omitida.
<Configuração Funcional de Aparelho de Processamento>
[0126] A figura 10 é um diagrama em blocos ilustrando uma configuração funcional de um aparelho de processamento 100 de acordo com a terceira concretização.
[0127] Conforme mostrado na figura 10, o aparelho de processamento 100 inclui um terminal de entrada IN, uma parte de conversão de espectro de frequência 101, uma parte de detecção de ruído A 102, uma parte de detecção de ruído B 103, uma parte de estimativa de espectro de amplitude de ruído 104, uma parte de subtração de espectro de ruído 105, uma parte de conversão inversa de espectro de frequência 106, uma parte de ajuste de resistência à redução 109 e um terminal de saída OUT.
[0128] A parte de ajuste de resistência à redução 109 ajusta um nível de redução de ruído de um sinal sonoro introduzido, que foi introduzido no aparelho de processamento 100 através do envio de um sinal de ajuste de resistência à redução Srs para a parte de estimativa de espectro de amplitude de ruído 104 com base em informação introduzida do usuário.
<Configuração de Hardware de Aparelho de Processamento>
[0129] A figura 11 ilustra uma configuração de hardware do aparelho de processamento 100.
[0130] Conforme mostrado na figura 11, o aparelho de processamento 100 inclui um controlador 110, parte de I/F de rede 115, uma parte de I/F de meio de gravação 116, um suporte de válvula secundária 119, um terminal de entrada IN e um terminal de saída OUT. O controlador 110 inclui uma CPU 111, um HDD (Hard Disk Drive) 112, uma ROM (Read Only Memory) 113 e uma RAM (Random Access Memory) 114.
[0131] O painel de operação 119 é hardware incluindo um dispositivo de entrada, como botões para recebimento de operações do usuário, uma tela de operação, tal como um painel de cristal líquido, tendo uma função de painel de toque e/ou semelhante. No painel de operação 119, níveis de redução de ruído de um sinal sonoro introduzido no aparelho de processamento 100, ou semelhante, são exibidos de tal maneira que o usuário pode selecionar um dos níveis exibidos. A parte de ajuste de resistência à redução 109 envia o sinal de ajuste de resistência à redução Srs com base na informação introduzida pelo usuário no painel de operação 119.
<Configuração Funcional de Parte de Estimativa de Espectro de Amplitude de Ruído>
[0132] A figura 12 ilustra uma configuração funcional da parte de estimativa de espectro de amplitude de ruído 104 de acordo com a terceira concretização.
[0133] Conforme mostrado na figura 12, a parte de estimativa de espectro de amplitude de ruído 104 inclui uma parte de cálculo de espectro de amplitude 41, uma parte de determinação 42, uma parte de controle de armazenamento A 43, uma parte de controle de armazenamento B 44, uma parte de armazenamento de espectro de amplitude 45, uma parte de armazenamento de espectro de amplitude de ruído 46, uma parte de estimativa de espectro de amplitude de ruído A 47a, uma parte de ajuste de atenuação 48 e uma parte de ajuste de amplitude 49.
[0134] A parte de ajuste de atenuação 48 é um exemplo de uma parte de ajuste de ruído e envia um sinal de ajuste de atenuação Saa para a parte de estimativa de espectro de amplitude de ruído B 47b com base no sinal de ajuste de resistência à redução Srs enviado pela 109.
[0135] Como na primeira concretização, a parte de estimativa de espectro de amplitude de ruído B 47b obtém a inclinação “a” da função linear aproximada para múltiplos quadros que ocorrem na e após a geração de ruído pela fórmula (5) mencionada acima. A seguir, a parte de estimativa de espectro de amplitude de ruído B 47b obtém a amplitude Am do ruído do m-ésimo quadro contado após a detecção do ruído pela fórmula (8) a seguir:
Figure img0011
[0136] O coeficiente “g” na fórmula (8) é um valor determinado de acordo com o sinal de ajuste de resistência à redução Srs introduzido da parte de ajuste de resistência à redução 109 para a parte de ajuste de atenuação 48.
[0137] Em um caso de redução de ruído de um sinal sonoro introduzido, resistências de redução de ruído de 1 a 3, em que um nível de redução de ruído é diferente, por exemplo, são exibidos no painel de operação 119, o usuário deve selecionar um deles e a parte de ajuste de resistência à redução 109 envia a resistência à redução de ruído selecionada para a parte de ajuste de atenuação 48 como o sinal de ajuste de resistência à redução Srs. A parte de ajuste de atenuação 48 determina um sinal de ajuste de atenuação Saa de acordo com uma tabela 1 mostrada abaixo, por exemplo, de acordo com o sinal de ajuste de resistência à redução Srs enviado pela parte de ajuste de resistência à redução 109 e transmite o sinal de ajuste de atenuação Saapara a parte de estimativa de espectro de amplitude de ruídoB 47b.Tabela 1
Figure img0012
[0138] No exemplo mostrado na Tabela 1, o coeficiente “g” se torna menor à medida que a resistência à redução do ruído se torna maior e o espectro de amplitude de ruído estimado pela parte de estimativa de espectro de amplitude de ruído B 47b se torna maior de acordo com a fórmula (8) . Desse modo, o ruído é muito reduzido do sinal sonoro introduzido. Em contraste, o coeficiente “g” se torna maior enquanto a resistência à redução do ruído se torna menor e o espectro de amplitude de ruído estimado pela parte de estimativa de espectro de amplitude de ruído B 47b se torna menor de acordo com a fórmula (8). Desse modo, o ruído reduzido do sinal sonoro introduzido se torna menor.
[0139] Ainda, a parte de ajuste de amplitude 49 é um exemplo de uma parte de ajuste de ruído e ajusta a magnitude do espectro de amplitude de ruído Am obtido pela parte de estimativa de espectro de amplitude de ruído A 47a ou parte de estimativa de espectro de amplitude de ruído B 47b, com base no sinal de ajuste de resistência à redução Srs enviado pela parte de ajuste de resistência à redução 109, de acordo com a fórmula (9) a seguir:
Figure img0013
[0140] O coeficiente “G” na fórmula (9) é um valor, por exemplo, determinado de acordo coma Tabela 2 abaixo de acordo com o sinal de ajuste de resistência à redução Srs enviado pela 109:Tabela 2
Figure img0014
[0141] A parte de ajuste de amplitude 49, desse modo,determina o valor de “G” de acordo com o sinal de ajuste de resistência à redução Srs e envia o espectro de amplitude de ruído estimado Am’ (Seno) obtido de acordo com a fórmula (9). No exemplo mostrado na Tabela 2, em um caso onde a resistência à redução do ruído é menor, o espectro de amplitude de ruído estimado Am’ (Seno) a ser enviado é menor uma vez que o valor de “G” é menor. Ao contrário, em um caso onde a resistência à redução do ruído é maior, o espectro de amplitude de ruído estimado Am’ (Seno) a ser enviado é maior, uma vez que o valor de “G” é maior. É notado que como o valor de “G”, um valor diferente pode ser dado para cada frequência do espectro de amplitude Sa calculado.
[0142] Desse modo, no aparelho de processamento 100 de acordo com a terceira concretização, a parte de estimativa de espectro de amplitude de ruído 104 pode controlar a resistência do espectro de amplitude de ruído estimado Am’ (Seno) de acordo com o sinal de ajuste de resistência à redução Srs enviado pela parte de ajuste de resistência à redução 109 e, desse modo, e, assim, ajustar o nível de redução do ruído do sinal sonoro introduzido.
(Processo de Estimativa de Espectro de Amplitude de Ruído pela Parte de Estimativa de Espectro de Amplitude de Ruído)
[0143] A figura 13 ilustra um fluxograma do processo de estimativa do espectro de amplitude de ruído Seno pela parte de estimativa de espectro de amplitude de ruído 104 de acordo com a terceira concretização.
[0144] Quando o espectro de frequência Sif foi introduzido na parte de estimativa de espectro de amplitude de ruído 104 da parte de conversão de espectro de frequência 101, a parte de cálculo de espectro de amplitude 41 calcula o espectro de amplitude Sa do espectro de frequência Sif na etapa S11. Em seguida, na etapa S12, a parte de determinação 42 determina da informação de detecção A IdA e da informação de detecção B IdB se qualquer uma dentre a parte de detecção de ruído A 102 e a parte de detecção de ruído B 103 detectou ruído do som introduzido.
[0145] Quando ruído é incluído em um quadro do sinal sonoro introduzido Sis (etapa S12 SIM), a parte de controle de armazenamento A 43 armazena o espectro (ou espectros) de amplitude, armazenado, temporariamente, no armazenamento temporário na parte de armazenamento de espectro de amplitude 45, na etapa S13.
[0146] Em seguida, na etapa S14, a parte de determinação 42 envia o sinal de execução 1 Se1 e a parte de estimativa de espectro de amplitude de ruído A 47a estima o espectro de amplitude, na etapa S15. Após o que, na etapa S16, a parte de ajuste de amplitude 49 calcula o espectro de amplitude de ruído estimado Seno obtido pela fórmula (9) de acordo com o sinal de ajuste de resistência à redução Srs enviado pela parte de ajuste de resistência à redução 109.
[0147] Em seguida, na etapa S17, a parte de controle de armazenamento B 44 armazena o espectro de amplitude de ruído estimado Seno calculado pela parte de ajuste de amplitude 49 na parte de armazenamento de espectro de amplitude de ruído 46 na área de armazenamento correspondente ao tempo decorrido desde a última detecção do ruído na maneira de sobrescrição e o processo está acabado.
[0148] Em um caso onde nenhum ruído é incluído no quadro do sinal sonoro introduzido (etapa S12 NÃO), a parte de determinação 42 determina se o quadro correntemente processado está incluído dentro dos n quadros contados desde a última detecção do ruído, na etapa S18. Em um caso onde o quadro correntemente processado está incluído dentro dos n quadros contados desde a última detecção do ruído (etapa S18 SIM) , a parte de estimativa de espectro de amplitude de ruído A 47a estima o espectro de amplitude de ruído nas etapas S14 e S15.
[0149] Em um caso onde o quadro correntemente processado não está incluído dentro dos n quadros contados desde a última detecção do ruído (etapa S18 NÃO), a parte de determinação 42 envia o sinal de execução 2 Se2, na etapa S19. Em seguida, na etapa S20, a parte de ajuste de atenuação 48 gera o sinal de ajuste de atenuação Saa e envia o sinal de ajuste de atenuação Saa para a parte de estimativa de espectro de amplitude de ruído B 47b. Em seguida, na etapa S21, a parte de estimativa de espectro de amplitude de ruído B 47b estima o espectro de amplitude de ruído.
[0150] Após o que, na etapa S16, a parte de ajuste de amplitude 49 calcula o espectro de amplitude de ruído estimado Seno obtido pela fórmula (9) de acordo com a parte de ajuste de resistência à redução 109. Na etapa S17, a parte de controle de armazenamento B 44 armazena o espectro de amplitude de ruído estimado pela parte de estimativa de espectro de amplitude de ruído B 47b na parte de armazenamento de espectro de amplitude de ruído 46 e o processo é acabado.
[0151] Desse modo, a parte de estimativa de espectro de amplitude de ruído 104 estima o espectro de amplitude de ruído do ruído incluído no som introduzido por qualquer uma dentre a parte de estimativa de espectro de amplitude de ruído A 47a e a parte de estimativa de espectro de amplitude de ruído B 47b, as duas partes de estimativa de espectro de amplitude de ruído 47a e 47b estimando o espectro de amplitude de ruído nos diferentes métodos. Ao ter as duas partes de estimativa de espectro de amplitude de ruído 47a e 47b estimando o espectro de amplitude de ruído nos diferentes métodos, a parte de estimativa de espectro de amplitude de ruído 14 pode estimar o espectro de amplitude de ruído do ruído incluído no som introduzido, independente do tipo e/ou do tempo de geração do ruído.
[0152] Ainda, o aparelho de processamento 100 de acordo com a terceira concretização tem a parte de ajuste de resistência à redução 109 pode ajustar a resistência do espectro de amplitude de ruído Seno para ser estimada a partir do som introduzido e pode mudar o nível de redução de ruído do sinal sonoro inserido. Desse modo, o usuário pode mudar apropriadamente o nível de redução de ruído de acordo com uma situação. Isto é, o usuário pode realizar um ajuste para reduzir o nível de redução de ruído em um caso de desejo de reproduzir fielmente o som original. Também, o usuário pode realizar outro ajuste para aumentar o nível de redução de ruído em um caso de desejar reduzir o ruído do som original tanto quanto possível.
[0153] É notado que, conforme mostrado na figura 14, na parte de estimativa de espectro de amplitude de ruído 104, múltiplas partes de estimativa de espectro de amplitude de ruído A a N (47a a 47n) podem ser proporcionadas, as múltiplas partes de estimativa de espectro de amplitude de ruído A a N (47a a 47n) estimam o espectro de amplitude de ruído em métodos diferentes e, também múltiplas partes de ajuste de atenuação A a N (48a a 48n) podem ser proporcionadas. Nesse caso, uma das partes de estimativa de espectro de amplitude de ruído A a N (47a a 47n) selecionadas pela parte de determinação 42 com o correspondente dos sinais de execução Se1 a Sen estima o espectro de amplitude de ruído de acordo com o correspondente dos sinais de ajuste de atenuação A a N (SaaA a SaaN emitidos pelas partes de ajuste de atenuação correspondentes A a N (48a a 48n). Ainda, nesse caso, a parte de ajuste de amplitude 49 ajusta o espectro de amplitude de ruído estimado pela selecionada das partes de estimativa de espectro de amplitude de ruído A a N (47a a 47n) de acordo com o sinal de ajuste de resistência à redução Srs.
Quarta Concretização
[0154] Em seguida, uma quarta concretização será descrita usando figuras. É notado que para os mesmos elementos/ componentes que aqueles das concretizações descritas acima, os mesmos números de referência/ letras são dados, e descrição em duplicata será omitida.
<Configuração Funcional de Sistema de Processamento>
[0155] A figura 15 é um diagrama em blocos ilustrando uma configuração funcional de um sistema de processamento 300 de acordo com a quarta concretização. Conforme mostrado na figura 15, o sistema de processamento 300 inclui aparelhos de processamento 100 e 200 conectados via uma rede 400.
[0156] O aparelho de processamento 100 inclui uma parte de redução de ruído 120, uma parte de entrada de som 121, uma parte de saída de som 122, uma parte de transmissão 123 e uma parte de recepção 124. A parte de redução de ruído 120 inclui uma parte de conversão de espectro de frequência 101, uma parte de detecção de ruído A 102, uma parte de detecção de ruído B 103, uma parte de estimativa de espectro de amplitude de ruído 104, uma parte de subtração de espectro de ruído 105, uma parte de conversão inversa de espectro de frequência 106 e uma parte de ajuste de resistência à redução 109.
[0157] A parte de entrada de som 121, por exemplo, coleta um som (voz ou semelhante) que ocorre em torno do aparelho de processamento 100, gera um sinal sonoro e envia o sinal sonoro para a parte de redução de ruído 120. A parte de saída de som 122 envia um som (uma voz ou semelhante) com base em um sinal sonoro introduzido pela parte de redução de ruído 120.
[0158] A parte de transmissão 123 transmite dados como um sinal sonoro do qual ruído é reduzido pela parte de redução de ruído 120 para outro aparelho conectado via a rede 400 ou semelhantes. A 124 recebe dados como dados sonoros de outro aparelho conectado via a rede 400, ou semelhantes.
[0159] A parte de redução de ruído 120 envia um sinal sonoro introduzido na parte de entrada de som 121 para a parte de transmissão 123 após a remoção de ruído. Ainda, a parte de redução de ruído 120 envia um sinal sonoro recebido pela parte de recepção 124 para a parte de saída de som 122 após remoção de ruído.
[0160] No aparelho de processamento 100 de acordo com a quarta concretização, a parte de redução de ruído 120 inclui as múltiplas partes (partes de estimativa de espectro de amplitude de ruído) que estimam espectro de amplitude nos métodos diferentes, seleciona a parte de estimativa de espectro de amplitude de ruído adequada com base no resultado da detecção de ruído do som introduzido e estima o espectro de amplitude de ruído Seno. Desse modo, independente do tipo e/ou tempo de geração do ruído, o aparelho de processamento 100 pode estimar o espectro de amplitude de ruído Seno do ruído incluído no som introduzido com alta precisão e envia o sinal sonoro obtido da redução do ruído do som introduzido.
[0161] Ainda, no aparelho de processamento 100, é possível ajustar o nível de redução do ruído do sinal sonoro introduzido ou recebido pela parte de ajuste de resistência à redução 109 da parte de redução de ruído 120. Desse modo, o usuário pode ajustar o nível de redução de ruído de acordo com o estado de uso (situação) e usá-lo.
[0162] O aparelho de processamento 200 conectado ao aparelho de processamento 100 via a rede 400 inclui uma parte de recepção 203, uma parte de transmissão 204, uma parte de entrada de som 205 e uma parte de saída de som 206.
[0163] A parte de recepção 203 recebe um sinal sonoro transmitido de outro aparelho conectado via a rede 400, ou semelhante, e envia o sinal sonoro para a parte de entrada de som 205. A parte de transmissão 204 transmite um sinal sonoro introduzido na parte de saída de som 206 para outro aparelho conectado via a rede 400 ou semelhante.
[0164] A parte de entrada de som 205 envia um sinal sonoro recebido pela parte de recepção 203 para o lado de fora. A parte de saída de som 206, por exemplo, coleta um som (uma voz ou semelhante) que ocorre em torno do aparelho de processamento 200, gera um sinal sonoro e envia o sinal sonoro para a parte de transmissão 204.
<Configuração de Hardware de Sistema de Processamento>
[0165] A figura 16 ilustra uma configuração de hardware do sistema de processamento 300 de acordo com a quarta concretização.
[0166] O aparelho de processamento 100 inclui um controlador 110, uma parte de I/F de rede 115, uma parte de I/F de meio de gravação 116, um dispositivo de entrada/ saída de som 118 e um painel de operação 119. O controlador 110 inclui uma CPU 111, um HDD 112, uma ROM 113 e uma RAM 114.
[0167] O painel de operação 119 é hardware incluindo um dispositivo de entrada, como botões, para recebimento de operações do usuário, uma tela de operação, como um painel de cristal líquido tendo uma função de painel de toque e/ou semelhante. No painel de operação 119, níveis de redução de ruído de um sinal sonoro introduzido, sendo introduzido no aparelho de processamento 100 ou semelhante são exibidos de tal maneira que o usuário pode selecionar um dos níveis exibidos. A parte de ajuste de resistência à redução 109 envia um sinal de ajuste de resistência à redução Srs com base na informação introduzida pelo usuário para o painel de operação 119.
[0168] No sistema de processamento 300, de acordo com a quarta concretização, por exemplo, o aparelho de processamento 100 transmite um sinal sonoro introduzido após a remoção do ruído para o aparelho de processamento 200. Desse modo, o usuário do aparelho de processamento 200 pode capturar claramente o som introduzido do aparelho de processamento 100. Ainda, o aparelho de processamento 100 pode enviar um sinal sonoro transmitido do aparelho de processamento 200 após remoção de ruído. Desse modo, o usuário do aparelho de processamento 100 pode capturar claramente o som transmitido do aparelho de processamento 200. Desse modo, é possível realizar conversação, gravação e/ou semelhante através de um som claro, obtido de ruído que está sendo reduzido entre os usuários do aparelho deprocessamento 100 e do aparelho de processamento 200 conectados via a rede 400.
[0169] Ainda, a parte de redução de ruído 120 do aparelho de processamento 100 tem a parte de ajuste de resistência à redução 109 e pode ajustar o nível de redução do ruído do sinal sonoro introduzido. O nível de redução do ruído a ser ajustado pela parte de ajuste de resistência à redução 109 pode ser introduzido via o painel de operação 119 pelo usuário do aparelho de processamento 100 ou pode ser controlado por um sinal de processamento de redução de ruído sendo transmitido do aparelho de processamento 200 para o aparelho de processamento 100. Desse modo, o usuário do sistema de processamento 300 pode ajustar o nível apropriado de redução do ruído do sinal sonoro.
[0170] É notado que, por exemplo, o número dos aparelhos de processamento incluídos no sistema de processamento 300 não está limitado àquele da quarta concretização. O sistema de processamento 300 pode incluir três ou mais aparelhos de processamento. Ainda, o sistema de processamento 300 de acordo com a quarta concretização pode ser aplicado a um sistema em que, por exemplo, múltiplos PCs, PDAs, telefones celulares, terminais de conferência e/ou semelhantes transmitem/ recebem som ou semelhante.
[0171] Desse modo, os aparelhos de processamento e os sistemas de processamento foram descritos com base nas concretizações. As funções do aparelho de processamento 100 de acordo com cada uma das concretizações podem ser realizadas como um resultado de um computador executando um programa que é obtido da codificação dos respectivos procedimentos de processamento de cada uma das concretizações descritas acima por uma linguagem de programação adequada ao aparelho de processamento 100. Portanto, o programa para a realização das funções do aparelho de processamento 100 de acordo com cada uma das concretizações pode ser armazenado no meio de gravação legível em computador 117.
[0172] Desse modo, através do armazenamento do programa de acordo com cada uma das concretizações no meio de gravação 117, como um disco flexível, CD, um DVD, uma memória USB ou semelhante, o programa pode ser instalado no aparelho de processamento 100. Ainda, uma vez que o aparelho de processamento 100 tem a parte de I/F de rede 115, o programa de acordo com cada uma das concretizações pode ser instalado no aparelho de processamento 100 como um resultado de ser baixado via um circuito de telecomunicações, tal como a Internet.
[0173] De acordo com as concretizações descritas acima, é possível proporcionar um aparelho de processamento tendo uma capacidade de estimativa de um espectro de amplitude de ruído incluído em um som introduzido independente do tipo do ruído e do tempo de geração do ruído.
[0174] Desse modo, os aparelhos de processamento, cada um dos quais estima um espectro de amplitude de ruído do ruído incluído em um sinal sonoro introduzido foram descritos pelas concretizações. Contudo, a presente invenção não está limitada a essas concretizações e variações e modificações existem dentro do escopo e do espírito da invenção como escrito e definido nas reivindicações mostradas abaixo.
[0175] O presente pedido é baseado no Pedido de Prioridade Japonês N° 2012-104573, depositado em 1 de maio de 2012 e no Pedido de Prioridade Japonês N° 2013-032959, depositado em 22 de fevereiro de 2013, todo o conteúdo dos quais é aqui incorporado através de referência.

Claims (12)

1. Aparelho de processamento (100, 200) para estimar um espectro de amplitude de ruído (104) do ruído incluído em um sinal de som caracterizado pelo fato de que compreende: uma parte de cálculo de espectro de amplitude (41) configurada para calcular um espectro de amplitude (41) do sinal de som para cada um dos quadros obtidos a partir da divisão do sinal de som em unidades de tempo; e uma parte de estimativa do espectro de amplitude do ruído (104) configurada para estimar o espectro de amplitude de ruído (104) do ruído detectado a partir dos quadros, em que a parte de estimativa do espectro de amplitude do ruído (104) inclui uma primeira parte de estimativa configurada para estimar o espectro de amplitude de ruído (104) com base numa diferença entre o espectro de amplitude calculado pela parte de cálculo do espectro de amplitude (41) e o espectro de amplitude dos quadros que ocorre antes do ruído é detectado, e uma segunda parte de estimativa configurada para estimar o espectro de amplitude de ruído (104) com base numa função de atenuação obtida do espectro de amplitude de ruído (104) dos quadros que ocorre após o ruído ser detectado.
2. Aparelho de processamento (100, 200), de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda: uma parte de detecção de ruído (102, 103) configurada para determinar se o ruído existente nos quadros; e uma parte de saída de sinal de execução configurada para emitir um sinal de execução para a primeira parte de estimativa ou a segunda parte de estimativa para fazer com que a primeira parte de estimativa ou a segunda parte de estimativa estime o espectro de amplitude do ruído (104), com base num tempo decorrido desde que a parte de detecção de ruído (102, 103) detecte o ruído.
3. Aparelho de processamento (100, 200), de acordo com a reivindicação 2, caracterizado pelo fato de que compreende ainda: uma parte de armazenamento de espectro de amplitude de ruído (46) configurada para armazenar o espectro de amplitude de ruído (104) estimado pela parte estimativa de espectro de amplitude de ruído (104); e uma parte de controle de armazenamento de espectro de amplitude de ruído (46) configurada para alojar, após a parte de detecção de ruído (102, 103) detectar o ruído, o espectro de amplitude de ruído (104) estimado pela parte de estimativa de espectro de amplitude de ruído (104) na parte de armazenamento de espectro de amplitude de ruído (46) de acordo com o tempo decorrido desde quando a parte de detecção de ruído (102, 103) detecta o ruído.
4. Aparelho de processamento (100, 200), de acordo com a reivindicação 1, caracterizado pelo fato de que a função de atenuação obtida pela segunda parte estimativa é uma função exponencial.
5. Aparelho de processamento (100, 200), de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda: uma parte de armazenamento de espectro de amplitude (45) configurada para armazenar o espectro de amplitude calculado pela parte de cálculo de espectro de amplitude (41); e uma parte de controle de armazenamento de espectro de amplitude (45) configurada para armazenar temporariamente o espectro de amplitude calculado pela parte de cálculo de espectro de amplitude (41), e armazenar o espectro de amplitude armazenado temporariamente na parte de armazenamento de espectro de amplitude (45) quando o ruído foi detectado.
6. Aparelho de processamento (100, 200), de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda: uma parte de ajuste de ruído (48) configurado para ajustar a magnitude do espectro de amplitude de ruído (41) estimada pela primeira parte estimativa ou a segunda parte de estimativa.
7. Aparelho de processamento (100, 200), de acordo com a reivindicação 6, caracterizado pelo fato de que a parte de ajuste de ruído (48) é configurada para ajustar a magnitude do espectro de amplitude (41) do ruído pela alteração de um valor de um coeficiente a ser multiplicado com o espectro de amplitude de ruído estimado pela primeira parte de estimativa ou a segunda parte de estimativa.
8. Aparelho de processamento (100, 200), de acordo com a reivindicação 6, caracterizado pelo fato de que a parte de ajuste de ruído (48) é configurada para ajustar a magnitude do espectro de amplitude (41) do ruído pela alteração de um valor de um coeficiente da função de atenuação obtida pela segunda parte de estimativa.
9. Método de processamento de estimar um espectro de amplitude do ruído de ruído incluído num sinal de som caracterizado pelo fato de que compreende: calcular um espectro de amplitude do sinal de som para cada um dos quadros obtidos a partir da divisão do sinal de som em unidades de tempo; e estimar o espectro de amplitude do ruído do ruído detectado a partir dos quadros, em que a estimativa inclui: estimar o espectro de amplitude de ruído com base numa diferença entre o espectro de amplitude calculado pela parte de cálculo de espectro de amplitude (41) e o espectro de amplitude do quadro ocorrendo antes do ruído ser detectado, e estimar o espectro de amplitude de ruído com base numa função de atenuação obtida a partir do espectro de amplitude do ruído dos quadros que ocorrem após o ruído ser detectado.
10. Programa caracterizado pelo fato de que é adaptado para fazer com que um computador realize o método de processamento, conforme definido na reivindicação 9.
11. Mídia de gravação de informação legível por computador caracterizado pelo fato de que armazena o programa conforme definido na reivindicação 10.
12. Sistema de processamento (300) compreendendo aparelhos de processamento plurais ligados através de uma rede (400) caracterizado pelo fato de que compreende: uma parte de cálculo de espectro de amplitude (41) configurada para calcular um espectro de amplitude de um sinal de som para cada um dos quadros obtidos a partir da divisão do sinal de som em unidades de tempo; e uma parte de estimativa de espectro de amplitude de ruído (104) configurada para estimar o espectro de amplitude de ruído do ruído detectado a partir dos quadros, em que a parte de estimativa de espectro de amplitude de ruído (104) inclui: uma primeira parte de estimativa configurada para estimar o espectro de amplitude de ruído com base numa diferença entre o espectro de amplitude calculado pela parte de cálculo de espectro de amplitude (41) e o espectro de amplitude do quadro ocorrendo antes do ruído ser detectado, e uma segunda parte de estimativa configurada para estimar o espectro de amplitude de ruído com base numa função de atenuação obtida a partir de espectros de amplitude de ruído dos quadros que ocorrem após o ruído ser detectado.
BR112014027494-0A 2012-05-01 2013-04-19 aparelho de processamento, método de processamento, programa, mídia de gravação de informação legível por computador e sistema de processamento BR112014027494B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2012-104573 2012-05-01
JP2012104573 2012-05-01
JP2013-032959 2013-02-22
JP2013032959A JP6182895B2 (ja) 2012-05-01 2013-02-22 処理装置、処理方法、プログラム及び処理システム
PCT/JP2013/062305 WO2013164981A1 (en) 2012-05-01 2013-04-19 Processing apparatus, processing method, program, computer readable information recording medium and processing system

Publications (2)

Publication Number Publication Date
BR112014027494A2 BR112014027494A2 (pt) 2017-06-27
BR112014027494B1 true BR112014027494B1 (pt) 2021-02-23

Family

ID=49514380

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112014027494-0A BR112014027494B1 (pt) 2012-05-01 2013-04-19 aparelho de processamento, método de processamento, programa, mídia de gravação de informação legível por computador e sistema de processamento

Country Status (9)

Country Link
US (1) US9754606B2 (pt)
EP (1) EP2845190B1 (pt)
JP (1) JP6182895B2 (pt)
CN (1) CN104364845B (pt)
BR (1) BR112014027494B1 (pt)
CA (1) CA2869884C (pt)
RU (1) RU2597487C2 (pt)
SG (1) SG11201406563YA (pt)
WO (1) WO2013164981A1 (pt)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6454495B2 (ja) * 2014-08-19 2019-01-16 ルネサスエレクトロニクス株式会社 半導体装置及びその故障検出方法
US9557698B2 (en) 2014-11-20 2017-01-31 Ricoh Company, Limited Information processing apparatus, information processing method, and computer-readable storage medium for detecting an abnormity from sound data
CN104900237B (zh) * 2015-04-24 2019-07-05 上海聚力传媒技术有限公司 一种用于对音频信息进行降噪处理的方法、装置和系统
US10015592B2 (en) 2016-05-20 2018-07-03 Ricoh Company, Ltd. Acoustic signal processing apparatus, method of processing acoustic signal, and storage medium
JP6701573B2 (ja) 2016-08-03 2020-05-27 株式会社リコー 音声処理装置、音声映像出力装置、及び遠隔会議システム
CN106443071B (zh) * 2016-09-20 2019-09-13 中国科学院上海微系统与信息技术研究所 噪声可识别的高量程加速度传感器共振频率的提取方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5212764A (en) 1989-04-19 1993-05-18 Ricoh Company, Ltd. Noise eliminating apparatus and speech recognition apparatus using the same
JP2859634B2 (ja) 1989-04-19 1999-02-17 株式会社リコー 雑音除去装置
JP3451146B2 (ja) 1995-02-17 2003-09-29 株式会社日立製作所 スペクトルサブトラクションを用いた雑音除去システムおよび方法
AU721270B2 (en) 1998-03-30 2000-06-29 Mitsubishi Denki Kabushiki Kaisha Noise reduction apparatus and noise reduction method
JP3310225B2 (ja) * 1998-09-29 2002-08-05 松下電器産業株式会社 雑音レベル時間変動率計算方法及び装置と雑音低減方法及び装置
JP3484112B2 (ja) 1999-09-27 2004-01-06 株式会社東芝 雑音成分抑圧処理装置および雑音成分抑圧処理方法
US7254170B2 (en) * 2002-11-06 2007-08-07 Qualcomm Incorporated Noise and channel estimation using low spreading factors
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP4162604B2 (ja) * 2004-01-08 2008-10-08 株式会社東芝 雑音抑圧装置及び雑音抑圧方法
JP4434813B2 (ja) * 2004-03-30 2010-03-17 学校法人早稲田大学 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置
ATE373302T1 (de) * 2004-05-14 2007-09-15 Loquendo Spa Rauschminderung für die automatische spracherkennung
KR100677126B1 (ko) * 2004-07-27 2007-02-02 삼성전자주식회사 레코더 기기의 잡음 제거 장치 및 그 방법
KR20070050058A (ko) * 2004-09-07 2007-05-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 향상된 잡음 억제를 구비한 전화통신 디바이스
WO2006046293A1 (ja) * 2004-10-28 2006-05-04 Fujitsu Limited 雑音抑圧装置
JP2007027897A (ja) 2005-07-12 2007-02-01 Matsushita Electric Ind Co Ltd 雑音抑圧装置
JP5046317B2 (ja) * 2006-04-27 2012-10-10 住友電気工業株式会社 受信機、送信機、伝送システム、及び伝送方法
CN101256772B (zh) * 2007-03-02 2012-02-15 华为技术有限公司 确定非噪声音频信号归属类别的方法和装置
CN101627428A (zh) 2007-03-06 2010-01-13 日本电气株式会社 抑制杂音的方法、装置以及程序
KR101141033B1 (ko) * 2007-03-19 2012-05-03 돌비 레버러토리즈 라이쎈싱 코오포레이션 스피치 개선을 위한 노이즈 분산 추정기
JP5071346B2 (ja) * 2008-10-24 2012-11-14 ヤマハ株式会社 雑音抑圧装置及び雑音抑圧方法
US8737641B2 (en) * 2008-11-04 2014-05-27 Mitsubishi Electric Corporation Noise suppressor
JP5187666B2 (ja) * 2009-01-07 2013-04-24 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧装置およびプログラム
CN101859568B (zh) * 2009-04-10 2012-05-30 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
CN102804260B (zh) * 2009-06-19 2014-10-08 富士通株式会社 声音信号处理装置以及声音信号处理方法
JP5310494B2 (ja) * 2009-11-09 2013-10-09 日本電気株式会社 信号処理方法、情報処理装置、及び信号処理プログラム
CN102117618B (zh) * 2009-12-30 2012-09-05 华为技术有限公司 一种消除音乐噪声的方法、装置及系统
JP5387459B2 (ja) * 2010-03-11 2014-01-15 富士通株式会社 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム
JP5588233B2 (ja) 2010-06-10 2014-09-10 日本放送協会 雑音抑圧装置およびプログラム
JP2012027186A (ja) 2010-07-22 2012-02-09 Sony Corp 音声信号処理装置、音声信号処理方法及びプログラム
CN102411930A (zh) 2010-09-21 2012-04-11 索尼公司 生成音频模型的方法、设备和检测场景类别的方法、设备
US8762139B2 (en) * 2010-09-21 2014-06-24 Mitsubishi Electric Corporation Noise suppression device

Also Published As

Publication number Publication date
JP6182895B2 (ja) 2017-08-23
EP2845190B1 (en) 2016-05-18
RU2014143473A (ru) 2016-06-20
WO2013164981A1 (en) 2013-11-07
US9754606B2 (en) 2017-09-05
RU2597487C2 (ru) 2016-09-10
CA2869884C (en) 2018-01-02
CN104364845A (zh) 2015-02-18
CN104364845B (zh) 2017-03-08
JP2013250548A (ja) 2013-12-12
US20150098587A1 (en) 2015-04-09
EP2845190A1 (en) 2015-03-11
SG11201406563YA (en) 2014-11-27
BR112014027494A2 (pt) 2017-06-27
EP2845190A4 (en) 2015-04-29
CA2869884A1 (en) 2013-11-07

Similar Documents

Publication Publication Date Title
US20220093111A1 (en) Analysing speech signals
US20200227071A1 (en) Analysing speech signals
KR101153093B1 (ko) 다감각 음성 향상을 위한 방법 및 장치
BR112014027494B1 (pt) aparelho de processamento, método de processamento, programa, mídia de gravação de informação legível por computador e sistema de processamento
JP5000647B2 (ja) 音声状態モデルを使用したマルチセンサ音声高品質化
JP4587160B2 (ja) 信号処理装置および方法
US7133826B2 (en) Method and apparatus using spectral addition for speaker recognition
US7590526B2 (en) Method for processing speech signal data and finding a filter coefficient
US7856353B2 (en) Method for processing speech signal data with reverberation filtering
WO2020025951A1 (en) Detection of replay attack
BR112016020066B1 (pt) Método implementado por computador e um sistema para supressão de ruído transiente em um sinal de áudio
EP3989217A1 (en) Method for detecting an audio adversarial attack with respect to a voice input processed by an automatic speech recognition system, corresponding device, computer program product and computer-readable carrier medium
JP2008544328A (ja) クリーン音声の事前分布を使用した多感覚応用の音声強調
WO2007127671A1 (en) Method and apparatus for automatic adjustment of play speed of audio data
JP4964259B2 (ja) パラメタ推定装置、音源分離装置、方向推定装置、それらの方法、プログラム
CN105224844A (zh) 验证方法、系统和装置
WO2021217750A1 (zh) 消除语音交互中信道差异的方法及系统、电子设备及介质
JP6891144B2 (ja) 生成装置、生成方法及び生成プログラム
CN115206292A (zh) 一种语音活动检测方法、装置,电子设备及存储介质
CN113470621A (zh) 语音检测方法、装置、介质及电子设备
CN114678038A (zh) 音频噪声检测方法、计算机设备和计算机程序产品

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 19/04/2013, OBSERVADAS AS CONDICOES LEGAIS.

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 9A ANUIDADE.

B24J Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12)

Free format text: EM VIRTUDE DA EXTINCAO PUBLICADA NA RPI 2667 DE 15-02-2022 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDA A EXTINCAO DA PATENTE E SEUS CERTIFICADOS, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.