BR102015000954A2 - método e sistema para identificação de atendimento automático em ligações telefônicas - Google Patents

método e sistema para identificação de atendimento automático em ligações telefônicas Download PDF

Info

Publication number
BR102015000954A2
BR102015000954A2 BR102015000954A BR102015000954A BR102015000954A2 BR 102015000954 A2 BR102015000954 A2 BR 102015000954A2 BR 102015000954 A BR102015000954 A BR 102015000954A BR 102015000954 A BR102015000954 A BR 102015000954A BR 102015000954 A2 BR102015000954 A2 BR 102015000954A2
Authority
BR
Brazil
Prior art keywords
automatic
message
call
database
signals
Prior art date
Application number
BR102015000954A
Other languages
English (en)
Other versions
BR102015000954B1 (pt
Inventor
Diego Augusto Silva
José Augusto Stuchi
Original Assignee
Fundacao Cpqd Ct Pesquisa E Desenvolvimento Em Tel
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fundacao Cpqd Ct Pesquisa E Desenvolvimento Em Tel filed Critical Fundacao Cpqd Ct Pesquisa E Desenvolvimento Em Tel
Priority to BR102015000954-2A priority Critical patent/BR102015000954B1/pt
Publication of BR102015000954A2 publication Critical patent/BR102015000954A2/pt
Publication of BR102015000954B1 publication Critical patent/BR102015000954B1/pt

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

método e sistema para identificação de atendimento automático em ligações telefônicas, aplicável a qualquer sistema que receba sinais de ligações telefônicas mediante o processamento dos sinais no domínio da frequência, compreendendo o cálculo das transformadas de fourier discretas (70) do fluxo da ligação (20) e de pelo menos um sinal de áudio de referência (120), a computação do produto espectral cruzado (80) de ambas as ditas transformadas de fourier discretas e a determinação da transformada inversa (90) do produto espectral para obter uma curva de correlação (130) e comparar o valor do pico de dita curva com um valor limiar (140). a mensagem recebida é identificada como sendo automática e classificada como improdutiva, caso dito valor de pico (150) ultrapassar dito valor limiar.

Description

MÉTODO E SISTEMA PARA IDENTIFICAÇÃO DE ATENDIMENTO AUTOMÁTICO EM LIGAÇÕES TELEFÔNICAS
Campo de Aplicação [001] A presente invenção se aplica ao campo das Telecomunicações, mais especificamente à Engenharia de Hardware e Software, e, mais particularmente, a um sistema e método de identificação de mensagens atendidas automaticamente em ligações telefônicas, utilizando a informação de fase do sinal no domínio da frequência com base na correlação de dois sinais e um algoritmo de detecção de picos. A invenção ora proposta se aplica a qualquer sistema que receba sinais de ligações telefônicas como, por exemplo, os sistemas utilizados em call centers ou mesmo aqueles embarcados em telefones celulares, não estando restrita a essas aplicações.
[002] Para um melhor entendimento do relatório descritivo, apresentam-se a seguir alguns termos, expressões e siglas utilizados no mesmo: [003] URA (Unidade de Resposta Audível) - também chamado de IVR (Interactive Voice Response), talker ou atendente eletrônica, é um equipamento para um call centers que provê serviços automáticos para responder a clientes que ligam com dúvidas e fornecer informações, sem a intervenção de um atendente. O equipamento tem capacidade para acessar todas as informações sobre o cliente ao ser acionado, sendo então, apresentado um "menu eletrônico" de serviços que se desdobram em vários outros, otimizando o atendimento eletrônico e evitando, ao máximo, o serviço de pessoas.
[004] DTMF (Dual-Tone Multi-Frequency) - Tom Dual de Frequência Múltipla, ou tons de duas frequências, utilizados na discagem dos telefones mais modernos. Nos primeiros telefones a discagem era feita através de um "disco" que gerava uma sequência de pulsos na linha telefônica.
[005] ASR (Automatic Speech Recognition) - Reconhecimento Automático de Fala. Há dois tipos de ASR, a saber: (DVI),ou "entrada de voz direta" e o (LVCSR) ou "grande vocabulário de reconhecimento de fala continua". Dispositivos DVI são destinados principalmente ao comando-e-controle de voz, enquanto os sistemas LVCSR são usadas para o preenchimento de formulários ou a criação de documentos baseados em voz.
[006] DFT (Díscrete Fouríer Transform) - Transformada Discreta de Fourier [007] IDFT (Inversa Díscrete Fourier Transform) - Transformada Discreta de Fourier Inversa Estado da Técnica [008] Tornou-se uma prática comum para as empresas de call center realizar chamadas telefônicas automatizadas, a fim de entregar lembretes, ofertas e fazer cobranças aos assinantes. Ao longo dos anos, sistemas automatizados para tais finalidades foram adotados e se tornaram cada vez mais sofisticados, especialmente por causa da crescente complexidade das redes telefônicas, visando à redução dos custos operacionais.
[009] Uma ferramenta bastante utilizada para este propósito é conhecida como discador automático ou discador preditivo, o qual tem a responsabilidade de prever o volume de chamadas necessárias para ocupar os recursos disponíveis, tais como atendentes disponíveis, em atendimento, etc.
[010] O discador tem a função de disparar automaticamente ligações baseadas em um banco de dados. Sendo positivo o atendimento, ele transfere a ligação para o atendente disponível. Para funcionar desta forma, ele conta também com o auxílio da URA (Unidade de Resposta Audível). Nesse contexto, caso todos os atendentes estiverem ocupados, o cliente passará primeiramente por uma campanha, ofertas ou menu da empresa.
[011] Um problema particular com os sistemas de discagem automática são as chamadas atendidas por máquinas de correio de voz ou unidades de resposta automática. Nesses casos, pode ocorrer o uso ineficiente do tempo do agente de atendimento, pois o mesmo precisará gastar tempo a ouvir a mensagem gravada e classificá-la manualmente como improdutiva. Neste cenário, o proprietário do discador seria cobrado por uma ligação não atendida por humano.
[012] A Agência Nacional de Telecomunicações (Anatel), órgão federal que trata da regulamentação do setor, prevê a cobrança de chamadas com duração acima de 3 segundos, sendo que do quarto ao trigésimo segundo de ligação é cobrado o valor total correspondente a 30 segundos. Por exemplo, em uma chamada de 4 segundos serão cobrados 30 segundos, bem como em uma chamada de 10 segundos. Após os primeiros 30 segundos de ligação, a cobrança será feita a cada seis segundos. Por exemplo, em uma chamada de 31 segundos, serão cobrados 36 segundos; já em uma de 37 segundos, a cobrança será de 42 segundos, e assim sucessivamente. Destacando que cada operadora de telefonia tem uma politica de preços especifica e há diferenciação de valores entre chamadas locais, interurbanas e internacionais.
[013] A invenção ora proposta compreende um método para detectar automaticamente se a chamada é atendida por uma máquina ou humano.
[014] Algumas abordagens já foram propostas para resolver essa questão, como a utilização de reconhecimento automático de palavras, temporização baseada em silêncio, detecção de tons DTMF e detecção de ruido de fundo.
[015] Compreendem o estado da técnica diversos documentos de patente revelando alguns métodos de detecção automática de correio de voz, apresentados e considerados a seguir.
[016] O documento de patente W02008008117 Al (Alejandro Acero et al.) "DETECTING AN ANSWERING MACHINE USING SPEECH RECOGNITION" contempla um método de detectar se é um humano ou uma máquina, através da tecnologia de reconhecimento de fala. Após reconhecer as palavras, utiliza um cálculo estatístico para determinar se essas foram geradas por um ser humano ou máquina. Esse método apresenta algumas deficiências causadas pelas limitações da tecnologia de reconhecimento de fala, como por exemplo: falsa aceitação ou falsa rejeição ocasionada pelo áudio degradado via comunicação analógica ou pelo erro de codificação utilizada em comunicação digital. Os mecanismos de reconhecimento de fala também não apresentam fidelidade de 100%.
[017] A patente US4941168 (Joseph J. Kelly, Jr) "SYSTEM FOR THE RECOGNITION OF AUTOMATED TELEPHONE ANSWERING DEVICES AND DELIVERY OF PRERECORDED MESSAGES TO SUCH DEVICES" informa a presença de um equipamento de instrução de áudio que direciona o atendente (máquina ou humano) a responder de alguma maneira especifica, como, por exemplo, apertando um botão no telefone, ficando por alguns segundos em silêncio, entre outras. Nesse método, a forma de iteração pode gerar falsos positivos ou negativos caso o usuário não siga as instruções ou não entenda a mensagem de aviso para realizar a ação. A proposta não utiliza processamento de sinais baseado em uma base de áudios marcados como automáticos, nem a técnica de correlação de fase janelada (tempo real) para análise do sinal e determinação se é um correio de voz automático ou não.
[018] A patente US7054419 B2 (Gary Culliss) "ANSWERING MACHINE DETECTION FOR VOICE MESSAGE DELIVERY METHOD AND SYSTEM" apresenta a detecção de mensagens automáticas para melhorar um sistema de entrega de mensagens de voz. Nesse caso, um usuário "A" grava uma ligação que será entregue a um usuário "B". O sistema de entrega deve, então, detectar se o atendimento do usuário "B" não foi gerado de forma automática por um correio de voz, por exemplo. Para detectar se as respostas são geradas por um humano ou máquina, utiliza técnicas de perguntas e resposta (opções interativas), bem como análise de intervalos silêncio. A utilização de técnicas interativas apresentam desvantagens pelo alto custo das tecnologias empregadas e estão limitadas por regras de comportamento normalmente fixas para tomada de decisões, o que torna o sistema menos flexível a novas mensagens.
[019] A patente US6850602 BI (Wu Chou) "METHOD AND APPARATUS FOR ANSWERING MACHINE DETECTION IN AUTOMATIC DIALING" mostra um sistema baseado em regras para detectar se o atendente é humano ou máquina. Utiliza várias técnicas como análise de silêncio, detecção de mensagens fixas por reconhecimento automático de fala (por exemplo, "Deixe sua mensagem após sinal"), detecção através de perguntas que sem resposta são identificadas como máquina, etc. Além desses, o método utiliza uma análise de tons do sinal, normalmente geradas por máquina. As tecnologias empregadas nesse método não permitem identificar o tipo de chamada recebida, como, por exemplo, uma mensagem de número inexistente ou impossibilitado de receber chamadas, entre outras. Além disso, limita-se por utilizar ASR e padrões fixos para reconhecer mensagens automáticas.
[020] A publicação US20120230483 Al (Ahmed Tewfik Bouzid et al.) "ANSWERING MACHINE DETECTION" cita um método que utiliza diferentes métodos para a detecção de secretária eletrônica, como, por exemplo, uso de timeout baseado em silêncio, detecção de tons DTMF, detecção de ruído de fundo e ainda contador de palavras que, se excedido, indica que a sentença foi gerada por uma máquina. Ainda faz o uso de reconhecimento automático de fala (ASR) para frases especificas. Os recursos tecnológicos utilizados para o propósito são métodos passivos como, por exemplo, detecção de silêncio, DTMF, entre outros. Também é baseado em modelos como o gerado para o ASR. Os métodos passivos e o ASR estão susceptíveis a erros causados pela baixa qualidade do áudio sob análise. Além de padrões fixos de comportamento não serem flexíveis a mudanças das mensagens automáticas.
[021] A patente US5371787 A (Chris A. Hamilton) "MACHINE ANSWER DETECTION", contempla um método baseado em um controlador que utiliza vários parâmetros para determinar se a ligação foi atendida por um humano ou máquina. Como alguns parâmetros utilizados, pode-se citar análise de ruído, toque, cliques, silêncio e voz. A utilização de parametrização baseada em padrões fixos impõem vulnerabilidades e pouca flexibilidade ao método, podendo causar decisões falsas no sistema empregado.
[022] A publicação US20140029733 Al (Kenneth W.D. Smith et al. ) "METHOD AND APPARATUS FOR TONE DETECTION" apresenta um método baseado no uso de detecção de tons e detecção de fala para detectar se a mensagem foi gerada por uma secretária eletrônica ou não. Técnicas pesadas de reconhecimento de fala e análise de tom deixam o método computacionalmente caro, além de susceptível a gerar erros para situações em que a qualidade do áudio sob análise é baixa.
[023] A patente US7386101 B2 (Jeff Pugliese) "SYSTEM AND METHOD FOR CALL ANSWER DETERMINAI ION FOR AUTOMATED CALLING SYSTEMS" mostra um método que analisa o conteúdo de voz de uma ligação e permite controlar a operação da ligação dependendo do contexto identificado. Para fazer a identificação do contexto da ligação, utiliza reconhecimento de fala baseado em gramáticas especificas que, dependendo do contexto, podem ser únicas para determinadas partes que iniciam a ligação. Os métodos de ASR não são 100% precisos, principalmente em ambientes ruidosos, no qual a detecção pode apresentar alta taxa de erros . Essa é a principal desvantagem presente na patente em questão. Além disso, o uso de modelo gramatical limita e dificulta a detecção caso novas mensagens automáticas sejam apresentadas.
[024]A publicação US20020001369 Al (Keith Merwin et al. ) "COMPUTERIZED SYSTEM FOR THE RECEIPT, RECORDATION, SCHEDULING AND REDELIVERY OF TELEPHONE MESSAGES TO PREDETERMINED TELEPHONE NUMBERS" descreve um sistema de entrega de mensagens que liga para determinado receptor e entrega uma mensagem, verificando, para tal, se o atendente é humano ou máquina (correio de voz ou secretária eletrônica). Também se baseia em um banco de dados de chamadas que permite ao sistema entregar mensagens especificas para um número em um determinado dia/hora. Tal base permite também o registro de mais de um número de telefone por usuário. Apesar de constar que possui capacidade de reconhecimento de sinais para detectar se o atendente é máquina ou humano, não apresenta detalhes de como tal processamento é realizado. A proposta não permite identificar o tipo de chamada, como, por exemplo, uma mensagem de número inexistente ou impossibilitado de receber ligações, além de não apresentar qual técnica de processamento foi utilizada para detecção das chamadas automáticas.
[025] A publicação EP2802133 Al (Danny Singer) "LIVE PERSON DETECTION IN AN AUTOMATED CALLING SYSTEM" de novembro de 2014, descreve um método que visa a detectar se uma chamada foi respondida por humano ou por máquina através da análise de padrões da voz e silêncio. Visa também evitar que respostas automáticas sejam encaminhadas para atendentes humanos em um call center, por exemplo. Apesar de também detectar se uma chamada foi respondida por uma máquina ou humano, consta que faz a detecção de padrões de voz e silêncio, como, por exemplo, tempo de resposta após uma pergunta, quantidade de silêncio do áudio, etc. A utilização de parametrização baseada em padrões passivos impõem vulnerabilidades ao método, podendo causar decisões falsas no sistema empregado. Além disso, utiliza padrões de identificação fixos os quais não possibilitam facilmente a detecção de novas mensagens automáticas.
[026] Em resumo, as principais deficiências e desvantagens gerais dos métodos e sistemas existentes residem na complexidade, no baixo grau de otimização, na necessidade de gerar modelos e/ou base de treinamentos, na baixa sensibilidade a sinais ruidosos e ainda na análise de padrões fixos o que torna tais métodos pouco adaptáveis a mudanças.
Objetivos da Invenção [027] O objetivo principal da presente invenção é prover um método e um sistema de identificação de atendimento automático que sejam suficientemente simples, de maneira que não haja a necessidade de treinamento anterior de um modelo de áudios gerados por máquinas, como ocorre, por exemplo, nos métodos existentes para reconhecimento automático de fala ou para detecção de padrões de silêncio e voz.
[028] Outro objetivo da presente invenção é prover um método e um sistema que identifiquem o tipo de mensagem automática recebida, possibilitando o enriquecimento do banco de dados e sua consequente otimização nas decisões de chamadas futuras.
[029] Ainda outro objetivo da presente invenção é prover um método e um sistema que detecte e identifique, em tempo real, o atendimento automático em ligações telefônicas, mesmo em condições ruidosas, minimizando os custos de tarifação de chamadas atendidas por atendentes não-humanos.
Descrição Geral da Invenção [030] Os objetivos acima descritos são alcançados pelo método para identificação de mensagens automáticas em ligações telefônicas proposto pela invenção, pelo provimento da detecção e identificação do tipo das mensagens automáticas recebidas realizado por meio do processamento do sinal no dominio da frequência e da análise do espectro de fase, em que: a partir do fluxo da ligação (trecho de áudio) e dos áudios de referência, são inicialmente calculadas as respectivas transformadas de Fourier. em seguida, é calculado o produto espectral cruzado 80 entre as duas transformadas 70 (DFT) e a seguir é feita a transformada inversa 90 do produto espectral, que é processada por um algoritmo de detecção de picos 100, cujo resultado 110 é analisado de forma quantitativa, permitindo verificar se uma mensagem automática foi detectada, bem como identificar o tipo da mensagem.
[031] O método da invenção é baseado no processamento de trechos do sinal atual de áudio comparados com outros de referência, cadastrados previamente na sua forma original. Assim, basta cadastrar o sinal original da mensagem automática no sistema, sem a necessidade de nenhum outro treinamento anterior, o que poupa tempo de gerência do sistema.
[032] O método da invenção permite identificar o tipo de mensagem automática recebida, possibilitando uma melhor análise para decisões futuras. Por exemplo, caso a mensagem mostre que o número de telefone esteja ocupado naquele momento, o operador pode utilizar tal informação para retornar a ligação alguns minutos após a primeira tentativa. Tal informação é bastante útil para classificar a chamada e otimizar o sistema de decisão de chamadas futuras, o qual pode ser realizado de forma automática.
[033] O método e o sistema propostos resultam em baixíssimo custo computacional, por utilizar algoritmo de correlação de fase, que se caracteriza por computação leve e paralelizável, com processamento em tempo real dos trechos de sinal de áudio da ligação recebida.
[034] A correlação de fase utilizada no método proposto garante boa separabilidade na classificação entre os conjuntos de mensagens automáticas e o conjunto de mensagens não automáticas, o que garante uma baixa taxa de falsos positivos e negativos.
Descrição das Figuras [035] As vantagens e características da invenção tornar-se-ão mais evidentes a partir da descrição de concretizações preferidas, dadas a título de exemplo e não de limitação, e das figuras que a elas se referem, em que: [036] A Figura 1 ilustra o fluxo básico realizado pelo método de identificação de mensagens automáticas da invenção.
[037] A Figura 2 ilustra um exemplo prático de operação do método de identificação de mensagens automáticas.
[038] A Figura 3 é um diagrama que mostra os blocos componentes do módulo identificador do sistema, concatenados com os passos do método da invenção para identificar um determinado tipo de áudio, por meio de um algoritmo de correlação de fase.
[039] A Figura 4 é um gráfico tempo x amplitude que mostra o resultado obtido pelo método da invenção, para o caso em que o áudio não foi identificado como uma mensagem automática.
[040] A Figura 5, por sua vez, é um gráfico que mostra o resultado obtido para o caso em que o áudio foi identificado como uma mensagem automática.
Descrição Detalhada de Realizações da Invenção [041] Como já mencionado, a identificação de mensagens automáticas em áudios de chamadas telefônicas proposta pela presente invenção é realizada a partir da informação de fase do espectro no dominio frequência do sinal, uma vez que a correlação de fase do sinal é praticamente insensível a ruídos e a não uniformidades, bastante comuns em sinais de áudio. Além disso, o custo computacional dessa correlação é bastante baixo se comparado com outros métodos de correlação, como a correlação cruzada, permitindo, dessa forma, o processamento em tempo real dos áudios das chamadas realizadas.
[042] A correlação de fase baseia-se no teorema do deslocamento de Fourier, sendo que boa parte das aplicações descritas no estado da técnica, que se utiliza dessa abordagem, está relacionada ao processamento e registro de imagens. Calcula-se o produto espectral cruzado entre a transformada da imagem de referência e a imagem a ser registrada, procurando picos na matriz resultante no domínio do espaço.
[043] Considerando uma imagem fi (x,y) como imagem referência e f2(x,y) uma imagem a ser registrada, sendo que f2(x,y) é a imagem fi(x,y) transladada por um offset (x0,yo) em relação a (x, y) , tem-se a Equação I : f2(x,y)= fi (χ-χο ,y-yo) (I) [044] A propriedade do deslocamento de Fourier afirma que um deslocamento da imagem no espaço resulta em um deslocamento na fase do sinal na frequência dado pela Equação II: f(x-a,y-b) - F(cox,my) .e^i(Va + “y'b) (II) [045] Assim, no dominio da frequência, tem-se: F2 (ωχ, ωγ) = F2 <ωχ,ωγ) .e-i(Vxo + VV (III) [046] A partir dessa propriedade, o fator de deslocamento de fase exponencial pode ser calculado pelo produto espectral cruzado, G(cúx,uy) , expresso pela Equação IV: G (ωχ, Qy) =Fi (ωχ, ωγ) ,F2* (ωχ, ωγ) / | F2 (ωχ, ωγ) . F2* (ωχ, ωγ) | =e-;L'VVVV (IV) [047] Com Θ(ωχ,ωγ) no dominio da frequência, pode-se calcular a transformada inversa, obtendo-se g(x,y), conhecida como matriz de offset espacial, dada pela Equação V: g(x,y) = δ (x-x0 , y-y0) (V) [048] Sendo a função g(x,y) o impulso unitário centrado em (x0, yo) /· basta agora encontrar a localização do pulso, sendo esse o ponto de máxima correlação entre as duas imagens e que indica o quanto uma imagem está deslocada em relação a outra. Na prática, o que se obtém como resultado é uma matriz com certa dispersão e com um pico na posição de máxima correlação entre as duas imagens. Dessa forma, para localizar o offset entre elas, basta encontrar o ponto de máximo valor da matriz g(x,y).
[049] Estendendo o acima exposto para sinais de voz, substituem-se as matrizes bidimensionais de entradas e saldas por vetores unidimensionais. Nesse caso, a saída da correlação será um vetor unidimensional que possui um pico de alta correlação, caso um trecho de uma mensagem automática já cadastrada na base de referências seja recebida na ligação atual.
[050] Assim, a presente invenção estende a aplicação da correlação de fase para sinais de áudio, visando à detecção e identificação de mensagens automáticas em ligações telefônicas. Uma característica bastante interessante do método de correlação de fase é, conforme já descrito, sua robustez a ruídos, os quais são bastante presentes em sinais de áudio. Além disso, o método permite a análise de pequenos trechos do sinal. Assim, é possível o processamento em tempo real do fluxo da ligação recebida, realizando a computação da correlação de pequenas partes do sinal com as referências cadastradas.
[051] A Figura 1 apresenta os passos básicos para a realização da identificação de mensagens automáticas em ligações telefônicas. Nesse contexto, o sistema contém um módulo identificador (10) que receberá o fluxo da ligação atual em tempo real (20) . Esse módulo faz uso de um banco de dados com os áudios das mensagens automáticas (30) . 0 banco de dados é alimentado com mensagens automáticas (padrões) como, por exemplo, as geradas pelas operadoras de telefonia. Ao perceber uma nova mensagem gerada por máquina, essa deve ser incluída no banco de dados.
[052] Mensagens antigas ou sem reincidência são removidas, para diminuir ainda mais o custo computacional e melhorar desempenho (envelhecimento da informação).
[053] Um identificador de padrão sonoro é utilizado para tomada de decisão de derrubar/encerrar ligação ou, enriquecer o banco de dados e gerar novas regras de negócio.
[054] As mensagens são os próprios sinais originais de mensagens automáticas, recebidos das operadoras e cadastrados no sistema em um momento anterior à ligação. O módulo (10), então, faz a comparação dos pequenos pedaços do áudio da ligação atual (stream) com os áudios cadastrados, verificando se caracterizam uma mensagem automática (41) ou não. Se uma mensagem não for detectada como automática, o método simplesmente retorna sua execução sem indicar um (ID), identificador de mensagem; caso contrário, o método retornará o ID (50) da mensagem identificada, a qual poderá ser usada pelo sistema discador, na sequência.
[055] A Figura 2 apresenta, por sua vez, uma realização exemplificativa de operação do método proposto. Como mostrado, o método processa o fluxo da ligação atual (20) visando a identificar (10) se caracteriza uma mensagem automática ou não. Nessa realização, no caso de a mensagem automática ser identificada (41), o ID (50) é obtido para fins de auditoria (log) e a ligação é encerrada, objetivando não permitir o faturamento e cobrança da mesma, já que o atendente não foi humano. Caso contrário, se a mensagem automática não seja reconhecida, a ligação é encaminhada a um operador humano (60) . Se porventura esse operador detectar (42) que o atendente é uma máquina, por exemplo, ouvindo uma mensagem do correio de voz, tal fato caracteriza um falso positivo e deve ser notificado para a inclusão no banco de dados de mensagens automáticas (30). Por fim, se não ocorreu erro de detecção, o fluxo da ligação (20) prossegue com o atendimento humano ao atendente.
[056] A Figura 3 apresenta os passos do método da invenção para a detecção da mensagem automática. Tais passos são realizados pelo módulo identificador (10) mostrado nas figuras 1 e 2. Trechos da ligação atual são captados em tempo real pelo módulo, que utiliza áudios de referência (120) previamente cadastrados para fazer a verificação, que são aqueles que estão no banco de dados das mensagens automáticas previamente cadastrados. O trecho de áudio processado oriundo do fluxo da ligação pode ter duração variável (por exemplo, de lOOms a lOOOms) e é obtido da ligação em tempo real, enquanto, todo o conteúdo do n-ésimo áudio de referência é usado na análise.
[057] A partir desses sinais, as respectivas transformadas de Fourier discretas (DFT-70) são calculadas. Visando a isolar a componente relativa à fase, o produto espectral cruzado (80) entre as DFT's dos dois sinais é calculado, de acordo com a equação IV. Em seguida, a transformada inversa do produto espectral (IDFT-90) é calculada, resultando no sinal mostrado na equação V. O resultado retornado mostra o valor máximo da correlação da fase dos sinais comparados, valor esse entre [0, 1], sendo estabelecido um limiar (threshold) (140) para indicar se o sinal é uma mensagem automática (caso de altíssima correlação) ou não.
[058] A saída dessa computação, ou seja, a correlação entre os sinais, é ilustrada exemplificativamente nas Figuras 4 e 5. Caso o sinal (130) não apresente um pico, como exibido na Figura 4, a chance da ligação ser uma mensagem automática é bastante baixa; no entanto, caso apresente um pico (150) e seu valor ultrapassar o referido limiar, como exibido na Figura 5, a probabilidade de se caracterizar uma mensagem automática é alta.
[059] Desse modo, o resultado da correlação é processado por um algoritmo de detecção de picos (100) que gera um resultado (110), o qual pode ser analisado de forma quantitativa para afirmar se uma mensagem (41) automática foi detectada ou não. Ainda, os áudios de referência (120) podem possuir um identificador que caracteriza o tipo de mensagem recebida como, por exemplo, número inexistente, telefone ocupado, entre outros. Nesse caso, além de identificar que é uma mensagem automática também é possível verificar a natureza da mesma, permitindo, dessa forma, o enriquecimento do banco de dados do sistema discador. Como exemplo, caso uma mensagem de número inexistente seja recebida, o sistema pode notificar o operador informando que aquele número não existe e que futuras ligações serão infrutíferas, o que resulta em economia de tempo e consequente redução de custos.
[060] Conforme descrito acima, as Figuras 4 e 5 exibem o uso de um limiar que, caso excedido pela curva de correlação, determina que o sinal apresentado é uma mensagem automática. Esse é apenas um exemplo de como o pico pode ser detectado, mas a presente invenção não se limita a ele, sendo que qualquer técnica de detecção de pico (100) pode ser utilizada. No exemplo das Figuras 4 e 5, o valor do limiar, representado pela linha tracejada, é o mesmo.
[061] Uma vez descritos os passos do método proposto, apresenta-se a seguir uma realização do sistema de software proposto pela invenção que permite implementar o método.
[062] 0 Sistema para identificação de mensagens automáticas em chamadas telefônicas, que implementa o método, de acordo com a invenção compreende: [063] Processador, que pode ser um PC convencional com sistema operacional ou um smartphone, tablet, servidor ou ainda algum sistema embarcado de propósito especifico; e [064] Módulo identificador (10), podendo ser especifico, como o Matlab, ou implementada em qualquer linguagem de programação, como Python, Java ou C;
[065] O Sistema compreende ainda as seguintes funcionalidades: [066] Leitura do áudio a ser verificado: os trechos de áudio com conteúdo da ligação podem estar armazenados em um arquivo, usando um formato especifico de áudio (como: .wav, .mp3, . raw, .ogg, etc), ou já estarem carregados em memória;
[067] Leitura do áudio de referência: o sinal de áudio com o conteúdo de uma mensagem automática pode ser obtido da mesma forma que o áudio a ser verificado. Nesse caso, os áudios são lidos de um banco de dados de mensagens automáticas pré-cadastradas;
[068] Cálculo das respectivas transformadas de Fourier dos áudios: geralmente o algoritmo mais usado é a FFT (Fast Fourier Transform) , mas as transformadas podem ser calculadas utilizando uma ferramenta de cálculo especifica, como o Matlab, ou implementada em uma linguagem de programação como Python, Java ou C, utilizando bibliotecas de processamento de sinais como a Blitz++ e OpenCV.;
[069] Cálculo do produto espectral cruzado das transformadas: o produto espectral, caracterizado pela equação IV, pode ser implementado por uma ferramenta de cálculo especifica, como o Matlab, ou ainda por linguagens de programação, como Python, Java ou C;
[070] Cálculo da transformada inversa do produto espectral: geralmente o algoritmo mais utilizado é a IFFT (Inverse Fast Fourier Transform) que pode ser computado por uma ferramenta de cálculo especifica, como o Matlab, ou ainda por linguagens de programação como Python, Java ou C, ou ainda podendo fazer o uso de bibliotecas de processamento de sinais como Blitz++ e OpenCV;
[071] Processamento do sinal resultante da transformada inversa do produto espectral, por um método de detecção de picos, gerando um resultado: a identificação do pico pode ser realizada por uma ferramenta de cálculo especifica, como o Matlab, ou pode ser implementada em qualquer linguagem de programação, como Python, Java ou C.
[072] Embora a presente invenção tenha sido descrita em conexão com modalidades preferenciais de realização, deve ser entendido que não se pretende limitar a invenção àquelas modalidades particulares. Ao contrário, pretende-se cobrir todas as alternativas, modificações e equivalentes possíveis dentro do espírito e do escopo da invenção.

Claims (10)

1. MÉTODO PARA IDENTIFICAÇÃO DE ATENDIMENTO AUTOMÁTICO EM LIGAÇÕES TELEFÔNICAS, aplicável a qualquer sistema que receba sinais de ligações telefônicas caracterizado por compreender o processamento dos sinais no dominio das- frequências-, de acordo com as seguintes etapas: - calcular as transformadas de Fourier discretas (70) (DFT) do fluxo da ligação (20), compreendendo pelo menos um trecho do sinal de áudio recebido, e de pelo menos um sinal de áudio de referência (120); - calcular o produto espectral cruzado (80) de ambas as ditas transformadas de Fourier discretas (DFT); calcular a transformada inversa (90) do produto espectral, obtendo uma curva de correlação (130); processar o sinal resultante de dita transformada inversa dito processamento compreendendo a detecção de picos (100) e a comparação do valor do pico com um limiar (140) ; identificar a natureza da mensagem (100) como sendo automática, caso o valor de pico ultrapasse dito limiar, e atribuir um rótulo de identificação da mensagem.
2. MÉTODO de acordo com a reivindicação 1, caracterizado por dito sinal de áudio de referência (120) estar cadastrado previamente num banco de dados (30) contendo áudios de mensagens automáticas.
3. MÉTODO de acordo com a reivindicação 2, caracterizado por permitir associar regras aos tipos de mensagens automáticas, visando a executar determinadas ações caso uma mensagem de um determinado tipo seja reconhecida.
4. MÉTODO de acordo com a reivindicação 2, caracterizado por ser a ligação encerrada caso a mensagem recebida seja identificada (41) como automática.
5. MÉTODO de acordo com a reivindicação 2, caracterizado por ser a ligação encaminhada a um operador humano (60) caso a mensagem recebida não seja identificada (41) como automática.
6. MÉTODO de acordo com a reivindicação 5, caracterizado por ser detectado pelo operador que se trata de uma mensagem automática (42), tal fato é notificado para inclusão no dito banco de dados (30) de mensagens automáticas.
7 . SISTEMA PARA IDENTIFICAÇÃO DE ATENDIMENTO AUTOMÁTICO EM LIGAÇÕES TELEFÔNICAS, caracterizado por compreender um processador, um módulo identificador (10) e um banco de dados de mensagens automáticas (30).
8. SISTEMA de acordo com a reivindicação 7, caracterizado por dito processador ser constituído por um dentre os seguintes dispositivos: PC convencional, smartphone, tablet, servidor ou sistema embarcado de propósito especifico.
9. SISTEMA de acordo com a reivindicação 7, caracterizado por dito módulo identificador (10) ser implementado em linguagem de programação, compreendendo Python, Java, C, entre outras.
10. SISTEMA de acordo com a reivindicação 7, caracterizado por dito módulo identificador (10) prover a identificação de mensagens atendidas automaticamente a partir de sinais de referência (120) armazenados em dito banco de dados (30) .
BR102015000954-2A 2015-01-15 2015-01-15 Método e sistema para identificação de atendimento automático em ligações telefônicas BR102015000954B1 (pt)

Priority Applications (1)

Application Number Priority Date Filing Date Title
BR102015000954-2A BR102015000954B1 (pt) 2015-01-15 2015-01-15 Método e sistema para identificação de atendimento automático em ligações telefônicas

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
BR102015000954-2A BR102015000954B1 (pt) 2015-01-15 2015-01-15 Método e sistema para identificação de atendimento automático em ligações telefônicas

Publications (2)

Publication Number Publication Date
BR102015000954A2 true BR102015000954A2 (pt) 2016-08-16
BR102015000954B1 BR102015000954B1 (pt) 2024-02-27

Family

ID=56613904

Family Applications (1)

Application Number Title Priority Date Filing Date
BR102015000954-2A BR102015000954B1 (pt) 2015-01-15 2015-01-15 Método e sistema para identificação de atendimento automático em ligações telefônicas

Country Status (1)

Country Link
BR (1) BR102015000954B1 (pt)

Also Published As

Publication number Publication date
BR102015000954B1 (pt) 2024-02-27

Similar Documents

Publication Publication Date Title
US12088761B2 (en) Voice and speech recognition for call center feedback and quality assurance
US10069966B2 (en) Multi-party conversation analyzer and logger
US8219404B2 (en) Method and apparatus for recognizing a speaker in lawful interception systems
US8886663B2 (en) Multi-party conversation analyzer and logger
US20230008822A1 (en) Detecting scam callers using conversational agent and machine learning systems and methods
EP3510755A1 (en) Call classification through analysis of dtmf events
Drake et al. Using digital recordings and sonogram analysis to obtain counts of yellow rails
CN109873907A (zh) 呼叫处理方法、装置、计算机设备及存储介质
CN110766442A (zh) 客户信息验证方法、装置、计算机设备及存储介质
US20240312466A1 (en) Systems and Methods for Distinguishing Between Human Speech and Machine Generated Speech
EP2781079A1 (en) System and method for servicing a call
US10706839B1 (en) Electronic signatures via voice for virtual assistants&#39; interactions
CN110493476B (zh) 一种检测方法、装置、服务器及存储介质
CN111508527A (zh) 一种电话应答状态检测方法、装置及服务器
US12008996B2 (en) System and method for managing an automated voicemail
US10237399B1 (en) Identical conversation detection method and apparatus
BR102015000954A2 (pt) método e sistema para identificação de atendimento automático em ligações telefônicas
CN113992797B (zh) 一种欺诈防控平台及方法
CN116320159A (zh) 骚扰诈骗号码识别处理方法、装置、电子设备及介质
CN118200439A (zh) 外呼诈骗电话的识别方法及装置、存储介质、电子设备
CN118262716A (zh) 一种智能涉诈劝阻方法、装置、计算机设备及存储介质
CN119697318A (zh) 基于ai大模型外呼回访的诈骗管控方法、设备及介质
US10091353B1 (en) Identical conversation detection systems and processes
CN115204540A (zh) 服务质量检测方法及装置
Melin The Gandalf speaker verification database

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]
B11A Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing
B04C Request for examination: application reinstated [chapter 4.3 patent gazette]
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 15/01/2015, OBSERVADAS AS CONDICOES LEGAIS