BR102020017532A2 - Conversão de linguagem de sinais em tempo real para comunicação em um centro de contato - Google Patents

Conversão de linguagem de sinais em tempo real para comunicação em um centro de contato Download PDF

Info

Publication number
BR102020017532A2
BR102020017532A2 BR102020017532-7A BR102020017532A BR102020017532A2 BR 102020017532 A2 BR102020017532 A2 BR 102020017532A2 BR 102020017532 A BR102020017532 A BR 102020017532A BR 102020017532 A2 BR102020017532 A2 BR 102020017532A2
Authority
BR
Brazil
Prior art keywords
human agent
video image
sign language
agent
customer
Prior art date
Application number
BR102020017532-7A
Other languages
English (en)
Inventor
Valentine C. Matula
Pushkar Yashavant Deole
Sandesh Chopdekar
Sadashiv Vamanrao Deshmukh
Original Assignee
Avaya Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Avaya Inc. filed Critical Avaya Inc.
Publication of BR102020017532A2 publication Critical patent/BR102020017532A2/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/42391Systems providing special services or facilities to subscribers where the subscribers are hearing-impaired persons, e.g. telephone devices for the deaf
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/1066Session management
    • H04L65/1083In-session procedures
    • H04L65/1089In-session procedures by adding media; by removing media
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/28Recognition of hand or arm movements, e.g. recognition of deaf sign language
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/762Media network packet handling at the source 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/75Media network packet handling
    • H04L65/765Media network packet handling intermediate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5183Call or contact centers with computer-telephony arrangements
    • G06K9/00355
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/50Telephonic communication in combination with video communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/60Medium conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Human Computer Interaction (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Social Psychology (AREA)
  • Psychiatry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Telephonic Communication Services (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

conversão de linguagem de sinais em tempo real para comunicação em um centro de contato. as interações entre os agentes de um centro de contato e os clientes fornecem a maior parte das comunicações e geralmente funcionam bem, exceto quando o cliente é surdo ou mudo. os clientes que sinalizam muitas vezes preferem realizar interações em linguagem de sinais, mas o conjunto de agentes tendo essas habilidades é limitado. ao fornecer sistemas e métodos para alterar uma imagem de um agente que não sinaliza, um cliente pode ser apresentado com uma imagem de um agente que sinaliza. além disso, os sistemas e métodos aqui descritos permitem que um agente que não sinaliza seja apresentado com a fala gerada e/ou texto traduzido dos gestos de sinalização fornecidos pela imagem do cliente que sinaliza.

Description

CONVERSÃO DE LINGUAGEM DE SINAIS EM TEMPO REAL PARA COMUNICAÇÃO EM UM CENTRO DE CONTATO AVISO DE DIREITOS AUTORAIS
[001] Uma parte da divulgação deste documento de patente contém material que está sujeito à proteção de direitos autorais. O proprietário dos direitos autorais não se opôs à reprodução fac-símile por ninguém do documento de patente ou a divulgação da patente conforme aparece nos arquivos ou registros de patentes do Escritório de Marcas e Patentes, mas, de outra forma, reserva-se todos os direitos autorais.
CAMPO DA DIVULGAÇÃO
[002] A invenção se refere genericamente a sistemas e métodos para manipulação de imagens de vídeo e, particularmente, à geração de conteúdo de vídeo para integração em uma alimentação de vídeo ao vivo.
FUNDAMENTOS
[003] A voz é normalmente o canal de comunicação mais preferido por clientes interagindo com um agente de um centro de contato e a maioria das interações ocorre ao longo do canal de voz. No entanto, o canal de voz não tem utilidade para clientes surdos e/ou mudos. Esses clientes podem contar com dispositivos de assistência, como TeleTYpe (TTY), Dispositivo de Telecomunicações para Surdos (TDD) ou Telefone de Texto (TT). Embora eficaz, muitas vezes não é preferido, pois esses clientes são normalmente mais confortáveis e eficientes se comunicando em linguagem de sinais (por exemplo, Linguagem de Sinais Americana).
[004] A maioria dos agentes de centro de contato são utilizados para uma habilidade particular, como entender como solucionar problemas, ter conhecimento do produto e idioma. O conjunto de pessoas que são capazes de se comunicar em um determinado idioma, incluindo a linguagem de sinais, é geralmente proporcional ao uso do idioma em uma determinada área ou mesmo em todo o mundo. Isso deixa um conjunto muito limitado de recursos dos quais recorrer. Os centros de contato se esforçam para acomodar as comunicações preferenciais dos clientes, incluindo o idioma. Se as facilidades do centro de contato forem aproveitadas por esses clientes, o centro de contato precisa empregar agentes que entendam a linguagem de sinais. Isso é desafiador, pois as pessoas que não são surdas ou mudas raramente são treinadas em linguagem de sinais e, mais raro ainda, são fluentes. A contratação de agentes dedicados para sinalizar interações, que podem ser eles mesmos surdos ou mudos, pode resultar na má utilização de tais agentes, visto que as comunicações de voz podem ser difíceis ou impossíveis. Como resultado, os centros de contato relutam em contratar ou treinar agentes de sinalização e os clientes surdos ou mudos permanecem privados de comunicar-se com os agentes de centro de contato em seu idioma preferido.
SUMÁRIO
[005] A Avaya está empenhada em fornecer soluções para permitir comunicações eficazes e eficientes com todos os clientes. As soluções da técnica anterior exigem que os clientes surdos e/ou mudos se comuniquem com dispositivos de texto ou renunciem completamente à interação, como para pedir a ajuda de alguém que pode conduzir uma interação de voz em seu nome. As modalidades neste documento são geralmente direcionadas para permitir a conversão em tempo real da linguagem de sinais em voz e/ou texto que poderia ser compreendido por agentes que não sinalizam e converter a voz ou texto do agente em representações visuais de linguagem de sinais para serem aplicadas a uma imagem do agente, por exemplo, por sobrepor os gestos e/ou manipular a imagem do agente de modo a apresentar ao cliente uma imagem em tempo real da comunicação do agente através de sinalização.
[006] Em uma modalidade, é divulgado uma aplicação que permite a um dispositivo de comunicação de cliente fornecer comunicação de sinalização bidirecional em tempo real entre um cliente e um agente de um centro de contato, com apenas uma parte de sinalização. A aplicação pode ser implantada em um computador ou dispositivo móvel (por exemplo, telefone inteligente) para uso pela comunidade de clientes surdos e mudos para iniciar interações com o centro de contato. A aplicação pode ser usada pelos clientes para iniciar uma chamada de vídeo com o centro de contato. Depois que o cliente está conectado a um agente, o cliente pode fazer uso da linguagem de sinais (por exemplo, a linguagem de sinais americana) para interagir com o agente por meio de transmissão contínua de vídeo com o agente.
[007] Embora as modalidades neste documento sejam geralmente descritas em relação à habilitação da comunicação de vídeo entre um agente que não sinaliza e um cliente que sinaliza, as modalidades também são contempladas em que a comunicação de vídeo é habilitada entre um agente de sinalização e um cliente que não sinaliza.
[008] Em outra modalidade, um componente de centro de contato, como um servidor, implementa um intérprete de linguagem de sinais ao reconhecer a sessão de agente-cliente atual com um cliente que sinaliza. Uma vez que o cliente está conectado ao agente, o vídeo do cliente que sinaliza é transmitido continuamente a partir do dispositivo de comunicação de cliente para o servidor de centro de contato e processado por um motor de intérprete de linguagem de sinais.
[009] O motor de intérprete de linguagem de sinais é responsável por converter a linguagem de sinais em transcrições de texto e/ou voz que são alimentadas ao agente. O motor de intérprete de linguagem de sinais pode ser um motor proprietário ou motor disponível publicamente que é capaz de converter a linguagem de sinais com um padrão específico (por exemplo, Linguagem de Sinais Americana) em transcrições de texto/voz. O motor de intérprete de linguagem de sinais pode ser personalizado, de modo a dar prioridade de processamento para detectar palavras com maior probabilidade de serem encontradas. Por exemplo, um cliente que inicia uma interação com uma companhia aérea tem mais probabilidade de utilizar palavras associadas a viagens em vez de palavras associadas a serviços bancários, o que pode ser muito provável se o cliente tivesse iniciado a interação com um banco ou outra instituição financeira.
[0010] Em outra modalidade, o motor de intérprete de linguagem de sinais converte texto e/ou voz em linguagem de sinais. Para conversão de texto ou voz de volta em linguagem de sinais, o centro de contato pode fazer uso de várias tecnologias de vídeo através das quais a sinalização pode ser sobreposta à imagem do agente. Isso fornece uma sensação muito mais natural ao cliente, que é apresentado com uma imagem em tempo real do agente de sinalização. Por exemplo, em uma modalidade, uma tela verde ou tecnologia de chroma key é implementada que permite uma parte de uma imagem de um agente, como uma capturada que tem uma cor única particular, geralmente verde, que é substituída por uma imagem alternativa, tal como a imagem de braços e mãos sinalizando.
[0011] Em certas modalidades, uma biblioteca visual de imagens de vídeo de palavras ou frases sinalizadas pelos agentes pode ser capturada em um primeiro momento, como durante uma sessão com um treinador, para reprodução subsequente durante uma interação com um cliente. Essas palavras ou frases são então armazenadas em um banco de dados e quando um determinado agente está atendendo a chamada para um cliente com deficiência, as imagens capturadas podem ser incluídas com a imagem do agente, como do pescoço para cima, e transmitidas continuamente de volta ao cliente. Em tal modalidade, a face do agente real é mantida no vídeo apresentado ao cliente junto com uma parte do vídeo que compreende sequências de sinalização formadas pela combinação de imagens previamente capturadas para o agente, como a sobreposição de sequências de sinalização sobre o corpo do agente. A modalidade anterior pode ser particularmente adequada para implementação em pequenos centros de contato com um número relativamente limitado de agentes ou outra implementação onde o investimento de tempo necessário para criar a biblioteca de vídeo para cada agente é desejado.
[0012] Em outra modalidade, pelo menos um processador executando um agente de inteligência algorítmica ou artificial pode fornecer manipulação de vídeo. O vídeo original de um agente que não sinaliza pode ser modificado/manipulado, em tempo real, para fornecer os gestos de sinalização e/ou expressões faciais desejados. O processador pode implementar ou receber modificações no vídeo que são sobrepostas ou substituem a imagem, conforme capturada, do agente ou partes do agente (por exemplo, mãos, braços e/ou rosto) para fornecer ao cliente uma imagem em tempo real da sinalização de agente e/ou expressar o conteúdo visual determinado pelo processador. A modalidade anterior pode ser particularmente bem adequada para centros de contato maiores ou outras modalidades onde não seja desejável criar uma biblioteca de expressões gravadas para cada agente.
[0013] Em outra modalidade, o pelo menos um processador pode alterar a imagem do rosto ou porção do agente (por exemplo, lábios) de modo a fornecer a imagem de vídeo apresentada ao cliente do agente que tem expressões de sinalização sincronizadas com suas expressões faciais. Geralmente, sinalização ocorre em um ritmo mais lento em comparação com a fala e a imagem real (isto é, não modificada) do agente falando pode exigir que o processador produza uma imagem do agente sinalizando em um ritmo não natural ou incompreensível. Consequentemente, a sinalização pode ser fornecida em um ritmo mais natural ou compreensível e a fala do agente atrasada pela inserção de atrasos ou pausas na imagem do rosto do agente. Como resultado, a imagem do rosto do agente, incluindo a expressão visual da fala ou emoção, é sincronizada com as imagens de sinalização.
[0014] Os clientes que aguardam na fila de um agente podem ser apresentados com uma imagem visual, como um relógio de contagem regressiva, estimativa de quando sua chamada será atendida, número de chamadores à frente do cliente, etc. Em outra modalidade, clientes de sinalização esperando em fila podem ser apresentados com a imagem de uma recepcionista de vídeo apresentando informações sinalizadas, como tempo restante na fila, tempo estimado de resposta, etc.
[0015] Em outra modalidade, a aplicação pode ser configurável para permitir que o cliente receba imagens sinalizadas, legendas ocultas ou ambos. Quando o cliente foi configurado para receber apenas a legenda oculta, então o processador que fornece a manipulação de vídeo do agente ao vivo pode ser omitido enquanto a voz do agente ao vivo é alimentada em um motor de fala-para-texto para gerar legenda oculta para apresentação no dispositivo de comunicação do cliente.
[0016] Em outra modalidade, o registro da interação pode ser fornecido para manutenção de registro, retorno para processos de gerenciamento de qualidade humanos ou automatizados, ou outros fins. As gravações podem ser mantidas para um ou mais vídeos de entrada, vídeo bruto do agente, transcrição de texto da voz do agente, transcrição de texto da sinalização gerada pelo agente, transcrição de texto da sinalização do cliente, transcrição de fala gerada a partir da sinalização do cliente, vídeo bruto do agente ou partes do agente (por exemplo, rosto, cabeça, etc.), parte(s) manipulada da imagem do agente (por exemplo, mãos, braços, boca, lábios, rosto, etc.) que são então inseridas no vídeo final e/ou no vídeo final conforme entregue ao dispositivo de comunicação do cliente.
[0017] Estas e outras necessidades são abordadas pelas várias modalidades e configurações da presente invenção. A presente invenção pode fornecer uma série de vantagens dependendo da configuração particular. Estas e outras vantagens serão evidentes a partir da divulgação da(s) invenção(ões) aqui contida(s).
[0018] Em uma modalidade, um sistema para tradução de linguagem de sinais em tempo real é divulgado, compreendendo: uma interface de comunicação configurada para receber uma imagem de vídeo de um agente humano envolvido em uma interação por meio de uma rede com um cliente utilizando um dispositivo de comunicação de cliente; um processador tendo uma memória acessível; e o processador configurado para: receber a imagem de vídeo do agente humano; receber uma entrada de áudio compreendendo a fala do agente humano; determinar um gesto de linguagem de sinais da fala; modificar a imagem de vídeo do agente humano para compreender o gesto de linguagem de sinais; e apresentar o dispositivo de comunicação de cliente com a imagem de vídeo modificada do agente humano compreendendo o gesto de linguagem de sinais.
[0019] Em outra modalidade, um método é divulgado, compreendendo: receber uma imagem de vídeo de um agente humano envolvido em uma interação, por meio de uma rede, com um cliente utilizando um dispositivo de comunicação de cliente; receber a imagem de vídeo do agente humano; receber uma entrada de áudio compreendendo a fala do agente humano; determinar um gesto de linguagem de sinais da fala; modificar a imagem de vídeo do agente humano para compreender o gesto de linguagem de sinais; e apresentar o dispositivo de comunicação de cliente com a imagem de vídeo modificada do agente humano compreendendo o gesto de linguagem de sinais.
[0020] Em outra modalidade um sistema é divulgado, compreendendo: meios para receber uma imagem de vídeo de um agente humano envolvido em uma interação, por meio de uma rede, com um cliente utilizando um dispositivo de comunicação de cliente; meios para receber a imagem de vídeo do agente humano; meios para receber uma entrada de áudio compreendendo a fala do agente humano; meios para determinar um gesto de linguagem de sinais da fala; meios para modificar a imagem de vídeo do agente humano para compreender o gesto de linguagem de sinais; e meios para apresentar o dispositivo de comunicação de cliente com a imagem de vídeo modificada do agente humano compreendendo o gesto de linguagem de sinais.
[0021] O termo "sinalização", quando se refere a um humano ou um proxy humano, é capaz de se comunicar fornecendo gestos de linguagem de sinais (por exemplo, Linguagem de Sinais Americana, ortografia com os dedos, etc.). O proxy humano pode ser um avatar, a reprodução de uma imagem gravada de uma sinalização humana ou outro elemento gráfico que pode apresentar gestos em linguagem de sinais de maneira semelhante à de uma sinalização humana. O termo "que não sinaliza" refere-se a um humano, ou proxy humano, que atualmente está se comunicando de uma maneira diferente do uso de sinalização.
[0022] As frases "pelo menos um", "um ou mais", "ou" e "e/ou" são expressões abertas que são conjuntivas e disjuntivas em operação. Por exemplo, cada uma das expressões "pelo menos um de A, B e C," "pelo menos um de A, B ou C," "um ou mais de A, B e C," "um ou mais de A, B ou C", "A, B e/ou C" e "A, B ou C" significa A sozinho, B sozinho, C sozinho, A e B juntos, A e C juntos, B e C juntos, ou A, B e C juntos.
[0023] O termo "um" ou "uma" entidade refere-se a uma ou mais dessas entidades. Como tal, os termos "um" (ou "uma"), "um ou mais" e "pelo menos um" podem ser usados indistintamente neste documento. Também deve ser observado que os termos "compreendendo", "incluindo" e "tendo" podem ser usados indistintamente.
[0024] O termo "automático" e variações do mesmo, conforme usado neste documento, referem-se a qualquer processo ou operação, que é tipicamente contínuo ou semicontínuo, feito sem entrada humana material quando o processo ou operação é realizado. No entanto, um processo ou operação pode ser automático, mesmo que o desempenho do processo ou operação use entrada humana material ou imaterial, se a entrada for recebida antes da execução do processo ou operação. A entrada humana é considerada material se essa entrada influenciar a forma como o processo ou operação será realizado. A entrada humana que consente ao desempenho do processo ou operação não é considerada "material".
[0025] Os aspectos da presente divulgação podem assumir a forma de uma modalidade que é inteiramente hardware, uma modalidade que é inteiramente de software (incluindo firmware, software residente, microcódigo, etc.) ou uma modalidade combinando aspectos de software e hardware que podem todos geralmente ser referidos neste documento como um "circuito", "módulo" ou "sistema". Qualquer combinação de um ou mais meios legíveis por computador pode ser utilizada. O meio legível por computador pode ser um meio de sinal legível por computador ou um meio de armazenamento legível por computador.
[0026] Um meio de armazenamento legível por computador pode ser, por exemplo, mas não limitado a, um sistema, aparelho ou dispositivo eletrônico, magnético, ótico, eletromagnético, infravermelho ou semicondutor ou qualquer combinação adequada dos anteriores. Exemplos mais específicos (uma lista não exaustiva) do meio de armazenamento legível por computador incluiriam o seguinte: uma conexão elétrica com um ou mais fios, um disquete de computador portátil, um disco rígido, uma memória de acesso aleatório (RAM), uma memória somente de leitura (ROM), uma memória somente de leitura programável apagável (EPROM ou memória Flash), uma fibra ótica, uma memória somente de leitura de disco compacto portátil (CD-ROM), um dispositivo de armazenamento ótico, um dispositivo de armazenamento magnético ou qualquer combinação adequada dos anteriores. No contexto deste documento, um meio de armazenamento legível por computador pode ser qualquer meio tangível e não transitório que pode conter ou armazenar um programa para uso por ou em conexão com um sistema, aparelho ou dispositivo de execução de instrução.
[0027] Um meio de sinal legível por computador pode incluir um sinal de dados propagado com código de programa legível por computador incorporado no mesmo, por exemplo, em banda base ou como parte de uma onda portadora. Tal sinal propagado pode assumir qualquer uma de uma variedade de formas, incluindo, mas não se limitando a, eletromagnética, ótica ou qualquer combinação adequada das mesmas. Um meio de sinal legível por computador pode ser qualquer meio legível por computador que não seja um meio de armazenamento legível por computador e que pode se comunicar, propagar ou transportar um programa para uso por ou em conexão com um sistema, aparelho ou dispositivo de execução de instrução. O código de programa incorporado em um meio legível por computador pode ser transmitido usando qualquer meio apropriado, incluindo, mas não se limitando a, sem fio, com fio, cabo de fibra ótica, RF, etc., ou qualquer combinação adequada dos anteriores.
[0028] Os termos "determinar", "calcular", "computar" e variações dos mesmos, conforme usados neste documento, são usados indistintamente e incluem qualquer tipo de metodologia, processo, operação matemática ou técnica.
[0029] O termo "meio", conforme usado neste documento, deve receber sua interpretação mais ampla possível de acordo com 35 USC, Seção 112(f) e/ou Seção 112, Parágrafo 6. Consequentemente, uma reivindicação incorporando o termo "meio" deve abranger todas as estruturas, materiais ou atos aqui estabelecidos, e todos os seus equivalentes. Além disso, as estruturas, materiais ou atos e seus equivalentes devem incluir todos aqueles descritos no sumário, breve descrição dos desenhos, descrição detalhada, resumo e as próprias reivindicações.
[0030] O anterior é um resumo simplificado da invenção para fornecer uma compreensão de alguns aspectos da invenção. Este resumo não é uma visão geral extensa nem exaustiva da invenção e suas várias modalidades. Não se destina a identificar os elementos chave ou críticos da invenção nem a delinear o âmbito da invenção, mas sim a apresentar conceitos selecionados da invenção de uma forma simplificada como uma introdução à descrição mais detalhadaapresentada abaixo. Como será apreciado, outras modalidades da invenção são possíveis utilizando, sozinhas ou em combinação, uma ou mais dos recursos estabelecidos acima ou descritos em detalhes abaixo. Além disso, embora a divulgação seja apresentada em termos de modalidades exemplares, deve ser apreciado que um aspecto individual da divulgação pode ser reivindicado separadamente.
BREVE DESCRIÇÃO DOS DESENHOS
[0031] A presente divulgação é descrita em conjunto com as figuras anexas:
a Figura 1 representa um primeiro sistema de acordo com modalidades da presente divulgação;
a Figura 2 representa uma transformação de imagem de acordo com modalidades da presente divulgação;
a Figura 3 representa um mapeamento de transformação de imagem de acordo com modalidades da presente divulgação;
a Figura 4 representa um segundo sistema de acordo com modalidades da presente divulgação;
a Figura 5 representa um processo de acordo com modalidades da presente divulgação; e
a Figura 6 representa um terceiro sistema de acordo com modalidades da presente divulgação.
DESCRIÇÃO DETALHADA
[0032] A descrição que segue fornece modalidades apenas e não se destina a limitar o escopo, aplicabilidade ou configuração das reivindicações. Em vez disso, a descrição que segue fornecerá aos versados na técnica uma descrição habilitadora para a implementação das modalidades. Será entendido que várias mudanças podem ser feitas na função e arranjo dos elementos sem se afastar do espírito e escopo das reivindicações anexas.
[0033] Qualquer referência na descrição compreendendo um número de elemento, sem um identificador de subelemento quando um identificador de subelemento existe nas figuras, quando usado no plural, se destina a fazer referência a quaisquer dois ou mais elementos com um número de elemento semelhante. Quando tal referência é feita no singular, pretende-se fazer referência a um dos elementos com o número de elemento semelhante, sem limitação a um específico dos elementos. Qualquer uso explícito aqui em contrário ou fornecendo qualificação ou identificação adicional deve prevalecer.
[0034] Os sistemas e métodos exemplares desta divulgação também serão descritos em relação ao software de análise, módulos, e hardware de análise associado. No entanto, para evitar obscurecer desnecessariamente a presente divulgação, a seguinte descrição omite estruturas, componentes e dispositivos bem conhecidos, que podem ser omitidos ou mostrados de uma forma simplificada nas figuras ou de outra forma resumidos.
[0035] Para fins de explicação, vários detalhes são apresentados a fim de fornecer uma compreensão completa da presente divulgação. Deve ser apreciado, no entanto, que a presente divulgação pode ser praticada de uma variedade de maneiras além dos detalhes específicos aqui estabelecidos.
[0036] Com referência agora à Figura 1, o sistema de comunicação 100 é discutido de acordo com pelo menos algumas modalidades da presente divulgação. O sistema de comunicação 100 pode ser um sistema distribuído e, em algumas modalidades, compreende uma rede de comunicação 104 conectando um ou mais dispositivos de comunicação 108 a um mecanismo de atribuição de trabalho 116, que pode ser de propriedade e operado por um centro de contato de administração de empresa 102 no qual um pluralidade de recursos 112 é distribuída para lidar com itens de trabalho chegando (na forma de contatos) a partir de dispositivos de comunicação de cliente 108.
[0037] O centro de contato 102 é incorporado de várias maneiras para receber e/ou enviar mensagens que são ou estão associadas a itens de trabalho e ao processamento e gerenciamento (por exemplo, escalonamento, atribuição, roteamento, geração, contabilidade, recepção, monitoramento, revisão, etc.) dos itens de trabalho por um ou mais recursos 112. Os itens de trabalho são geralmente solicitações geradas e/ou recebidas para um recurso de processamento 112 incorporado como, ou um componente de, uma mensagem eletrônica e/ou eletromagneticamente transmitida. O centro de contato 102 pode incluir mais ou menos componentes do que os ilustrados e/ou fornecer mais ou menos serviços do que os ilustrados. A fronteira que indica o centro de contato 102 pode ser uma fronteira física (por exemplo, um prédio, campus, etc.), fronteira legal (por exemplo, companhia, empresa, etc.) e/ou fronteira lógica (por exemplo, recursos 112 utilizados para fornecer serviços a clientes para um cliente do centro de contato 102).
[0038] Além disso, a fronteira que ilustra o centro de contato 102 pode ser conforme-ilustrado ou, em outras modalidades, incluir alterações e/ou mais e/ou menos componentes do que o ilustrado. Por exemplo, em outras modalidades, um ou mais dos recursos 112, banco de dados de cliente 118 e/ou outro componente podem se conectar ao motor de roteamento 132 por meio da rede de comunicação 104, como quando tais componentes se conectam por meio de uma rede pública (por exemplo, Internet). Em outra modalidade, a rede de comunicação 104 pode ser uma utilização privada de, pelo menos em parte, uma rede pública (por exemplo, VPN); uma rede privada localizada, pelo menos parcialmente, dentro do centro de contato 102; ou uma mistura de redes privadas e públicas que pode ser utilizada para fornecer comunicação eletrônica dos componentes aqui descritos. Além disso, deve ser apreciado que os componentes ilustrados como externos, como o servidor de mídia social 130 e/ou outras fontes de dados externas 134 podem estar dentro do centro de contato 102 fisicamente e/ou logicamente, mas ainda podem ser considerados externos para outros fins. Por exemplo, o centro de contato 102 pode operar o servidor de mídia social 130 (por exemplo, um site operável para receber mensagens de usuário a partir de clientes e/ou recursos 112) como um meio para interagir com os clientes por meio de seu dispositivo de comunicação de cliente 108.
[0039] Os dispositivos de comunicação de cliente 108 são incorporados como externos ao centro de contato 102, pois estão sob o controle mais direto de seu respectivo usuário ou cliente. No entanto, modalidades podem ser fornecidas por meio das quais um ou mais dispositivos de comunicação de cliente 108 estão fisicamente e/ou logicamente localizados dentro do centro de contato 102 e ainda são considerados externos ao centro de contato 102, como quando um cliente utiliza o dispositivo de comunicação de cliente 108 em um quiosque e anexa para uma rede privada do centro de contato 102 (por exemplo, conexão WiFi a um quiosque, etc.), dentro ou controlado pelo centro de contato 102 .
[0040] Deve ser apreciado que a descrição do centro de contato 102 fornece pelo menos uma modalidade em que as seguintes modalidades podem ser mais facilmente compreendidas, sem limitar tais modalidades. O centro de contato 102 pode ainda ser alterado, adicionado a, e/ou subtraído de sem se afastar do escopo de qualquer modalidade aqui descrita e sem limitar o escopo das modalidades ou reivindicações, exceto conforme expressamente fornecido.
[0041] Além disso, o centro de contato 102 pode incorporar e/ou utilizar o site de mídia social 130 e/ou outras fontes de dados externas 134 podem ser utilizadas para fornecer um meio para um recurso 112 receber e/ou recuperar contatos e conectar a um cliente de um centro de contato 102. Outras fontes de dados externas 134 podem incluir fontes de dados, como agências de serviços, provedores de dados de terceiros (por exemplo, agências de crédito, registros públicos e/ou privados, etc.). Os clientes podem utilizar seus respectivos dispositivos de comunicação de cliente 108 para enviar/receber comunicações utilizando o servidor de mídia social 130.
[0042] De acordo com pelo menos algumas modalidades da presente divulgação, a rede de comunicação 104 pode compreender qualquer tipo de meio de comunicação conhecido ou coleção de meios de comunicação e pode usar qualquer tipo de protocolo para transportar mensagens eletrônicas entre terminais. A rede de comunicação 104 pode incluir tecnologias de comunicação com e/ou sem fio. A Internet é um exemplo da rede de comunicação 104 que constitui uma rede de Protocolo de Internet (IP) que consiste em muitos computadores, redes de computação, e outros dispositivos de comunicação localizados em todo o mundo, que são conectados através de muitos sistemas de telefone e outros meios. Outros exemplos da rede de comunicação 104 incluem, sem limitação, um Sistema de Telefone Antigo Simples padrão (POTS), uma Rede Digital de Serviços Integrados (ISDN), a Rede Telefônica Pública Comutada (PSTN), uma Rede de Área Local (LAN), uma Rede de Área Ampla (WAN), uma rede de Protocolo de Iniciação de Sessão (SIP), uma rede de voz sobre IP (VoIP), uma rede celular, e qualquer outro tipo de rede de comutação de pacotes ou de comutação de circuitos conhecida na técnica. Além disso, pode ser apreciado que a rede de comunicação 104 não precisa ser limitada a qualquer tipo de rede e, em vez disso, pode ser composta por uma série de diferentes redes e/ou tipos de rede. Como um exemplo, as modalidades da presente divulgação podem ser utilizadas para aumentar a eficiência de um centro de contato baseado em grade 102. Exemplos de um centro de contato baseado em grade 102 são descritos mais completamente na Publicação de Patente dos Estados Unidos N° 2010/0296417 de Steiner, todo o conteúdo da qual é aqui incorporado por referência. Além disso, a rede de comunicação 104 pode compreender uma série de meios de comunicação diferentes, como cabo coaxial, cabo/fio de cobre, cabo de fibra ótica, antenas para transmissão/recepção de mensagens sem fio, e suas combinações.
[0043] Os dispositivos de comunicação 108 podem corresponder a dispositivos de comunicação de cliente. De acordo com pelo menos algumas modalidades da presente divulgação, um cliente pode utilizar seu dispositivo de comunicação 108 para iniciar um item de trabalho. Os itens de trabalho ilustrativos incluem, mas não estão limitados a, um contato direcionado e recebido em um centro de contato 102, uma solicitação de página da web direcionada e recebida em uma fazenda de servidores (por exemplo, coleção de servidores), uma solicitação de mídia, uma solicitação de aplicação (por exemplo, uma solicitação de localização de recursos de aplicação em um servidor de aplicação remoto, como um servidor de aplicação SIP) e semelhantes. O item de trabalho pode estar na forma de uma mensagem ou coleção de mensagens transmitidas pela rede de comunicação 104. Por exemplo, o item de trabalho pode ser transmitido como uma chamada telefônica, um pacote ou coleção de pacotes (por exemplo, pacotes IP transmitidos por um Rede IP), uma mensagem de e-mail, uma mensagem instantânea, uma mensagem SMS, um fax e suas combinações. Em algumas modalidades, a comunicação pode não ser necessariamente direcionada ao mecanismo de atribuição de trabalho 116, mas pode ser em algum outro servidor na rede de comunicação 104, onde é coletada pelo mecanismo de atribuição de trabalho 116, que gera um item de trabalho para a comunicação coletada, tal como servidor de mídia social 130. Um exemplo de tal comunicação coletada inclui uma comunicação de mídia social que é coletada pelo mecanismo de atribuição de trabalho 116 a partir de uma rede ou servidor de mídia social 130. Arquiteturas exemplares para coletar comunicações de mídia social e gerar itens de trabalho com base nas mesmas são descritos nos Pedidos de Patente dos EUA 12/784.369, 12/706.942 e 12/707.277, depositados em 20 de março de 2010, 17 de fevereiro de 2010 e 17 de fevereiro de 2010, respectivamente; cada um dos quais é aqui incorporado por referência em sua totalidade.
[0044] O formato do item de trabalho pode depender das capacidades do dispositivo de comunicação 108 e do formato da comunicação. Em particular, os itens de trabalho são representações lógicas dentro de um centro de contato 102 do trabalho a ser realizado em conexão com a manutenção de uma comunicação recebida no centro de contato 102 (e, mais especificamente, o mecanismo de atribuição de trabalho 116). A comunicação pode ser recebida e mantida no mecanismo de atribuição de trabalho 116, um comutador ou servidor conectado ao mecanismo de atribuição de trabalho 116, ou semelhante, até que um recurso 112 seja atribuído ao item de trabalho que representa essa comunicação. Nesse ponto, o mecanismo de atribuição de trabalho 116 passa o item de trabalho para um motor de roteamento 132 para conectar o dispositivo de comunicação 108, que iniciou a comunicação, com o recurso atribuído 112.
[0045] Embora o motor de roteamento 132 seja descrito como sendo separado do mecanismo de atribuição de trabalho 116, o motor de roteamento 132 pode ser incorporado ao mecanismo de atribuição de trabalho 116 ou sua funcionalidade pode ser executada pelo motor de atribuição de trabalho 120.
[0046] De acordo com pelo menos algumas modalidades da presente divulgação, os dispositivos de comunicação 108 podem compreender qualquer tipo de equipamento de comunicação conhecido ou coleção de equipamentos de comunicação. Exemplos de um dispositivo de comunicação adequado 108 incluem, mas não estão limitados a, um computador pessoal, laptop, Assistente Digital Pessoal (PDA), telefone celular, telefone inteligente, telefone ou combinações dos mesmos. Em geral, cada dispositivo de comunicação 108 pode ser adaptado para suportar comunicações de vídeo, áudio, texto e/ou dados com outros dispositivos de comunicação 108, bem como os recursos de processamento 112. O tipo de meio usado pelo dispositivo de comunicação 108 para se comunicar com outros dispositivos de comunicação 108 ou recursos de processamento 112 pode depender das aplicações de comunicação disponíveis no dispositivo de comunicação 108 .
[0047] De acordo com pelo menos algumas modalidades da presente divulgação, o item de trabalho é enviado para uma coleção de recursos de processamento 112 por meio dos esforços combinados do mecanismo de atribuição de trabalho 116 e do motor de roteamento 132. Os recursos 112 podem ser recursos completamente automatizados (por exemplo, unidades de resposta de voz interativa (IVR), microprocessadores, servidores ou semelhantes), recursos humanos utilizando dispositivos de comunicação (por exemplo, agentes humanos utilizando um computador, telefone, laptop, etc.) ou qualquer outro recurso conhecido por ser usado no centro de contato 102.
[0048] Como discutido acima, o mecanismo de atribuição de trabalho 116 e os recursos 112 podem ser de propriedade e operados por uma entidade comum em um formato de centro de contato 102. Em algumas modalidades, o mecanismo de atribuição de trabalho 116 pode ser administrado por várias empresas, cada uma das quais tem seus próprios recursos dedicados 112 conectados ao mecanismo de atribuição de trabalho 116.
[0049] Em algumas modalidades, o mecanismo de atribuição de trabalho 116 compreende um motor de atribuição de trabalho 120, que habilita o mecanismo de atribuição de trabalho 116 a tomar decisões de roteamento inteligentes para itens de trabalho. Em algumas modalidades, o motor de atribuição de trabalho 120 é configurado para administrar e tomar decisões de atribuição de trabalho em um centro de contato sem fila 102, conforme descrito no Pedido de Patente dos EUA No. de Série 12/882,950, cujo conteúdo inteiro é aqui incorporado por referência. Em outras modalidades, o motor de atribuição de trabalho 120 pode ser configurado para executar decisões de atribuição de trabalho em um centro de contato tradicional baseado em fila (ou baseado em habilidade) 102 .
[0050] O motor de atribuição de trabalho 120 e seus vários componentes podem residir no mecanismo de atribuição de trabalho 116 ou em uma série de servidores ou dispositivos de processamento diferentes. Em algumas modalidades, arquiteturas de computação baseada em nuvem podem ser empregadas, por meio das quais um ou mais componentes do mecanismo de atribuição de trabalho 116 são disponibilizados em uma nuvem ou rede de modo que possam ser recursos compartilhados entre uma pluralidade de usuários diferentes. O mecanismo de atribuição de trabalho 116 pode acessar o banco de dados de cliente 118, de modo a recuperar registros, perfis, histórico de compras, itens de trabalho anteriores e/ou outros aspectos de um cliente conhecido pelo centro de contato 102. O banco de dados de cliente 118 pode ser atualizado em resposta a um item de trabalho e/ou entrada a partir do recurso 112 processando o item de trabalho.
[0051] Deve ser apreciado que um ou mais componentes do centro de contato 102 podem ser implementados em uma arquitetura baseada em nuvem em sua totalidade, ou seus componentes (por exemplo, híbrido), além de modalidades sendo inteiramente locais. Em uma modalidade, o dispositivo de comunicação de cliente 108 está conectado a um dos recursos 112 por meio de componentes inteiramente hospedados por um provedor de serviços baseado em nuvem, em que os elementos de processamento e armazenamento de dados podem ser dedicados à operadora do centro de contato 102 ou compartilhados ou distribuídos entre uma pluralidade dos clientes de provedor de serviços, um deles sendo o centro de contato 102.
[0052] Em uma modalidade, uma mensagem é gerada pelo dispositivo de comunicação de cliente 108 e recebida, por meio da rede de comunicação 104, no mecanismo de atribuição de trabalho 116 . A mensagem recebida por um centro de contato 102, tal como no mecanismo de atribuição de trabalho 116, é geralmente, e aqui, referida como um "contato". O motor de roteamento 132 roteia o contato para pelo menos um dos recursos 112 para processamento.
[0053] Embora os recursos 112 sejam incorporados de várias maneiras, conforme descrito acima, as modalidades neste documento são direcionadas a um agente humano utilizando um dispositivo de comunicação de agente. O dispositivo de comunicação de agente compreende pelo menos uma câmera, para capturar uma imagem de vídeo ao vivo do agente; uma tela, para apresentar ao agente uma imagem de vídeo ao vivo do cliente, utilizando um dispositivo de comunicação de cliente compreendendo pelo menos uma câmera; um processador (ou seja, pelo menos um microprocessador); um armazenamento de dados e/ou memória acessível ao processador; e uma interface de rede. Em certas modalidades, o dispositivo de comunicação de agente pode omitir tais componentes internamente, mas quando omitidos internamente, terá acesso a tais componentes omitidos por meio de uma conexão de dados, como uma rede ou dispositivo periférico conectado. As modalidades neste documento são geralmente direcionadas a um dispositivo de comunicação de agente, utilizado por um agente humano que não sinaliza, e um dispositivo de comunicação de cliente, utilizado por um cliente que sinaliza e, portanto, o dispositivo de comunicação de agente compreende ainda ou utiliza um microfone para capturar a fala do agente humano e componentes e/ou instruções para converter a fala em linguagem de sinais. Em outra modalidade, o agente humano sinaliza e o cliente não sinaliza e, portanto, o dispositivo de comunicação de cliente compreende um microfone para capturar a fala do cliente que outros sistemas e mitologias então convertem em linguagem de sinais.
[0054] A Figura 2 representa a transformação de imagem 200 de acordo com modalidades da presente divulgação. A transformação de imagem 200 pode ser realizada por pelo menos um processador executando instruções conforme descrito neste documento. Em uma modalidade, a imagem bruta 202 é capturada por uma câmera de um agente humano, como um envolvido em uma interação com um cliente por meio de uma rede (não mostrada). A imagem bruta 202 é capturada e processada por um processador para se tornar a imagem processada 204. Mais especificamente, o agente humano não está sinalizando, e geralmente se comunica por meio do fornecimento de fala a um microfone conectado a um processador. O gesto 206 é neutro ou não fornece nenhuma informação útil sinalizada. Após o processamento, o gesto 208 é inserido na imagem e a imagem processada resultante 204 fornecida ao dispositivo de comunicação de cliente.
[0055] Como será descrito mais detalhadamente em relação às modalidades que seguem, o gesto 206 pode ser substituído pelo gesto 208. Em uma das implementações mais simples, a porção da imagem bruta 202 compreendendo as mãos e, pelo menos, antebraços do agente humano é substituída por uma caixa semelhante a um recurso de imagem-em-imagem, em que a caixa inserida apresenta imagens de mãos fazendo gestos de linguagem de sinais. No entanto, tal técnica pode ser ineficaz para apresentar uma imagem realista da sinalização do agente humano. Em outra implementação, uma sobreposição digital é mapeada para a imagem das mãos do agente humano (ver Figura 3), adicional ou alternativamente, compostagem de chroma key, realidade aumentada ou outra técnica de processamento de vídeo pode ser fornecida para permitir que a imagem bruta 202 forneça a aparência de um agente humano sinalizando quando o agente humano não está sinalizando.
[0056] A Figura 3 representa o mapeamento de transformação de imagem 300 de acordo com modalidades da presente divulgação. Em uma modalidade, a imagem bruta 202 é dividida, por pelo menos um processador, em uma série de polígonos, como o polígono 304A. O pelo menos um processador então altera (por exemplo, estica, dimensiona, clareia/escurece para adicionar/remover sombras, oculta/revela, gira, transpõe, etc.) o polígono 304A para se tornar o polígono 304B na imagem processada 204 e, assim, apresentar um gesto de linguagem de sinais.
[0057] Polígonos, como o polígono 304, podem ser formados a partir dos vértices dos marcadores 302A capturados na imagem bruta 202. Os polígonos podem marcar um ponto de interesse conhecido (por exemplo, os dígitos de uma mão) e/ou uma transição de um atributo de vídeo (por exemplo, cor, matiz, brilho, contraste, etc.) para outro, que pode estar acima de um limiar previamente determinado. Embora a imagem bruta 202 e a imagem processada 204 ilustrem um número limitado de marcadores 302A e 302B, respectivamente, a fim de evitar complicar demais a figura, deve ser apreciado que qualquer número de marcadores pode ser utilizado a fim de fornecer a resolução desejada do gesto. Por exemplo, as mãos são a fonte primária de informações visuais em linguagem de sinais e podem ser fornecidas com marcadores suficientes para identificar a posição de cada articulação do dedo, punho, rotação geral da mão, etc. Adicionalmente ou alternativamente, menos marcadores podem ser fornecidos às áreas transmitindo menos informações, como ombro ou cotovelo. Deve ser apreciado que, embora as modalidades neste documento sejam geralmente direcionadas a fornecer imagens das mãos que sinalizam, de um agente humano que não sinaliza, para um cliente, que outras partes do corpo e posições podem ser utilizadas sem se afastar do escopo das modalidades aqui. Por exemplo, levantar sobrancelhas e inclinar a cabeça pode ser aplicado para formar uma parte da imagem processada 204, como um meio para transmitir a pergunta de uma questão contra uma afirmação.
[0058] A Figura 4 representa o sistema 400 de acordo com modalidades da presente divulgação. Em uma modalidade, o agente humano 410 está envolvido em uma interação com o cliente 402 por meio da rede 104. O dispositivo de comunicação de agente 406 pode ser um computador tendo uma interface de comunicação, de modo a permitir comunicações com o servidor 404, rede 104 e/ou outros componentes. O dispositivo de comunicação de agente 406 pode compreender a câmera 408 para capturar imagens do agente humano 410, o microfone 412 para capturar a fala fornecida pelo agente humano 410, alto-falantes 414 para apresentar áudio, tal como a fala gerada pelo servidor 404 e/ou dispositivo de comunicação de agente 406, para agente humano 410. Deve ser apreciado que o fator de forma ilustrado (por exemplo, fone de ouvido) é meramente ilustrativo e outros fatores de forma, em particular uma modalidade de microfone 412 que não obscurece visualmente a boca do agente humano 410 para a câmera 408, podem ser utilizados.
[0059] A câmera 408 recebe a imagem ao vivo do agente humano 410 e o microfone 412 recebe a fala do agente humano 410. Os sinais a partir da câmera 408 e/ou do microfone 412 podem ser processados por pelo menos um processador, como aqueles associados ao servidor 404. O servidor 404 pode determinar que o agente humano 410 disse uma palavra ou frase e acessa um registro mantido no banco de dados 416, tal como o registro 418 compreendendo representações 420 de gestos de linguagem de sinais. Deve ser apreciado que, embora as representações 420 sejam ilustradas como gráficos, o conteúdo real mantido no banco de dados 416 são instruções de computador e/ou elementos gráficos que podem ser utilizados para criar uma imagem processada (por exemplo, imagem processada 204) . As representações 420 podem compreender mapas de vetor, para permitir que um processador mova um marcador (ver marcadores 3 02 da Figura 3) de uma posição dentro de um quadro para outro e redesenhe o(s) polígono(s) tendo o marcador movido como um vértice; imagens de vídeo, como gestos previamente gravados feitos por um agente, como o agente humano 410; geometrias e seus movimentos para fornecer gestos de linguagem de sinais; e/ou outro ativo gráfico e/ou instrução para criar uma imagem processada a partir de uma imagem bruta para compreender um gesto de linguagem de sinais.
[0060] Em outra modalidade, o servidor 404 seleciona a representação 422 de um gesto de linguagem de sinais associado à fala fornecida pelo agente humano 410. Pelo menos um processador, tal como associado ao servidor 404, então aplica a representação à imagem ao vivo capturada pela câmera 408 para criar uma imagem processada. A imagem processada é fornecida, por meio da rede 104, ao dispositivo de comunicação de cliente 108, como a tela 420 mostrando a imagem processada ao cliente 402.
[0061] Em outra modalidade, a câmera 424 captura imagens ao vivo do cliente 402 para serem transmitidas ao servidor 404 por meio da rede 104. O servidor 404 então aplica uma imagem de reconhecimento visual, tal como pode ser conhecido na técnica, para gerar voz e/ou texto para apresentação ao agente humano 410 por meio do computador 406 e/ou alto-falantes 414.
[0062] A Figura 5 representa o processo 500 de acordo com modalidades da presente divulgação. Em uma modalidade, o processo 500 é fornecido como um conjunto de instruções legíveis e executáveis por máquina para execução por pelo menos um processador, como pelo menos um processador do servidor 404 e/ou dispositivo de comunicação de agente 406 (ver Figura 4). Em uma modalidade, o passo 502 recebe uma imagem de vídeo de um agente humano, como a câmera 408 capturando uma imagem em tempo real do agente humano 410 envolvido em uma interação com o cliente 402. O passo 504 recebe um sinal de áudio de fala fornecida por um agente humano, tal como pelo microfone 412. O passo 506 determina um gesto de linguagem de sinais associado à fala. O passo 508 cria e/ou gera uma modificação de vídeo, como por meio de instruções de execução ou configurações que descrevem como pelo menos um processador deve manipular uma imagem e/ou recuperar um vídeo previamente gravado associado. O passo 510 modifica a imagem do agente humano com as modificações de vídeo, e o passo 512 entrega o vídeo modificado ao cliente por meio de um dispositivo de comunicação de cliente.
[0063] Figura 6 representa o dispositivo 602 no sistema 600 de acordo com modalidades da presente divulgação. Em uma modalidade, o dispositivo de comunicação de agente 406 e/ou servidor 4 04 pode ser incorporado, no todo ou em parte, como dispositivo 602 compreendendo vários componentes e conexões a outros componentes e/ou sistemas. Os componentes são incorporados de várias maneiras e podem compreender o processador 604. O processador 604 pode ser incorporado como um único microprocessador eletrônico ou dispositivo multiprocessador (por exemplo, multinúcleo) tendo nele componentes tais como unidade(s) de controle, unidade(s) de entrada/saída, unidade de lógica aritmética(s), registrador(es), memória primária e/ou outros componentes que acessam informações (por exemplo, dados, instruções, etc.), como recebidas por meio de barramento 614, executa instruções, e emite dados, novamente como por meio de barramento 614.
[0064] Além dos componentes do processador 604, o dispositivo 602 pode utilizar a memória 606 e/ou armazenamento de dados 6 08 para o armazenamento de dados acessíveis, como instruções, valores, etc. A interface de comunicação 610 facilita a comunicação com componentes, como processador 604 por meio do barramento 614 com componentes não acessíveis por meio do barramento 614. A interface de comunicação 610 pode ser incorporada como uma porta de rede, placa, cabo ou outro dispositivo de hardware configurado. Adicionalmente ou alternativamente, a interface de entrada/saída 612 se conecta a um ou mais componentes de interface para receber e/ou apresentar informações (por exemplo, instruções, dados, valores, etc.) para e/ou de um dispositivo humano e/ou eletrônico. Exemplos de dispositivos de entrada/saída 630 que podem ser conectados à interface de entrada/saída incluem, mas não estão limitados a, teclado, mouse, trackball, impressoras, exibições, sensor, comutador, relé, etc. Em outra modalidade, a interface de comunicação 610 pode compreender, ou ser composta por, interface de entrada/saída 612. A interface de comunicação 610 pode ser configurada para se comunicar diretamente com um componente de rede ou utilizar uma ou mais redes, como rede 620 e/ou rede 624.
[0065] A rede 104 pode ser incorporada, no todo ou em parte, como rede 620. Rede 620 pode ser uma rede com fio (por exemplo, Ethernet) , rede sem fio (por exemplo, WiFi, Bluetooth, celular, etc.), ou uma combinação das mesmas e permitir que o dispositivo 602 se comunique com o(s) componente(s) de rede 622.
[0066] Adicionalmente ou alternativamente, uma ou mais outras redes podem ser utilizadas. Por exemplo, a rede 624 pode representar uma segunda rede, que pode facilitar a comunicação com os componentes utilizados pelo dispositivo 602. Por exemplo, a rede 624 pode ser uma rede interna para o centro de contato 102 em que os componentes são confiáveis (ou pelo menos mais do que) do que os componentes ligados em rede 622, que podem ser conectados à rede 620 compreendendo uma rede pública (por exemplo, Internet) que pode não ser tão confiável. Os componentes anexados à rede 624 podem incluir memória 626, armazenamento de dados 628, dispositivo(s) de entrada/saída 630 e/ou outros componentes que podem ser acessíveis ao processador 604. Por exemplo, memória 62 6 e/ou armazenamento de dados 628 podem complementar ou suplantar a memória 606 e/ou o armazenamento de dados 608 inteiramente ou para uma tarefa ou propósito particular. Por exemplo, a memória 626 e/ou armazenamento de dados 628 pode ser um repositório de dados externo (por exemplo, fazenda de servidores, matriz, "nuvem" etc.) e permitir que o dispositivo 602 e/ou outros dispositivos acessem os dados nela. Da mesma forma, o(s) dispositivo(s) de entrada/saída 630 pode(m) ser acessado(s) pelo processador 604 por meio de interface de entrada/saída 612 e/ou por meio de interface de comunicação 610, seja diretamente, por meio de rede 624, por meio de rede 620 sozinha (não mostrada) ou por meio de redes 624 e 620.
[0067] Deve ser apreciado que dados legíveis por computador podem ser enviados, recebidos, armazenados, processados e apresentados por uma variedade de componentes. Também deve ser apreciado que os componentes ilustrados podem controlar outros componentes, sejam aqui ilustrados ou de outra forma. Por exemplo, um dispositivo de entrada/saída 630 pode ser um roteador, comutador, porta ou outro componente de comunicação, de modo que uma determinada saída do processador 604 habilite (ou desabilite) o dispositivo de entrada/saída 630, que pode estar associado à rede 620 e/ou rede 624, para permitir (ou não permitir) comunicações entre dois ou mais nós na rede 620 e/ou rede 624. Por exemplo, uma conexão entre um cliente específico, usando um dispositivo de comunicação de cliente específico 108, pode ser habilitada (ou desabilitada) com um componente ligado em rede particular 622 e/ou recurso particular 112, tal como agente humano 410 utilizando dispositivo de comunicação de agente 406 e vários dispositivos periféricos (por exemplo, câmera 408, microfone 412 e/ou alto-falante 414) . Da mesma forma, um componente ligado em rede 622 e/ou recurso particular 112 pode ser habilitado (ou desabilitado) de se comunicar com um outro componente ligado em rede 622 e/ou recurso particular 112, incluindo, em certas modalidades, o dispositivo 602 ou vice-versa. Os versados na técnica apreciarão que outro equipamento de comunicação pode ser utilizado, além ou como uma alternativa, àqueles descritos neste documento, sem se afastar do escopo das modalidades.
[0068] Na descrição anterior, para fins de ilustração, os métodos foram descritos em uma ordem particular. Deve ser apreciado que em modalidades alternativas, os métodos podem ser realizados em uma ordem diferente daquela descrita, sem se afastar do escopo das modalidades. Também deve ser apreciado que os métodos descritos acima podem ser executados como algoritmos executados por componentes de hardware (por exemplo, circuitos) construídos para realizar um ou mais algoritmos ou partes dos mesmos aqui descritos. Em outra modalidade, o componente de hardware pode compreender um microprocessador de propósito geral (por exemplo, CPU, GPU) que é primeiro convertido em um microprocessador de propósito especial. O microprocessador de propósito especial então tendo carregado no mesmo, sinais codificados fazendo com que o microprocessador, agora de propósito especial, mantenha instruções legíveis por máquina para permitir ao microprocessador ler e executar o conjunto legível por máquina de instruções derivadas dos algoritmos e/ou outras instruções aqui descritas. As instruções legíveis por máquina utilizadas para executar o(s) algoritmo(s), ou partes deles, não são ilimitadas, mas utilizam um conjunto finito de instruções conhecido pelo microprocessador. As instruções legíveis por máquina podem ser codificadas no microprocessador como sinais ou valores em componentes de produção de sinal e incluídas, em uma ou mais modalidades, tensões em circuitos de memória, configuração de circuitos de comutação, e/ou pelo uso seletivo de circuitos de porta lógica particulares. Adicionalmente ou alternativamente, as instruções legíveis por máquina podem ser acessíveis ao microprocessador e codificadas em uma mídia ou dispositivo como campos magnéticos, valores de voltagem, valores de carga, porções reflexivas/não reflexivas, e/ou sinais físicos.
[0069] Em outra modalidade, o microprocessador compreende ainda um ou mais de um único microprocessador, um processador multinúcleo, uma pluralidade de microprocessadores, um sistema de processamento distribuído (por exemplo, matriz(es), lâmina(s), conjunto de servidor(es), "nuvem", matriz(es) de processador multipropósito, agrupamento(s), etc.) e/ou pode ser co-localizado com um microprocessador executando outras operações de processamento. Qualquer um ou mais microprocessadores podem ser integrados em um único aparelho de processamento (por exemplo, computador, servidor, lâmina, etc.) ou localizados inteiramente ou em parte em um componente discreto conectado por meio de um enlace de comunicação (por exemplo, barramento, rede, backplane, etc. ou uma pluralidade dos mesmos).
[0070] Exemplos de microprocessadores de propósito geral podem compreender, uma unidade de processamento central (CPU) com valores de dados codificados em um registrador de instrução (ou outro circuito que mantém instruções) ou valores de dados compreendendo localizações de memória, que por sua vez compreendem valores utilizados como instruções. As localizações de memória podem compreender ainda uma localização de memória que é externa à CPU. Tais componentes externos de CPU podem ser incorporados como um ou mais de uma arranjo de portas programáveis em campo (FPGA), memória somente de leitura (ROM), memória somente de leitura programável (PROM), memória somente de leitura programável apagável (EPROM), memória de acesso aleatório (RAM), armazenamento acessível por barramento, armazenamento acessível por rede, etc.
[0071] Estas instruções executáveis por máquina podem ser armazenadas em um ou mais meios legíveis por máquina, como CD-ROMs ou outro tipo de discos óticos, disquetes, ROMs, RAMs, EPROMs, EEPROMs, cartões magnéticos ou óticos, memória flash, ou outros tipos de meios legíveis por máquina adequados para armazenar instruções eletrônicas. Alternativamente, os métodos podem ser realizados por uma combinação de hardware e software.
[0072] Em outra modalidade, um microprocessador pode ser um sistema ou coleção de componentes de hardware de processamento, como um microprocessador em um dispositivo cliente e um microprocessador em um servidor, uma coleção de dispositivos com seu respectivo microprocessador, ou um serviço de processamento compartilhado ou remoto (por exemplo, microprocessador baseado em "nuvem"). Um sistema de microprocessadores pode compreender alocação específicas de tarefas de tarefas de processamento e/ou tarefas de processamento compartilhadas ou distribuídas. Em ainda outra modalidade, um microprocessador pode executar software para fornecer os serviços para emular um microprocessador ou microprocessadores diferentes. Como resultado, o primeiro microprocessador, composto por um primeiro conjunto de componentes de hardware, pode fornecer virtualmente os serviços de um segundo microprocessador, pelo qual o hardware associado ao primeiro microprocessador pode operar usando um conjunto de instruções associado ao segundo microprocessador.
[0073] Embora as instruções executáveis por máquina possam ser armazenadas e executadas localmente em uma máquina específica (por exemplo, computador pessoal, dispositivo de computação móvel, laptop, etc.), deve ser apreciado que o armazenamento de dados e/ou instruções e/ou a execução de pelo menos uma parte das instruções pode ser fornecido por meio de conectividade a um dispositivo de armazenamento e/ou processamento de dados remoto ou coleção de dispositivos, comumente conhecidos como "a nuvem", mas pode incluir um serviço público, privado, dedicado, compartilhado e/ou outro bureau de serviços, serviço de computação e/ou "fazenda de servidores".
[0074] Exemplos de microprocessadores conforme descritos neste documento podem incluir, mas não estão limitados a, pelo menos um dos Qualcomm® Snapdragon® 800 e 801, Qualcomm® Snapdragon® 610 e 615 com integração 4G LTE e computação de 64 bits, Microprocessador Apple® A7 com arquitetura de 64 bits, motion comicroprocessadores Apple® M7, Samsung® Exynos® series, a família Intel® Core ™ de microprocessadores, a família Intel® Xeon® de microprocessadores, a família Intel® Atom™ de microprocessadores, a família Intel Itanium® de microprocessadores, Intel® Core® i5-4670K e i7-4770K 22nm Haswell, Intel® Core® i5-3570K 22nm Ivy Bridge, a família AMD® FX™ de microprocessadores, AMD® FX-4300, 6300 e FX-8350 32nm Vishera, microprocessadores AMD® Kaveri, microprocessadores de infoentretenimento automotivo da Texas Instruments® Jacinto C6000™, microprocessadores móveis de classe automotiva da Texas Instruments® OMAP™, microprocessadores ARM® Cortex™-M, microprocessadores ARM® Cortex-A e ARM926EJ-S™, outros microprocessadores equivalentes da indústria, e podem realizar funções computacionais usando qualquer padrão conhecido ou desenvolvido no futuro, conjunto de instruções, bibliotecas e/ou arquitetura.
[0075] Qualquer um dos passos, funções e operações aqui discutidos podem ser realizados contínua e automaticamente.
[0076] Os sistemas e métodos exemplares desta invenção foram descritos em relação aos sistemas de comunicações e componentes e métodos para monitorar, melhorar e embelezar comunicações e mensagens. No entanto, para evitar obscurecer desnecessariamente a presente invenção, a descrição anterior omite uma série de estruturas e dispositivos conhecidos. Esta omissão não deve ser interpretada como uma limitação do escopo da invenção reivindicada. Detalhes específicos são apresentados para fornecer uma compreensão da presente invenção. Deve, no entanto, ser apreciado que a presente invenção pode ser praticada de uma variedade de maneiras além dos detalhes específicos aqui estabelecidos.
[0077] Além disso, embora as modalidades exemplares ilustradas neste documento mostrem os vários componentes do sistema co-localizados, certos componentes do sistema podem ser localizados remotamente, em partes distantes de uma rede distribuída, como uma LAN e/ou a Internet, ou dentro de um sistema dedicado. Assim, deve ser apreciado que os componentes ou partes dos mesmos (por exemplo, microprocessadores, memória/armazenamento, interfaces, etc.) do sistema podem ser combinados em um ou mais dispositivos, como um servidor, servidores, computador, dispositivo de computação, terminal, "nuvem" ou outro processamento distribuído, ou co-localizados em um nó específico de uma rede distribuída, como uma rede de telecomunicações analógica e/ou digital, uma rede de comutação de pacotes ou uma rede de comutação de circuitos. Em outra modalidade, os componentes podem ser físicos ou logicamente distribuídos por meio de uma pluralidade de componentes (por exemplo, um microprocessador pode compreender um primeiro microprocessador em um componente e um segundo microprocessador em outro componente, cada um executando uma parte de uma tarefa compartilhada e/ou tarefa alocada). Será apreciado a partir da descrição anterior, e por razões de eficiência computacional, que os componentes do sistema podem ser dispostos em qualquer localização dentro de uma rede distribuída de componentes sem afetar a operação do sistema. Por exemplo, os vários componentes podem estar localizados em um comutador, como um PBX e servidor de mídia, gateway, em um ou mais dispositivos de comunicação, nas instalações de um ou mais usuários, ou alguma combinação dos mesmos. Da mesma forma, uma ou mais partes funcionais do sistema podem ser distribuídas entre um(s) dispositivo(s) de telecomunicações e um dispositivo de computação associado.
[0078] Além disso, deve ser apreciado que os vários enlaces que conectam os elementos podem ser enlaces com fio ou sem fio, ou qualquer combinação dos mesmos, ou qualquer outro elemento conhecido ou desenvolvido posteriormente que é capaz de fornecer e/ou comunicar dados para e dos elementos conectados. Esses enlaces com ou sem fio também podem ser enlaces seguros e podem comunicar informações criptografadas. Os meios de transmissão usados como enlaces, por exemplo, podem ser qualquer portadora adequada para sinais elétricos, incluindo cabos coaxiais, fios de cobre e fibra ótica, e podem assumir a forma de ondas acústicas ou de luz, como aquelas geradas durante ondas de rádio e comunicações de dados infravermelhos.
[0079] Além disso, embora os fluxogramas tenham sido discutidos e ilustrados em relação a uma sequência particular de eventos, deve ser apreciado que mudanças, adições e omissões a esta sequência podem ocorrer sem afetar materialmente a operação da invenção.
[0080] Podem ser utilizadas várias variações e modificações da invenção. Seria possível fornecer alguns recursos da invenção sem fornecer outros.
[0081] Em ainda outra modalidade, os sistemas e métodos desta invenção podem ser implementados em conjunto com um computador de propósito especial, um microprocessador ou microcontrolador programado e elemento(s) de circuito integrado periférico, um ASIC ou outro circuito integrado, um microprocessador de sinal digital, um circuito eletrônico ou lógico com fio, como circuito de elemento discreto, um dispositivo lógico programável ou arranjo de portas, como PLD, PLA, FPGA, PAL, computador de propósito especial, qualquer meio comparável, ou semelhantes. Em geral, qualquer dispositivo(s) ou meio capaz de implementar a metodologia ilustrada neste documento pode ser usado para implementar os vários aspectos desta invenção. Hardware exemplar que pode ser usado para a presente invenção inclui computadores, dispositivos portáteis, telefones (por exemplo, celular, habilitado para Internet, digital, analógico, híbrido e outros), e outro hardware conhecido na técnica. Alguns desses dispositivos incluem microprocessadores (por exemplo, um único ou vários microprocessadores), memória, armazenamento não volátil, dispositivos de entrada e dispositivos de saída. Além disso, implementações de software alternativas, incluindo, mas não se limitando a, processamento distribuído ou processamento distribuído de componente/objeto, processamento paralelo, ou processamento de máquina virtual também podem ser construídas para implementar os métodos descritos aqui.
[0082] Em ainda outra modalidade, os métodos divulgados podem ser prontamente implementados em conjunto com software usando ambientes de desenvolvimento de software de objetos ou orientados a objeto que fornecem código-fonte portátil que pode ser usado em uma variedade de plataformas de computador ou estação de trabalho. Alternativamente, o sistema divulgado pode ser implementado parcialmente ou totalmente em hardware usando circuitos lógicos padrão ou projeto VLSI. Se software ou hardware é usado para implementar os sistemas de acordo com esta invenção é dependente dos requisitos de velocidade e/ou eficiência do sistema, a função particular e os sistemas de software ou hardware particulares ou sistemas de microprocessador ou microcomputador sendo utilizados.
[0083] Em ainda outra modalidade, os métodos divulgados podem ser parcialmente implementados em software que pode ser armazenado em um meio de armazenamento, executado em um computador de propósito geral programado com a cooperação de um controlador e memória, um computador de propósito especial, um microprocessador, ou semelhantes. Nestes casos, os sistemas e métodos desta invenção podem ser implementados como um programa embutido em um computador pessoal, como um miniaplicativo, script JAVA® ou CGI, como um recurso residente em um servidor ou estação de trabalho de computador, como uma rotina embutida em um sistema de medição dedicado, componente de sistema ou semelhantes. O sistema também pode ser implementado pela incorporação física do sistema e/ou método em um sistema de software e/ou hardware.
[0084] As modalidades aqui compreendidas pelo software são executadas, ou armazenadas para execução subsequente, por um ou mais microprocessadores e são executadas como código executável. O código executável sendo selecionado para executar instruções que compreendem a modalidade particular. As instruções executadas sendo um conjunto restrito de instruções selecionadas a partir do conjunto discreto de instruções nativas compreendidas pelo microprocessador e, antes da execução, comprometidas com a memória acessível por microprocessador. Em outra modalidade, software de "código-fonte" legível por humanos, antes da execução pelo um ou mais microprocessadores, é primeiro convertido em software de sistema para compreender um conjunto específico de plataforma (por exemplo, computador, microprocessador, banco de dados, etc.) de instruções selecionadas a partir do conjunto de instruções nativas da plataforma.
[0085] Embora a presente invenção descreva componentes e funções implementados nas modalidades com referência a padrões e protocolos particulares, a invenção não está limitada a tais padrões e protocolos. Outros padrões e protocolos semelhantes não mencionados aqui existem e são considerados incluídos na presente invenção. Além disso, os padrões e protocolos mencionados neste documento e outros padrões e protocolos semelhantes não mencionados neste documento são substituídos periodicamente por equivalentes mais rápidos ou eficazes tendo essencialmente as mesmas funções. Tais padrões e protocolos de substituição com as mesmas funções são considerados equivalentes incluídos na presente invenção.
[0086] A presente invenção, em várias modalidades, configurações e aspectos, inclui componentes, métodos, processos, sistemas e/ou aparelhos substancialmente conforme representado e descrito neste documento, incluindo várias modalidades, subcombinações e subconjuntos dos mesmos. Os versados na técnica entenderão como fazer e usar a presente invenção depois de compreender a presente divulgação. A presente invenção, em várias modalidades, configurações e aspectos, inclui o fornecimento de dispositivos e processos na ausência de itens não representados e/ou descritos aqui ou em várias modalidades, configurações ou aspectos dos mesmos, incluindo a ausência de tais itens como pode ter sido usado em dispositivos ou processos anteriores, por exemplo, para melhorar o desempenho, obter facilidade e/ou reduzir o custo de implementação.
[0087] A discussão anterior da invenção foi apresentada para fins de ilustração e descrição. O anterior não se destina a limitar a invenção à forma ou formas aqui divulgadas. Na Descrição Detalhada anterior, por exemplo, vários recursos da invenção são agrupados em uma ou mais modalidades, configurações ou aspectos com a finalidade de agilizar a divulgação. Os recursos das modalidades, configurações ou aspectos da invenção podem ser combinados em modalidades, configurações ou aspectos diferentes daqueles discutidos acima. Este método de divulgação não deve ser interpretado como refletindo uma intenção de que a invenção reivindicada requer mais recursos do que os expressamente citados em cada reivindicação. Em vez disso, como as reivindicações a seguir refletem, os aspectos inventivos estão em menos do que todos os recursos de uma única modalidade, configuração ou aspecto divulgado anteriormente. Assim, as seguintes reivindicações são aqui incorporadas nesta Descrição Detalhada, com cada uma das reivindicações por si só como uma modalidade preferida separada da invenção.
[0088] Além disso, embora a descrição da invenção inclua a descrição de uma ou mais modalidades, configurações ou aspectos e certas variações e modificações, outras variações, combinações e modificações estão dentro do escopo da invenção, por exemplo, como pode estar dentro da habilidade e conhecimento daqueles na técnica, após compreender a presente divulgação. Destina-se a obter direitos, que incluem modalidades alternativas, configurações ou aspectos na medida do permitido, incluindo estruturas, funções, intervalos ou passos alternativos, intercambiáveis e/ou equivalentes àqueles reivindicados, se ou não tais estruturas, funções, intervalos ou passos alternativos, intercambiáveis e/ou equivalentes são divulgados neste documento, e sem a intenção de dedicar publicamente qualquer assunto patenteável.

Claims (10)

  1. Sistema para tradução de linguagem de sinais em tempo real, caracterizado pelo fato de que compreende:
    uma interface de comunicação configurada para receber uma imagem de vídeo de um agente humano envolvido em uma interação por meio de uma rede com um cliente utilizando um dispositivo de comunicação de cliente;
    um processador tendo uma memória acessível; e
    o processador configurado para:
    receber a imagem de vídeo do agente humano;
    receber uma entrada de áudio compreendendo a fala do agente humano;
    determinar um gesto de linguagem de sinais da fala;
    modificar a imagem de vídeo do agente humano para compreender o gesto de linguagem de sinais; e
    apresentar o dispositivo de comunicação de cliente com a imagem de vídeo modificada do agente humano compreendendo o gesto de linguagem de sinais.
  2. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda:
    um armazenamento de dados configurado para manter registros de dados acessíveis ao processador; e
    em que o processador é ainda configurado para selecionar um registro a partir do armazenamento de dados compreendendo um gesto pré-gravado e selecionado de acordo com o gesto de linguagem de sinais determinado da fala e em que o processador modifica a imagem de vídeo do agente humano compreendendo sobrepor o gesto pré-gravado na imagem de vídeo do agente humano.
  3. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador é ainda configurado para mapear partes da imagem de vídeo compreendendo partes associadas da anatomia do agente humano ao gesto de linguagem de sinais e em que a modificação da imagem de vídeo do agente humano para compreender o gesto de linguagem de sinais, compreende ainda, colocar as partes mapeadas da anatomia do agente humano para coincidir com o gesto de linguagem de sinais.
  4. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador é ainda configurado para gerar imagens de partes da anatomia do agente humano para fazer com que as imagens geradas produzam o gesto de linguagem de sinais e em que o processador modifica a imagem de vídeo do agente humano compreendendo as imagens sobrepondo a imagem de vídeo do agente humano.
  5. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador modifica a imagem de vídeo do agente humano para compreender o gesto de linguagem de sinais, compreendendo a aplicação de alterações a pelo menos um polígono mapeando partes da imagem de vídeo do agente humano de acordo com os dados de alteração mantidos em um armazenamento de dados.
  6. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a modificação da imagem de vídeo do agente humano para compreender o gesto de linguagem de sinais compreende ainda modificar uma parte da imagem de vídeo do chroma key de agente humano mascarado e omitir a modificação da imagem de vídeo do agente humano que não tem máscara de chroma key.
  7. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que a modificação da imagem de vídeo do agente humano para compreender o gesto de linguagem de sinais compreende ainda a modificação de uma parte da imagem de vídeo compreendendo a boca do agente humano e a aplicação de uma modificação de sincronização para fazer com que a fala do agente humano seja sincronizada com o gesto de linguagem de sinais.
  8. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador é ainda configurado para:
    receber uma imagem de vídeo do cliente;
    determinar um gesto de linguagem de sinais a partir da imagem de vídeo do cliente;
    traduzir o determinado gesto de linguagem de sinais em fala; e
    apresentar a fala ao agente humano.
  9. Sistema, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador é ainda configurado para:
    receber uma imagem de vídeo do cliente;
    determinar um gesto de linguagem de sinais a partir da imagem de vídeo do cliente;
    traduzir o gesto de linguagem de sinais determinado em texto; e
    apresentar o texto ao agente humano.
  10. Método, caracterizado pelo fato de que compreende:
    receber uma imagem de vídeo de um agente humano envolvido em uma interação, por meio de uma rede, com um cliente utilizando um dispositivo de comunicação de cliente;
    receber a imagem de vídeo do agente humano;
    receber uma entrada de áudio compreendendo a fala do agente humano;
    determinar um gesto de linguagem de sinais da fala;
    modificar a imagem de vídeo do agente humano para compreender o gesto de linguagem de sinais; e
    apresentar o dispositivo de comunicação de cliente com a imagem de vídeo modificada do agente humano compreendendo o gesto de linguagem de sinais.
BR102020017532-7A 2019-08-30 2020-08-27 Conversão de linguagem de sinais em tempo real para comunicação em um centro de contato BR102020017532A2 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/557,488 US10757251B1 (en) 2019-08-30 2019-08-30 Real time sign language conversion for communication in a contact center
US16/557,488 2019-08-30

Publications (1)

Publication Number Publication Date
BR102020017532A2 true BR102020017532A2 (pt) 2021-03-16

Family

ID=72140913

Family Applications (1)

Application Number Title Priority Date Filing Date
BR102020017532-7A BR102020017532A2 (pt) 2019-08-30 2020-08-27 Conversão de linguagem de sinais em tempo real para comunicação em um centro de contato

Country Status (2)

Country Link
US (2) US10757251B1 (pt)
BR (1) BR102020017532A2 (pt)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11785140B2 (en) 2020-09-23 2023-10-10 Avaya Management L.P. Gesture-based call center agent state change control
US11294474B1 (en) * 2021-02-05 2022-04-05 Lenovo (Singapore) Pte. Ltd. Controlling video data content using computer vision
US11822490B2 (en) 2021-10-14 2023-11-21 Samsung Electronics Co., Ltd. Systems, methods, and devices for accessing a device operating system over an interconnect
US20230353613A1 (en) * 2022-04-29 2023-11-02 Zoom Video Communications, Inc. Active speaker proxy presentation for sign language interpreters

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6477239B1 (en) * 1995-08-30 2002-11-05 Hitachi, Ltd. Sign language telephone device
US20020140718A1 (en) * 2001-03-29 2002-10-03 Philips Electronics North America Corporation Method of providing sign language animation to a monitor and process therefor
US7333507B2 (en) * 2001-08-31 2008-02-19 Philip Bravin Multi modal communications system
US20110157472A1 (en) * 2004-06-24 2011-06-30 Jukka Antero Keskinen Method of simultaneously watching a program and a real-time sign language interpretation of the program
US20090012788A1 (en) * 2007-07-03 2009-01-08 Jason Andre Gilbert Sign language translation system
US20100235218A1 (en) 2008-09-29 2010-09-16 Avaya Inc. Pre-qualified or history-based customer service
US8964958B2 (en) 2009-05-20 2015-02-24 Avaya Inc. Grid-based contact center
US20140171036A1 (en) * 2009-11-18 2014-06-19 Gwendolyn Simmons Method of communication
US20110125826A1 (en) 2009-11-20 2011-05-26 Avaya Inc. Stalking social media users to maximize the likelihood of immediate engagement
US20110125793A1 (en) 2009-11-20 2011-05-26 Avaya Inc. Method for determining response channel for a contact center from historic social media postings
US8634543B2 (en) 2010-04-14 2014-01-21 Avaya Inc. One-to-one matching in a contact center
US20140331189A1 (en) * 2013-05-02 2014-11-06 Jpmorgan Chase Bank, N.A. Accessible self-service kiosk with enhanced communication features
US20160062987A1 (en) * 2014-08-26 2016-03-03 Ncr Corporation Language independent customer communications
US9965467B2 (en) * 2016-03-28 2018-05-08 Avaya Inc. Sign language communication with communication devices
US10176366B1 (en) * 2017-11-01 2019-01-08 Sorenson Ip Holdings Llc Video relay service, communication system, and related methods for performing artificial intelligence sign language translation services in a video relay service environment
US20190279529A1 (en) * 2018-03-08 2019-09-12 King Saud University Portable robot for two-way communication with the hearing-impaired

Also Published As

Publication number Publication date
US11115526B2 (en) 2021-09-07
US20210067628A1 (en) 2021-03-04
US10757251B1 (en) 2020-08-25

Similar Documents

Publication Publication Date Title
BR102020017532A2 (pt) Conversão de linguagem de sinais em tempo real para comunicação em um centro de contato
US8117538B2 (en) Method for dynamically converting voice XML scripts into other compatible markup language scripts based on required modality
US9344674B2 (en) Method and system for routing video calls to a target queue based upon dynamically selected or statically defined parameters
US11264012B2 (en) Network topology determination and configuration from aggregated sentiment indicators
CN107566671B (zh) 网络语音通信方法及其系统、存储介质、电子设备
JP7473676B2 (ja) オーディオ処理方法、装置、可読媒体及び電子機器
US11196962B2 (en) Method and a device for a video call based on a virtual image
US11194995B1 (en) Video composition management system
US20180130257A1 (en) Intelligent contact recording in a virtual reality contact center
EP3772850A1 (en) Optimizing interaction results using ai-guided manipulated video
US11647056B1 (en) Hybrid videoconferencing architecture for telemedicine
CN107783650A (zh) 一种基于虚拟机器人的人机交互方法及装置
US20210407527A1 (en) Optimizing interaction results using ai-guided manipulated video
US11652921B2 (en) Contact center of celebrities
US20200193965A1 (en) Consistent audio generation configuration for a multi-modal language interpretation system
CN116030825A (zh) 数字人驱动视频生成方法、装置、电子设备及存储介质
US20200226953A1 (en) System and method for facilitating masking in a communication session
US11785140B2 (en) Gesture-based call center agent state change control
US20220407925A1 (en) Cloud automation fulfillment enabler
JP2022068146A (ja) データ注釈方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN111885343B (zh) 特征处理方法及装置、电子设备和可读存储介质
US11677873B2 (en) Artificial ventriloquist-like contact center agents
EP4145444A1 (en) Optimizing interaction results using ai-guided manipulated speech
US12008752B2 (en) Automated scan of common ailments so that a consistent image can be given to a doctor for analysis
US20220414866A1 (en) Automated scan of common ailments so that a consistent image can be given to a doctor for analysis

Legal Events

Date Code Title Description
B03A Publication of a patent application or of a certificate of addition of invention [chapter 3.1 patent gazette]