BR112013013113B1 - Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar ocr e sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste - Google Patents

Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar ocr e sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste Download PDF

Info

Publication number
BR112013013113B1
BR112013013113B1 BR112013013113-6A BR112013013113A BR112013013113B1 BR 112013013113 B1 BR112013013113 B1 BR 112013013113B1 BR 112013013113 A BR112013013113 A BR 112013013113A BR 112013013113 B1 BR112013013113 B1 BR 112013013113B1
Authority
BR
Brazil
Prior art keywords
image
filter
sequence
text
configuration
Prior art date
Application number
BR112013013113-6A
Other languages
English (en)
Other versions
BR112013013113A2 (pt
Inventor
Liam Friel
Original Assignee
Accenture Global Solutions Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Accenture Global Solutions Limited filed Critical Accenture Global Solutions Limited
Publication of BR112013013113A2 publication Critical patent/BR112013013113A2/pt
Publication of BR112013013113B1 publication Critical patent/BR112013013113B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/04Diagnosis, testing or measuring for television systems or their details for receivers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/04Diagnosis, testing or measuring for television systems or their details for receivers
    • H04N17/045Self-contained testing apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

OCR APERFEIÇOADO PARA TESTE DE STB AUTOMATIZADO O presente pedido fornece um sistema de teste configurável por usuário para aparelhos conversores de sinais (STB) e outros dispositivos de consumidor fornecendo saída de vídeo. Em particular, ele fornece um método de melhorar um processo de Reconhecimento Ótico de Caracteres (OCR) em tais sistemas de testes.

Description

CAMPO
[001] O presente pedido de uma maneira geral dizrespeito a teste automatizado de aparelhos conversores de sinais (STB) e de outro equipamento audiovisual.
ANTECEDENTES
[002] Um aparelho conversor de sinais (STB) tambémconhecido como um digibox ou unidade conversora (STU) é um dispositivo que se conecta a uma televisão e a uma fonte externa de sinal, mudando o sinal para conteúdo que pode então ser entregue como um sinal audiovisual (A/V) para exibição na tela de televisão ou em outro dispositivo A/V. Mais frequentemente, a fonte externa de sinal é fornecida por uma conexão via satélite ou de cabo.
[003] Tal como com outros produtos de consumidor, tantofabricantes quanto fornecedores estão interessados em assegurar que produtos operam corretamente e tal como especificado. Inicialmente e até hoje, uma parte significativa do teste é executada manualmente, pelo que um testador emite um comando para o STB que pode ser por meio da interface de usuário no STB propriamente dito ou por meio de um dispositivo de controle remoto tal como ilustrado na figura 1, e observa a resposta do STB em uma tela de TV. Tal como está mostrado na figura 1, um STB típico 10 tem diversas entradas de sinal incluindo um sinal RF 14, o qual, por exemplo, pode ser de uma conexão via satélite ou de cabo. Um sinal A/V 16 também pode ser fornecido como entrada permitindo ao aparelho conversor de sinais alimentar por meio de um sinal para uma televisão proveniente de um VCR, DVD, disco Blu-ray, Media Juke Box ou de outro dispositivo similar. A saída para a televisão é um sinal A/V 18 que pode ser fornecido por meio de uma variedade de interfaces padrões incluindo SCART e HDMI. Para permitir que o usuário controle a operação do STB, diversas teclas e controles similares podem ser fornecidos no STB propriamente dito. Adicionalmente e mais comumente empregado por usuários, o STB pode ter uma entrada de controle remoto de infravermelho (IR) ou sem fio configurada para operar com um dispositivo de controle remoto 12.
[004] Como teste manual pode ser demorado, propenso aerro e em alguns casos carecendo de precisão, um esforço tem sido feito para automatizar alguns destes testes. Em relação a estes testes automatizados, será percebido que este teste tipicamente é executado no produto final por usuários sem necessariamente qualquer conhecimentodetalhado ou acesso ao conjunto de circuitos interno do STB. Desta maneira, o teste de STBs de uma maneira geral é executado em uma base de “caixa preta”, onde somente as entradas e saídas estão disponíveis para modificação e exame. Desta maneira métodos e sistemas de teste têm sido desenvolvidos especificamente para aparelhos conversores de sinais, um exemplo de um sistema como este é StormTest™ fornecido pelo S3 Group de Dublin, Irlanda, que pode ser empregado para testar STBs, televisões e dispositivos similares tais como reprodutores de mídia digital. Um arranjo para um sistema de teste de STB está mostrado na figura 2. O sistema de teste de STB 20 compreende um controlador 28 que gerencia a função de teste e interage com os outros recursos do sistema de teste de STB. Os outros recursos incluem uma interface de saída para controlar um dispositivo de controle remoto 12, permitindo que comandos sejam enviados para o STB, e uma interface de entrada para receber os sinais de vídeo e/ou de áudio provenientes do STB 10. Esta interface de entrada pode incluir um dispositivo de captura de áudio 24 para aceitar o áudio como um sinal de teste e/ou um capturador de imagem de vídeo 22 ou dispositivo similar para aceitar os quadros de vídeo provenientes do STB. Os dados capturados são então tornados disponíveis para um processador para análise, o qual por sua vez produz um resultado de teste e fornece este resultado para um usuário. Assim, durante um teste típico, o sistema de teste emite um comando ou sequência de comandos para o STB, adequadamente por meio da interface de controle remoto. Cada quadro de vídeo e/ou o áudio são capturados e tornados disponíveis para o sistema de teste para análise da resposta de STB para os comandos emitidos para ele.
[005] Tipicamente, testes podem incluir a geração de um comando de “mudar canal” para o STB seguido por análise das saídas de áudio e/ou de vídeo para assegurar que o comando de mudança de canal foi recebido e executado corretamente pelo STB.
[006] Aparelhos conversores de sinais são dispositivos complexos contendo uma CPU embutida principal poderosa e vários dispositivos periféricos. Eles de uma maneira geral executam um sistema de operação sofisticado (por exemplo, Linux, ou VxWorks) e executam funções complexas, e executam uma grande e complexa pilha de software nesse sistema de operação. Estes dispositivos de uma maneira geral apresentam para os usuários uma interface gráfica de usuário sofisticada com menus e gráficos na tela. Automação do teste tipicamente envolve, entre outras áreas, reconhecimento ótico de caracteres (OCR) para ler texto da tela e compará-lo com valor conhecido ou esperado, para determinar se a interface de usuário apresentada para o usuário é tal como esperado.
[007] Tal como mostrado na figura 2, OCR pode serexecutado em um quadro capturado ou em uma seção de um quadro. Tipicamente, ao configurar uma rotina de teste, a pessoa configurando o teste identificará a seção do quadro onde texto é para ser encontrado. A pessoa também pode configurar o teste ao definir o resultado esperado do processo OCR. O resultado esperado pode ser um valor predeterminado conhecido ou ele pode ser obtido em outro lugar na rotina de teste. Adicionalmente, o processo OCR pode ser empregado para obter e armazenar informação do dispositivo sob teste. OCR de uma maneira geral é executadopor um componente de software conhecido como um “MecanismoOCR”. Existem diversos mecanismos OCR (produto de software)de uma maneira geral disponíveis para este propósito, istoé, os mecanismos podem processar imagens e extrair texto delas. Entretanto, existem diversas dificuldades práticas no uso de um mecanismo OCR no contexto de um quadro capturado de um STB ou de dispositivo com um mostrador, porexemplo, uma televisão digital. Um dos motivos para isto éque mecanismos OCR convencionalmente vêm da área de processamento de documentos, a qual tem diversas diferenças para imagens capturadas de um fluxo de vídeo. A resolução de scanners de documento usados para capturar imagens de documento de uma maneira geral é muito maior que a resolução de imagens, mesmo imagens de alta definição, capturadas do vídeo.
[008] Documentos de uma maneira geral têm um padrão decontraste primeiro plano/plano de fundo fixado: de umamaneira geral texto escuro sobre um plano de fundo claro. Além do mais, o contraste para uma dada página de documento não é variável. Uma vez que o mecanismo OCR tenha determinado as cores de primeiro plano e de plano de fundo para uma página, estas não mudarão. Assim, por exemplo, é conhecido usar filtros para otimizar um mecanismo OCR, por exemplo, onde a cor de página não é branca. Entretanto contraste em interfaces de usuário dinâmicas modernas pode ser altamente variável. Como um exemplo, painéis transparentes na interface de usuário são comuns e assim o contraste do texto variará à medida que o programa de televisão de plano de fundo mudar. Para tornar a questão ainda pior, imagens capturadas de fluxos de vídeo podem ser muito ruidosas. Como resultado, a experiência do presente inventor é que a precisão de um mecanismo OCR típico quando empregado com vídeo capturado pode ser somente na região de 65%-90%.
[009] Seria benéfico melhorar o desempenho demecanismos OCR ao analisar imagens de vídeo.
SUMÁRIO
[0010] Em particular, o presente pedido fornece sistemase métodos de acordo com as reivindicações que se seguem.
DESCRIÇÃO DOS DESENHOS
[0011] O presente pedido será agora descrito comreferência aos desenhos anexos, nos quais:
[0012] A figura 1 é uma ilustração de um STB exemplarconhecido na técnica;
[0013] A figura 2 é uma ilustração de um sistema deteste de STB de técnica anterior convencional tendo OCR;
[0014] A figura 3 é um diagrama de blocos de um aspectode sistema de teste de STB de acordo com uma modalidade do presente pedido;
[0015] A figura 4 ilustra um arranjo exemplar paraselecionar uma configuração de filtro de acordo com uma outra modalidade; e
[0016] A figura 5 ilustra um método para uso no arranjoda figura 4.
DESCRIÇÃO DETALHADA
[0017] O presente pedido é baseado na premissa de quedesenvolver um mecanismo OCR especificamente para imagens de vídeo capturadas pode ser um processo caro e demorado. Em vez disto é desejável fornecer um método que melhore o desempenho de mecanismos OCR existentes, por exemplo, que são pretendidos para documentos varridos.
[0018] O presente pedido melhora o desempenho demecanismos OCR em quadros de vídeo capturados ou seções dos mesmos. O melhoramento é obtido ao pré-processar a imagem (o quadro capturado ou uma parte do mesmo) antes da submissão para o mecanismo OCR. Em particular, foi constatado pelo presente inventor que ao processar uma imagem com um filtro de imagem o desempenho do mecanismo OCR pode ser melhorado. A dificuldade é que embora certos filtros de imagem possam trabalhar perfeitamente em certas situações eles podem resultar em pior desempenho em outras.
[0019] Um sistema de teste exemplar para testar um STB de uma maneira geral pode empregar o sistema de teste de STB conhecido da figura 2 e assim pode incluir uma primeira interface para controlar a operação de um aparelho conversor de sinais, por exemplo, ao enviar comandos para o STB por meio de um controle remoto IR. Entretanto, será percebido que outras entradas/interfaces de controle podem ser empregadas; por exemplo, uma conexão serial direta pode ser empregada se o STB tiver uma interface como esta disponível. Será percebido que uma interface empregada para controlar o STB é comumente empregada em sistemas de testes convencionais para STBs e assim seu projeto e operação são facilmente entendidos e familiares para os versados na técnica. O sistema de teste é configurado para analisar vídeo do STB juntamente com outras saídas incluindo, por exemplo, áudio.
[0020] Especificamente uma segunda interface é empregada para obter uma ou mais saídas do STB. Esta segunda interface pode incluir um capturador de imagem de vídeo para capturar os quadros de vídeo do STB e/ou um conversor analógico para digital para capturar a saída de áudio do STB. Será percebido que a tecnologia associada com estes elementos também seria familiar para os versados na técnica. Entretanto, adequadamente o capturador de imagem de vídeo é sincronizado com o sincronismo de quadro de vídeo, o que permite a ele capturar um quadro de vídeo completo em um tempo. Será percebido que, onde uma saída digital do aparelho conversor de sinais está disponível, a exigência para um capturador de imagem de vídeo/dispositivo de captura de áudio analógico pode ser removida e substituída por uma interface digital que capture diretamente os quadros de vídeo sendo transmitidos. Onde o dispositivo sob teste tem um mostrador integrado para exibir o vídeo, o vídeo pode ser capturado usando uma câmera de vídeo direcionada para o mostrador. Tal como com sistemas existentes, o sistema pode selecionar uma região particular de interesse do quadro. A região de interesse tipicamente seria predefinida durante o processo de configuração\estabelecimento de uma rotina de teste.
[0021] Na modalidade exemplar ilustrada na figura 3 pode ser visto que a captura de quadro e mecanismo\processos OCR estão inalterados e em vez disto um processador (filtro) de imagem 40 é fornecido para pré-filtrar a imagem (que tal como explicado anteriormente pode ser o quadro capturado total ou mais provavelmente uma seção pré-selecionada do quadro capturado) antes do processamento pelo mecanismo OCR para extrair texto da imagem.
[0022] O filtro do processador de imagem 40 é um filtro configurável de tal maneira que a função de filtro aplicada à imagem pode ser variada pelo sistema. Mais especificamente, a configuração para o filtro para uma imagem em um ponto particular em uma rotina de teste é preestabelecida adequadamente durante um processo de configuração inicial onde a rotina de teste executada pelo sistema de teste é preparada.
[0023] O modo de operação será agora explicado com referência para o método de determinação de uma configuração para o filtro configurável tal como mostrado na figura 4, em que o filtro configurável 40 compreende uma sequência dos diferentes filtros de imagem 42a-42f que podem ser aplicados sequencialmente a uma imagem 44 de um quadro capturado ou parte do mesmo. Tal como será percebido com a explicação que se segue, cada um dos filtros na sequência pode ser usado ou não para filtrar a imagem. Assim, o filtro total pode ser configurado pela seleção de quais filtros particulares serão usados. Adicionalmente, cada filtro pode ser configurável por meio de um ou mais parâmetros (mostrados pelos números 0-5 para cada filtro), os quais ajustam as características de filtro. Um destes parâmetros, por exemplo, 0, pode indicar que o filtro não é para ser usado. Após filtragem ter sido completada, a imagem filtrada é passada para o mecanismo OCR 24 para processamento, onde o texto reconhecido pode ser comparado com um resultado esperado para determinar o sucesso ou não de um teste particular. Em certas circunstâncias, pode não existir um resultado esperado e, neste caso, o resultado pode ser simplesmente armazenado para referência ou uso subsequentemente na rotina de teste. Esta mesma rotina também pode ser empregada no processo para determinar a configuração de filtro tal como descrita com mais detalhes a seguir.
[0024] Como exemplos, os seguintes filtros de imagem foram determinados para melhorar a detecção precisa de texto pelo mecanismo OCR ao operar em imagens coloridas:• Remover seletivamente uma ou mais componentes de cor da imagem original, com ou sem conversão para escala de cinza da imagem resultante;• Ajustar contraste de imagem; • Inverter as cores na imagem;• Obscurecer a imagem;• Enfatizar a imagem;• Aproximar a imagem de maneira que ela seja aumentada, interpolando pixels da imagem original para criar a nova imagem.
[0025] Será percebido, entretanto, que cada um destespode ser considerado como um filtro de imagem. Será percebido que um parâmetro geral para um filtro pode ser se ele é empregado ou não. Um parâmetro específico no caso de remover uma ou mais componentes de cor seria as componentes de cor a ser removidas, e assim no caso de uma imagem VVA (Vermelho Verde Azul) as configurações de filtro podem ser remoção de:a) Vb) Vc) Ad) VVe) VAf) VA
[0026] No caso de ajustar contraste de imagem, umparâmetro individual pode ser se é para aumentar ou diminuir o contraste ou a quantidade de ajuste de contraste. De forma similar, no caso de obscurecer ou enfatizar o grau de obscurecimento ou de realce seria umparâmetro de filtro individual. No caso de um filtro de imagem para “aproximar” a imagem de maneira que ela seja aumentada, parâmetros individuais podem ser o grau de escalamento e/ou a seleção de um tipo particular de interpolação, por exemplo, bicúbica, linear etc.
[0027] Um método exemplar de selecionar uma configuração para o filtro está mostrado na figura 5. Neste método exemplar um usuário ao configurar o sistema de teste, e tal como seria executado convencionalmente, opcionalmente pode identificar uma seção da tela (quadro capturado) para ser analisada. O usuário especifica o resultado esperado do processo OCR. O resultado esperado é usado para comparar a saída\resultado OCR de diferentes configurações de filtro em uma sequência de imagens para determinar o desempenho das diferentes configurações de filtro. Cada uma da sequência de imagens contém substancialmente o mesmo conteúdo de texto, isto é, um usuário visualiza o mesmo texto em cada imagem da sequência. Por exemplo, capturando 100 quadros sequenciais de vídeo tendo uma caixa OSD (Em Exibição Na Tela) mostrada teria o mesmo conteúdo de texto visível para um usuário na caixa em cada um dos quadros na tela. Será percebido, entretanto, que um bit para comparação de bit dos quadros capturados pode bem se mostrar para ser completamente diferente pelos motivos explicados anteriormente incluindo ruído e possivelmente mudança de conteúdo de vídeo atrás da caixa OSD. Adequadamente, uma sequência de imagens é obtida como uma etapa inicial e a mesma sequência de imagens é usada para comparar o desempenho de cada configuração de filtro já que o conteúdo na tela pode concluir a espera após alguns segundos e uma OSD pode desaparecer totalmente. Será percebido que a sequência de imagens pode ser obtida como parte deste processo ou ela pode ter sido obtida separadamente e armazenada.
[0028] Uma primeira configuração de filtro é selecionada em 52 para ser usada para filtrar a primeira imagem selecionada na sequência em 54. No arranjo exemplar da figura 4, uma série de filtros é aplicada à imagem em uma cadeia. A primeira configuração de filtro pode ter um ajuste de “nulo” para cada filtro que não alterar a imagem. De forma pictorial, na figura 4, isto está representado pelo ajuste “0” para um filtro. Esta primeira configuração de filtro é usada para estabelecer o filtro e a primeira imagem é processada em 56 pelo filtro usando esta configuração para fornecer uma imagem filtrada. A imagem filtrada é então passada em 58 pelo mecanismo OCR e o texto extraído é comparado em 60 com o resultado esperado para determinar o desempenho do filtro. Será percebido que o resultado esperado não necessita ser o total do texto extraído, mas de fato pode ser uma parte do texto. Por exemplo, a pessoa configurando o teste pode simplesmente exigir a presença de uma palavra particular no texto extraído em vez de um casamento exato com o total do texto extraído. Uma decisão é então tomada em 62 com base no resultado, onde o desempenho de filtro é negativo (isto é, texto não reconhecido corretamente), então a próxima configuração de filtro pode ser selecionada em 52 e o teste é executado de novo. Onde o desempenho de filtro é determinado como sendo positivo, o teste pode ser repetido para a próxima imagem na sequência em 54. Onde o desempenho de uma configuração de filtro particular é positivo para todas as imagens na sequência, então essa configuração pode ser selecionada e armazenada em 64 dentro da rotina de teste para uso futuro em um processo de teste. Em cujo ponto o processo de configuração para esse aspecto do teste é completado.
[0029] Alternativamente, todas as configurações de filtro podem ser testadas com a precisão de cada uma sendo determinada (isto é, enquanto da sequência de imagens, um filtro resultou no OCR produzindo o resultado esperado) e o filtro com a melhor precisão sendo selecionado.
[0030] Usando este método, é possível escolher uma configuração de filtro que resulta em um casamento correto com o texto reconhecido.
[0031] Embora a descrição anterior se refira a uma sequência de imagens tendo substancialmente o mesmo conteúdo de texto, será percebido que a sequência pode não ser a sequência real de quadros e o conjunto de treinamento (sequência de imagens) pode ser, por exemplo, quadros capturados escolhidos em intervalos separados.
[0032] Será percebido que onde o método é configurado para selecionar a primeira configuração de filtro que resulte em 100% de precisão que as configurações de filtro a ser testadas podem ser escolhidas em ordem aleatória via métodos de Monte Carlo tradicionais, evitando assim blocos subideais localmente de filtros se filtros forem experimentados em ordem rígida de definição.
[0033] Em uma outra variação, também é possível gerar o conjunto de treinamento do sinal ao vivo, ao capturar imagens “ao vivo” e acumular estas imagens capturadas em armazenamento local. Contanto que cada nova imagem que chega seja reconhecida corretamente, não existe necessidade de treinar novamente com todas as imagens capturadas existentes (uma vez que estas, por definição, também já terão casado). Entretanto uma vez que uma imagem que é capturada não casa com o texto esperado, as imagens capturadas formam o conjunto de treinamento, e o algoritmo começa a procurar um filtro melhor usando as imagens capturadas. Onde uma imagem adicional não casa com o resultado esperado com um filtro, ela pode ser acrescentada ao conjunto de treinamento até que um conjunto de treinamento adequado tenha sido selecionado.
[0034] Este treinamento pode ser limitado em tempo (de maneira que se todas as imagens casarem com o texto esperado, para um período de tempo definido por usuário, o melhor filtro (configuração) corrente é avaliado como bom o suficiente e salvo).
[0035] Dada uma imagem ou conjunto de imagens, é possível o sistema determinar automaticamente com um alto grau de precisão o texto esperado sem entrada de usuário. Isto é baseado na observação de que embora texto reconhecido incorretamente tipicamente seja aleatório, o texto reconhecido corretamente é sempre o mesmo. Portanto, o sistema pode “supor” que a sequência de caracteres que aparece mais frequentemente nos resultados de reconhecimento é provável que seja o texto que o usuário desejou, e na maioria dos casos ele estará correto. Assim, embora o método mencionado anteriormente se refira ao usuário introduzindo um resultado de texto “esperado”, pode não ser necessário o usuário para fazer isto. Em uma variação alternativa, o texto extraído de uma primeira imagem em uma sequência pode ser empregado como o resultado “esperado” para o restante das imagens na sequência, isto é, consistência de resultado é determinada para se equiparar à precisão de resultado. Certamente, é possível que o processo OCR possa falhar de forma consistente para reconhecer o texto corretamente e que esta variação alternativa pode não ser apropriada.
[0036] Assim é possível, sem intervenção de usuário de qualquer tipo, determinar um conjunto de filtros de processamento de imagem para aplicar à imagem capturada que melhorará a precisão de reconhecimento.
[0037] Será percebido que embora o presente pedido tenha sido descrito de uma maneira geral com relação a teste de STBs, ele é igualmente aplicável para testar outros dispositivos tais como televisões digitais, reprodutores de mídia digital, reprodutores de DVD e dispositivos de consumidor tais como telefones móveis e PDAs. Será percebido que embora televisões digitais, reprodutores de mídia digital e reprodutores de DVD possam ter uma entrada de controle remoto (por exemplo, IR) para receber comandos de teste do sistema de teste, outros dispositivos podem exigir uma interface diferente no sistema de teste para enviar comandos de teste para o dispositivo sob teste.
[0038] Além disso, será percebido que as técnicas descritas presentemente também podem ser empregadas diretamente sem um processo de configuração de teste. Em particular, embora o método mencionado anteriormente tenha sido descrito com relação a usar uma rotina de configuração inicial para estabelecer/armazenar os parâmetros de filtro corretos para executar um teste particular. O método também pode ser usado em um cenário ao vivo para determinar conteúdo de texto de uma sequência de imagens capturadas. Em um arranjo como este, uma sequência de quadros capturados (ou partes dos mesmos) pode ser passada pelo filtro configurável usando uma primeira configuração de filtro e então pelo mecanismo OCR para fornecer um resultado de texto. Onde o resultado de texto é consistente para todos os quadros capturados (ou para uma proporção significativa dos mesmos), o resultado de texto pode ser considerado como válido. Onde o texto não é consistente, o processo pode ser repetido com uma configuração de filtro diferente. Este processo pode ser repetido, variando a configuração a cada vez, até que um resultado válido seja determinado. Será percebido que este processo pode ser de uso de uma maneira geral para vídeo capturado de um dispositivo sob teste e pode ser empregado de uma maneira geral para identificar texto em conteúdo de vídeo.

Claims (6)

1. Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar OCR, o método caracterizado pelo fato de que compreende as etapas de:a) fornecer uma sequência capturada de imagens contendo o mesmo conteúdo, a sequência de imagens compreende uma primeira imagem na sequência e uma pluralidade de imagens subsequentes na sequência;b) selecionar uma configuração para um filtro para pré- processar as imagens, a partir de uma pluralidade de configurações disponíveis;c) pré-processar a primeira imagem na sequência usando esta configuração de filtro e submeter a primeira imagem pré-processada a um processo OCR para extrair texto da primeira imagem pré-processada;d) pré-processar uma imagem da pluralidade de imagens subsequentes na sequência usando a configuração de filtro selecionada e submeter a imagem pré-processada da pluralidade de imagens subsequentes a um processo OCR para extrair texto da imagem pré-processada da pluralidade de imagens subsequentes;e) analisar o texto extraído da primeira imagem pré- processada e imagem pré-processada da pluralidade de imagens subsequentes para determinar o desempenho do filtro, em que o desempenho é determinado a ser positivo se o texto extraído for determinado a ser correto e em que a determinação de se o texto extraído está correto é feita por comparação entre os textos extraídos da primeira imagem na sequência e o texto extraído da imagem da pluralidade de imagens subsequentes na sequência; ef) decidir que a configuração é adequada e armazena a configuração adequada, em que as etapas d) e e) são executadas em cada imagem da pluralidade de imagens subsequentes na sequência e a determinação de se a configuração adequada é feita quando o desempenho da configuração de filtro selecionado é determinado a ser positivo para cada um da pluralidade das imagens subsequentes;em que as etapas d) e e) são repetidas para cada imagem sucessiva na sequência contanto que o texto extraído seja determinado a ser correto a partir da imagem precedente e quando se o texto extraído a partir de uma imagem da pluralidade de imagens subsequentes for determinada a não ser correta, selecionar uma diferente configuração para pré- processamento de imagens, e repetir as etapas c) a f).
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que as etapas b) a e) são repetidas para uma pluralidade de configurações diferentes, em que a configuração compreende a seleção de um ou mais tipos de filtros de uma pluralidade de tipos de filtros diferentes ou a configuração compreende a seleção de um parâmetro para um filtro, ou ambos.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o filtro compreende uma sequência de diferentes filtros que são aplicados em sequência e a configuração compreende a seleção de um ou mais parâmetros para cada filtro.
4. Sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste, o sistema caracterizado pelo fato de que compreende:um processador de imagem compreendendo o filtro para filtrar o quadro de vídeo capturado ou região do mesmo parafornecer uma imagem filtrada;um mecanismo OCR para analisar a imagem filtrada paraidentificar texto na imagem;em que o sistema é configurado para executar o método, como definido em qualquer uma das reivindicações 1 a 3;uma interface de controle remoto para transmitir comandos para o dispositivo sob teste;em que a filtragem executada pelo processador de imagem é configurada usando a configuração adequada determinada.
5. Sistema de teste, de acordo com a reivindicação 4, caracterizado pelo fato de que o filtro é adaptado para executar um ou mais do seguinte na imagem:a) remover seletivamente um ou mais componentes de cor, com ou sem conversão para escala de cinza;b) ajustar contraste de imagem;c) inverter cores;d) obscurecer;e) enfatizar a imagem; ef) aproximar a imagem de maneira que ela seja aumentadausando interpolação.
6. Sistema de teste, de acordo com a reivindicação 4 ou 5, caracterizado pelo fato de que um filtro tendo uma pluralidade de configurações de filtro diferentes é empregado pelo processador de imagem e em que o pelo menos um valor de configuração define as configurações de filtro a ser empregadas para filtrar o quadro de vídeo capturado ou região do mesmo.
BR112013013113-6A 2010-11-26 2011-12-22 Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar ocr e sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste BR112013013113B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1020101.0A GB2485833A (en) 2010-11-26 2010-11-26 Improved OCR Using Configurable Filtering for Analysing Set Top Boxes
GB1020101.0 2010-11-26
PCT/EP2011/073802 WO2012069662A1 (en) 2010-11-26 2011-12-22 Improved ocr for automated stb testing

Publications (2)

Publication Number Publication Date
BR112013013113A2 BR112013013113A2 (pt) 2017-10-17
BR112013013113B1 true BR112013013113B1 (pt) 2022-02-01

Family

ID=43500715

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112013013113-6A BR112013013113B1 (pt) 2010-11-26 2011-12-22 Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar ocr e sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste

Country Status (8)

Country Link
US (2) US9516304B2 (pt)
EP (1) EP2643973B8 (pt)
BR (1) BR112013013113B1 (pt)
CA (1) CA2831113C (pt)
DK (1) DK2643973T3 (pt)
GB (1) GB2485833A (pt)
MY (1) MY164774A (pt)
WO (1) WO2012069662A1 (pt)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010092585A1 (en) * 2009-02-16 2010-08-19 Communitake Technologies Ltd. A system, a method and a computer program product for automated remote control
US9836376B2 (en) 2009-09-24 2017-12-05 Contec, Llc Method and system for automated test of end-user devices
GB2485833A (en) 2010-11-26 2012-05-30 S3 Res & Dev Ltd Improved OCR Using Configurable Filtering for Analysing Set Top Boxes
US10108515B2 (en) * 2013-03-01 2018-10-23 Sony Interactive Entertainment LLC Remotely testing electronic devices using messaging and presence protocol
GB2514410A (en) * 2013-05-24 2014-11-26 Ibm Image scaling for images including low resolution text
US10511580B2 (en) 2014-03-31 2019-12-17 Monticello Enterprises LLC System and method for providing a social media shopping experience
US12008629B2 (en) 2014-03-31 2024-06-11 Monticello Enterprises LLC System and method for providing a social media shopping experience
US11080777B2 (en) * 2014-03-31 2021-08-03 Monticello Enterprises LLC System and method for providing a social media shopping experience
US11004139B2 (en) 2014-03-31 2021-05-11 Monticello Enterprises LLC System and method for providing simplified in store purchases and in-app purchases using a use-interface-based payment API
US10318804B2 (en) * 2014-06-30 2019-06-11 First American Financial Corporation System and method for data extraction and searching
US9460503B2 (en) 2015-02-02 2016-10-04 Arris Enterprises, Inc. Automated video testing using QR codes embedded in a video stream
US10277497B2 (en) 2015-09-25 2019-04-30 Contec, Llc Systems and methods for testing electronic devices using master-slave test architectures
US9992084B2 (en) 2015-11-20 2018-06-05 Contec, Llc Cable modems/eMTAs under test
US9810735B2 (en) 2015-09-25 2017-11-07 Contec, Llc Core testing machine
US9960989B2 (en) 2015-09-25 2018-05-01 Contec, Llc Universal device testing system
US9900116B2 (en) 2016-01-04 2018-02-20 Contec, Llc Test sequences using universal testing system
US10291959B2 (en) 2015-09-25 2019-05-14 Contec, Llc Set top boxes under test
US10122611B2 (en) 2015-09-25 2018-11-06 Contec, Llc Universal device testing interface
US9838295B2 (en) 2015-11-23 2017-12-05 Contec, Llc Wireless routers under test
US10320651B2 (en) 2015-10-30 2019-06-11 Contec, Llc Hardware architecture for universal testing system: wireless router test
US20170126536A1 (en) 2015-10-30 2017-05-04 Contec, Llc Hardware Architecture for Universal Testing System: Cable Modem Test
US9900113B2 (en) 2016-02-29 2018-02-20 Contec, Llc Universal tester hardware
US10779056B2 (en) 2016-04-14 2020-09-15 Contec, Llc Automated network-based test system for set top box devices
US10462456B2 (en) 2016-04-14 2019-10-29 Contec, Llc Automated network-based test system for set top box devices
US10237593B2 (en) 2016-05-26 2019-03-19 Telefonaktiebolaget Lm Ericsson (Publ) Monitoring quality of experience (QoE) at audio/video (AV) endpoints using a no-reference (NR) method
US10235260B1 (en) 2016-07-26 2019-03-19 Contec, Llc Set top box and customer premise equipment (CPE) unit test controller
US9848233B1 (en) 2016-07-26 2017-12-19 Contect, LLC Set top box and customer premise equipment (CPE) unit test controller
US9872070B1 (en) 2016-07-26 2018-01-16 Contec, Llc Customer premise equipment (CPE) and set top box quality control test system providing scalability and performance
US10230945B2 (en) 2016-10-17 2019-03-12 Accenture Global Solutions Limited Dynamic loading and deployment of test files to prevent interruption of test execution
US10284456B2 (en) 2016-11-10 2019-05-07 Contec, Llc Systems and methods for testing electronic devices using master-slave test architectures
KR102478396B1 (ko) * 2017-11-29 2022-12-19 삼성전자주식회사 이미지에서 텍스트를 인식할 수 있는 전자 장치

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0358181A (ja) * 1989-07-26 1991-03-13 Nec Corp 光学文字読み取り装置
US5014328A (en) * 1990-07-24 1991-05-07 Eastman Kodak Company Automatic detection and selection of a drop-out color used in conjunction with optical character recognition of preprinted forms
US5262860A (en) * 1992-04-23 1993-11-16 International Business Machines Corporation Method and system communication establishment utilizing captured and processed visually perceptible data within a broadcast video signal
US5647023A (en) * 1994-07-28 1997-07-08 Lucent Technologies Inc. Method of nonlinear filtering of degraded document images
US5805747A (en) * 1994-10-04 1998-09-08 Science Applications International Corporation Apparatus and method for OCR character and confidence determination using multiple OCR devices
US6658662B1 (en) * 1997-06-30 2003-12-02 Sun Microsystems, Inc. Retrieving information from a broadcast signal
US6731788B1 (en) * 1999-01-28 2004-05-04 Koninklijke Philips Electronics N.V. Symbol Classification with shape features applied to neural network
US6295387B1 (en) * 1999-05-27 2001-09-25 Lockheed Martin Corporation Method and apparatus for determination of verified data
CN1459761B (zh) * 2002-05-24 2010-04-21 清华大学 基于Gabor滤波器组的字符识别技术
JP4320438B2 (ja) * 2003-06-06 2009-08-26 独立行政法人 国立印刷局 印刷物の文字列抽出処理装置
US9171202B2 (en) * 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US7664323B2 (en) * 2005-01-28 2010-02-16 Microsoft Corporation Scalable hash-based character recognition
US7551782B2 (en) * 2005-02-15 2009-06-23 Dspv, Ltd. System and method of user interface and data entry from a video call
ES2516823T3 (es) * 2005-06-10 2014-10-31 Accenture Global Services Limited Identificación electrónica de vehículos
US7575171B2 (en) * 2005-09-01 2009-08-18 Zvi Haim Lev System and method for reliable content access using a cellular/wireless device with imaging capabilities
JP2007228220A (ja) * 2006-02-23 2007-09-06 Funai Electric Co Ltd ハードディスクドライブ内蔵型テレビジョン受像機、及びテレビジョン受像機
US7664317B1 (en) * 2006-03-23 2010-02-16 Verizon Patent And Licensing Inc. Video analysis
US7787693B2 (en) * 2006-11-20 2010-08-31 Microsoft Corporation Text detection on mobile communications devices
US7995097B2 (en) * 2007-05-25 2011-08-09 Zoran Corporation Techniques of motion estimation when acquiring an image of a scene that may be illuminated with a time varying luminance
CN101571922A (zh) * 2008-05-04 2009-11-04 中兴通讯股份有限公司 一种用于移动终端自动化测试的文字识别工具及其方法
GB2470417B (en) * 2009-05-22 2011-08-03 S3 Res & Dev Ltd A test system for a set-top box
CN102023966B (zh) * 2009-09-16 2014-03-26 鸿富锦精密工业(深圳)有限公司 用于合约比较的计算机系统及合约比较方法
US9152883B2 (en) * 2009-11-02 2015-10-06 Harry Urbschat System and method for increasing the accuracy of optical character recognition (OCR)
US8386121B1 (en) * 2009-09-30 2013-02-26 The United States Of America As Represented By The Administrator Of National Aeronautics And Space Administration Optimized tuner selection for engine performance estimation
US8737702B2 (en) * 2010-07-23 2014-05-27 International Business Machines Corporation Systems and methods for automated extraction of measurement information in medical videos
JP5747485B2 (ja) * 2010-11-22 2015-07-15 株式会社リコー 情報処理装置、情報処理方法、及びプログラム
GB2485833A (en) 2010-11-26 2012-05-30 S3 Res & Dev Ltd Improved OCR Using Configurable Filtering for Analysing Set Top Boxes
WO2012088107A1 (en) * 2010-12-23 2012-06-28 The Directv Group, Inc. System and method for performing an automated set top box test

Also Published As

Publication number Publication date
MY164774A (en) 2018-01-30
GB2485833A (en) 2012-05-30
EP2643973A1 (en) 2013-10-02
DK2643973T3 (en) 2018-06-14
US20130347050A1 (en) 2013-12-26
US9516304B2 (en) 2016-12-06
US20170048519A1 (en) 2017-02-16
EP2643973B1 (en) 2018-03-07
WO2012069662A1 (en) 2012-05-31
WO2012069662A8 (en) 2013-01-10
BR112013013113A2 (pt) 2017-10-17
GB201020101D0 (en) 2011-01-12
CA2831113C (en) 2017-05-09
EP2643973B8 (en) 2020-11-11
US9942543B2 (en) 2018-04-10
CA2831113A1 (en) 2012-05-31

Similar Documents

Publication Publication Date Title
BR112013013113B1 (pt) Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar ocr e sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste
US9875409B2 (en) Abnormality detection apparatus, abnormality detection method, and recording medium storing abnormality detection program
US11070891B1 (en) Optimization of subtitles for video content
US20190362478A1 (en) Machine learning techniques for increasing color consistency across videos
JP2011232111A (ja) 検査装置及び検査装置の用いた欠陥検出方法
US9258458B2 (en) Displaying an image with an available effect applied
JP7078175B2 (ja) 検査装置及び方法
WO2013118955A1 (ko) 깊이 맵 보정 장치 및 방법과 이를 이용한 입체 영상 변환 장치 및 방법
CN110414346A (zh) 活体检测方法、装置、电子设备及存储介质
CN104795011A (zh) 结合edid的显示器画面偏移检测系统以及使用方法
CN107797784B (zh) 获取拼接处理器的适配分辨率的方法及装置
WO2023236371A1 (zh) 用于电缆元件识别的视觉分析方法
WO2013114803A1 (ja) 画像処理装置及びその画像処理方法、並びにコンピュータ・プログラム、および画像処理システム
FR3018118A1 (fr) Procede de test d'un systeme electronique
JPWO2014013792A1 (ja) ノイズ評価方法、画像処理装置、撮像装置およびプログラム
ES2897326T3 (es) Prueba de renderización de objetos de pantalla
CN112801891B (zh) 显示屏画面检测方法、显示屏画面检测系统
US10205940B1 (en) Determining calibration settings for displaying content on a monitor
US20120127326A1 (en) Image optimization system and method for optimizing images
CN114116464A (zh) 一种图像处理的测试方法和装置
Patel et al. An improvement of forgery video detection technique using Error Level Analysis
KR20120121748A (ko) 차트를 이용한 카메라 설정정보의 설정장치 및 방법
WO2013114802A1 (ja) 画像処理装置及びその画像処理方法、並びにコンピュータ・プログラム、および画像処理システム
JP2016127505A (ja) 画像処理装置及び画像処理方法
US10964022B2 (en) Image processing method, corresponding image processing apparatus and endoscope arrangement

Legal Events

Date Code Title Description
B25A Requested transfer of rights approved

Owner name: S3 TV TECHNOLOGY LIMITED (IE)

B25A Requested transfer of rights approved

Owner name: ACCENTURE GLOBAL SOLUTIONS LIMITED (IE)

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 22/12/2011, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.