BR112013013113B1 - Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar ocr e sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste - Google Patents
Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar ocr e sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste Download PDFInfo
- Publication number
- BR112013013113B1 BR112013013113B1 BR112013013113-6A BR112013013113A BR112013013113B1 BR 112013013113 B1 BR112013013113 B1 BR 112013013113B1 BR 112013013113 A BR112013013113 A BR 112013013113A BR 112013013113 B1 BR112013013113 B1 BR 112013013113B1
- Authority
- BR
- Brazil
- Prior art keywords
- image
- filter
- sequence
- text
- configuration
- Prior art date
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000008569 process Effects 0.000 title claims abstract description 24
- 239000003086 colorant Substances 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000012015 optical character recognition Methods 0.000 abstract description 33
- 238000012549 training Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/04—Diagnosis, testing or measuring for television systems or their details for receivers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
- H04N17/04—Diagnosis, testing or measuring for television systems or their details for receivers
- H04N17/045—Self-contained testing apparatus
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/445—Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
OCR APERFEIÇOADO PARA TESTE DE STB AUTOMATIZADO O presente pedido fornece um sistema de teste configurável por usuário para aparelhos conversores de sinais (STB) e outros dispositivos de consumidor fornecendo saída de vídeo. Em particular, ele fornece um método de melhorar um processo de Reconhecimento Ótico de Caracteres (OCR) em tais sistemas de testes.
Description
[001] O presente pedido de uma maneira geral dizrespeito a teste automatizado de aparelhos conversores de sinais (STB) e de outro equipamento audiovisual.
[002] Um aparelho conversor de sinais (STB) tambémconhecido como um digibox ou unidade conversora (STU) é um dispositivo que se conecta a uma televisão e a uma fonte externa de sinal, mudando o sinal para conteúdo que pode então ser entregue como um sinal audiovisual (A/V) para exibição na tela de televisão ou em outro dispositivo A/V. Mais frequentemente, a fonte externa de sinal é fornecida por uma conexão via satélite ou de cabo.
[003] Tal como com outros produtos de consumidor, tantofabricantes quanto fornecedores estão interessados em assegurar que produtos operam corretamente e tal como especificado. Inicialmente e até hoje, uma parte significativa do teste é executada manualmente, pelo que um testador emite um comando para o STB que pode ser por meio da interface de usuário no STB propriamente dito ou por meio de um dispositivo de controle remoto tal como ilustrado na figura 1, e observa a resposta do STB em uma tela de TV. Tal como está mostrado na figura 1, um STB típico 10 tem diversas entradas de sinal incluindo um sinal RF 14, o qual, por exemplo, pode ser de uma conexão via satélite ou de cabo. Um sinal A/V 16 também pode ser fornecido como entrada permitindo ao aparelho conversor de sinais alimentar por meio de um sinal para uma televisão proveniente de um VCR, DVD, disco Blu-ray, Media Juke Box ou de outro dispositivo similar. A saída para a televisão é um sinal A/V 18 que pode ser fornecido por meio de uma variedade de interfaces padrões incluindo SCART e HDMI. Para permitir que o usuário controle a operação do STB, diversas teclas e controles similares podem ser fornecidos no STB propriamente dito. Adicionalmente e mais comumente empregado por usuários, o STB pode ter uma entrada de controle remoto de infravermelho (IR) ou sem fio configurada para operar com um dispositivo de controle remoto 12.
[004] Como teste manual pode ser demorado, propenso aerro e em alguns casos carecendo de precisão, um esforço tem sido feito para automatizar alguns destes testes. Em relação a estes testes automatizados, será percebido que este teste tipicamente é executado no produto final por usuários sem necessariamente qualquer conhecimentodetalhado ou acesso ao conjunto de circuitos interno do STB. Desta maneira, o teste de STBs de uma maneira geral é executado em uma base de “caixa preta”, onde somente as entradas e saídas estão disponíveis para modificação e exame. Desta maneira métodos e sistemas de teste têm sido desenvolvidos especificamente para aparelhos conversores de sinais, um exemplo de um sistema como este é StormTest™ fornecido pelo S3 Group de Dublin, Irlanda, que pode ser empregado para testar STBs, televisões e dispositivos similares tais como reprodutores de mídia digital. Um arranjo para um sistema de teste de STB está mostrado na figura 2. O sistema de teste de STB 20 compreende um controlador 28 que gerencia a função de teste e interage com os outros recursos do sistema de teste de STB. Os outros recursos incluem uma interface de saída para controlar um dispositivo de controle remoto 12, permitindo que comandos sejam enviados para o STB, e uma interface de entrada para receber os sinais de vídeo e/ou de áudio provenientes do STB 10. Esta interface de entrada pode incluir um dispositivo de captura de áudio 24 para aceitar o áudio como um sinal de teste e/ou um capturador de imagem de vídeo 22 ou dispositivo similar para aceitar os quadros de vídeo provenientes do STB. Os dados capturados são então tornados disponíveis para um processador para análise, o qual por sua vez produz um resultado de teste e fornece este resultado para um usuário. Assim, durante um teste típico, o sistema de teste emite um comando ou sequência de comandos para o STB, adequadamente por meio da interface de controle remoto. Cada quadro de vídeo e/ou o áudio são capturados e tornados disponíveis para o sistema de teste para análise da resposta de STB para os comandos emitidos para ele.
[005] Tipicamente, testes podem incluir a geração de um comando de “mudar canal” para o STB seguido por análise das saídas de áudio e/ou de vídeo para assegurar que o comando de mudança de canal foi recebido e executado corretamente pelo STB.
[006] Aparelhos conversores de sinais são dispositivos complexos contendo uma CPU embutida principal poderosa e vários dispositivos periféricos. Eles de uma maneira geral executam um sistema de operação sofisticado (por exemplo, Linux, ou VxWorks) e executam funções complexas, e executam uma grande e complexa pilha de software nesse sistema de operação. Estes dispositivos de uma maneira geral apresentam para os usuários uma interface gráfica de usuário sofisticada com menus e gráficos na tela. Automação do teste tipicamente envolve, entre outras áreas, reconhecimento ótico de caracteres (OCR) para ler texto da tela e compará-lo com valor conhecido ou esperado, para determinar se a interface de usuário apresentada para o usuário é tal como esperado.
[007] Tal como mostrado na figura 2, OCR pode serexecutado em um quadro capturado ou em uma seção de um quadro. Tipicamente, ao configurar uma rotina de teste, a pessoa configurando o teste identificará a seção do quadro onde texto é para ser encontrado. A pessoa também pode configurar o teste ao definir o resultado esperado do processo OCR. O resultado esperado pode ser um valor predeterminado conhecido ou ele pode ser obtido em outro lugar na rotina de teste. Adicionalmente, o processo OCR pode ser empregado para obter e armazenar informação do dispositivo sob teste. OCR de uma maneira geral é executadopor um componente de software conhecido como um “MecanismoOCR”. Existem diversos mecanismos OCR (produto de software)de uma maneira geral disponíveis para este propósito, istoé, os mecanismos podem processar imagens e extrair texto delas. Entretanto, existem diversas dificuldades práticas no uso de um mecanismo OCR no contexto de um quadro capturado de um STB ou de dispositivo com um mostrador, porexemplo, uma televisão digital. Um dos motivos para isto éque mecanismos OCR convencionalmente vêm da área de processamento de documentos, a qual tem diversas diferenças para imagens capturadas de um fluxo de vídeo. A resolução de scanners de documento usados para capturar imagens de documento de uma maneira geral é muito maior que a resolução de imagens, mesmo imagens de alta definição, capturadas do vídeo.
[008] Documentos de uma maneira geral têm um padrão decontraste primeiro plano/plano de fundo fixado: de umamaneira geral texto escuro sobre um plano de fundo claro. Além do mais, o contraste para uma dada página de documento não é variável. Uma vez que o mecanismo OCR tenha determinado as cores de primeiro plano e de plano de fundo para uma página, estas não mudarão. Assim, por exemplo, é conhecido usar filtros para otimizar um mecanismo OCR, por exemplo, onde a cor de página não é branca. Entretanto contraste em interfaces de usuário dinâmicas modernas pode ser altamente variável. Como um exemplo, painéis transparentes na interface de usuário são comuns e assim o contraste do texto variará à medida que o programa de televisão de plano de fundo mudar. Para tornar a questão ainda pior, imagens capturadas de fluxos de vídeo podem ser muito ruidosas. Como resultado, a experiência do presente inventor é que a precisão de um mecanismo OCR típico quando empregado com vídeo capturado pode ser somente na região de 65%-90%.
[009] Seria benéfico melhorar o desempenho demecanismos OCR ao analisar imagens de vídeo.
[0010] Em particular, o presente pedido fornece sistemase métodos de acordo com as reivindicações que se seguem.
[0011] O presente pedido será agora descrito comreferência aos desenhos anexos, nos quais:
[0012] A figura 1 é uma ilustração de um STB exemplarconhecido na técnica;
[0013] A figura 2 é uma ilustração de um sistema deteste de STB de técnica anterior convencional tendo OCR;
[0014] A figura 3 é um diagrama de blocos de um aspectode sistema de teste de STB de acordo com uma modalidade do presente pedido;
[0015] A figura 4 ilustra um arranjo exemplar paraselecionar uma configuração de filtro de acordo com uma outra modalidade; e
[0016] A figura 5 ilustra um método para uso no arranjoda figura 4.
[0017] O presente pedido é baseado na premissa de quedesenvolver um mecanismo OCR especificamente para imagens de vídeo capturadas pode ser um processo caro e demorado. Em vez disto é desejável fornecer um método que melhore o desempenho de mecanismos OCR existentes, por exemplo, que são pretendidos para documentos varridos.
[0018] O presente pedido melhora o desempenho demecanismos OCR em quadros de vídeo capturados ou seções dos mesmos. O melhoramento é obtido ao pré-processar a imagem (o quadro capturado ou uma parte do mesmo) antes da submissão para o mecanismo OCR. Em particular, foi constatado pelo presente inventor que ao processar uma imagem com um filtro de imagem o desempenho do mecanismo OCR pode ser melhorado. A dificuldade é que embora certos filtros de imagem possam trabalhar perfeitamente em certas situações eles podem resultar em pior desempenho em outras.
[0019] Um sistema de teste exemplar para testar um STB de uma maneira geral pode empregar o sistema de teste de STB conhecido da figura 2 e assim pode incluir uma primeira interface para controlar a operação de um aparelho conversor de sinais, por exemplo, ao enviar comandos para o STB por meio de um controle remoto IR. Entretanto, será percebido que outras entradas/interfaces de controle podem ser empregadas; por exemplo, uma conexão serial direta pode ser empregada se o STB tiver uma interface como esta disponível. Será percebido que uma interface empregada para controlar o STB é comumente empregada em sistemas de testes convencionais para STBs e assim seu projeto e operação são facilmente entendidos e familiares para os versados na técnica. O sistema de teste é configurado para analisar vídeo do STB juntamente com outras saídas incluindo, por exemplo, áudio.
[0020] Especificamente uma segunda interface é empregada para obter uma ou mais saídas do STB. Esta segunda interface pode incluir um capturador de imagem de vídeo para capturar os quadros de vídeo do STB e/ou um conversor analógico para digital para capturar a saída de áudio do STB. Será percebido que a tecnologia associada com estes elementos também seria familiar para os versados na técnica. Entretanto, adequadamente o capturador de imagem de vídeo é sincronizado com o sincronismo de quadro de vídeo, o que permite a ele capturar um quadro de vídeo completo em um tempo. Será percebido que, onde uma saída digital do aparelho conversor de sinais está disponível, a exigência para um capturador de imagem de vídeo/dispositivo de captura de áudio analógico pode ser removida e substituída por uma interface digital que capture diretamente os quadros de vídeo sendo transmitidos. Onde o dispositivo sob teste tem um mostrador integrado para exibir o vídeo, o vídeo pode ser capturado usando uma câmera de vídeo direcionada para o mostrador. Tal como com sistemas existentes, o sistema pode selecionar uma região particular de interesse do quadro. A região de interesse tipicamente seria predefinida durante o processo de configuração\estabelecimento de uma rotina de teste.
[0021] Na modalidade exemplar ilustrada na figura 3 pode ser visto que a captura de quadro e mecanismo\processos OCR estão inalterados e em vez disto um processador (filtro) de imagem 40 é fornecido para pré-filtrar a imagem (que tal como explicado anteriormente pode ser o quadro capturado total ou mais provavelmente uma seção pré-selecionada do quadro capturado) antes do processamento pelo mecanismo OCR para extrair texto da imagem.
[0022] O filtro do processador de imagem 40 é um filtro configurável de tal maneira que a função de filtro aplicada à imagem pode ser variada pelo sistema. Mais especificamente, a configuração para o filtro para uma imagem em um ponto particular em uma rotina de teste é preestabelecida adequadamente durante um processo de configuração inicial onde a rotina de teste executada pelo sistema de teste é preparada.
[0023] O modo de operação será agora explicado com referência para o método de determinação de uma configuração para o filtro configurável tal como mostrado na figura 4, em que o filtro configurável 40 compreende uma sequência dos diferentes filtros de imagem 42a-42f que podem ser aplicados sequencialmente a uma imagem 44 de um quadro capturado ou parte do mesmo. Tal como será percebido com a explicação que se segue, cada um dos filtros na sequência pode ser usado ou não para filtrar a imagem. Assim, o filtro total pode ser configurado pela seleção de quais filtros particulares serão usados. Adicionalmente, cada filtro pode ser configurável por meio de um ou mais parâmetros (mostrados pelos números 0-5 para cada filtro), os quais ajustam as características de filtro. Um destes parâmetros, por exemplo, 0, pode indicar que o filtro não é para ser usado. Após filtragem ter sido completada, a imagem filtrada é passada para o mecanismo OCR 24 para processamento, onde o texto reconhecido pode ser comparado com um resultado esperado para determinar o sucesso ou não de um teste particular. Em certas circunstâncias, pode não existir um resultado esperado e, neste caso, o resultado pode ser simplesmente armazenado para referência ou uso subsequentemente na rotina de teste. Esta mesma rotina também pode ser empregada no processo para determinar a configuração de filtro tal como descrita com mais detalhes a seguir.
[0024] Como exemplos, os seguintes filtros de imagem foram determinados para melhorar a detecção precisa de texto pelo mecanismo OCR ao operar em imagens coloridas:• Remover seletivamente uma ou mais componentes de cor da imagem original, com ou sem conversão para escala de cinza da imagem resultante;• Ajustar contraste de imagem; • Inverter as cores na imagem;• Obscurecer a imagem;• Enfatizar a imagem;• Aproximar a imagem de maneira que ela seja aumentada, interpolando pixels da imagem original para criar a nova imagem.
[0025] Será percebido, entretanto, que cada um destespode ser considerado como um filtro de imagem. Será percebido que um parâmetro geral para um filtro pode ser se ele é empregado ou não. Um parâmetro específico no caso de remover uma ou mais componentes de cor seria as componentes de cor a ser removidas, e assim no caso de uma imagem VVA (Vermelho Verde Azul) as configurações de filtro podem ser remoção de:a) Vb) Vc) Ad) VVe) VAf) VA
[0026] No caso de ajustar contraste de imagem, umparâmetro individual pode ser se é para aumentar ou diminuir o contraste ou a quantidade de ajuste de contraste. De forma similar, no caso de obscurecer ou enfatizar o grau de obscurecimento ou de realce seria umparâmetro de filtro individual. No caso de um filtro de imagem para “aproximar” a imagem de maneira que ela seja aumentada, parâmetros individuais podem ser o grau de escalamento e/ou a seleção de um tipo particular de interpolação, por exemplo, bicúbica, linear etc.
[0027] Um método exemplar de selecionar uma configuração para o filtro está mostrado na figura 5. Neste método exemplar um usuário ao configurar o sistema de teste, e tal como seria executado convencionalmente, opcionalmente pode identificar uma seção da tela (quadro capturado) para ser analisada. O usuário especifica o resultado esperado do processo OCR. O resultado esperado é usado para comparar a saída\resultado OCR de diferentes configurações de filtro em uma sequência de imagens para determinar o desempenho das diferentes configurações de filtro. Cada uma da sequência de imagens contém substancialmente o mesmo conteúdo de texto, isto é, um usuário visualiza o mesmo texto em cada imagem da sequência. Por exemplo, capturando 100 quadros sequenciais de vídeo tendo uma caixa OSD (Em Exibição Na Tela) mostrada teria o mesmo conteúdo de texto visível para um usuário na caixa em cada um dos quadros na tela. Será percebido, entretanto, que um bit para comparação de bit dos quadros capturados pode bem se mostrar para ser completamente diferente pelos motivos explicados anteriormente incluindo ruído e possivelmente mudança de conteúdo de vídeo atrás da caixa OSD. Adequadamente, uma sequência de imagens é obtida como uma etapa inicial e a mesma sequência de imagens é usada para comparar o desempenho de cada configuração de filtro já que o conteúdo na tela pode concluir a espera após alguns segundos e uma OSD pode desaparecer totalmente. Será percebido que a sequência de imagens pode ser obtida como parte deste processo ou ela pode ter sido obtida separadamente e armazenada.
[0028] Uma primeira configuração de filtro é selecionada em 52 para ser usada para filtrar a primeira imagem selecionada na sequência em 54. No arranjo exemplar da figura 4, uma série de filtros é aplicada à imagem em uma cadeia. A primeira configuração de filtro pode ter um ajuste de “nulo” para cada filtro que não alterar a imagem. De forma pictorial, na figura 4, isto está representado pelo ajuste “0” para um filtro. Esta primeira configuração de filtro é usada para estabelecer o filtro e a primeira imagem é processada em 56 pelo filtro usando esta configuração para fornecer uma imagem filtrada. A imagem filtrada é então passada em 58 pelo mecanismo OCR e o texto extraído é comparado em 60 com o resultado esperado para determinar o desempenho do filtro. Será percebido que o resultado esperado não necessita ser o total do texto extraído, mas de fato pode ser uma parte do texto. Por exemplo, a pessoa configurando o teste pode simplesmente exigir a presença de uma palavra particular no texto extraído em vez de um casamento exato com o total do texto extraído. Uma decisão é então tomada em 62 com base no resultado, onde o desempenho de filtro é negativo (isto é, texto não reconhecido corretamente), então a próxima configuração de filtro pode ser selecionada em 52 e o teste é executado de novo. Onde o desempenho de filtro é determinado como sendo positivo, o teste pode ser repetido para a próxima imagem na sequência em 54. Onde o desempenho de uma configuração de filtro particular é positivo para todas as imagens na sequência, então essa configuração pode ser selecionada e armazenada em 64 dentro da rotina de teste para uso futuro em um processo de teste. Em cujo ponto o processo de configuração para esse aspecto do teste é completado.
[0029] Alternativamente, todas as configurações de filtro podem ser testadas com a precisão de cada uma sendo determinada (isto é, enquanto da sequência de imagens, um filtro resultou no OCR produzindo o resultado esperado) e o filtro com a melhor precisão sendo selecionado.
[0030] Usando este método, é possível escolher uma configuração de filtro que resulta em um casamento correto com o texto reconhecido.
[0031] Embora a descrição anterior se refira a uma sequência de imagens tendo substancialmente o mesmo conteúdo de texto, será percebido que a sequência pode não ser a sequência real de quadros e o conjunto de treinamento (sequência de imagens) pode ser, por exemplo, quadros capturados escolhidos em intervalos separados.
[0032] Será percebido que onde o método é configurado para selecionar a primeira configuração de filtro que resulte em 100% de precisão que as configurações de filtro a ser testadas podem ser escolhidas em ordem aleatória via métodos de Monte Carlo tradicionais, evitando assim blocos subideais localmente de filtros se filtros forem experimentados em ordem rígida de definição.
[0033] Em uma outra variação, também é possível gerar o conjunto de treinamento do sinal ao vivo, ao capturar imagens “ao vivo” e acumular estas imagens capturadas em armazenamento local. Contanto que cada nova imagem que chega seja reconhecida corretamente, não existe necessidade de treinar novamente com todas as imagens capturadas existentes (uma vez que estas, por definição, também já terão casado). Entretanto uma vez que uma imagem que é capturada não casa com o texto esperado, as imagens capturadas formam o conjunto de treinamento, e o algoritmo começa a procurar um filtro melhor usando as imagens capturadas. Onde uma imagem adicional não casa com o resultado esperado com um filtro, ela pode ser acrescentada ao conjunto de treinamento até que um conjunto de treinamento adequado tenha sido selecionado.
[0034] Este treinamento pode ser limitado em tempo (de maneira que se todas as imagens casarem com o texto esperado, para um período de tempo definido por usuário, o melhor filtro (configuração) corrente é avaliado como bom o suficiente e salvo).
[0035] Dada uma imagem ou conjunto de imagens, é possível o sistema determinar automaticamente com um alto grau de precisão o texto esperado sem entrada de usuário. Isto é baseado na observação de que embora texto reconhecido incorretamente tipicamente seja aleatório, o texto reconhecido corretamente é sempre o mesmo. Portanto, o sistema pode “supor” que a sequência de caracteres que aparece mais frequentemente nos resultados de reconhecimento é provável que seja o texto que o usuário desejou, e na maioria dos casos ele estará correto. Assim, embora o método mencionado anteriormente se refira ao usuário introduzindo um resultado de texto “esperado”, pode não ser necessário o usuário para fazer isto. Em uma variação alternativa, o texto extraído de uma primeira imagem em uma sequência pode ser empregado como o resultado “esperado” para o restante das imagens na sequência, isto é, consistência de resultado é determinada para se equiparar à precisão de resultado. Certamente, é possível que o processo OCR possa falhar de forma consistente para reconhecer o texto corretamente e que esta variação alternativa pode não ser apropriada.
[0036] Assim é possível, sem intervenção de usuário de qualquer tipo, determinar um conjunto de filtros de processamento de imagem para aplicar à imagem capturada que melhorará a precisão de reconhecimento.
[0037] Será percebido que embora o presente pedido tenha sido descrito de uma maneira geral com relação a teste de STBs, ele é igualmente aplicável para testar outros dispositivos tais como televisões digitais, reprodutores de mídia digital, reprodutores de DVD e dispositivos de consumidor tais como telefones móveis e PDAs. Será percebido que embora televisões digitais, reprodutores de mídia digital e reprodutores de DVD possam ter uma entrada de controle remoto (por exemplo, IR) para receber comandos de teste do sistema de teste, outros dispositivos podem exigir uma interface diferente no sistema de teste para enviar comandos de teste para o dispositivo sob teste.
[0038] Além disso, será percebido que as técnicas descritas presentemente também podem ser empregadas diretamente sem um processo de configuração de teste. Em particular, embora o método mencionado anteriormente tenha sido descrito com relação a usar uma rotina de configuração inicial para estabelecer/armazenar os parâmetros de filtro corretos para executar um teste particular. O método também pode ser usado em um cenário ao vivo para determinar conteúdo de texto de uma sequência de imagens capturadas. Em um arranjo como este, uma sequência de quadros capturados (ou partes dos mesmos) pode ser passada pelo filtro configurável usando uma primeira configuração de filtro e então pelo mecanismo OCR para fornecer um resultado de texto. Onde o resultado de texto é consistente para todos os quadros capturados (ou para uma proporção significativa dos mesmos), o resultado de texto pode ser considerado como válido. Onde o texto não é consistente, o processo pode ser repetido com uma configuração de filtro diferente. Este processo pode ser repetido, variando a configuração a cada vez, até que um resultado válido seja determinado. Será percebido que este processo pode ser de uso de uma maneira geral para vídeo capturado de um dispositivo sob teste e pode ser empregado de uma maneira geral para identificar texto em conteúdo de vídeo.
Claims (6)
1. Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar OCR, o método caracterizado pelo fato de que compreende as etapas de:a) fornecer uma sequência capturada de imagens contendo o mesmo conteúdo, a sequência de imagens compreende uma primeira imagem na sequência e uma pluralidade de imagens subsequentes na sequência;b) selecionar uma configuração para um filtro para pré- processar as imagens, a partir de uma pluralidade de configurações disponíveis;c) pré-processar a primeira imagem na sequência usando esta configuração de filtro e submeter a primeira imagem pré-processada a um processo OCR para extrair texto da primeira imagem pré-processada;d) pré-processar uma imagem da pluralidade de imagens subsequentes na sequência usando a configuração de filtro selecionada e submeter a imagem pré-processada da pluralidade de imagens subsequentes a um processo OCR para extrair texto da imagem pré-processada da pluralidade de imagens subsequentes;e) analisar o texto extraído da primeira imagem pré- processada e imagem pré-processada da pluralidade de imagens subsequentes para determinar o desempenho do filtro, em que o desempenho é determinado a ser positivo se o texto extraído for determinado a ser correto e em que a determinação de se o texto extraído está correto é feita por comparação entre os textos extraídos da primeira imagem na sequência e o texto extraído da imagem da pluralidade de imagens subsequentes na sequência; ef) decidir que a configuração é adequada e armazena a configuração adequada, em que as etapas d) e e) são executadas em cada imagem da pluralidade de imagens subsequentes na sequência e a determinação de se a configuração adequada é feita quando o desempenho da configuração de filtro selecionado é determinado a ser positivo para cada um da pluralidade das imagens subsequentes;em que as etapas d) e e) são repetidas para cada imagem sucessiva na sequência contanto que o texto extraído seja determinado a ser correto a partir da imagem precedente e quando se o texto extraído a partir de uma imagem da pluralidade de imagens subsequentes for determinada a não ser correta, selecionar uma diferente configuração para pré- processamento de imagens, e repetir as etapas c) a f).
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que as etapas b) a e) são repetidas para uma pluralidade de configurações diferentes, em que a configuração compreende a seleção de um ou mais tipos de filtros de uma pluralidade de tipos de filtros diferentes ou a configuração compreende a seleção de um parâmetro para um filtro, ou ambos.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o filtro compreende uma sequência de diferentes filtros que são aplicados em sequência e a configuração compreende a seleção de um ou mais parâmetros para cada filtro.
4. Sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste, o sistema caracterizado pelo fato de que compreende:um processador de imagem compreendendo o filtro para filtrar o quadro de vídeo capturado ou região do mesmo parafornecer uma imagem filtrada;um mecanismo OCR para analisar a imagem filtrada paraidentificar texto na imagem;em que o sistema é configurado para executar o método, como definido em qualquer uma das reivindicações 1 a 3;uma interface de controle remoto para transmitir comandos para o dispositivo sob teste;em que a filtragem executada pelo processador de imagem é configurada usando a configuração adequada determinada.
5. Sistema de teste, de acordo com a reivindicação 4, caracterizado pelo fato de que o filtro é adaptado para executar um ou mais do seguinte na imagem:a) remover seletivamente um ou mais componentes de cor, com ou sem conversão para escala de cinza;b) ajustar contraste de imagem;c) inverter cores;d) obscurecer;e) enfatizar a imagem; ef) aproximar a imagem de maneira que ela seja aumentadausando interpolação.
6. Sistema de teste, de acordo com a reivindicação 4 ou 5, caracterizado pelo fato de que um filtro tendo uma pluralidade de configurações de filtro diferentes é empregado pelo processador de imagem e em que o pelo menos um valor de configuração define as configurações de filtro a ser empregadas para filtrar o quadro de vídeo capturado ou região do mesmo.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1020101.0A GB2485833A (en) | 2010-11-26 | 2010-11-26 | Improved OCR Using Configurable Filtering for Analysing Set Top Boxes |
GB1020101.0 | 2010-11-26 | ||
PCT/EP2011/073802 WO2012069662A1 (en) | 2010-11-26 | 2011-12-22 | Improved ocr for automated stb testing |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112013013113A2 BR112013013113A2 (pt) | 2017-10-17 |
BR112013013113B1 true BR112013013113B1 (pt) | 2022-02-01 |
Family
ID=43500715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112013013113-6A BR112013013113B1 (pt) | 2010-11-26 | 2011-12-22 | Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar ocr e sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste |
Country Status (8)
Country | Link |
---|---|
US (2) | US9516304B2 (pt) |
EP (1) | EP2643973B8 (pt) |
BR (1) | BR112013013113B1 (pt) |
CA (1) | CA2831113C (pt) |
DK (1) | DK2643973T3 (pt) |
GB (1) | GB2485833A (pt) |
MY (1) | MY164774A (pt) |
WO (1) | WO2012069662A1 (pt) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010092585A1 (en) * | 2009-02-16 | 2010-08-19 | Communitake Technologies Ltd. | A system, a method and a computer program product for automated remote control |
US9836376B2 (en) | 2009-09-24 | 2017-12-05 | Contec, Llc | Method and system for automated test of end-user devices |
GB2485833A (en) | 2010-11-26 | 2012-05-30 | S3 Res & Dev Ltd | Improved OCR Using Configurable Filtering for Analysing Set Top Boxes |
US10108515B2 (en) * | 2013-03-01 | 2018-10-23 | Sony Interactive Entertainment LLC | Remotely testing electronic devices using messaging and presence protocol |
GB2514410A (en) * | 2013-05-24 | 2014-11-26 | Ibm | Image scaling for images including low resolution text |
US10511580B2 (en) | 2014-03-31 | 2019-12-17 | Monticello Enterprises LLC | System and method for providing a social media shopping experience |
US12008629B2 (en) | 2014-03-31 | 2024-06-11 | Monticello Enterprises LLC | System and method for providing a social media shopping experience |
US11080777B2 (en) * | 2014-03-31 | 2021-08-03 | Monticello Enterprises LLC | System and method for providing a social media shopping experience |
US11004139B2 (en) | 2014-03-31 | 2021-05-11 | Monticello Enterprises LLC | System and method for providing simplified in store purchases and in-app purchases using a use-interface-based payment API |
US10318804B2 (en) * | 2014-06-30 | 2019-06-11 | First American Financial Corporation | System and method for data extraction and searching |
US9460503B2 (en) | 2015-02-02 | 2016-10-04 | Arris Enterprises, Inc. | Automated video testing using QR codes embedded in a video stream |
US10277497B2 (en) | 2015-09-25 | 2019-04-30 | Contec, Llc | Systems and methods for testing electronic devices using master-slave test architectures |
US9992084B2 (en) | 2015-11-20 | 2018-06-05 | Contec, Llc | Cable modems/eMTAs under test |
US9810735B2 (en) | 2015-09-25 | 2017-11-07 | Contec, Llc | Core testing machine |
US9960989B2 (en) | 2015-09-25 | 2018-05-01 | Contec, Llc | Universal device testing system |
US9900116B2 (en) | 2016-01-04 | 2018-02-20 | Contec, Llc | Test sequences using universal testing system |
US10291959B2 (en) | 2015-09-25 | 2019-05-14 | Contec, Llc | Set top boxes under test |
US10122611B2 (en) | 2015-09-25 | 2018-11-06 | Contec, Llc | Universal device testing interface |
US9838295B2 (en) | 2015-11-23 | 2017-12-05 | Contec, Llc | Wireless routers under test |
US10320651B2 (en) | 2015-10-30 | 2019-06-11 | Contec, Llc | Hardware architecture for universal testing system: wireless router test |
US20170126536A1 (en) | 2015-10-30 | 2017-05-04 | Contec, Llc | Hardware Architecture for Universal Testing System: Cable Modem Test |
US9900113B2 (en) | 2016-02-29 | 2018-02-20 | Contec, Llc | Universal tester hardware |
US10779056B2 (en) | 2016-04-14 | 2020-09-15 | Contec, Llc | Automated network-based test system for set top box devices |
US10462456B2 (en) | 2016-04-14 | 2019-10-29 | Contec, Llc | Automated network-based test system for set top box devices |
US10237593B2 (en) | 2016-05-26 | 2019-03-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Monitoring quality of experience (QoE) at audio/video (AV) endpoints using a no-reference (NR) method |
US10235260B1 (en) | 2016-07-26 | 2019-03-19 | Contec, Llc | Set top box and customer premise equipment (CPE) unit test controller |
US9848233B1 (en) | 2016-07-26 | 2017-12-19 | Contect, LLC | Set top box and customer premise equipment (CPE) unit test controller |
US9872070B1 (en) | 2016-07-26 | 2018-01-16 | Contec, Llc | Customer premise equipment (CPE) and set top box quality control test system providing scalability and performance |
US10230945B2 (en) | 2016-10-17 | 2019-03-12 | Accenture Global Solutions Limited | Dynamic loading and deployment of test files to prevent interruption of test execution |
US10284456B2 (en) | 2016-11-10 | 2019-05-07 | Contec, Llc | Systems and methods for testing electronic devices using master-slave test architectures |
KR102478396B1 (ko) * | 2017-11-29 | 2022-12-19 | 삼성전자주식회사 | 이미지에서 텍스트를 인식할 수 있는 전자 장치 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0358181A (ja) * | 1989-07-26 | 1991-03-13 | Nec Corp | 光学文字読み取り装置 |
US5014328A (en) * | 1990-07-24 | 1991-05-07 | Eastman Kodak Company | Automatic detection and selection of a drop-out color used in conjunction with optical character recognition of preprinted forms |
US5262860A (en) * | 1992-04-23 | 1993-11-16 | International Business Machines Corporation | Method and system communication establishment utilizing captured and processed visually perceptible data within a broadcast video signal |
US5647023A (en) * | 1994-07-28 | 1997-07-08 | Lucent Technologies Inc. | Method of nonlinear filtering of degraded document images |
US5805747A (en) * | 1994-10-04 | 1998-09-08 | Science Applications International Corporation | Apparatus and method for OCR character and confidence determination using multiple OCR devices |
US6658662B1 (en) * | 1997-06-30 | 2003-12-02 | Sun Microsystems, Inc. | Retrieving information from a broadcast signal |
US6731788B1 (en) * | 1999-01-28 | 2004-05-04 | Koninklijke Philips Electronics N.V. | Symbol Classification with shape features applied to neural network |
US6295387B1 (en) * | 1999-05-27 | 2001-09-25 | Lockheed Martin Corporation | Method and apparatus for determination of verified data |
CN1459761B (zh) * | 2002-05-24 | 2010-04-21 | 清华大学 | 基于Gabor滤波器组的字符识别技术 |
JP4320438B2 (ja) * | 2003-06-06 | 2009-08-26 | 独立行政法人 国立印刷局 | 印刷物の文字列抽出処理装置 |
US9171202B2 (en) * | 2005-08-23 | 2015-10-27 | Ricoh Co., Ltd. | Data organization and access for mixed media document system |
US7664323B2 (en) * | 2005-01-28 | 2010-02-16 | Microsoft Corporation | Scalable hash-based character recognition |
US7551782B2 (en) * | 2005-02-15 | 2009-06-23 | Dspv, Ltd. | System and method of user interface and data entry from a video call |
ES2516823T3 (es) * | 2005-06-10 | 2014-10-31 | Accenture Global Services Limited | Identificación electrónica de vehículos |
US7575171B2 (en) * | 2005-09-01 | 2009-08-18 | Zvi Haim Lev | System and method for reliable content access using a cellular/wireless device with imaging capabilities |
JP2007228220A (ja) * | 2006-02-23 | 2007-09-06 | Funai Electric Co Ltd | ハードディスクドライブ内蔵型テレビジョン受像機、及びテレビジョン受像機 |
US7664317B1 (en) * | 2006-03-23 | 2010-02-16 | Verizon Patent And Licensing Inc. | Video analysis |
US7787693B2 (en) * | 2006-11-20 | 2010-08-31 | Microsoft Corporation | Text detection on mobile communications devices |
US7995097B2 (en) * | 2007-05-25 | 2011-08-09 | Zoran Corporation | Techniques of motion estimation when acquiring an image of a scene that may be illuminated with a time varying luminance |
CN101571922A (zh) * | 2008-05-04 | 2009-11-04 | 中兴通讯股份有限公司 | 一种用于移动终端自动化测试的文字识别工具及其方法 |
GB2470417B (en) * | 2009-05-22 | 2011-08-03 | S3 Res & Dev Ltd | A test system for a set-top box |
CN102023966B (zh) * | 2009-09-16 | 2014-03-26 | 鸿富锦精密工业(深圳)有限公司 | 用于合约比较的计算机系统及合约比较方法 |
US9152883B2 (en) * | 2009-11-02 | 2015-10-06 | Harry Urbschat | System and method for increasing the accuracy of optical character recognition (OCR) |
US8386121B1 (en) * | 2009-09-30 | 2013-02-26 | The United States Of America As Represented By The Administrator Of National Aeronautics And Space Administration | Optimized tuner selection for engine performance estimation |
US8737702B2 (en) * | 2010-07-23 | 2014-05-27 | International Business Machines Corporation | Systems and methods for automated extraction of measurement information in medical videos |
JP5747485B2 (ja) * | 2010-11-22 | 2015-07-15 | 株式会社リコー | 情報処理装置、情報処理方法、及びプログラム |
GB2485833A (en) | 2010-11-26 | 2012-05-30 | S3 Res & Dev Ltd | Improved OCR Using Configurable Filtering for Analysing Set Top Boxes |
WO2012088107A1 (en) * | 2010-12-23 | 2012-06-28 | The Directv Group, Inc. | System and method for performing an automated set top box test |
-
2010
- 2010-11-26 GB GB1020101.0A patent/GB2485833A/en not_active Withdrawn
-
2011
- 2011-12-22 CA CA2831113A patent/CA2831113C/en active Active
- 2011-12-22 MY MYPI2013001902A patent/MY164774A/en unknown
- 2011-12-22 BR BR112013013113-6A patent/BR112013013113B1/pt active IP Right Grant
- 2011-12-22 EP EP11805510.2A patent/EP2643973B8/en active Active
- 2011-12-22 US US13/989,777 patent/US9516304B2/en active Active
- 2011-12-22 DK DK11805510.2T patent/DK2643973T3/en active
- 2011-12-22 WO PCT/EP2011/073802 patent/WO2012069662A1/en active Application Filing
-
2016
- 2016-10-31 US US15/338,983 patent/US9942543B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
MY164774A (en) | 2018-01-30 |
GB2485833A (en) | 2012-05-30 |
EP2643973A1 (en) | 2013-10-02 |
DK2643973T3 (en) | 2018-06-14 |
US20130347050A1 (en) | 2013-12-26 |
US9516304B2 (en) | 2016-12-06 |
US20170048519A1 (en) | 2017-02-16 |
EP2643973B1 (en) | 2018-03-07 |
WO2012069662A1 (en) | 2012-05-31 |
WO2012069662A8 (en) | 2013-01-10 |
BR112013013113A2 (pt) | 2017-10-17 |
GB201020101D0 (en) | 2011-01-12 |
CA2831113C (en) | 2017-05-09 |
EP2643973B8 (en) | 2020-11-11 |
US9942543B2 (en) | 2018-04-10 |
CA2831113A1 (en) | 2012-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112013013113B1 (pt) | Método para determinar uma configuração adequada para um filtro para pré-processar imagens de vídeo capturadas antes de executar ocr e sistema de teste para analisar um quadro de vídeo capturado de um dispositivo sob teste | |
US9875409B2 (en) | Abnormality detection apparatus, abnormality detection method, and recording medium storing abnormality detection program | |
US11070891B1 (en) | Optimization of subtitles for video content | |
US20190362478A1 (en) | Machine learning techniques for increasing color consistency across videos | |
JP2011232111A (ja) | 検査装置及び検査装置の用いた欠陥検出方法 | |
US9258458B2 (en) | Displaying an image with an available effect applied | |
JP7078175B2 (ja) | 検査装置及び方法 | |
WO2013118955A1 (ko) | 깊이 맵 보정 장치 및 방법과 이를 이용한 입체 영상 변환 장치 및 방법 | |
CN110414346A (zh) | 活体检测方法、装置、电子设备及存储介质 | |
CN104795011A (zh) | 结合edid的显示器画面偏移检测系统以及使用方法 | |
CN107797784B (zh) | 获取拼接处理器的适配分辨率的方法及装置 | |
WO2023236371A1 (zh) | 用于电缆元件识别的视觉分析方法 | |
WO2013114803A1 (ja) | 画像処理装置及びその画像処理方法、並びにコンピュータ・プログラム、および画像処理システム | |
FR3018118A1 (fr) | Procede de test d'un systeme electronique | |
JPWO2014013792A1 (ja) | ノイズ評価方法、画像処理装置、撮像装置およびプログラム | |
ES2897326T3 (es) | Prueba de renderización de objetos de pantalla | |
CN112801891B (zh) | 显示屏画面检测方法、显示屏画面检测系统 | |
US10205940B1 (en) | Determining calibration settings for displaying content on a monitor | |
US20120127326A1 (en) | Image optimization system and method for optimizing images | |
CN114116464A (zh) | 一种图像处理的测试方法和装置 | |
Patel et al. | An improvement of forgery video detection technique using Error Level Analysis | |
KR20120121748A (ko) | 차트를 이용한 카메라 설정정보의 설정장치 및 방법 | |
WO2013114802A1 (ja) | 画像処理装置及びその画像処理方法、並びにコンピュータ・プログラム、および画像処理システム | |
JP2016127505A (ja) | 画像処理装置及び画像処理方法 | |
US10964022B2 (en) | Image processing method, corresponding image processing apparatus and endoscope arrangement |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B25A | Requested transfer of rights approved |
Owner name: S3 TV TECHNOLOGY LIMITED (IE) |
|
B25A | Requested transfer of rights approved |
Owner name: ACCENTURE GLOBAL SOLUTIONS LIMITED (IE) |
|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B350 | Update of information on the portal [chapter 15.35 patent gazette] | ||
B07A | Application suspended after technical examination (opinion) [chapter 7.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 22/12/2011, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO. |