BR112015022052B1 - Método em um dispositivo eletrônico, para o dispositivo eletrônico detectar um logotipo em uma área de sobreposição definida por uma máscara de logotipo dentro de uma imagem - Google Patents

Método em um dispositivo eletrônico, para o dispositivo eletrônico detectar um logotipo em uma área de sobreposição definida por uma máscara de logotipo dentro de uma imagem Download PDF

Info

Publication number
BR112015022052B1
BR112015022052B1 BR112015022052-5A BR112015022052A BR112015022052B1 BR 112015022052 B1 BR112015022052 B1 BR 112015022052B1 BR 112015022052 A BR112015022052 A BR 112015022052A BR 112015022052 B1 BR112015022052 B1 BR 112015022052B1
Authority
BR
Brazil
Prior art keywords
image
value
logo
area
mixed
Prior art date
Application number
BR112015022052-5A
Other languages
English (en)
Other versions
BR112015022052A2 (pt
Inventor
Faisal Ishtiaq
Kevin L. Baum
Original Assignee
Arris Technology, Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US13/862,318 external-priority patent/US9058522B2/en
Application filed by Arris Technology, Inc filed Critical Arris Technology, Inc
Publication of BR112015022052A2 publication Critical patent/BR112015022052A2/pt
Publication of BR112015022052B1 publication Critical patent/BR112015022052B1/pt

Links

Abstract

DETECTOR DE PRESENÇA DE LOGOTIPO COM BASE NAS CARACTERÍSTICAS DE MISTURA. Um sistema de processamento de vídeo detecta uma imagem de sobreposição, como um logotipo, em uma imagem de um fluxo de vídeo, a sobreposição, por exemplo, sendo um logotipo de transmissores de difusão. A detecção é baseada na avaliação de características de mistura de um quadro de imagem. O método de detecção de uma sobreposição define primeira e segunda áreas no interior da imagem, a primeira e segunda áreas não sobrepostas. Em seguida um valor de alfa- misturado é calculado para o valor de cor médio da segunda área com um valor de cor de sobreposição. Então, se o valor de cor médio da primeira área é mais próximo do valor de alfa- misturado do que é para o valor de cor médio da segunda área, a sobreposição pode ser indicada como detectada e definida dentro da imagem. Detecção da sobreposição pode ser utilizada para identificar um proprietário do vídeo, ou detectar quando uma cena muda como quando um comercial ocorre.

Description

REFERÊNCIA CRUZADA PARA PEDIDOS RELACIONADOS
[001] Este pedido reivindica prioridade sob 35 USC § 119 (e) a partir de Pedido Provisório dos Estados Unidos anterior depositado No. Serial 61/799.196, depositado em 15 de março de 2013, e reivindica a prioridade de Pedido de Utilidade No. US 13/862.318, depositado em 12 de abril de 2013, a totalidade dos quais é incorporada aqui por referência.
ANTECEDENTES CAMPO TÉCNICO
[002] A presente invenção refere-se genericamente ao campo de processamento de vídeo, e mais particularmente para identificar imagens e/ou regiões de imagens tendo gráficos misturados.
ARTE RELACIONADA
[003] Sinais de televisão de difusão exemplificam quadros de imagem que podem incluir gráficos sobrepostos, tais como logotipos. O conhecimento da presença ou ausência de tais gráficos sobrepostos pode ser significativo para sistemas e/ou processos que se relacionam com tais quadros de imagem. Por exemplo, uma empresa de difusão pode sobrepor (superimpor) o logotipo da empresa no canto inferior direito de quadros de imagem de programa para indicar que o programa foi recebido de suas instalações de transmissão.
[004] Em muitas aplicações, um gráfico tal como um logotipo é aplicado (isto é, sobreposto) em uma primeira imagem; a imagem combinada mostra uma combinação visual do gráfico com a primeira imagem. Em alguns designs de logotipo, a combinação visual pode ter um atributo de transparência. A primeira imagem pode ser visível através do gráfico imposto em certa medida na imagem combinada. Em uma imagem combinada, na vizinhança de um gráfico imposto, os valores de dados da imagem combinada podem ser uma combinação de contribuições de ambas a primeira imagem e o gráfico. Essa imagem combinada, especialmente com um atributo de transparência, pode ser referida como um gráfico misturado de sobreposição.
[005] É desejável continuar a fornecer sistemas melhorados para identificar a presença ou ausência de gráficos, tais como logotipos em uma imagem combinada.
SUMÁRIO
[006] Modalidades da presente invenção fornecem um sistema e método de processamento de vídeo para detecção de uma sobreposição em uma imagem de um fluxo de vídeo, a sobreposição, por exemplo, sendo um logotipo da empresa de difusão. A detecção é baseada na avaliação de características de mistura de um quadro, ou regiões de um ou mais quadros. Em algumas modalidades, parâmetros de vídeo e processos de codificação e decodificação podem ser modificados para aumentar características de visualização a jusante em resposta à detecção ou ausência de uma sobreposição, tais como um logotipo em imagens de um fluxo.
[007] Um método de detecção de uma sobreposição em uma imagem em uma modalidade, primeiro define primeira e segunda áreas dentro da imagem, a primeira e segunda áreas sendo não sobrepostas e a segunda área suportando uma sobreposição. Em seguida um valor de alfa-misturado é calculado para o valor de cor médio da segunda área com um valor de cor de sobreposição. Então, se o valor de cor médio da primeira área é a mais perto do valor de alfa- misturado do que é para o valor de cor médio da segunda área, em seguida, os seguintes passos são realizados: (1) uma área de sobreposição é definida que compreende pelo menos um pixel dentro da primeira área; e (2) uma ação é selecionada a partir do grupo que inclui: exibir uma borda em torno da área de sobreposição, definir um valor indicador que uma área de sobreposição foi encontrada, fornecendo uma máscara da área de sobreposição, influenciar parâmetros a serem usados ao codificar pelo menos a área de sobreposição, e fazer um codificador atingir uma maior qualidade de saída de vídeo codificada para a área de sobreposição.
[008] Utilizando modalidades da presente invenção, processamento de vídeo a jusante pode ser otimizado, com base na identificação da presença de uma sobreposição particular, tal como um logotipo, em um local específico dentro de imagens específicas. Por exemplo, o codificador pode utilizar a informação processada para ajustar parâmetros de codificação, como a taxa de bits, em resposta às indicações por pixel ou por área da presença de uma sobreposição especificada. Ausência de uma detecção de uma sobreposição pode ainda ajudar a identificar um intervalo comercial inserido em um fluxo de programa. A presença de uma sobreposição pode ainda ajudar a identificar programas e/ou canais específicos.
BREVE DESCRIÇÃO DOS DESENHOS
[009] Outros detalhes da presente invenção são explicados com a ajuda dos desenhos anexos, nos quais: a Figura 1 mostra uma imagem de exemplo, a imagem tendo gráficos misturados; a Figura 2 representa regiões de uma imagem de exemplo, a imagem tendo gráficos misturados; a Figura 3 representa um gráfico comparativo exemplar de luminância de pixel de fundo em relação à luminância de pixel misturada prevista; as Figuras 4 representa regiões de uma imagem, a imagem tendo gráficos misturados; as Figuras 5a-5b representam regiões de imagens, as imagens tendo gráficos misturados; a Figura 6 representa uma imagem de exemplo sem gráficos misturados; a Figura 7 representa um detector de transição misturado; a Figura 8 representa um detector de transição misturado; a Figura 9 representa um diagrama de blocos dos componentes utilizados para fornecer modalidade; a Figura 10 representa um fluxograma que ilustra a operação das modalidades; as Figuras 11a- 11b retratam uma imagem de entrada de exemplo e imagem processada; as Figuras 12a-12b mostram uma outra imagem de entrada de exemplo e imagem processada; as Figuras 13a-13c mostra uma imagem de entrada de exemplo, e uma primeira e segunda imagens processadas; as Figuras 14a-14c ilustram uma outra imagem de entrada de exemplo, e primeira e segunda imagens processadas; a Figura 15 representa uma modalidade de fluxograma; e a Figura 16 representa uma modalidade de sistema de computação.
DESCRIÇÃO DETALHADA
[0010] A Figura 1 mostra uma imagem de exemplo, a imagem tendo gráficos de sobreposição misturados. Um logotipo de direito de propriedade 112 e um gráfico fornecendo identificação de programa 111 são visíveis na imagem. Notavelmente, tanto o logotipo de direito 112 e o elemento de identificação de programa 1011 exibem um atributo de transparência. Isto é, algumas características de uma primeira imagem correspondendo para material de programa são pelo menos parcialmente visíveis através dos gráficos 111 e 112.
[0011] A Figura 2 representa regiões de uma imagem de exemplo, a imagem tendo gráficos misturados de sobreposição (por exemplo, um logotipo sobreposto). A região é uma porção exemplificativa de uma imagem combinada, que mostra a vizinhança de um gráfico, isto é, uma região que abrange um logotipo reconhecível. Região 211 indica uma pequena região no interior da forma de logotipo reconhecível. Região 212 indica uma pequena região que fica perto do logotipo, mas não está dentro do logotipo.
[0012] O valor de um pixel de imagem dentro de um gráfico misturado de sobreposição pode ser modelado de acordo com a Eqn. 1 representa o valor de um pixel misturado de sobreposição, como mostrado por 211, em uma localização (i, j) dentro de um quadro de imagem. A localização (i, j) pode representar a linha i e coluna j de uma matriz bidimensional de localizações de pixel.
[0013] Em algumas modalidades típicas, valores de pixel tal como aqui descritos podem corresponder a um valor de componente de luminância como é bem conhecido nas artes relacionadas. A utilização do componente de luminância é suficiente para a finalidade de presença de logotipo/determinação de ausência em muitas aplicações, e resulta em complexidade computacional reduzida quando comparado à utilização de múltiplos componentes, tal como RGB (isto é, vermelho, verde e azul), para o valor pixel. Em algumas modalidades uma gama típica para tais valores de luminância pode variar de 0 a 1, correspondendo respectivamente a uma medida de luminância mínima especificada, e uma medida de luminância máxima especificada. Em algumas modalidades uma gama de mínimo para máximo em uma modalidade pode corresponder respectivamente aos valores codificados como 0 a 255, o que pode vantajosamente corresponder a codificação de 8 bits dos valores. Gamas e codificação de outros parâmetros descritos neste documento podem ser implementadas como é bem conhecido nas artes relacionadas. Embora algumas modalidades específicas utilizando valores de luminância para valores de pixel estejam aqui descritas, os sistemas e processos aqui descritos não são necessariamente assim limitados. Modalidades alternativas utilizando quaisquer outros componentes e/ou medidas de representação de pixel de imagem conhecidos e/ou convenientes são entendidas como estando dentro do âmbito e espírito das modalidades descritas. Se vários componentes são escolhidos para representar um valor de pixel, as equações e processos de modalidades da presente invenção podem ser aplicados a um dos vários componentes, ou podem ser aplicados a mais de um dos componentes ou alguma combinação dos componentes.
[0014] O valor de pixel misturado de sobreposição P é uma mistura de contribuições a partir de um valor de pixel de logotipo Pl, e um valor de pixel de fundo Pb, de acordo com o valor do parâmetro de mistura α. O parâmetro de mistura também pode ser referido como um parâmetro de mistura de sobreposição, uma vez que refere-se a sobreposição de um gráfico para uma imagem. Em algumas modalidades típicas, cada um dos Pl, Pb, α pode ter uma gama de 0 a 1. O valor de pixel de logotipo Pl é representativo de um elemento gráfico imposto como um logotipo, e o valor de pixel de fundo Pb é representativo de uma primeira imagem sobre a qual o gráfico é imposto.
[0015] Modalidades da presente invenção podem analisar uma imagem para determinar se partes da imagem têm características que são consistentes com a presença de um objeto gráfico misturado de sobreposição. Em algumas modalidades, a análise baseia-se nas propriedades do modelo de Eqn. 1. À medida que Pb(j,i) não está acessível na imagem já combinada, modalidades da invenção fornecem uma aproximação por usar um pixel espacialmente separado a partir da imagem que é, de preferência nas proximidades, tal como indicado na Eqn. 2.
[0016] A Figura 2 representa um exemplo com um logotipo misturado de sobreposição. Neste exemplo, um logotipo com valor de luminância quase máximo (antes da mistura) foi misturado de sobreposição em uma imagem escura, resultando em um logotipo misturado de sobreposição que é muito mais escuro do que o valor de luminância máximo (luminância muito menos do que a máxima). Para o pixel misturado de sobreposição P(i, j) na região 211 dentro do logotipo, Pb(i, j) pode ser aproximado por um pixel perto da região 212, (i',j'), localizado fora do logotipo. Sob esta aproximação, Pb(i, j) torna-se e o modelo de Eqn. 1 torna-se:
[0017] Partindo do princípio que Pl(i, j) e α são conhecidos, Eqn. 3 pode ser avaliada. Em alguns casos, Pl(i, j) e α podem não ser conhecidos diretamente. No entanto, tem-se observado que várias difusões usam luminância aproximadamente máxima (por exemplo, 255 para uma representação de 8 bits) para Pl(i, j) e utilizam frequentemente um α na gama de 0,3-0,5. Assim, quando Pl(i, j) e α não são conhecidos, é possível utilizar valores aproximados, tais como Pl(i, j) = "valor máximo" e α = 0,4. Alternativamente, imagens de amostra a partir de uma difusão contendo um logotipo misturado de sobreposição podem ser capturadas e a região de logotipo das imagens pode continuar a ser analisada para fornecer estimativas de Pl(i, j) e α.
[0018] Um critério de presença de gráfico misturado de sobreposição (por exemplo, um logotipo sobreposto) pode ser satisfeito se o valor de P(i, j) é uma melhor correspondência com o valor de do que é para o valor de . Isto é, uma presença de gráfico misturado de sobreposição é indicada na posição (i, j), se P(i, j) é em uma direção mais perto do valor de do que é para o valor de .
[0019] Um indicador de presença de gráfico misturado de sobreposição Cp pode representar o resultado da avaliação do critério. Em algumas modalidades, o critério de presença de logotipo pode ser avaliado como a equação lógica:
[0020] A Figura 3 representa um gráfico comparativo exemplar de luminância de pixel de fundo em relação à luminância de pixel misturada usando Eqn. 1 ou luminância de pixel misturada prevista usando Eqn. 3. Na modalidade representada na Figura 3, os valores no eixo x 314 podem representar a luminância do pixel de fundo, Pb (Eqn. 1) ou Pb (Eqn. 3), e os valores no eixo Y 315 podem representar a luminância do pixel misturado de sobreposição, P (Eqn. 1) ou pixel misturado de sobreposição previsto (Eqn. 3) . Na modalidade mostrada na Figura 3, a linha inferior 316 representa um valor de pixel de fundo com nenhum componente misturado (alfa definido como zero), em que o valor de pixel misturado é igual ao valor de pixel de luminância de fundo, e a linha superior 317 representa um pixel misturado de sobreposição, P (Eqn. 1) ou pixel misturado de sobreposição previsto (Eqn. 3), utilizando um valor de α 318 de 0,4 e assumindo que o valor da luminância de Pl(i, j) é 255 ou branco. A Figura 3 demonstra graficamente que como o valor do pixel de fundo torna-se mais elevado ou se torna mais brilhante (ao longo do eixo horizontal 314), menor será a diferença entre o valor misturado usando a Eqn. 1 (ou o valor previsto usando a Eqn. 3), e a linha de componente de pixel de fundo de referência 316 gerada sem a utilização de mistura.
[0021] Algumas modalidades podem utilizar o modo que o valor de alfa-misturado varia com o valor do pixel de fundo para formar o valor de pixel previsto. A partir da Figura 3, a Eqn. 1, ou a Eqn. 3, pode-se determinar que como o valor do pixel de fundo aumenta ou se torna mais brilhante (ao longo do eixo horizontal 314), a diferença entre o fundo e valores de pixel misturados diminui de uma forma linear. Além disso, pode ser determinado que o valor de pixel misturado é maior do que ou igual ao valor de pixel de fundo. Estas características podem ser utilizadas para formar um valor de pixel misturado previsto para um pixel em uma região a partir de um pixel em uma outra região. Observe que a Figura 3 está plotada para um Pl de 255. Para menores valores de Pl, a curva de pixel misturado pode atravessar a curva de eixo vs eixo 316 e ser abaixo dela para grandes valores de pixel de fundo. Neste caso, o valor de pixel previsto será ainda maior do que o valor de pixel de fundo para valores de pixel de fundo inferiores a um certo valor, mas menor do que os valores de pixel de fundo para valores de pixel de fundo acima do determinado valor. O valor determinado pode ser referido como um valor de cruzamento. Acima do valor de cruzamento, a diferença de valor entre os pixels misturados e de fundo pode aumentar de uma forma linear.
[0022] Em algumas modalidades, a satisfação de um critério de presença de gráfico misturado de sobreposição pode estar sujeita a uma restrição de tolerância adicional. A restrição adicional pode ser expressa como:
[0023] Quando esta restrição adicional é usada, tanto Eqn. 5a e a instrução "Se" de Eqn. 4 devem ser avaliadas como "verdadeiro" (o que em algumas modalidades pode ser representado como um valor numérico de 1) para o critério de presença de gráfico misturado de sobreposição Cp para indicar uma saída positiva (por exemplo, "verdadeiro" ou 1). Esta restrição adicional ajuda a impedir uma indicação de falsos positivos quando o pixel na posição (i, j) não é misturado de sobreposição, mas tem um valor muito elevado de luminância em comparação com o pixel na posição (i', j'). A restrição adicional pode, alternativamente, ser formulada com uma operação de valor absoluto tal como mostrada na Eqn. 5b para reduzir respostas falso positivas devido tanto a valores muito altos e muito baixos de luminância que, no entanto, satisfizeram Eqn. 4. Excluir resultados de outro modo positivos com base em não cumprir uma restrição também pode ser referido como redefinir uma área de sobreposição.
[0024] Em tais modalidades, satisfação do critério de presença de gráfico misturado de sobreposição exige que o valor P(i, j) seja uma melhor correspondência para o valor do P que é o valor de e, que as Eqn. 5a ou 5b aplicáveis avaliam como verdadeiro.
[0025] O valor de tolerância (Pb) pode ser fixo ou variável. Um valor fixo é muito simples de implementar, mas melhor desempenho pode ser obtido com um valor variável. Quando se utiliza um valor variável, é preferível que o valor de tolerância (Pb) diminua à medida que o valor de aumenta. Isso porque um misturado de sobreposição provoca um aumento proporcionalmente menor em termos de luminância quando o pixel de fundo já tem um alto valor de luminância. Algumas modalidades usam uma função linear para p tolerância (Pb) o pode variar linearmente a partir do seu máximo valor para o seu valor mínimo quando aumenta e a partir de um valor mínimo na sua gama para um valor máximo na sua gama de funcionamento. Considerando-se um caso em que a luminância é representada em um intervalo de 0 a 255, em algumas modalidades o valor máximo de tolerância (Pb) é 30 e seu valor mínimo é 6. Em algumas modalidades, um valor mínimo de pode corresponder ao preto, e, um valor máximo pode corresponder a branco.
[0026] Em algumas modalidades, esta restrição adicional sobre o critério de presença de gráfico misturado de sobreposição pode vantajosamente evitar detecção de falsos positivos a partir de um objeto brilhante não misturado.
[0027] Alguns exemplos adicionais não limitativos de introdução de um valor de um valor de tolerância, são como segue:
[0028] Equação 5c:
[0029] Equação 5d:
[0030] A título de exemplos não limitativos: se P (i, j) está mais próximo de então a saída de detector pode ser 1 desde que:
[0031] Exemplo: varia linearmente de 30 a 6 como aumenta de 0 (preto) a 255 (branco). Além disso, a título de exemplo não limitativo, para reduzir a probabilidade de um resultado falso positivo o seguinte pode ser empregue. se P (i, j) está mais próximo de então a saída do detector será 1 desde que:
[0032] Exemplo: varia linearmente de 30 a 6 como aumenta de 0 (preto) a 255 (branco)
[0033] Além disso, em algumas modalidades tanto o limites superior e inferior podem ser combinados, como mostrado abaixo: se P (i, j) está mais próximo de então a saída do detector será 1 desde que:
[0034] A Figura 4 representa as regiões de uma imagem em um quadro 410, a imagem tendo gráficos misturados de sobreposição. Figura 4 não mostram os valores de pixel reais da imagem, mas ao invés apenas serve como uma referência lógica para as diferentes regiões da imagem. Por conveniência nesta representação, locais onde pixels de logotipo foram misturados de sobreposição na imagem correspondem a preto mostrado dentro do quadro, e todas as outras localizações dentro do quadro correspondem a branco.
[0035] A região de recorte 420 também é mostrada dentro do quadro da Figura 4. A região de recorte 420 contém um logotipo reconhecível, com regiões 421 e 422 correspondentes às localizações com presença de logotipo. Região 423 está localizada no interior do recorte, mas fora da forma de logotipo, assim correspondente a um local com ausência de logotipo. Nomeadamente, como mostrado no exemplo, uma gráfica misturada de superposição pode ter uma geometria e/ou combinação complexa de formas tais que a presença e ausência de gráfico misturado de sobreposição não correspondem necessariamente a regiões conectadas e/ou contíguas dentro da imagem combinada. Um conjunto de informação que especifica a forma e a localização de um elemento gráfico, tal como um logotipo, pode ser referido como uma máscara de logotipo.
[0036] Em funcionamento, processos a jusante podem ser otimizados, com base na identificação da presença de um logotipo de direito de proprietário particular em um local específico dentro de imagens específicas. Por exemplo, um codificador de um fluxo de imagem pode ajustar parâmetros de codificação, como a taxa de bits, em resposta às indicações por pixel ou por área da presença de um logotipo de propriedade particular. Tais ajustes de taxa de bits podem otimizar as características de visualização a jusante do logotipo. Além disso, em algumas modalidades, a ausência de um logotipo de direito de propriedade, em uma base por quadro, pode ajudar a identificar uma pausa comercial inserida em um fluxo de programa ou a presença de logotipos específicos dentro de um quadro pode ajudar a identificar os programas e/ou canais específicos.
[0037] A Figura 4 também mostra uma imagem binária com uma máscara de logotipo. A máscara de logotipo é representada pelos pixels pretos das letras de bloco "H" - "D" - "T" - "V" e os pixels do triângulo preto cheio acima das letras. Por conveniência de exibição na Figura 4, os pixels tendo valor 1 (a máscara de logotipo) foram mapeados para uma cor de exibição preta e os pixels tendo um valor de 0 foram mapeados para uma cor de exibição de branco. Em algumas modalidades, os pixels de máscara de logotipo podem ser representados em uma forma não binária, tal como pelo valor de luminância máximo ou um valor de luminância predeterminado tal como Pl. Uma modalidade pode fazer uma determinação sobre se ou não o logotipo misturado de sobreposição correspondente foi imposto sobre a imagem que está sendo analisado. Locais candidatos (i', j') para avaliar se o valor de pixel de pode ser quaisquer locais de pixel que são especificados para serem fora da máscara de logotipo. Um local candidato (i, j) para tanto medir um valor de pixel de imagem P, e estimar um valor de pixel misturado de sobreposição , pode ser qualquer local que é especificado para ser no interior da máscara de logotipo. Pode ser vantajoso selecionar o local (i', j') para ser próximo, mas fora da máscara de logotipo. Pode ser vantajoso invocar técnicas de média espacial na avaliação do valor de pixel de fundo e/ou o valor de pixel de imagem.
[0038] Assim, passos de um método de praticar esta modalidade, para cada quadro de imagem de interesse, podem compreender: medir uma intensidade de pixel média para pelo menos uma porção dos pixels localizados no interior da máscara de logotipo, fornecendo desse modo um valor de pixel de imagem P; medir uma intensidade de pixel média para pelo menos uma porção dos pixels localizados fora da máscara de logotipo, fornecendo desse modo um valor de pixel de fundo ; estimar um valor do pixel misturado de sobreposição , que pode ser de acordo com a Eqn. 3; e avaliar o critério de presença de gráfico misturado de sobreposição, usando estes P, e .
[0039] O critério de presença de gráfico misturado de sobreposição pode ser avaliado de acordo com a Eqn. 4, em algumas dessas modalidades. Em algumas modalidades utilizando uma máscara de logotipo, uma determinação de se o logotipo representado pela máscara de logotipo está presente na imagem sendo analisada, é com base em se o critério de presença de gráfico misturado de sobreposição é satisfeito ou não.
Caso 1: Modalidade com uma máscara de logotipo predefinida disponível
[0040] Os diagramas das Figuras. 5a-5b ilustram modalidades de Caso 1. Nas modalidades de caso 1, uma máscara de logotipo está disponível. A máscara de logotipo especifica a localização de pixels dentro de um logotipo. Em um exemplo de modalidade, uma máscara de logotipo representa o conjunto de (i, j) locais em que pixels de logotipo correspondentes podem estar presentes, dentro de uma imagem combinada. Ou seja, as localizações dos pixels de logotipo dentro de um quadro são predeterminadas. Em algumas modalidades, uma máscara de logotipo pode ser representada como uma porção de uma imagem binária, a imagem binária tendo as mesmas dimensões que a imagem (ou recorte de imagem) a ser analisada, em que a imagem binária tem valores de pixel de 1 em todas as posições em que os pixels de logotipo podem estar presentes (a máscara de logotipo), e 0 em todos os outros locais de pixel (fora da máscara de logotipo).
[0041] Na Figura 5a, a região ilustra uma região de recorte de um quadro de imagem de vídeo combinado de exemplo. A região da Figura 5b representa uma região de recorte 530 de um quadro de imagem combinado tal como o quadro de imagem 410 representado no diagrama da Figura 4, partindo do princípio que o caso representado na Figura 4 é um caso em que uma máscara de logotipo está disponível. Por conveniência na Figura 5b, valores máximos de luminância podem corresponder a preto mostrado dentro de uma região, e valores mínimos de luminância pode corresponder a branco mostrado dentro de uma região.
Caso 1: Exemplo 1:
[0042] Valores de imagem de pixel correspondentes a todos os locais dentro da máscara de logotipo têm sua média calculada, a fim de formar um valor de imagem de pixel P. Esses locais são visíveis nos recortes 530 e 520, e identificáveis como as áreas em que a forma de logotipo foi claramente imposta a um primeiro quadro de imagem. Exemplos de locais específicos dentro de uma máscara de logotipo são mostrados, tais como 532, 536, 522 e 526. O conjunto de todos os locais dentro de uma máscara de logotipo é claramente visível como um logotipo que compreende um triângulo preenchido, e as letras "H" "D" "T" e "V", dentro de cada recorte 530 e 520.
[0043] Os valores de imagem de pixel correspondendo a todos os locais dentro do recorte, mas fora da máscara de logotipo tem sua média calculada, de modo a formar um valor de pixel de fundo. Área 533 no interior do recorte 530, e, área 533 no interior do recorte 520, descrevem, a título de exemplo, alguns dos referidos locais.
Caso 1: Exemplo 2:
[0044] Os valores de imagem de pixel correspondendo a todos os locais dentro de uma região especificada dentro da máscara de logotipo tem sua média calculada a fim de formar uma imagem de pixel valor P. Em recorte 530, tal região é descrita como região 'dentro de máscara' 536. Em recorte 520, tal região é descrita como região 'dentro de máscara' 526.
[0045] Os valores de imagem de pixel correspondendo a todos os locais dentro de uma região especificada fora da máscara de logotipo tem sua média calculada a fim de formar um valor de pixel de fundo . Em recorte 530, tal região é descrita como região 'fora da máscara' 535. Em recorte 520, tal região é descrita como região 'fora da máscara' 525.
[0046] As regiões "dentro" e/ou "fora" de tal modalidade podem ser selecionadas para serem vantajosamente alinhadas com relação a características geométricas de uma máscara de logotipo conhecida. Por exemplo, o alinhamento com características de logotipo fora do eixo pode ajudar a retirar ambiguidade entre presença de logotipo e características no eixo de imagens de fundo. A título de exemplo e não de limitação, modalidades que utilizam regiões “dentro da máscara” e “fora da máscara” diagonalmente alinhadas tal como descrito no diagrama 4001 podem ser relativamente insensíveis a (mal) interpretação de características de borda horizontais e/ou verticais dentro de uma imagem de fundo como indicativo de presença de logotipo.
[0047] Em algumas modalidades, as regiões "dentro" e/ou "fora" de tal modalidade podem ser selecionadas com base em um ou vários critérios alternativos ou adicionais, tais como, a título de exemplo e não como limitação, um conjunto de pixels ao longo das bordas da máscara para a região "dentro", um conjunto de pixels fora da máscara, mas perto das bordas da máscara para a região "fora", um seletor de pixels aleatório ou pseudoaleatório para as porções "dentro" e/ou "fora", uniformidade e/ou brilho.
Caso 1: Melhorado
[0048] Em modalidades adicionais, desempenho pode ser melhorado através da combinação (Caso 1) de modalidades de Exemplo 1 e Exemplo 2 para detectar com mais confiabilidade a presença de logotipo em uma imagem. Em tais modalidades adicionais, um critério de presença de logotipo ficará satisfeito se a operação de ambas modalidades de Exemplo 1 e Exemplo 2 indica a presença de logotipo.
[0049] A título de exemplo, uma sequência de operações correspondentes a tais modalidades adicionais pode ser descrita. Em primeiro lugar, uma modalidade de Exemplo 1 de caso 1 opera em uma imagem. Se o resultado desta operação indica (positivamente) uma presença de logotipo dentro da imagem, uma modalidade de Exemplo 2 de caso 1 opera na mesma imagem. Se o resultado da Operação de Exemplo 2 de Caso 1 na imagem também indica uma presença de logotipo dentro da imagem, então o resultado combinado da operação indica uma presença de logotipo dentro da imagem. No caso em que a operação de Exemplo 2 de Caso 1 não é indicativa da presença de um logotipo, em seguida, o resultado combinado da sequência de operações não indica uma presença de logotipo.
[0050] A Figura 6 ilustra uma imagem 610 em que uma modalidade melhorada de Caso 1 operou. Notavelmente, imagem 610 está ausente de um gráfico imposto ou logotipo dentro da região 611. Região 611 compreende uma região de luminância muito alta, bem como características de borda verticais de uma imagem de fundo. A operação de uma modalidade de exemplo 1 de Caso 1 na imagem indicou uma presença de logotipo correspondente para região 611. A operação de uma modalidade de Exemplo 2 de Caso 1 na imagem indicou nenhuma presença de logotipo. Assim, a operação combinada das modalidades de Exemplo 1 e Exemplo 2 produz uma indicação precisa de nenhum logotipo presente. A operação da Modalidade melhorada de Caso 1 pode ser descrita como eliminando ou evitando uma indicação de falsos positivos de presença de logotipo.
[0051] A função de uma modalidade melhorada de Caso 1, como acabado de descrever, pode ser descrita como fornecendo um tipo de verificação de forma de logotipo, uma vez que a Modalidade de Exemplo 2 de Caso 1 forneceu uma resposta negativa quando aplicada a uma porção da máscara de logotipo tendo uma direção de borda diagonal distintiva.
[0052] Podem haver modalidades adicionais que combinam operação de mais de uma modalidade de Exemplo 2, com ou sem aplicação combinada de uma modalidade de Exemplo 1. As modalidades de Exemplo 2 adicionais podem servir para testar diferentes elementos de uma geometria de logotipo ou uma forma de logotipo inteira.
[0053] Em particular, o resultado combinado com êxito da operação de combinações de tais modalidades em cima da mesma imagem não requer necessariamente uma determinada ordem das operações. Em algumas modalidades, as indicações por modalidade da presença de logotipo podem ser logicamente ou de outro modo combinadas para fornecer um resultado útil, sem levar em conta a ordem ou o momento em que foram fornecidas.
Caso 2: Operar sem uma máscara de logotipo predefinida
[0054] Modalidades de Caso 2 operam sem acessar uma máscara de logotipo predefinida. Tal operação pode ser descrita como "detecção cega" e em algumas modalidades um detector de mistura é utilizado para identificar as fronteiras de logotipo.
Detector de Transição Misturado:
[0055] Modalidades de um Detector de Transição Misturado (BTD) são aqui descritas. Um BTD pode ser responsivo a fronteiras entre pixels de fundo e pixels misturados de sobreposição, e outras fronteiras que são consistentes com uma transição a partir de pixels não misturados para pixels misturados. Isto é, um BTD pode responder às características de uma imagem combinada que são consistentes com as características de gráficos misturados de sobreposição, tais como logotipos, que são impostos dentro da imagem.
[0056] Um BTD avalia P(i, j) e :> (i, j) = (i', j') para uma ou mais localizações de pixel (i, j) em uma imagem, em que (i, j) denotam a (linha, coluna) de uma imagem de pixel. Em algumas modalidades, o BTD pode avaliar localizações de pixel dentro de uma região especificada, um conjunto predeterminado de localizações de pixel, a cada localização de pixel de ordem k, uma maioria de localizações de pixel, ou mesmo todas as localizações de pixel. A localização de um pixel espacialmente separado (i', j') é espacialmente deslocada a partir da localização de pixel de imagem por um valor determinado de δ, em uma direção especificada D dentro do plano da imagem.
[0057] Os valores de P(i, j) e (i, j) são empregues para estimar a valor de pixel misturado de sobreposição (i, j), que pode ser de acordo com a Eqn. 3. O critério de presença de gráfico misturado de sobreposição é avaliado, usando estes P,, e , que podem ser de acordo com a Eqn. 4. Um indicador de presença de gráfico misturado de sobreposição Cp pode, assim, ser atribuído um valor para cada localização (i, j) dentro do plano da imagem.
[0058] P(i, j) e (i, j) = P(i', j') podem cada ser avaliado por vários métodos. Por exemplo, os valores de pixel nas localizações (i, j) e (i', j') podem ser utilizados diretamente. No entanto, pode ser preferível utilizar valores de pixel filtrados em cada posição. Vários filtros para valores de pixel são conhecidos na arte e podem ser utilizados com a presente invenção para determinar os valores de pixel filtrados. Um tal filtro pode ser referido como um filtro de média espacial, que envolve o cálculo da média dos valores de um conjunto de pixels preferivelmente vizinhos. Pode ser vantajoso realizar tal média espacial em uma direção essencialmente ortogonal à direção D especificada correspondendo a um BTD específico. Notavelmente, uma variedade de sistemas e métodos de filtragem de pixel eficazes é disponível, como são bem conhecidos nas artes relacionadas, tais como por meio de exemplo e não de limitação, métodos de filtragem relacionados com alisamento de imagem ou para detecção de borda em imagens. Note que um valor filtrado pode também ser referido como um valor médio ou um valor de média, e localizações (i, j) e (i', j') também podem ser consideradas a partir de diferentes áreas da imagem.
[0059] A Figura 7 descreve as modalidades de BTD. Um BTD tendo uma direção horizontal 720 é mostrado dentro do quadro de imagem 710. Região 725 compreende uma localização de pixel e algumas localizações de pixel adicionais igualmente distribuídas em cada lado da localização (i, j) e ortogonais à direção do BTD. Valor de pixel P(i, j) podem ser um valor de pixel filtrado que é obtido pela média espacial dos pixels na Região 725. Como um exemplo e sem limitação, região 725 pode incluir três pixels, tendo localizações (i, j), (i-1, j), e (i+1, j) para fornecer média espacial em uma direção essencialmente ortogonal à direção especificada 720.
[0060] Região 726 compreende a localização de pixel de deslocada (i', j') e algumas localizações de pixel adicionais distribuídas igualmente em ambos os lados da localização (i', j') e ortogonais à direção do BTD. A localização de pixel (i', j') dentro de 726 está localizada a uma distância especificada δ 721 da localização de pixel de imagem (i', j') ao longo da direção horizontal especificada 720 correspondente a este BTD. A título de exemplo não limitativo, em algumas modalidades δ pode ter um valor pequeno, tal como 2 pixels. Valor de pixel (i, j) = P(i', j') pode ser um valor de pixel filtrado que é obtido pela média espacial dos pixels na região 726.
[0061] A varredura de todas as localizações de imagem, para uma modalidade de BTD tendo uma direção como representado pela direção horizontal 720 (esquerda para direita) pode ser descrita como: Deixe (i, j) denotar a (linha, coluna) de uma imagem de pixel. Varrer sobre cada localização de pixel na imagem. Para cada localização de pixel deixe i' = i, e j' = j - δ.
[0062] A varredura de todas as localizações de imagem para uma modalidade de BTD tendo uma direção horizontal 740, que é oposta à direção 720, pode ser caracterizada como deixar i' = i, e j' = j + δ.
[0063] Em algumas modalidades, o BTD pode usar vários valores do delta de deslocamento espacial. Ao usar vários valores de delta, o BTD pode identificar pixels misturados de gráfico adicionais. Como um exemplo não limitativo, o BTD pode operar com um primeiro valor de delta para identificar um contorno de uma mistura de gráfico, e, em seguida, operar com valores de delta adicionais para "preencher" o contorno misturado de gráfico ou fornecer uma máscara derivada.
[0064] Exemplos de diferentes direções correspondendo a modalidades de BTD adicionais estão representados no quadro de imagem 710. Em geral, direção de BTD é limitada apenas como estando dentro do plano de imagem. A título de exemplo e não de limitação, modalidades de BTD tendo direção horizontal 720 e 740, vertical 730, e diagonal 750 são descritas. No caso geral, para cada direção disponível existe uma direção oposta disponível correspondente. Além disso, um BTD não está limitado a varrer sobre todas as localizações (i, j) de uma imagem, como um BTD pode ser aplicado a qualquer uma ou mais localizações.
[0065] Em algumas modalidades, fronteiras de máscara e/ou uma máscara mais completa do logotipo podem ser derivadas por seleção de pixels que são conhecidos ou descobertos como estando dentro do logotipo (por detecção e/ou qualquer outra técnica e/ou método conhecido e/ou conveniente) e seletivamente modificar o valor de δ até um resultado não positivo ser obtido. A título de exemplo não limitativo, após a detecção de uma indicação positiva da presença de um logotipo, um ou mais pixels de ancoragem pode ser estabelecidos. Um valor de δ pode, em seguida, ser incrementado (ou em algumas modalidades decrementada) por um valor desejado e o resultado pode ser reavaliado para presença de uma indicação positivo de um logotipo. O valor de δ associado com o pixel de ancoragem pode ser repetidamente incrementado e o resultado reavaliado quanto à presença de uma indicação positiva de um logotipo. No ponto em que o valor de δ incrementado proporciona uma determinação não positiva para a presença de logotipo, um pixel de ancoragem subsequente pode ser selecionado e o processo de incrementar (ou decrementar) o valor de δ pode ser repetido na mesma ou uma forma semelhante, tal como aqui descrito. Este sistema, método e/ou o processo pode resultar não apenas na identificação das fronteiras da máscara de logotipo, mas também pode definir mais completamente o interior da máscara de logotipo e pode ajudar a diferenciar entre gráficos sólidos e transparentes.
[0066] Em algumas modalidades, a tela pode ser dividida em regiões para complexidade reduzida e resultados falsos reduzidos. A título de exemplo não limitativo, se um usuário deseja apenas procurar logotipos no canto inferior direito de uma tela, um usuário pode calcular as saídas de detector para a região de interesse. Em alternativa, um usuário pode avaliar quadros anteriores e utilizar as saídas de detector a partir de um ou mais quadros anteriores para estreitar as regiões processadas em um quadro subsequente.
[0067] A divulgação contida neste documento não se destina a ser limitada aos logotipos tradicionais, mas também pode ser implementada com qualquer elemento gráfico conhecido, conveniente e/ou o desejado.
[0068] A Figura 8 representa uma modalidade de BTD. Um BTD tendo uma direção horizontal 820 é mostrado dentro do quadro de imagem 810. A imagem fornecida é um exemplo representativo de pelo menos uma porção de uma imagem de televisão aberta. Região 825 compreende uma localização de pixel (i, j) e algumas localizações de pixel adicionais distribuídas igualmente em ambos os lados de localização (i, j) e ortogonais para direção do BTD. P(i, j) pode ser avaliado como um pixel filtrado por média espacial dos pixels na Região 825.
[0069] Região 826 compreende a localização de pixel deslocado (i', j') e algumas localizações de pixel adicionais distribuídas igualmente em ambos os lados da localização (i', j') e ortogonais para a direção do BTD. A localização de pixel (i', j') dentro de 826 está localizada dentro de uma determinada distância δ 821 da localização de pixel de imagem (i, j) ao longo da direção horizontal especificada 820 correspondente a este BTD. (i, j) = P(i', j') pode ser avaliado como um pixel filtrado por média espacial dos pixels na Região 826.
[0070] Uma pluralidade de BTDs com direções distintas pode operar na mesma imagem. Os resultados correspondentes das operações de BTD, como os resultados por pixel, podem ser combinados. A título de exemplo e não de limitação, em algumas modalidades, os resultados podem ser combinados por uma avaliação de uma operação de OR lógico em uma base por pixel, em que as entradas para a operação de OR são resultados por pixel a partir dos BTDs, e a saída pode ser um resultado combinado por pixel. Em algumas modalidades, o resultado combinado pode fornecer um esboço de gráficos, como logotipos, se o gráfico misturado de sobreposição está presente no quadro de imagem.
[0071] A Figura 9 representa uma modalidade de diagrama de blocos aplicável a sistemas e métodos da presente invenção descrita. Pode notar-se que esta é uma visão agregada de funcionalidade em várias modalidades. Modalidades específicas podem variar desde a forma específica da Figura 9, sem afastamento do âmbito da revelação.
[0072] Um ou mais quadros de imagem 910 podem ser recebidos por unidade de pixel de imagem 920. Unidade de pixel de imagem 920 pode fornecer valor (es) de pixel de imagem P r, responsivo para os quadros de imagem 910 recebidos. Em algumas modalidades, unidade de pixel de imagem 920 processa quadros de imagem recebidos 910. Esse tratamento pode compreender, por meio de exemplos não limitativos, filtragem espacial, filtragem temporal e funções morfológicas.
[0073] Um ou mais quadros de imagem 910 podem ser recebidos pelo estimador de fundo 921. Estimador de fundo 921 podem fornecer valor de pixel de fundo estimado (s) , responsivo para os quadros de imagem 910 recebidos. Em algumas modalidades, o estimador de fundo 921 processa quadros de imagem recebidos 910. Esse processamento pode compreender, a título de exemplo não limitativo, filtragem espacial.
[0074] Algumas modalidades podem modelar um valor de pixel de fundo de um pixel de alfa-misturado por uma versão rearranjada de Eqn. 1: Eqn. 1 (rearranjada) Uma vez que esta relação fornece o valor de pixel de fundo que é pelo menos parcialmente obscurecido atrás de um gráfico misturado de sobreposição, ela pode ser referida como de-alfa-mistura.
[0075] Em algumas modalidades um pixel em (i, j) pode ser postulado como sendo dentro de um gráfico misturado enquanto um pixel em (i', j') pode ser postulado como sendo fora de um gráfico misturado. Em seguida, o pixel em (i, j) pode ser de-alfa-misturado e o resultado comparado com o valor de pixel real em (i', j'), se o valor do pixel de-alfa-misturado em (i, j) está mais próximo para o valor do pixel em (i', j') do que o valor do pixel em (i, j), então o pixel em (i, j) pode ser identificado como um pixel misturado de sobreposição. Em algumas modalidades, a identificação pode adicionalmente ser sujeita a satisfazer uma restrição de tolerância, tais como: o valor do pixel de-alfa-misturado em (i, j) deve ser menor do que o valor de pixel em (i', j') mais um valor de tolerância, e/ou o valor do pixel de-alfa-misturado em (i, j) deve ser maior do que o valor de pixel em (i', j') menos um valor de tolerância.
[0076] Algumas modalidades podem utilizar o modo como o valor de pixel de fundo varia com o valor de alfa- misturado para formar predição de um valor de pixel de- alfa-misturado. A partir da Figura 3, a Eqn. 1, ou a Eqn. 3, pode-se determinar que o valor do pixel de-alfa- misturado aumenta ou torna-se mais brilhante (ao longo do eixo vertical, 315), a diferença entre os valores de pixel misturados ou de fundo diminui de uma forma linear. Além disso, pode ser determinado que o valor de pixel de fundo é inferior a ou igual ao valor de pixel misturado. Estas características podem ser utilizadas para formar um valor de pixel de fundo previsto para um pixel em uma região a partir de um pixel em uma outra região. Observe que a Figura 3 é plotada para um Pl de 255. Para menores valores de Pl, a curva de pixel misturada pode cruzar a curva de eixo vs. eixo 316 e ser abaixo dela para grandes valores de pixel de fundo. Neste caso, o valor de pixel de fundo ainda vai ser menor do que o valor de pixel misturado para valores de pixel misturados inferiores a um certo valor, mas maior do que os valores de pixel misturados para valores de pixel combinados acima do determinado valor. O valor determinado pode ser referido como um valor de cruzamento. Acima do valor de cruzamento, a diferença de valor entre os pixels misturados e de fundo vai aumentar de uma forma linear.
[0077] Em algumas modalidades um estimador de parâmetro de mistura 912 pode estimar valor (es) de parâmetro de mistura α.
[0078] Em algumas modalidades, uma máscara de logotipo 911 é conhecida. Em algumas modalidades uma máscara de logotipo 91 pode ser explicitamente especificada. Em algumas modalidades uma máscara de logotipo pode ser derivada a partir de operações. Em algumas modalidades, uma máscara de logotipo pode compreender uma ou mais de informação de localização, informação de forma, informação de valor de pixel de logotipo Pl, e/ou informação de valor de parâmetro de mistura α.
[0079] Estimador de pixel misturado 930 pode receber valor (es) de pixel de fundo estimado, valor (es) de pixel logotipo Pl, e valor (es) de parâmetro de mistura α. Estimador de pixel misturado 930 pode fornecer valor (es) de pixel misturado estimado responsivo aos p π valores , Pi, e α recebidos. Em algumas modalidades, pode ser estimado de acordo com a Eqn. 3. Em algumas modalidades, pode ser estimado de acordo com a Eqn. 5a ou Eqn. 5b.
[0080] Avaliador de critério 940 pode receber valor (es) de pixel de fundo estimado , valor (es) de pixel de logotipo Pl, e valor (es) de pixel misturado estimado . Avaliador de critério 940 pode avaliar um critério de presença de gráfico misturado de sobreposição para fornecer uma indicação da presença de gráfico misturado de sobreposição, como valor (es) de indicador de presença de gráfico misturado de sobreposição Cp, responsivo para p P valores , Pl, e recebidos. Em algumas modalidades, um critério de presença de gráfico misturado de sobreposição é avaliado de acordo com a Eqn. 4. Para casos em que uma máscara de logotipo predeterminada é usada como parte de determinar Cp, um valor positivo de Cp pode indicar a presença do logotipo especificado pela máscara.
[0081] Processador espacial-temporal 942 pode receber uma indicação de presença de gráfico misturado de sobreposição como indicador de presença de gráfico misturado de sobreposição Cp. Em algumas modalidades, processador espacial-temporal 942 pode receber Cp juntamente com a sua posição (i, j) correspondente para localização na imagem. Em algumas modalidades, o processador espacial-temporal 942 fornece filtragem temporal e/ou operações morfológicas tal como aqui descrito em relação a modalidades particulares. Processador espacial-temporal 942 pode, assim, fornecer uma indicação processada de presença de logotipo 943. Para modalidades utilizando um ou mais BTD (s), valores positivos de Cp irão tipicamente ocorrer ao longo das bordas de um logotipo misturado de sobreposição. Em algumas modalidades, o conjunto de localizações de Cp positivas pode então ser processado para determinar se um logotipo está presente. Como um exemplo e sem limitação, as localizações de Cp positivas podem ser representadas em uma imagem binária tendo as mesmas dimensões que a imagem sendo analisada, em que localizações de Cp não positivas são representadas por um 0 e localizações de Cp positivas são representadas por um 1. Como um exemplo e sem limitação, operações morfológicas, tais como operação de fechamento seguida por uma operação de abertura, podem ser aplicadas à imagem binária para eliminar ruidosas respostas positivas isoladas e encher regiões com várias respostas positivas nas proximidades, e a presença de uma tal região preenchida após processamento morfológico pode indicar a presença de um logotipo ou outros objetos gráficos.
[0082] Um codificador 950 pode receber uma indicação da presença de gráfico misturado de sobreposição, tais como CP, uma indicação processada da presença de logotipo tal como fornecida por um processador espacial- temporal 942, e um ou mais quadros de imagem 910. Um codificador pode fornecer quadros de imagem codificados 945. Um processo de codificação de quadros de imagem recebidos 910 pode ser responsivo a uma indicação de presença de gráfico misturado de sobreposição tal como Cp, uma indicação processada de presença de logotipo 943 como fornecido por um processador espacial-temporal 942, e os quadros de imagem recebidos 910. Como um exemplo e sem limitação, o codificador 950 pode alocar mais bits ou um alvo de qualidade de codificação maior para uma parte da imagem de entrada contendo um grupo de pixels misturados de sobreposição ou uma indicação de presença de logotipo positiva.
[0083] A Figura 10 representa uma modalidade de fluxograma aplicável a sistemas e métodos aqui descritos. Pode notar-se que esta é uma visão agregada de funcionalidade em várias modalidades. Modalidades específicas podem variar da forma específica da Figura 10 sem se afastar do âmbito da descrição.
[0084] No passo 1010, valores de pixel de imagem P podem ser recebidos, tais como aqueles que compreendem um quadro de imagem. No passo 1012, valor (es) de parâmetro de mistura α podem então ser recebidos. No passo 1014, valor (es) de pixel de logotipo Pl pode ainda ser recebido.
[0085] Em seguida estimativas de pixel são feitas. No passo 1016, valor (es) de pixel de fundo Pb é estimado, p como . No passo 1018, valor de pixel misturado (s) P pode ser estimado, como . No passo 1020, um critério de presença de gráfico misturado de sobreposição pode então ser avaliado. Em resposta à avaliação, um indicador de presença de gráfico misturado de sobreposição, tal como Cp, e uma indicação de presença de logotipo pode ser fornecida. Em algumas modalidades, no passo 1022, um indicador de presença de gráfico misturado de sobreposição, tal como Cp, pode ser processado. O processamento pode compreender filtragem temporal e/ou operações morfológicas. Em algumas modalidades, no passo 1024, dados de imagem tais como valores de pixel de imagem recebidos (acima) podem ser codificados, fornecendo assim quadros de imagem codificados. A codificação pode ser responsiva a um indicador de presença de gráfico misturado de sobreposição, tal como Cp e/ou responsiva a um indicador de presença de logotipo processado.
[0086] A Figura 11a mostra um exemplo de imagem combinada e a Figura 11b representa uma versão processada da imagem da Figura 11a. A imagem combinada inclui elementos gráficos misturados de sobreposição como identificado em localizações 1111 e 1112. A imagem processada de Figura 11a mostra os resultados combinados de várias operações de BTD na imagem combinada da Figura 11a. BTDs correspondentes a direções (duas) horizontais e (duas) verticais operaram na imagem combinada 10010. Isto é, as direções de BTD compreenderam: esquerda para direita, direita para esquerda, de cima para baixo, e, de baixo para cima. Os resultados das operações de BTD foram combinados com uma operação de OU lógico tal como aqui descrito. A imagem processada de Figura 11 exibe os resultados combinados por pixel. Notavelmente, contornos de elementos gráficos impostos são visíveis em localizações 1121 e 1122, correspondendo respectivamente aos gráficos misturados em localizações 1111 e 1112 no interior da imagem combinada 1110.
[0087] Em algumas modalidades, os resultados de operações de BTD em uma imagem, como uma imagem combinada, podem indicar transições em algumas localizações de pixel que não correspondem aos gráficos impostos, como logotipos. Os resultados podem ser refinados por meio da aplicação de filtragem temporal e/ou operações morfológicas. Em algumas modalidades, a filtragem temporal e/ou operações morfológicas podem ser vantajosamente aplicadas à imagem, tais como a imagem combinada, e/ou para os resultados das operações de BTD, tais como para o resultado combinado de várias operações de BTD em uma imagem.
[0088] As operações de filtragem temporal podem compreender, a título de exemplo e não de limitação, decimação de tempo dos quadros de um fluxo de imagens de vídeo de fonte, e, um filtro de média aplicado aos pixels decimados no tempo. A título de exemplo e não de limitação, um fluxo de fonte de entrada tendo uma taxa de quadros de 30 quadros por segundo pode ser decimado para 1 quadro por segundo. Os quadros decimados de pixels de imagem podem então ter a média calculada com um filtro unipolar recursivo, em que a contribuição de um valor de pixel de imagem de quadro atual contribui para 10% do valor médio do valor de pixel de imagem.
[0089] Operações morfológicas, como é bem conhecido na arte de processamento de imagem, podem seguir e/ou de outra forma ser combinadas com operações temporais, tais como as operações de filtragem descritas acima. Operações morfológicas podem compreender, a título de exemplo e não de limitação, uma operação de fechamento, e/ou uma operação de abertura.
[0090] Em algumas modalidades, uma operação de fechamento, seguida por uma operação de abertura, pode ser realizada após operações de decimação e filtragem.
[0091] Em algumas modalidades, conforme ilustrado na Figura 9, a unidade de imagem de pixel 920 pode aplicar decimação de tempo e/ou de filtragem para imagens e/ou fluxos de imagem 910. Em algumas modalidades, como representado na Figura 9, o processador espacial-temporal 942 pode fornecer operações morfológicas para os resultados de BTD e/ou outro processamento sobre quadros de imagem. Em algumas modalidades, valores de pixel de imagem, P, 920 podem ter média temporal calculada independentemente de valores de pixel de fundo estimados, , 921, que podem ter a média temporal calculada. No entanto, em modalidades alternativas, valores de pixel de imagem, P, 920 podem ter coletivamente a média temporal calculada com valores de p pixel de fundo estimados, , 921.
[0092] Em algumas modalidades, uma máscara de logotipo/de gráfico derivada pode ser determinada com base na média temporal e/ou limiar de dados de imagem. Quando um gráfico é determinado para ser persistentemente presente ao longo de vários quadros de vídeo, média temporal dos quadros para fornecer uma imagem média pode vantajosamente reduzir a contribuição dos pixels não gráficos para a imagem média. Se os dados de imagem são baseados em valores de luminância, a luminância de pixels de gráfico na imagem média pode ser maior do que a dos pixels não gráficos. Limiarização da imagem média com base em um limiar de luminância pode identificar uma máscara de gráfico derivada. Isto é, em algumas modalidades localizações de pixel tendo um valor de luminância acima de um limiar de fora podem ser determinadas como sendo parte da máscara de gráfico derivada. O valor de limiar pode ser fixo ou pode ser determinado com base nas características dos pixels, como o valor médio espacial de alguns dos pixels, derivando o limiar com base no método de Otsu e/ou com base em qualquer outra característica e/ou características conhecidas, convenientes ou desejadas.
[0093] Em algumas modalidades, uma região de recorte de imagem pode ser predeterminada com base no conhecimento de onde gráficos misturados podem ou ser susceptíveis de estar presentes, ou pode ser determinada através da identificação de uma região que tem resultados de BTD positivos ao longo de vários quadros (embora não necessariamente consecutivos). Média e/ou limiarização temporal pode então, em algumas modalidades, ser limitada para a região de recorte de imagem. Em algumas modalidades, média temporal pode ser controlada pelas características dos pixels tal como a luminância de uma imagem e/ou região de imagem pode ter média espacial calculada e comparada com um limiar de luminância. Em modalidades alternativas qualquer outra característica de pixel conhecida e/ou conveniente e/ou característica de pixel estatística concatenada pode ser comparada. Se o limiar não é excedido, a imagem pode ser excluída do processo de cálculo de média.
[0094] A Figura 12a representa um outro exemplo de imagem combinada, enquanto a Figura 12b mostra uma imagem processada. A imagem combinada da Figura 12a compreende misturar um elemento gráfico como identificado na localização 1211. A imagem processada de Figura 12b mostra os resultados combinados de várias operações de BTD na imagem combinada da Figura 12-A. BTDs correspondentes a direções (duas) horizontais e (duas) verticais operadas na imagem combinada de Figura 12-A. Ou seja, as direções de BTD compreenderam: esquerda para direita, direita para esquerda, de cima para baixo, e, de baixo para cima. Os resultados das operações de BTD foram combinados com uma operação de OU lógico tal como aqui descrito. A imagem processada de Figura 12b apresenta os resultados por pixel combinados. Notavelmente, contornos de um elemento gráfico imposto são visíveis em localizações 1221, correspondendo, respectivamente, para o gráfico misturado em localizações 1211 dentro da imagem combinada de Figura 12a.
[0095] A Figura 13a representa um outro exemplo de imagem combinada 1310, enquanto a Figura 13b mostra uma primeira imagem processada, e a Figura 13c mostra uma segunda imagem processada 1330. A imagem combinada da Figura 13a inclui um elemento gráfico como identificado na localização 1311. A imagem combinada representa um quadro atual dentro de um fluxo de 30 quadros por segundo de quadros de imagem.
[0096] A primeira imagem processada de Figura 13b ilustra os resultados de decimação e filtragem do fluxo de quadros de imagem de fonte, e aplicação de operações de BTD no quadro atual decimado e filtrado. O quadro atual decimado e filtrado não é mostrado. A decimação e filtragem são aplicadas tal como foi acima descrito. Pode ser apreciado que a primeira imagem processada da Figura 13b, assim descreve uma primeira imagem atual processada dentro de um fluxo de primeiras imagens processadas resultante das operações temporais no fluxo de quadros de imagem de fonte. A segunda imagem processada de Figura 13c apresenta um resultado atual das operações morfológicas no fluxo de primeiras imagens processadas. As operações morfológicas são aplicadas como descrito acima.
[0097] Nas Figuras 13a-c, um elemento gráfico imposto pode ser identificado na localização 1321 dentro da primeira imagem processada da Figura 13b, e na posição 1331 no interior da segunda imagem processada da Figura 13c, correspondendo, respectivamente, para o gráfico misturado na localização 1311 no interior da imagem combinada da Figura 13a.
[0098] Notavelmente, primeira imagem processada da Figura 13b indica transições em algumas localizações de pixel 1322 que não correspondem aos gráficos impostos, como logotipos, na localização correspondente 1312 dentro da imagem combinada de fonte de Figura 13a. A segunda imagem processada de Figura 13c não indica gráficos impostos na posição 1332, correspondendo à indicação na posição 1322 dentro de primeira imagem processada da Figura 13b. Assim, a sequência combinada de operações refinou com sucesso os resultados.
Combinação de Caso 1 e Caso 2:
[0099] Em algumas modalidades, operações de Caso 1 e Caso 2 podem ser combinadas. Algumas destas modalidades podem suportar identificação de presença de gráficos, como um logotipo, em uma base quadro a quadro. A localização e contorno de uma máscara de logotipo que não é identificada podem ser obtidos a partir de operações de Caso 2 em um fluxo de imagens, tal como aqui descrito. Uma tal máscara de logotipo pode ser descrita como uma máscara de logotipo derivada.
[00100] Em algumas modalidades, as operações de caso 2 podem ser aplicadas ao longo de um grande número de quadros de imagem a partir de um fluxo de quadros de imagem. A título de exemplo e não de limitação, tais operações podem ser aplicadas aos quadros correspondentes a um tempo de duração de segundos ou minutos, mediante um fluxo de imagens tendo uma taxa de quadros de 30 quadros por segundo.
[00101] Em algumas modalidades, operações de caso 1 podem ser aplicadas em quadros de imagem individuais a partir do fluxo de quadros de imagem, pelo emprego da máscara de logotipo identificada. Tais operações podem fornecer uma indicação da presença de logotipo em uma base quadro a quadro. Notavelmente, as operações de Caso 1 podem ser aplicadas a quadros de imagem individuais que não tiveram a média calculada com outros quadros do fluxo de quadros de imagem.
[00102] Em algumas modalidades, as operações de Caso 2 podem ser aplicadas em quadros de imagem individuais a partir do fluxo de quadros de imagem. Os resultados destas operações de 2 nos quadros individuais podem ser comparados com a máscara de logotipo derivada. A comparação pode compreender uma medida da semelhança. A título de exemplo e não de limitação, uma tal medida pode ser comparada com um valor de limiar especificado e o resultado pode fornecer uma indicação da presença de logotipo em uma base quadro a quadro.
[00103] Em algumas modalidades, se a presença de e/ou o logotipo é desconhecido no início do processamento, os sistemas, métodos e/ou aparelhos aqui descritos podem ser usados para identificar a presença, localização e/ou máscara para um logotipo. Depois da máscara e/ou localização de um logotipo ter sido identificada, o sistema, método e/ou aparelho pode utilizar a máscara para o logotipo identificado para processar utilizando sistemas, métodos, técnicas e/ou aparelhos alternativos que podem ser empregados com máscaras conhecidas e/ou identificadas. Por conseguinte, máscaras de logotipo previamente desconhecidas e/ou previamente conhecidas podem ser definidas e processamento quadro a quadro de imagens pode ser processado com base na máscara definida e a sua presença dentro da imagem prontamente identificada.
[00104] Modalidades de operações de Caso 1 e Caso 2 combinadas podem fornecer algumas características vantajosas nomeadamente que podem compreender, a título de exemplo e não de limitação: (1) fornecer um indicador de presença de logotipo quadro a quadro, adequado para utilização por processos de codificação. (2) Gerar automaticamente uma máscara de logotipo, eliminar assim a necessidade de fornecer a máscara por outros meios, tais como a especificação explícita. (3) Adaptação às mudanças na localização de máscara de logotipo dentro de um quadro de imagem, e adaptação às mudanças no conteúdo correspondente, isto é, o design, de um elemento gráfico, como um logotipo.
Gráficos sólidos:
[00105] Em algumas modalidades, a identificação de um elemento gráfico que compreende uma região preenchida, o que pode ser descrito como um gráfico sólido, pode ser suportada por refinação dos resultados das operações de BTD através da aplicação de filtragem temporal e/ou operações morfológicas. Os resultados podem ser refinados por meio da aplicação de filtragem temporal e/ou operações morfológicas, como descrito acima.
[00106] A Figura 14a ilustra um exemplo de imagem combinada, enquanto a Figura 14b mostra uma primeira imagem processada, e a Figura 14c mostra uma segunda imagem processada. A imagem combinada da Figura 14a inclui um elemento gráfico como identificado em localização 1411. A imagem combinada representa um quadro atual dentro de um fluxo de 30 quadros por segundo de quadros de imagem.
[00107] A primeira imagem processada de Figura 14b ilustra os resultados de decimação e filtragem do fluxo de quadros de imagem de fonte, e aplicação de operações de BTD no quadro atual decimado e filtrado. O quadro atual decimado e filtrado não é mostrado. A decimação e filtragem são aplicadas tal como foi acima descrito. Pode ser apreciado que a primeira imagem processada da Figura 14b assim descreve uma primeira imagem atual processada dentro de um fluxo de primeiras imagens processadas resultante das operações temporais no fluxo de quadros de imagem de fonte.
[00108] A segunda imagem processada de Figura 14c apresenta um resultado atual das operações morfológicas no fluxo de primeiras imagens processadas. As operações morfológicas são aplicadas como descrito acima.
[00109] Um elemento gráfico imposto pode ser identificado na localização 1421 na primeira imagem processada de Figura 14b, e na localização 1431 no interior da segunda imagem processada da Figura 14c, correspondendo, respectivamente, para o gráfico misturado em localizações 1141 dentro da imagem combinada da Figura 14-A.
[00110] Notavelmente, primeira imagem processada da Figura 14b também indica transições em algumas localizações de pixel 1422 que não correspondem aos gráficos impostos, como logotipos, na localização correspondente 1412 dentro da imagem combinada de fonte de Figura 14-A. A segunda imagem processada de Figura 14b não indica gráficos impostos na localização 1432, correspondendo à indicação na localização 1422 dentro da primeira imagem processada da Figura 14b. Assim, a sequência de operações combinadas refinou os resultados com sucesso. Além disso, a combinação de operações identificou o gráfico imposto 1431 compreendendo uma região cheia, isto é, um gráfico sólido.
[00111] A Figura 15 representa uma modalidade de fluxograma de um processo de detector de logotipo. Tais modalidades podem utilizar operações de BTD de Caso 2. As modalidades podem identificar transições espaciais a partir de pixels não misturados para pixels misturados, dentro de quadros de imagem. As modalidades podem ser responsivas aos gráficos impostos tais como logotipos semitransparentes e/ou outras formas de gráficos impostos. As modalidades podem ser responsivas aos gráficos impostos que são um tanto persistentes, e podem ser tão responsivas para fundos que estão um tanto estáticos ou dinâmicos. Ausente uma máscara de logotipo disponível, BTD e outras operações em combinação podem aplicar média temporal para identificar gráficos um tanto persistentes e para gerar uma máscara de região de interesse. As modalidades podem apoiar análise quadro a quadro para identificar a presença de gráficos em um quadro de imagem atual. Essa identificação da presença de gráficos em um quadro atual pode ser filtrada por uma máscara de região de interesse.
[00112] A operação começa no passo 1510, com um arquivo de filme de fonte compreendendo um fluxo de quadros de imagem que pode ser fornecido. A título de exemplo e não de limitação, o arquivo de filme de fonte pode ter características: h.264 mp4/mkv, resolução horizontal ~ 270 ou 360 linhas. No passo 1512, o fluxo de fonte fornecido pode ser decimado a partir de uma representação de taxa de quadros maior para uma representação de taxa de quadros menor. Em algumas modalidades, a representação de taxa de quadros menor compreende um fluxo de quadros de imagem correspondente a uma taxa de quadros de um quadro por segundo.
[00113] No passo 1514, em um trajeto a partir de operação 1512, operações de BTD podem ser aplicadas em um quadro de imagem atual. No passo 1516, o resultado de passos 1514 e 1530 pode ser logicamente combinado com uma operação AND. No passo 1518, a filtragem morfológica pode ser aplicada aos resultados de passo 1516, criando assim gotas. No passo 1520, gotas recebidas a partir do passo 1518 podem ser marcadas, e contornos das bolhas podem ser fornecidos aos processos subsequentes. No passo 1522, os contornos fornecidos de gotas podem ser sobrepostos em um quadro de imagem original, e o resultado combinado pode ser gravado em um arquivo, como um arquivo AVI. Este passo não necessita ser realizado a menos que seja desejado criar um arquivo ou um vídeo de demonstração dos resultados produzidos pelo processo.
[00114] No passo 1524, em um segundo caminho a partir do passo 1512, uma determinação pode ser feita que mais do que X% (X = 50) de pixels de um quadro de imagem de média foram significativamente alterados desde uma atualização anterior. Se essa determinação é logicamente verdadeira, o fluxo de controle pode avançar para o passo 1528, caso contrário o fluxo de controle pode avançar para o passo 1526. No passo 1526 uma determinação pode ser feita que o número de quadros desde a última atualização é maior do que um limiar especificado. Em algumas modalidades, o limiar pode ser especificado como 10. Se a determinação é logicamente verdadeira, o controle de fluxo pode avançar para o passo 1528, caso contrário, o fluxo de controle pode avançar para o passo 1530. No passo 1528 uma imagem de média pode ser atualizada de acordo com as características de média especificadas. Em algumas modalidades as características podem compreender: janela deslizante exponencial, e, a imagem atual contribui 10%. No passo 1530 operações de BTD podem ser aplicadas em um quadro de imagem de média.
[00115] Um processo de média temporal de mudança de porta 1502 compreende operações específicas e controla fluxo dentro do diagrama 1501. As operações específicas podem compreender passos 1524, 1526 e 1528 e o controle de fluxo específico pode compreender o fluxo de controle descrito aqui correspondente a esses passos.
Estimativa de valor de parâmetro de mistura:
[00116] Em algumas modalidades, o valor (es) de parâmetro de mistura α pode ser estimado. Resolvendo Eqn. 1 para α produz:
[00117] Uma estimativa do parâmetro de mistura pode ser desenvolvida, fornecendo valores para P, e Pi para um cálculo da Eqn. 6. Após a identificação de uma máscara de gráfico na tela, tal como uma máscara de logotipo, estes valores podem ser fornecidos como aqui descrito.
[00118] Em algumas modalidades, o valor do parâmetro de alfa-mistura pode ser estimado. A título de exemplo não limitativo, uma imagem pode ser analisada para determinar se um gráfico está presente dentro de uma região especificada por uma máscara (ou predefinida ou calculada). Se assim for, o valor de alfa pode ser estimado com base na Eqn. 6, com P fornecido por um ou mais pixels da região e Pb fornecido por um ou mais pixels fora da região. Em algumas modalidades, a imagem usada para estimar o valor de alfa pode ser uma imagem de média temporal.
[00119] O valor (es) de P pode ser uma função dos valores de alguns pixels de imagem localizados dentro da localização da máscara, dentro de uma imagem. Assim P pode ser avaliado e um valor fornecido, por métodos aqui descritos, tais como por meio de exemplo e não de limitação, média espacial sobre uma região selecionada dentro da localização da máscara, no interior da imagem.
[00120] O valor (es) de Pb pode ser uma função dos valores de alguns pixels de imagem localizados fora da localização da máscara, dentro de uma imagem. Assim Pb pode ser avaliado e um valor fornecido, por métodos aqui descritos, tais como por meio de exemplo e não de limitação, média espacial sobre uma região selecionada fora da localização da máscara, no interior da imagem.
[00121] O valor (es) de Pl pode corresponder aos valores de pixel de uma imagem antes do gráfico ser misturado de sobreposição em uma outra imagem, como um logotipo, pixels. Em algumas modalidades, estes valores podem ser assumidos como sendo em um máximo na gama de funcionamento correspondente.
[00122] Em algumas modalidades, o valor (es) de parâmetro de mistura estimado pode ser fornecido e/ou usado em lugar de um valor (es) de parâmetro de mistura explicitamente e/ou de outra forma fornecido α.
[00123] No diagrama da Figura 9, um estimador de parâmetro de mistura 912 pode fornecer valor (es) de parâmetro de mistura estimado, tal como aqui descrito. Estimador de pixel misturado 930 pode receber e operar em resposta ao valor de , como é/seria para explicitamente e/ou de outro modo forneceu o valor (es) de parâmetro de mistura α.
[00124] Em algumas modalidades, depois de uma máscara de gráfico na tela ter sido estimada/derivada, o sistema pode calcular o valor do alfa de parâmetro de mistura examinando alguns pixels dentro da máscara e fora da máscara e tratando os pixels fora da máscara tal como pixels de fundo e aqueles dentro da máscara como pixels de alfa-misturado, o sistema pode estimar o valor de alfa, reorganizando a equação de alfa-mistura original como segue:
[00125] Onde P é uma função de alguns pixels dentro da máscara, como a intensidade média e/ou qualquer outra característica de pixel conhecida e/ou uma desejada, Pb é uma função de alguns pixels fora da máscara, e Pl é o valor de pixels de logotipo antes do processo de alfa-mistura. Em algumas modalidades Pl pode ser assumido como sendo branco, ou intensidade de 255. No entanto, em modalidades alternativas quaisquer propriedade (s) e/ou característica (s) conveniente e/ou desejada conhecida se uniforme ou não uniforme pode ser utilizada.
[00126] Em algumas modalidades, enquanto logotipos podem aparecer ao olho como sendo estacionários dentro de um quadro, pode haver algumas variações reais, mas imperceptíveis visualmente em posição de logotipo de quadro para quadro. Além disso, posição de logotipo entre programas, enquanto um pouco fixo na localização dentro de um quadro, pode variar de localização. Por conseguinte, em algumas modalidades, uma caixa envolvente e/ou regiões de recorte podem ser empregues na localização em que um logotipo é antecipado de ocorrer e/ou em uma localização onde um logotipo anterior ocorreu e/ou em qualquer localização conhecida, conveniente e/ou desejada dentro de um quadro. Em algumas modalidades a caixa envolvente e/ou região de recorte pode ser maior do que o logotipo antecipado, de tal modo que o logotipo pode variar na localização dentro da caixa envolvente e/ou a região de recorte, mas pode ainda ser total e/ou substancialmente contido dentro da caixa envolvente e/ou região de recorte. Em algumas modalidades, a área inicial onde um logotipo deve ocorrer pode ser com base na saída do detector de transição misturado em um quadro atual, um quadro de média, uma combinação dos dois ou tendências tais como a consistência dos resultados de saída de BTD ao longo do tempo.
[00127] Em algumas modalidades quando o brilho global e/ou variação dos pixels na caixa envolvente e/ou região de recorte é baixo e/ou abaixo de um limiar prescrito, em seguida, os pixels identificados podem ser adicionados a um acumulador temporal e subsequentemente avaliados. Quando um determinado número de quadros tiver sido transferido para o acumulador temporal e/ou quando um limiar prescrito alternativo é atingido, uma máscara de logotipo pode ser gerada a partir dos dados no acumulador temporal por limiarização binária ou qualquer sistema, método e/ou aparelho conhecido e/ou conveniente. Em algumas modalidades, a posição de máscara de logotipo definida pode ser utilizada como uma referência para reposicionar a máscara de logotipo original dentro do quadro e/ou no interior da caixa envolvente e/ou a região de recorte para identificação futura. Isso pode resultar em uma melhor detecção de presença de logotipo e aumento do desempenho em relação às técnicas alternativas como a correlação de vários desvios espaciais com base em avaliações quadro a quadro. Em modalidades alternativas, a máscara e posição de logotipo definidas podem ser utilizadas para determinação subsequente de presença de logotipo, se uma máscara de logotipo anteriormente definida era desconhecida e/ou indisponível.
[00128] Em algumas modalidades, os resultados, saídas, ou determinações dos métodos aqui descritos podem ser usados para influenciar as operações de equipamento de processamento de vídeo que inclui codificadores e/ou transcodificadores de vídeo. A título de exemplo não limitativo, um codificador de vídeo pode determinar ou alterar seus parâmetros operacionais, tais como tamanhos de passo de quantização, tamanho de unidade de codifica, tamanho de unidade de transformação, e modos de macrobloco com base na presença e localização ou região de um gráfico misturado sendo fornecido ou sinalizado para o codificador. Além disso, a título de exemplo não limitativo, o codificador pode determinar seus parâmetros de operação de modo a atingir uma maior qualidade de saída de vídeo codificada para regiões indicadas como contendo gráficos sobrepostos. Algumas modalidades podem fornecer um valor estimado de um parâmetro de alfa-mistura para o equipamento de processamento de vídeo. Algumas modalidades podem fornecer uma máscara de logotipo/gráfico misturado estimada ou derivada para o equipamento de processamento de vídeo.
[00129] A execução das sequências de instruções necessárias para prática de modalidades pode ser realizada por um sistema de computador da Figura 16. O sistema de computador fornece um diagrama de blocos dos componentes funcionais que podem ser usados para habilitar modalidades da presente invenção. Tal como aqui utilizado, o termo sistema de computador é amplamente utilizado para descrever qualquer dispositivo de computação que pode armazenar e executar de forma independente um ou mais programas.
[00130] Cada sistema de computador da Figura 16 pode incluir uma interface de comunicação 1614 acoplada ao barramento 1606. A interface de comunicação 1614 fornece comunicação bidirecional entre sistemas de computador, tal como mostrado na Figura 16. Um enlace de comunicação 1615 liga um sistema de computador com cada outro. Por exemplo, o enlace de comunicação 1615 pode ser uma LAN, um cartão de rede digital de serviços integrados (ISDN) ou um modem, ou o enlace de comunicação 1615 ligado à Internet, caso em que a interface de comunicação 1614 pode ser um modem de discagem, cabo ou sem fio.
[00131] Um sistema de computador da Figura 16 pode transmitir e receber mensagens, dados e instruções, incluindo programa ou código, por meio de seu respectivo enlace de comunicação 1615 e interface de comunicação 1614. Código de programa recebido pode ser executado pelo processador respectivo (s) 1607 em que é recebido, e/ou armazenado na ROM 1609 ou outro dispositivo de armazenamento 1610 para execução posterior.
[00132] Em uma modalidade, o sistema de computador da Figura 16 opera em conjunção com um sistema de armazenamento de dados 1631 que contém um banco de dados 1632. O sistema de computador da Figura 16 comunica com o sistema de armazenamento de dados 1631 através de uma interface de dados 1633. A interface de dados 1633, que é acoplada ao barramento 1606, transmite e recebe sinais elétricos, eletromagnéticos ou óticos.
[00133] O sistema de computador da Figura 16 inclui um barramento 1606 ou outro mecanismo de comunicação para comunicar instruções, mensagens e dados, coletivamente, informação e um ou mais processadores 1607, juntamente com o barramento 1606 para o processamento de informação. O sistema de computador inclui ainda uma memória principal 1608, tal como uma memória de acesso aleatório (RAM) ou outro dispositivo de armazenamento dinâmico, acoplado ao barramento 1606 para armazenamento de dados e instruções dinâmicas para serem executadas pelo processador (s) 1607. A memória principal 1608 também pode ser usada para o armazenamento temporário de dados, isto é, variáveis, ou outras informações intermediárias durante a execução de instruções pelo processador (s) 1607.
[00134] Um sistema de computador da Figura 16 pode ser acoplado através do barramento 1606 para um dispositivo de exibição 1611, tal como, mas não limitado a, um tubo de raios catódicos (CRT), para exibir informação a um usuário. Um dispositivo de entrada 1612, por exemplo, teclas alfanuméricas e outras, é acoplado ao barramento 1606 para comunicar informação e seleções de comando ao processador (s) 1607.
[00135] Embora o presente sistema, método e aparelho tenham sidos descritos anteriormente com particularidade, isto foi apenas para ensinar um perito na especialidade como preparar e utilizar o sistema, método e/ou aparelho. Muitas modificações adicionais irão cair no âmbito do sistema, método e/ou aparelho, como este âmbito é definido pelas reivindicações seguintes.

Claims (5)

1. Método em um dispositivo eletrônico, para o dispositivo eletrônico detectar um logotipo em uma área de sobreposição definida por uma máscara de logotipo (532, 536) dentro de uma imagem, o método caracterizado pelo fato de que compreende: receber uma máscara de logotipo (532, 536) especificando a localização de pixels (i, j) dentro do logotipo; calcular uma média de valores de pixel de imagem correspondentes a todas as localizações dentro da máscara de logotipo (532, 536), a fim de formar um valor de pixel de imagem de área de sobreposição; calcular uma média de valores de pixel de imagem correspondentes a todas as localizações dentro da área de sobreposição, porém fora da máscara de logotipo (532, 536), a fim de formar um valor de pixel de fundo. de área de sobreposição; calcular um valor de alfa-misturado do valor de pixel de fundo de área de sobreposição; avaliar um primeiro critério (940) de presença de gráfico misturado de sobreposição Cp usando o valor de pixel de imagem P de área de sobreposição e o valor de pixel de fundo de área de sobreposição, em que o primeiro critério de presença de gráfico misturado de sobreposição Cp é satisfeito se o valor de pixel de imagem P de área de sobreposição é uma melhor correspondência para o valor de alfa-misturado calculado do valor de pixel de fundo . de área de sobreposição do que é para o valor de pixel de fundo de área de sobreposição; o método compreendendo ainda: definir uma pluralidade de pares de primeira e segunda áreas dentro da imagem, para pelo menos duas diferentes primeiras áreas e duas diferentes segundas áreas dentro da imagem, em que cada primeira área é localizada dentro da máscara de logotipo (532, 536) e cada segunda área é localizada fora da máscara de logotipo (532, 536) e na área de sobreposição; para cada par de primeira e segunda áreas: calcular uma média de valores de pixel de imagem correspondentes à primeira área, a fim de formar um valor de pixel de imagem P de primeira área; calcular uma média de valores de pixel de imagem correspondentes à segunda área, a fim de formar um valor de pixel de fundo de segunda área; calcular um valor de alfa-misturado do valor de pixel de fundo de segunda área; e avaliar um segundo critério (940) de presença de gráfico misturado de sobreposição Cp usando o valor de pixel de imagem de primeira área e o valor de pixel de fundo de segunda área, em que se o valor de pixel de imagem de primeira área é mais próximo ao valor de alfa-misturado do valor de pixel de fundo de segunda área do que é para o valor de pixel de fundo de segunda área, então determinar que o segundo critério de presença de gráfico misturado de sobreposição é satisfeito; em que um critério de presença de logotipo (943) é satisfeito se a operação de ambos o primeiro critério de presença de gráfico misturado de sobreposição e cada segundo critério de presença de gráfico misturado de sobreposição são satisfeitos; em que calcular um valor de alfa-misturado de uma área compreende aplicar um valor de alfa predeterminado e um valor de cor de sobreposição predeterminado, e é realizado de acordo com a fórmula em que representa o valor de alfa-misturado calculado, representa o valor de cor de imagem médio de uma área fora da máscara de logotipo (532, 536), representa o valor de cor de sobreposição predeterminado, e representa o valor de alfa predeterminado, e em que o valor de um pixel de imagem dentro de um gráfico misturado de sobreposição é representado por uma localização (i, j) dentro de um quadro de imagem, e em que a localização (i, j) pode representar a linha i e coluna j de uma matriz bidimensional de localizações de pixel.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato que compreende ainda, se o critério de presença de logotipo (943) é satisfeito, então executar uma ação compreendendo pelo menos um de: exibir uma borda em torno da área de sobreposição, indicar que uma área de sobreposição está presente, influenciar parâmetros a serem usados ao codificar pelo menos a área de sobreposição, e fazer um codificador (950) atingir uma maior qualidade de saída de vídeo codificada para a área de sobreposição.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que mais perto é definido em termos de valores de luminância.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que cada primeira área está localizada em um deslocamento predefinido a partir de uma localização de sua segunda área correspondente.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o deslocamento predefinido é definido em uma direção atravessando a imagem selecionada a partir do grupo que consiste em: horizontalmente, verticalmente e diagonalmente.
BR112015022052-5A 2013-03-15 2014-03-05 Método em um dispositivo eletrônico, para o dispositivo eletrônico detectar um logotipo em uma área de sobreposição definida por uma máscara de logotipo dentro de uma imagem BR112015022052B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361799196P 2013-03-15 2013-03-15
US61/799,196 2013-03-15
US13/862,318 US9058522B2 (en) 2013-03-15 2013-04-12 Logo presence detection based on blending characteristics
US13/862,318 2013-04-12
PCT/US2014/020685 WO2014149748A1 (en) 2013-03-15 2014-03-05 Logo presence detector based on blending characteristics

Publications (2)

Publication Number Publication Date
BR112015022052A2 BR112015022052A2 (pt) 2017-12-19
BR112015022052B1 true BR112015022052B1 (pt) 2023-07-18

Family

ID=

Similar Documents

Publication Publication Date Title
AU2017204855B2 (en) Logo presence detector based on blending characteristics
US9672437B2 (en) Legibility enhancement for a logo, text or other region of interest in video
Wang et al. Single image defogging by multiscale depth fusion
US9495739B2 (en) Method and system for validating image data
Pece et al. Bitmap movement detection: HDR for dynamic scenes
US20020172420A1 (en) Image processing apparatus for and method of improving an image and an image display apparatus comprising the image processing apparatus
US20160342843A1 (en) Anomalous pixel detection
CN110268712A (zh) 用于处理图像属性图的方法和装置
CN104486618A (zh) 视频图像的噪声检测方法及装置
MX2013013874A (es) Sistema y metodos para probar hardware de video al evaluar tramas de video de salida que contienen caracteristicas de referencia integradas.
US11113537B2 (en) Image detection using multiple detection processes
BR112015022052B1 (pt) Método em um dispositivo eletrônico, para o dispositivo eletrônico detectar um logotipo em uma área de sobreposição definida por uma máscara de logotipo dentro de uma imagem
US9171370B2 (en) Method, an apparatus and a computer program product for deinterlacing an image having a plurality of pixels
Schwarz et al. On predicting visual popping in dynamic scenes
US20160163060A1 (en) Method and apparatus for color correction
US20110122133A1 (en) Method and program for constructing three dimensional object model
Usui et al. 58.1: A Study of Adaptive Temporal Aperture Control for OLED Displays with Motion Vector
CN117994165B (zh) 一种基于大数据的智慧校园管理方法及系统
CN110533628B (zh) 一种确定屏幕方向的方法、装置及可读存储介质
Spencer et al. P. 134L: late news poster: resolution limits for smartphones—video playback
CN111325804B (zh) 一种确定yuv图像显示参数的方法及装置
CN115272186A (zh) 一种图像的坏线检测方法、设备和计算机可读存储介质
Chaabane et al. Edge detection via statistical features and automatic thresholding technique
VI Daytime fog detection and density estimation with entropy minimization