BRPI0212828B1 - detecção de corte de cena em um fluxo de bits de vídeo - Google Patents

detecção de corte de cena em um fluxo de bits de vídeo Download PDF

Info

Publication number
BRPI0212828B1
BRPI0212828B1 BRPI0212828A BR0212828A BRPI0212828B1 BR PI0212828 B1 BRPI0212828 B1 BR PI0212828B1 BR PI0212828 A BRPI0212828 A BR PI0212828A BR 0212828 A BR0212828 A BR 0212828A BR PI0212828 B1 BRPI0212828 B1 BR PI0212828B1
Authority
BR
Brazil
Prior art keywords
frame
image
field
determining
ratio
Prior art date
Application number
BRPI0212828A
Other languages
English (en)
Other versions
BR0212828A (pt
Inventor
Edmond Chalom
Richard Mateer Peterson
Original Assignee
Thomson Licensing Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing Sa filed Critical Thomson Licensing Sa
Publication of BR0212828A publication Critical patent/BR0212828A/pt
Publication of BRPI0212828B1 publication Critical patent/BRPI0212828B1/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

"detecção de corte de cena em um fluxo de bits de vídeo". um método e aparelho são descritos para detecção de cortes de cena em um fluxo de bits de vídeo. o número de macroblocos codificados para cada uma de uma pluralidade de cortes de cena potenciais é determinado (309). o número de macroblocos preditos (310) para cada uma da pluralidade de cortes de cena potenciais é determinado. uma razão do número dos macroblocos codificados com relação ao número dos macroblocos preditos para cada uma de uma pluralidade de quadros correspondendo com os cortes de cena potenciais é então calculada. um quadro tendo a razão desejada é selecionado (312). a razão do quadro selecionado é comparada com um valor limiar (313). um corte de cena é relatado quando detectado em resposta a uma determinação que a razão do quadro selecionado satisfaz o valor limiar (314).

Description

"DETECÇÃO DE CORTE DE CENA EM UM FLUXO DE BITS DE VÍDEO" REFERÊNCIAS COM PEDIDOS RELACIONADOS O presente pedido reivindica o benefício do Pedido de Patente Provisório U.S. No. Serial 60/324.890, depositado em 26 de setembro de 2001.
CAMPO DA INVENÇÃO A presente invenção refere-se a vídeo do tipo MPEG e, mais particularmente, à detecção de corte de cena dentro do fluxo de bits de vídeo.
ANTECEDENTES DA INVENÇÃO
Seqüências de vídeo baseadas em MPEG podem ser divididas em cenas que podem variar de menos do que um segundo a minutos ou mais de duração. A detecção dessas divisões ou cortes de cena torna possível uma ampla variedade de aspectos adicionados de valor. Por exemplo, um quadro pode ser selecionado de cada cena para criar um esboço seqüencial resumindo os conteúdos de uma gravação de vídeo. Ademais, um editor de vídeo pode ser usado para manipular a gravação de vídeo em uma base de cena por cena, por exemplo, reordenando cenas ou aplicando técnicas de processamento de imagem em cada quadro em uma cena.
As seqüências de vídeo em MPEG incluem três tipos de quadros, Intra-Quadros (I), Inter-Quadros (P) e Quadros Bidirecionais (B). Quadros I codificam uma imagem parada u-sando um método similar à codificação JPEG. Quadros P são preditos de um quadro I ou P prévio. Quadros B são preditos tanto de um quadro prévio I ou P quanto de um próximo quadro I ou P. Esses três tipos de quadros são codificados usando uma transformada discreta de cosseno (DCT), que organiza a redundância nas direções espaciais entre os quadros. Entretanto, para quadros I, a informação da DCT é derivada diretamente de uma amostra de imagem, enquanto que para os quadros P e B, a informação da DCT é derivada de um erro residual depois de uma previsão.
Cada quadro é dividido em uma pluralidade de ma-croblocos. Cada macrobloco inclui informação relacionada a uma pluralidade de blocos de luminância, por exemplo, Y1, Y2, Y3 e Y4, e uma pluralidade de blocos de crominância, por exemplo, um U e um V em um sistema YUV. Cada um desses blocos inclui uma pluralidade de pels, ou elementos de imagem, por exemplo, um bloco 8x8.
Quando o video tiver sido codificado em um fluxo de bits semelhante a MPEG, a detecção do corte da cena pode ser feita sem decodificar totalmente o fluxo de bits, o que aumenta a velocidade do processamento do video. Informação adicional, tal como, tipos de codificação de macrobloco, vetores de movimento e coeficientes da DCT, pode também ser extraída do fluxo de bits sem decodificar totalmente o fluxo de bits.
Um método para detecção de corte da cena é executado como segue: 1. Para quadros I, as diferenças de quadrado médio entre coeficientes da DCT são determinadas, 2. Para quadros P, o método proposto determina o número dos macroblocos preditos para frente, 3. Para quadros B, o menor entre o número dos ma-croblocos codificados para frente e o número dos macroblocos codificados para trás é contado, e 4. Um mínimo é então determinado em um gráfico desses números versus o número do quadro.
Em um outro método proposto para detecção de corte de cena: para quadros I, a diferença entre os histogramas de cor construídos a partir dos coeficientes DC é usada, e combinada com a informação sobre a razão do número dos macroblocos sem compensação de movimento em relação ao número com compensação de movimento. O método proposto busca um pico em um gráfico versus o número do quadro. Para quadros B, a razão das previsões para frente em relação às para trás é determinada. Em todos os casos, uma técnica de limiar adapta-tivo local é implementada para identificar os picos.
Ainda um outro método faz uso de histogramas para todos os quadros (I, P e B) construídos a partir dos coeficientes do cosseno discreto (DC) com compensação de movimento .
Entretanto, nenhum sistema ou método conhecido a-tualmente existe para detecção de corte de cena com base no exame global de todas as previsões dentro de um subgrupo de imagens (GOP).
SUMÁRIO DA INVENÇÃO
Cortes de cena são detectados com base no exame global de todas as previsões dentro de um sub-GOP de acordo com os princípios da presente invenção. O número dos macroblocos codificados para cada uma de uma pluralidade de cor- tes de cena potenciais é detectado primeiro. O número dos macroblocos preditos para cada uma da pluralidade de cortes de cena potenciais é então determinado. A razão do número dos macroblocos codificados em relação ao número dos macroblocos preditos para cada uma de uma pluralidade de quadros correspondendo aos cortes de cena potencial é determinada a seguir. Um quadro tendo a razão desejada é selecionado. A razão é comparada com um valor limiar. Um corte de cena é detectado se é determinado que a razão satisfaz o valor limiar .
BREVE DESCRIÇÃO DOS DESENHOS
Modalidades preferidas da presente invenção serão descritas abaixo em mais detalhes, com referência aos desenhos acompanhantes, nos quais: A Fig. 1 ilustra cortes de cena exemplares dentro de um sub-GOP, de acordo com os princípios da presente invenção, A Fig. 2 é um fluxograma ilustrando um primeiro método para detecção de corte de cena, de acordo com os princípios da presente invenção, e A Fig. 3 é um fluxograma ilustrando um segundo método para detecção de corte de cena, de acordo com os princípios da presente invenção.
DESCRIÇÃO DETALHADA
De acordo com os princípios da presente invenção, a detecção de corte de cena é executada coletando dados sobre o número de macroblocos preditos para frente e para trás em cada Inter-Quadro (P) ou quadro Bidirecional (B), anali- sando-os em um nível de sub-GOP (cada quadro âncora junto com quadros B precedentes) sem considerar cada quadro inde-pendentemente. Deve ser entendido que a presente invenção pode ser implementada em várias formas de hardware, software, firmware, processadores de uso especial ou uma combinação desses. Em uma modalidade exemplar, a presente invenção é implementada em software como um programa de aplicação personificado de forma tangível em um dispositivo de armazenamento de programa. O programa de aplicação pode ser transferido para, e executado por, uma máquina compreendendo qualquer arquitetura adequada. De preferência, a máquina é implementada em uma plataforma de computador tendo um hardware tal como uma ou mais unidades de processamento central (CPU), uma memória de acesso aleatório (RAM) e interface(s) de entrada/saida (1/0). A plataforma de computador também inclui um sistema operacional e código de microinstrução. Os vários processos e funções descritos aqui podem ser parte do código de microinstrução ou parte do programa de aplicação (ou uma combinação desses) que é executado via o sistema o-peracional. Além do que, vários outros dispositivos periféricos podem ser conectados à plataforma do computador tal como um dispositivo(s) de armazenamento de dados adicional e um dispositivo(s) de impressão.
Deve ser também entendido que, pelo fato de que alguns dos componentes do sistema constituinte e etapas do método representados nas figuras acompanhantes podem ser implementados em software, as ligações atuais, interligações ou relações funcionais entre os componentes do sistema (ou as etapas do processo) podem diferir dependendo da maneira na qual a presente invenção é programada. Dado os ensinamentos da presente invenção proporcionados na mesma, alguém de conhecimento comum na técnica relacionada será capaz de considerar essas e implementações ou configurações similares da presente invenção.
Para cada quadro P ou B, o número de macroblocos utilizando previsão para frente e o número de macroblocos utilizando previsão para trás (encontrada somente nos quadros B) são gravados. Os dados para cada quadro âncora, In-tra-quadro (I) ou P, e todos os quadros B imediatamente precedentes são examinados.
Se um macrobloco é predito de maneira imprópria, o residual depois da compensação de movimento pode ser grande, e grandes coeficientes de DCT são necessários de modo a compensar a previsão. Para essas previsões, existe uma alta probabilidade (cerca de mais do que 50%) que a previsão seja falsa. Isto é, um macrobloco de quadro âncora no qual a previsão é baseada pode não ter associação real com o macrobloco no quadro predito, porém o quadro âncora pode ser similar o suficiente que uma previsão poderia ser feita a partir dele. Por essa razão, um tal macrobloco é ignorado na reunião da estatística. Mais particularmente, quando contando macroblocos com previsão para frente ou para trás, a energia total (entropia) dos coeficientes da DCT é examinada. A e-nergia total dos coeficientes da DCT é a soma dos quadrados dos coeficientes não-DC. Se essa energia fica acima de um valor limiar, o macrobloco não é contado, tanto para o núme- ro de previsões para frente ou para trás (nFwd e nBwd, respectivamente) , quanto para o número de macroblocos codificados (nCode). Para MPEG-2, foi verificado que um valor limiar exemplar é de cerca de 500.
Para um quadro âncora, o padrão de previsões para cada quadro no sub-GOP é analisado. Considere a Fig. 1, que representa um sub-GOP incluindo dois quadros B e um quadro P. Locais potenciais para um corte de cena incluem, antes do quadro Bx 102, entre os quadros Bx 102 e B2 103, e entre o quadro B2 103 e o quadro P3 104. Além do que, se os quadros são entrelaçados, um corte de cena pode ocorrer entre os campos de qualquer um dos três quadros, 105 a 107 respectivamente .
De acordo com uma modalidade da presente invenção, se um corte de cena ocorre em 108, poucos macroblocos preditos para frente estariam presentes nos quadros Bi 102, B2 103 ou P3 104, porque o quadro I/P0 101 não está relacionado com qualquer um desses quadros. Da mesma forma, se um corte de cena ocorre em 109, poucos macroblocos preditos para trás estariam presentes no quadro Bi 102 porque o quadro Bi 102 não está relacionado com o quadro P3 104 a partir do qual essas previsões são feitas; e nós esperamos poucos macroblocos preditos para frente no quadro B2 103 ou P3 104 porque o quadro I/Po 101 não está relacionado como esses quadros.
Assim, uma medida da probabilidade de um corte de cena em 108 é o total do número dos macroblocos preditos para frente nos quadros Bi 102, B2 103 ou P3 104. Uma medida da probabilidade de um corte de cena em 109 é o total do número dos macroblocos preditos para trás no quadro Βχ 102 mais o número dos macroblocos preditos para frente no quadro B2 103 e P3 104; e similarmente para a probabilidade de um corte de cena em 110. A probabilidade de que exista um corte de cena no ponto correspondente aumenta à medida que o número total de macroblocos preditos para frente e para trás diminui.
Com referência à Fig. 2, com a determinação que a imagem atual (p) é um quadro P ou B 2 01, o número total de macroblocos codificados no quadro (nCode[p]) é fixado para o número de macroblocos tendo uma AcEnergy menor do que e-nergyThresh 202. O número total de macroblocos preditos para frente para o quadro (nFwd. [p]) é fixado como o número de macroblocos tendo uma AcEnergy menor do que energyThresh E previsão para frente 203. O número total de macroblocos preditos para trás para o quadro (nBwd[p]) é fixado como o número de macroblocos tendo uma AcEnergy menor do que uma e-nergyThresh E previsão para trás 204.
Com referência agora à Fig. 3, de acordo com a e-tapa 301, é determinado se p é um quadro I ou P. Se p é um quadro I ou P, não existe detecção de corte de cena até o fim do sub-GOP, de acordo com a etapa 302. De acordo com a etapa 3 03, é determinado se p é um quadro I e se o quadro prévio era um quadro I ou P. Se é determinado que o p é um quadro I e a imagem prévia era um quadro I ou P, então um corte de cena não é detectado nesse sub-GOP, de acordo com a etapa 304. Com a determinação que p é tipo P ou que a imagem prévia é tipo B, então os dados são reunidos quanto ao sub-GOP corrente nas etapas 305 a 311. A contagem das previsões que cruzam o corte de cena potencial entre o campo f e o campo precedente {predMBs[f]) e a contagem dos macroblocos cujas previsões poderíam cruzar esse limite (MBs[f] codificado) são inicializadas para 0 para cada campo f no sub-GOP, de acordo com a etapa 305.
Para cada campo f no sub-GOP, é determinado se o campo f está em uma imagem I, de acordo com a etapa 307. Se o campo f está em uma imagem I, então o processo continua para o próximo campo de acordo com a etapa 308. Com a determinação que o campo f não está em uma imagem I, então o processo retorna para os locais potenciais para um corte de cena no sub-GOP, isto é, cada local f' entre dois campos. O valor de codedMBs[f'J é incrementado por nCode [f] para cada corte de cena potencial f' no sub-GOP, de acordo com a etapa 309. Ademais, o valor de predMBs[f'] é incrementado por nFwd[f] para cada corte de cena potencial f' antes ou igual a f, de acordo com a etapa 310.
De acordo com a etapa 311, é determinado se o último campo foi alcançado, e se não o processo prossegue com o próximo campo, de acordo com a etapa 308. Com a determinação de que o último campo foi alcançado, um campo f para o qual a razão de predMBs [f] em relação a coded MBs [f] (por exemplo, predMBs[f] para MBs[f] codificado) está em um mínimo é determinada, de acordo com a etapa 312. Para o campo f determinado como tendo a razão mínima, se predMBs[f] dividido por MBs [f] codificado é menor do que predRatioThresh de acordo com a etapa 313, o processo detecta e relata um corte de cena entre esse campo e o campo precedente, de acordo com a etapa 314, senão nenhum corte de cena é detectado no sub-GOP, de acordo com a etapa 315.
Observe que o número de macroblocos preditos (PredMBs) e macroblocos com campo codificado (codedMBs) são determinados para cada campo, mesmo se as imagens são imagens de quadro, desde que um corte de cena pode ocorrer entre campos de uma imagem de quadro (se a imagem de quadro é entrelaçada) . Os macroblocos de uma imagem de quadro são a-pliçados em cada campo do quadro no cálculo de predMBs e codedMBs. Isto é, nCode[f'] é o número total de macroblocos codificados no quadro quando f' se refere a qualquer campo do quadro. Similarmente, nFwd[f'] e nBwd[f'] representam o número de macroblocos de previsão para frente e macroblocos de previsão para trás no campo f', respectivamente. Quando f' está na mesma imagem do quadro que f, predMBs[f] é incrementado por nBwd[f] e codedMBs[f] é incrementado por nCo-de[f'], somente quando f ê o primeiro campo do quadro. As matrizes para o segundo campo não são incrementadas porque assume-se que as previsões para frente aplicam-se ao primeiro campo somente, e as previsões para trás ao segundo campo somente. Se isso não fosse feito, um corte de cena entre campos de uma imagem de quadro seria mascarado por previsões através do limite da cena.
Um bom valor para o limiar da razão de previsão, preRatioThresh, foi encontrado, através de experimentação, como sendo 0,05. Entretanto, experimentação adicional e/ou aplicações podem determinar que algum valor diferente desse valor, ou que um valor de limiar variável pode ser mais a- propriado em uma aplicação específica. Além disso, o valor específico escolhido para o limiar da energia AC, AcThresh, pode similarmente ser diferente do valor exemplar descrito aqui. Seria evidente para esses peritos na técnica avaliar e modificar esses e outros valores para maximizar a eficiência e precisão da invenção, tal modificação ainda incluindo os princípios da presente invenção como descrito aqui. O método específico descrito acima é o que foi implementado e testado. Ele não é planejado para limitar o escopo dessa descrição ou as reivindicações contidas na mesma. Um princípio básico da presente invenção é a detecção precisa de um corte de cena nítido pelo exame global de todas as previsões dentro de um sub-GOP. Buscando a consistência de toda informação disponível sobre as previsões, falsos positivos (relatórios falsos de cortes de cena) podem ser reduzidos .
Os princípios da presente invenção podem ser integrados com, por exemplo, métodos com base em histograma, para lidar com os casos de quadro I somente, e de uma imagem P seguida por uma imagem I, em cujos casos esse método não pode detectar um corte de cena. Extensões envolvendo histogra-mas podem também ser implementadas para detectar as transições de cena graduais tais como desaparecimentos graduais, dissoluções e apagamentos.
Tendo descrito modalidades para a detecção precisa de um corte de cena pelo exame global de todas as previsões dentro de um sub-GOP, é observado que modificações e variações podem ser feitas por pessoas peritas na técnica em vis- ta dos ensinamentos acima. Deve ser entendido, portanto, que várias mudanças e modificações podem ser feitas nas modalidades particulares da invenção descrita que estão dentro do escopo e espirito da invenção como definido pelas reivindicações anexas. Tendo assim descrito a invenção com os detalhes e particularidade exigidos pelas leis de patentes, o que é reivindicado e pretende-se proteger pela Carta Patente é apresentado nas reivindicações anexas.

Claims (21)

1. Método para detecção de cortes de cena em um fluxo de bits de video em MPEG, CARACTERIZADO pelo fato de que compreende as etapas de: determinar um número de macroblocos codificados para cada um de uma pluralidade de cortes de cena potenciais, onde a pluralidade de cortes de cena potenciais existe entre uma pluralidade de quadros e entre uma pluralidade de campos em cada quadro (309), configurar um número de macroblocos preditos igual a um número de macroblocos preditos para frente para cada um da pluralidade de cortes de cena potenciais, com a determinação de que um campo correspondente é um primeiro campo em um quadro, e configurar o número de macroblocos preditos igual a um número de macroblocos preditos para trás para cada um da pluralidade de cortes de cena potenciais, com a determinação de que o campo correspondente é um segundo campo no quadro, onde o quadro inclui o primeiro e o segundo campos (310), determinar uma razão do número de macroblocos codificados com relação ao número de macroblocos preditos para cada um de uma pluralidade de campos correspondendo à pluralidade de cortes de cena potenciais, selecionar um campo tendo a menor razão entre a pluralidade de campos (312), comparar a menor razão com um valor limiar (313), e detectar um corte de cena com a determinação de que a menor razão satisfaz o valor limiar, onde o corte de cena corresponde ao campo selecionado (314).
2. Método, de acordo com a reivindicação 1, CARACTERIZADO adicionalmente pelo fato de que compreende a etapa de processar um grupo de quadros, cada quadro incluindo dois campos, onde o grupo de quadros compreende um subgrupo de imagens e o fluxo de bits de video inclui uma pluralidade de subgrupos de imagens.
3. Método, de acordo com a reivindicação 1, CARACTERIZADO adicionalmente pelo fato de que compreende as etapas de: determinar se um primeiro quadro é uma imagem I ou P, e avançar o processamento para um próximo subgrupo de imagens, responsivo a uma determinação de que o primeiro quadro não é uma imagem I ou P.
4. Método, de acordo com a reivindicação 1, CARACTERIZADO adicionalmente pelo fato de que compreende as etapas de: determinar se a primeira imagem é uma imagem I, determinar se uma imagem prévia era uma imagem I ou P, e avançar o processamento para um próximo subgrupo de imagens, responsivo à determinação de que a primeira imagem é uma imagem P ou a imagem prévia é uma imagem B.
5. Método, de acordo com a reivindicação 1, CARACTERIZADO adicionalmente pelo fato de que compreende as etapas de: inicializar o número de macroblocos preditos para zero para cada campo, e inicializar o número de macroblocos codificados para zero para cada campo.
6. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que pelo menos um da pluralidade de cortes de cena potenciais existe entre campos entrelaçados de um quadro.
7. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que adicionalmente compreende a etapa de: determinar um número de macroblocos preditos para cada uma da pluralidade de cortes de cena potenciais (310); e selecionar um campo tendo a menor razão entre a pluralidade de campos (312) compreende selecionar um quadro tendo uma razão desejada (312) .
8. Método, de acordo com a reivindicação 7, CARACTERIZADO adicionalmente pelo fato de que compreende a etapa de processar um grupo de quadros, onde cada quadro inclui dois campos, e onde o grupo de quadros compreende um subgrupo de imagens e o fluxo de bits de video inclui uma pluralidade de subgrupos de imagens.
9. Método, de acordo com a reivindicação 7, CARACTERIZADO adicionalmente pelo fato de que compreende a etapa de determinar se um primeiro quadro é uma imagem I ou P, com a determinação de que o primeiro quadro não é uma imagem I ou P, e avançar para um próximo subgrupo de imagens .
10. Método, de acordo com a reivindicação 7, CARACTERIZADO adicionalmente pelo fato de que compreende a etapa de determinar se a primeira imagem é uma imagem I e se uma imagem prévia era uma imagem I ou P, com a determinação de que a primeira imagem é uma imagem P ou a imagem prévia é uma imagem B, e avançar para o próximo subgrupo de imagens.
11. Método, de acordo com a reivindicação 7, CARACTERIZADO adicionalmente pelo fato de que compreende as etapas de: inicializar o número de macroblocos preditos para zero para cada quadro, e inicializar o número de macroblocos codificados para zero para cada quadro.
12. Método, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de que pelo menos um dos cortes de cena potenciais existe entre campos entrelaçados de um quadro .
13. Método, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que a etapa de determinar o número de macroblocos preditos adicionalmente compreende as etapas de: configurar o número de macroblocos preditos igual a um número de macroblocos preditos para frente para cada corte de cena potencial, com a determinação de que um campo correspondente é um primeiro campo em um quadro, e configurar o número de macroblocos preditos igual a um número de macroblocos preditos para trás para cada corte de cena potencial, com a determinação de que o campo correspondente é um segundo campo no quadro, onde o quadro inclui o primeiro e o segundo campos.
14. Método, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que o corte de cena corresponde ao campo selecionado.
15. Método, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de que cortes de cena potenciais existem entre os quadros de um subgrupo de imagens.
16. Dispositivo de armazenamento de programa legível por máquina, personificando de modo tangível um programa de instruções executáveis pela máquina para executar etapas do método para detecção de cortes de cena em um fluxo de bits de vídeo, as etapas do método sendo CARACTERIZADAS pelo fato de que compreendem as etapas de: determinar um número de macroblocos codificados para cada um de uma pluralidade de cortes de cena potenciais (309), determinar um número de macroblocos preditos para cada um da pluralidade de cortes de cena potenciais (310), determinar a razão do número dos macroblocos codificados com relação ao número de macroblocos preditos para cada um de uma pluralidade de quadros correspondendo à pluralidade de cortes de cena potenciais, selecionar um quadro tendo uma razão desejada (312), comparar a razão com um valor limiar (313), e detectar um corte de cena com a determinação de que a razão satisfaz o valor limiar (314).
17. Método, de acordo com a reivindicação 16, CARACTERIZADO pelo fato de que a pluralidade de cortes de cena potenciais existe entre campos entrelaçados de um quadro .
18. Método, de acordo com a reivindicação 17, CARACTERIZADO pelo fato de que a etapa de determinar o número de macroblocos preditos adicionalmente compreende as etapas de: configurar o número de macroblocos preditos igual ao número de macroblocos preditos para frente para cada corte de cena potencial, com a determinação de que um campo correspondente é um primeiro campo em um quadro, e configurar o número de macroblocos preditos igual a um número de macroblocos preditos para trás para cada corte de cena potencial, com a determinação de que o campo correspondente é um segundo campo no quadro, onde o quadro inclui o primeiro e o segundo campos.
19. Método, de acordo com a reivindicação 17, CARACTERIZADO pelo fato de que o corte de cena corresponde ao campo selecionado.
20. Método, de acordo com a reivindicação 16, CARACTERIZADO pelo fato de que a razão desejada é uma razão minima entre todas as razões determinadas.
21. Aparelho para detectar cortes de cena em um fluxo de bits de video, CARACTERIZADO pelo fato de que compreende : um dispositivo para determinar um número de macro-blocos codificados para cada um de uma pluralidade de cortes de cena potenciais, um dispositivo para determinar um número de macro-blocos preditos para cada um da pluralidade de cortes de cena potenciais, um dispositivo para determinar a razão do número de macroblocos codificados com relação ao número de macro-blocos preditos para cada um de uma pluralidade de quadros correspondendo à pluralidade de cortes de cena potenciais, um dispositivo para selecionar um quadro tendo uma razão desejada, um dispositivo para comparar a razão com um valor limiar, e um dispositivo para detectar um corte de cena com a determinação de que a razão satisfaz o valor limiar.
BRPI0212828A 2001-09-26 2002-09-20 detecção de corte de cena em um fluxo de bits de vídeo BRPI0212828B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US32489001P 2001-09-26 2001-09-26
US10/014,963 US6996183B2 (en) 2001-09-26 2001-12-11 Scene cut detection in a video bitstream
PCT/US2002/029883 WO2003028236A1 (en) 2001-09-26 2002-09-20 Scene cut detection in a video bitstream

Publications (2)

Publication Number Publication Date
BR0212828A BR0212828A (pt) 2004-10-13
BRPI0212828B1 true BRPI0212828B1 (pt) 2016-05-10

Family

ID=26686770

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0212828A BRPI0212828B1 (pt) 2001-09-26 2002-09-20 detecção de corte de cena em um fluxo de bits de vídeo

Country Status (10)

Country Link
US (1) US6996183B2 (pt)
EP (1) EP1430613B1 (pt)
JP (1) JP4173099B2 (pt)
KR (1) KR100920096B1 (pt)
CN (1) CN100525129C (pt)
BR (1) BRPI0212828B1 (pt)
ES (1) ES2385324T3 (pt)
MX (1) MXPA04002923A (pt)
MY (1) MY127481A (pt)
WO (1) WO2003028236A1 (pt)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100428801C (zh) * 2005-11-18 2008-10-22 清华大学 一种视频场景切换检测方法
JP4719889B2 (ja) * 2006-08-03 2011-07-06 国立大学法人電気通信大学 カット点検出システムおよび該カット点検出システムを用いたショット識別システム、カット点検出方法、並びにカット点検出プログラム
US20090313546A1 (en) * 2008-06-16 2009-12-17 Porto Technology, Llc Auto-editing process for media content shared via a media sharing service
KR101149522B1 (ko) 2008-12-15 2012-05-25 한국전자통신연구원 장면 전환 검출 시스템 및 방법
CN101534442B (zh) * 2009-04-13 2011-01-12 腾讯科技(深圳)有限公司 视频编码系统及方法
KR101043768B1 (ko) * 2009-10-13 2011-06-22 중앙대학교 산학협력단 회화적 렌더링 장치 및 방법
CN109510919B (zh) 2011-10-11 2021-12-24 瑞典爱立信有限公司 用于感知质量评估的场景变换检测的方法、设备和介质
WO2013075335A1 (en) * 2011-11-25 2013-05-30 Thomson Licensing Video quality assessment considering scene cut artifacts
AU2012388049A1 (en) 2012-08-23 2015-02-26 Thomson Licensing Method and apparatus for detecting gradual transition picture in video bitstream
CN105075273B (zh) * 2013-02-27 2019-03-26 苹果公司 自适应流式传输技术
US9979970B2 (en) * 2014-08-08 2018-05-22 Qualcomm Incorporated System and method for determining buffer fullness for display stream compression
CN109194955B (zh) * 2018-11-16 2021-04-30 深圳市梦网视讯有限公司 一种场景切换检测方法及系统
CN114071143B (zh) * 2020-07-31 2024-09-06 中移(苏州)软件技术有限公司 视频处理方法、装置、设备和存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2294173B (en) * 1994-10-11 1998-12-09 Mitsubishi Electric Corp Disk media, and method of and device for recording and playing back information on or from a disk media
US5835149A (en) * 1995-06-06 1998-11-10 Intel Corporation Bit allocation in a coded video sequence
US5774593A (en) * 1995-07-24 1998-06-30 University Of Washington Automatic scene decomposition and optimization of MPEG compressed video
US5872598A (en) * 1995-12-26 1999-02-16 C-Cube Microsystems Scene change detection using quantization scale factor rate control
US5768537A (en) * 1996-02-22 1998-06-16 International Business Machines Corporation Scalable MPEG2 compliant video encoder
US5724100A (en) * 1996-02-26 1998-03-03 David Sarnoff Research Center, Inc. Method and apparatus for detecting scene-cuts in a block-based video coding system
US5731835A (en) * 1996-02-26 1998-03-24 David Sarnoff Research Center, Inc. Dynamic coding rate control in a block-based video coding system
JPH09261648A (ja) * 1996-03-21 1997-10-03 Fujitsu Ltd シーンチェンジ検出装置
JP3244629B2 (ja) * 1996-08-20 2002-01-07 株式会社日立製作所 シーン変化点検出方法
US5751378A (en) * 1996-09-27 1998-05-12 General Instrument Corporation Scene change detector for digital video
US6735253B1 (en) * 1997-05-16 2004-05-11 The Trustees Of Columbia University In The City Of New York Methods and architecture for indexing and editing compressed video over the world wide web
FR2764156B1 (fr) * 1997-05-27 1999-11-05 Thomson Broadcast Systems Dispositif de pretraitement pour codage mpeg ii
DE69826823T2 (de) * 1997-07-29 2005-10-20 Koninklijke Philips Electronics N.V. Verfahren zur videocodierung mit variabler bitrate und entsprechender videocodierer
US6100940A (en) * 1998-01-21 2000-08-08 Sarnoff Corporation Apparatus and method for using side information to improve a coding system
JP3905969B2 (ja) * 1998-01-30 2007-04-18 株式会社東芝 動画像符号化装置および動画像符号化方法
US6252905B1 (en) * 1998-02-05 2001-06-26 International Business Machines Corporation Real-time evaluation of compressed picture quality within a digital video encoder
US6125147A (en) * 1998-05-07 2000-09-26 Motorola, Inc. Method and apparatus for reducing breathing artifacts in compressed video
JP2001266158A (ja) 2000-01-11 2001-09-28 Canon Inc 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体

Also Published As

Publication number Publication date
JP2005505165A (ja) 2005-02-17
CN1602592A (zh) 2005-03-30
ES2385324T3 (es) 2012-07-23
JP4173099B2 (ja) 2008-10-29
EP1430613A4 (en) 2010-05-26
EP1430613B1 (en) 2012-05-02
MY127481A (en) 2006-12-29
CN100525129C (zh) 2009-08-05
KR20040037104A (ko) 2004-05-04
MXPA04002923A (es) 2004-07-05
US6996183B2 (en) 2006-02-07
EP1430613A1 (en) 2004-06-23
WO2003028236A1 (en) 2003-04-03
US20030058947A1 (en) 2003-03-27
KR100920096B1 (ko) 2009-10-01
BR0212828A (pt) 2004-10-13

Similar Documents

Publication Publication Date Title
JP3609965B2 (ja) 圧縮形式でのデジタルビデオデータの処理方法
KR100698106B1 (ko) 엠펙(mpeg)압축 비디오 환경에서 계층적 혼합형장면 변화 검출 방법
Meng et al. Scene change detection in an MPEG-compressed video sequence
US6618507B1 (en) Methods of feature extraction of video sequences
US7054367B2 (en) Edge detection based on variable-length codes of block coded video
US6327390B1 (en) Methods of scene fade detection for indexing of video sequences
BRPI0212828B1 (pt) detecção de corte de cena em um fluxo de bits de vídeo
JP2011176811A (ja) 監視ビデオをエンコードするための方法及び装置
BRPI0800008B1 (pt) dispositivo e método de decodificação de imagem para obter sinais de imagem decodificando dados comprimidos de sinais de imagem em movimento digitais
BRPI0800010B1 (pt) dispositivo de codificação de imagem em movimento, dispositivo de decodificação de imagem em movimento, método de codificação de imagem em movimento e método de decodificação de imagem em movimento
WO2017177675A1 (zh) 视频编码方法和装置
US5768536A (en) Generation of a secondary video bitstream from a compressed video bitstream to enhance playback performance
JP3714871B2 (ja) サンプリングされたディジタル動画シーケンス中の推移を検出する方法
Sugano et al. A fast scene change detection on MPEG coding parameter domain
KR100327952B1 (ko) 영역분할기반동영상압축부호화방법및장치
Fernando et al. Sudden scene change detection in MPEG-2 video sequences
KR100286742B1 (ko) 압축된 뉴스 영상의 장면전환 및 기사 검출방법
Dawood et al. Clear scene cut detection directly from MPEG bit streams
JP2002064823A (ja) 圧縮動画像のシーンチェンジ検出装置、圧縮動画像のシーンチェンジ検出方法及びそのプログラムを記録した記録媒体
JP2002281508A (ja) スキップ領域検出型動画像符号化装置および記録媒体
JPH118854A (ja) カット点検出方法及び装置
KR102343029B1 (ko) 모션벡터 기반 분기처리를 이용한 압축영상의 영상분석 처리 방법
KR100249829B1 (ko) 엠펙-2 비트열 상에서 계층적 구조를 갖는 장면전환 검출 방법
JP4003149B2 (ja) 画像符号化装置及びその方法
De Queiroz et al. Fast video segmentation using encoding cost data

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 10/05/2016, OBSERVADAS AS CONDICOES LEGAIS.

B25D Requested change of name of applicant approved
B25G Requested change of headquarter approved
B25A Requested transfer of rights approved
B25A Requested transfer of rights approved
B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 19A ANUIDADE.

B24J Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12)

Free format text: EM VIRTUDE DA EXTINCAO PUBLICADA NA RPI 2640 DE 10-08-2021 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDA A EXTINCAO DA PATENTE E SEUS CERTIFICADOS, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.