BRPI0212828B1 - detecção de corte de cena em um fluxo de bits de vídeo - Google Patents
detecção de corte de cena em um fluxo de bits de vídeo Download PDFInfo
- Publication number
- BRPI0212828B1 BRPI0212828B1 BRPI0212828A BR0212828A BRPI0212828B1 BR PI0212828 B1 BRPI0212828 B1 BR PI0212828B1 BR PI0212828 A BRPI0212828 A BR PI0212828A BR 0212828 A BR0212828 A BR 0212828A BR PI0212828 B1 BRPI0212828 B1 BR PI0212828B1
- Authority
- BR
- Brazil
- Prior art keywords
- frame
- image
- field
- determining
- ratio
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title abstract description 14
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000008569 process Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/147—Scene change detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/87—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/4402—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
"detecção de corte de cena em um fluxo de bits de vídeo". um método e aparelho são descritos para detecção de cortes de cena em um fluxo de bits de vídeo. o número de macroblocos codificados para cada uma de uma pluralidade de cortes de cena potenciais é determinado (309). o número de macroblocos preditos (310) para cada uma da pluralidade de cortes de cena potenciais é determinado. uma razão do número dos macroblocos codificados com relação ao número dos macroblocos preditos para cada uma de uma pluralidade de quadros correspondendo com os cortes de cena potenciais é então calculada. um quadro tendo a razão desejada é selecionado (312). a razão do quadro selecionado é comparada com um valor limiar (313). um corte de cena é relatado quando detectado em resposta a uma determinação que a razão do quadro selecionado satisfaz o valor limiar (314).
Description
"DETECÇÃO DE CORTE DE CENA EM UM FLUXO DE BITS DE VÍDEO" REFERÊNCIAS COM PEDIDOS RELACIONADOS O presente pedido reivindica o benefício do Pedido de Patente Provisório U.S. No. Serial 60/324.890, depositado em 26 de setembro de 2001.
CAMPO DA INVENÇÃO A presente invenção refere-se a vídeo do tipo MPEG e, mais particularmente, à detecção de corte de cena dentro do fluxo de bits de vídeo.
ANTECEDENTES DA INVENÇÃO
Seqüências de vídeo baseadas em MPEG podem ser divididas em cenas que podem variar de menos do que um segundo a minutos ou mais de duração. A detecção dessas divisões ou cortes de cena torna possível uma ampla variedade de aspectos adicionados de valor. Por exemplo, um quadro pode ser selecionado de cada cena para criar um esboço seqüencial resumindo os conteúdos de uma gravação de vídeo. Ademais, um editor de vídeo pode ser usado para manipular a gravação de vídeo em uma base de cena por cena, por exemplo, reordenando cenas ou aplicando técnicas de processamento de imagem em cada quadro em uma cena.
As seqüências de vídeo em MPEG incluem três tipos de quadros, Intra-Quadros (I), Inter-Quadros (P) e Quadros Bidirecionais (B). Quadros I codificam uma imagem parada u-sando um método similar à codificação JPEG. Quadros P são preditos de um quadro I ou P prévio. Quadros B são preditos tanto de um quadro prévio I ou P quanto de um próximo quadro I ou P. Esses três tipos de quadros são codificados usando uma transformada discreta de cosseno (DCT), que organiza a redundância nas direções espaciais entre os quadros. Entretanto, para quadros I, a informação da DCT é derivada diretamente de uma amostra de imagem, enquanto que para os quadros P e B, a informação da DCT é derivada de um erro residual depois de uma previsão.
Cada quadro é dividido em uma pluralidade de ma-croblocos. Cada macrobloco inclui informação relacionada a uma pluralidade de blocos de luminância, por exemplo, Y1, Y2, Y3 e Y4, e uma pluralidade de blocos de crominância, por exemplo, um U e um V em um sistema YUV. Cada um desses blocos inclui uma pluralidade de pels, ou elementos de imagem, por exemplo, um bloco 8x8.
Quando o video tiver sido codificado em um fluxo de bits semelhante a MPEG, a detecção do corte da cena pode ser feita sem decodificar totalmente o fluxo de bits, o que aumenta a velocidade do processamento do video. Informação adicional, tal como, tipos de codificação de macrobloco, vetores de movimento e coeficientes da DCT, pode também ser extraída do fluxo de bits sem decodificar totalmente o fluxo de bits.
Um método para detecção de corte da cena é executado como segue: 1. Para quadros I, as diferenças de quadrado médio entre coeficientes da DCT são determinadas, 2. Para quadros P, o método proposto determina o número dos macroblocos preditos para frente, 3. Para quadros B, o menor entre o número dos ma-croblocos codificados para frente e o número dos macroblocos codificados para trás é contado, e 4. Um mínimo é então determinado em um gráfico desses números versus o número do quadro.
Em um outro método proposto para detecção de corte de cena: para quadros I, a diferença entre os histogramas de cor construídos a partir dos coeficientes DC é usada, e combinada com a informação sobre a razão do número dos macroblocos sem compensação de movimento em relação ao número com compensação de movimento. O método proposto busca um pico em um gráfico versus o número do quadro. Para quadros B, a razão das previsões para frente em relação às para trás é determinada. Em todos os casos, uma técnica de limiar adapta-tivo local é implementada para identificar os picos.
Ainda um outro método faz uso de histogramas para todos os quadros (I, P e B) construídos a partir dos coeficientes do cosseno discreto (DC) com compensação de movimento .
Entretanto, nenhum sistema ou método conhecido a-tualmente existe para detecção de corte de cena com base no exame global de todas as previsões dentro de um subgrupo de imagens (GOP).
SUMÁRIO DA INVENÇÃO
Cortes de cena são detectados com base no exame global de todas as previsões dentro de um sub-GOP de acordo com os princípios da presente invenção. O número dos macroblocos codificados para cada uma de uma pluralidade de cor- tes de cena potenciais é detectado primeiro. O número dos macroblocos preditos para cada uma da pluralidade de cortes de cena potenciais é então determinado. A razão do número dos macroblocos codificados em relação ao número dos macroblocos preditos para cada uma de uma pluralidade de quadros correspondendo aos cortes de cena potencial é determinada a seguir. Um quadro tendo a razão desejada é selecionado. A razão é comparada com um valor limiar. Um corte de cena é detectado se é determinado que a razão satisfaz o valor limiar .
BREVE DESCRIÇÃO DOS DESENHOS
Modalidades preferidas da presente invenção serão descritas abaixo em mais detalhes, com referência aos desenhos acompanhantes, nos quais: A Fig. 1 ilustra cortes de cena exemplares dentro de um sub-GOP, de acordo com os princípios da presente invenção, A Fig. 2 é um fluxograma ilustrando um primeiro método para detecção de corte de cena, de acordo com os princípios da presente invenção, e A Fig. 3 é um fluxograma ilustrando um segundo método para detecção de corte de cena, de acordo com os princípios da presente invenção.
DESCRIÇÃO DETALHADA
De acordo com os princípios da presente invenção, a detecção de corte de cena é executada coletando dados sobre o número de macroblocos preditos para frente e para trás em cada Inter-Quadro (P) ou quadro Bidirecional (B), anali- sando-os em um nível de sub-GOP (cada quadro âncora junto com quadros B precedentes) sem considerar cada quadro inde-pendentemente. Deve ser entendido que a presente invenção pode ser implementada em várias formas de hardware, software, firmware, processadores de uso especial ou uma combinação desses. Em uma modalidade exemplar, a presente invenção é implementada em software como um programa de aplicação personificado de forma tangível em um dispositivo de armazenamento de programa. O programa de aplicação pode ser transferido para, e executado por, uma máquina compreendendo qualquer arquitetura adequada. De preferência, a máquina é implementada em uma plataforma de computador tendo um hardware tal como uma ou mais unidades de processamento central (CPU), uma memória de acesso aleatório (RAM) e interface(s) de entrada/saida (1/0). A plataforma de computador também inclui um sistema operacional e código de microinstrução. Os vários processos e funções descritos aqui podem ser parte do código de microinstrução ou parte do programa de aplicação (ou uma combinação desses) que é executado via o sistema o-peracional. Além do que, vários outros dispositivos periféricos podem ser conectados à plataforma do computador tal como um dispositivo(s) de armazenamento de dados adicional e um dispositivo(s) de impressão.
Deve ser também entendido que, pelo fato de que alguns dos componentes do sistema constituinte e etapas do método representados nas figuras acompanhantes podem ser implementados em software, as ligações atuais, interligações ou relações funcionais entre os componentes do sistema (ou as etapas do processo) podem diferir dependendo da maneira na qual a presente invenção é programada. Dado os ensinamentos da presente invenção proporcionados na mesma, alguém de conhecimento comum na técnica relacionada será capaz de considerar essas e implementações ou configurações similares da presente invenção.
Para cada quadro P ou B, o número de macroblocos utilizando previsão para frente e o número de macroblocos utilizando previsão para trás (encontrada somente nos quadros B) são gravados. Os dados para cada quadro âncora, In-tra-quadro (I) ou P, e todos os quadros B imediatamente precedentes são examinados.
Se um macrobloco é predito de maneira imprópria, o residual depois da compensação de movimento pode ser grande, e grandes coeficientes de DCT são necessários de modo a compensar a previsão. Para essas previsões, existe uma alta probabilidade (cerca de mais do que 50%) que a previsão seja falsa. Isto é, um macrobloco de quadro âncora no qual a previsão é baseada pode não ter associação real com o macrobloco no quadro predito, porém o quadro âncora pode ser similar o suficiente que uma previsão poderia ser feita a partir dele. Por essa razão, um tal macrobloco é ignorado na reunião da estatística. Mais particularmente, quando contando macroblocos com previsão para frente ou para trás, a energia total (entropia) dos coeficientes da DCT é examinada. A e-nergia total dos coeficientes da DCT é a soma dos quadrados dos coeficientes não-DC. Se essa energia fica acima de um valor limiar, o macrobloco não é contado, tanto para o núme- ro de previsões para frente ou para trás (nFwd e nBwd, respectivamente) , quanto para o número de macroblocos codificados (nCode). Para MPEG-2, foi verificado que um valor limiar exemplar é de cerca de 500.
Para um quadro âncora, o padrão de previsões para cada quadro no sub-GOP é analisado. Considere a Fig. 1, que representa um sub-GOP incluindo dois quadros B e um quadro P. Locais potenciais para um corte de cena incluem, antes do quadro Bx 102, entre os quadros Bx 102 e B2 103, e entre o quadro B2 103 e o quadro P3 104. Além do que, se os quadros são entrelaçados, um corte de cena pode ocorrer entre os campos de qualquer um dos três quadros, 105 a 107 respectivamente .
De acordo com uma modalidade da presente invenção, se um corte de cena ocorre em 108, poucos macroblocos preditos para frente estariam presentes nos quadros Bi 102, B2 103 ou P3 104, porque o quadro I/P0 101 não está relacionado com qualquer um desses quadros. Da mesma forma, se um corte de cena ocorre em 109, poucos macroblocos preditos para trás estariam presentes no quadro Bi 102 porque o quadro Bi 102 não está relacionado com o quadro P3 104 a partir do qual essas previsões são feitas; e nós esperamos poucos macroblocos preditos para frente no quadro B2 103 ou P3 104 porque o quadro I/Po 101 não está relacionado como esses quadros.
Assim, uma medida da probabilidade de um corte de cena em 108 é o total do número dos macroblocos preditos para frente nos quadros Bi 102, B2 103 ou P3 104. Uma medida da probabilidade de um corte de cena em 109 é o total do número dos macroblocos preditos para trás no quadro Βχ 102 mais o número dos macroblocos preditos para frente no quadro B2 103 e P3 104; e similarmente para a probabilidade de um corte de cena em 110. A probabilidade de que exista um corte de cena no ponto correspondente aumenta à medida que o número total de macroblocos preditos para frente e para trás diminui.
Com referência à Fig. 2, com a determinação que a imagem atual (p) é um quadro P ou B 2 01, o número total de macroblocos codificados no quadro (nCode[p]) é fixado para o número de macroblocos tendo uma AcEnergy menor do que e-nergyThresh 202. O número total de macroblocos preditos para frente para o quadro (nFwd. [p]) é fixado como o número de macroblocos tendo uma AcEnergy menor do que energyThresh E previsão para frente 203. O número total de macroblocos preditos para trás para o quadro (nBwd[p]) é fixado como o número de macroblocos tendo uma AcEnergy menor do que uma e-nergyThresh E previsão para trás 204.
Com referência agora à Fig. 3, de acordo com a e-tapa 301, é determinado se p é um quadro I ou P. Se p é um quadro I ou P, não existe detecção de corte de cena até o fim do sub-GOP, de acordo com a etapa 302. De acordo com a etapa 3 03, é determinado se p é um quadro I e se o quadro prévio era um quadro I ou P. Se é determinado que o p é um quadro I e a imagem prévia era um quadro I ou P, então um corte de cena não é detectado nesse sub-GOP, de acordo com a etapa 304. Com a determinação que p é tipo P ou que a imagem prévia é tipo B, então os dados são reunidos quanto ao sub-GOP corrente nas etapas 305 a 311. A contagem das previsões que cruzam o corte de cena potencial entre o campo f e o campo precedente {predMBs[f]) e a contagem dos macroblocos cujas previsões poderíam cruzar esse limite (MBs[f] codificado) são inicializadas para 0 para cada campo f no sub-GOP, de acordo com a etapa 305.
Para cada campo f no sub-GOP, é determinado se o campo f está em uma imagem I, de acordo com a etapa 307. Se o campo f está em uma imagem I, então o processo continua para o próximo campo de acordo com a etapa 308. Com a determinação que o campo f não está em uma imagem I, então o processo retorna para os locais potenciais para um corte de cena no sub-GOP, isto é, cada local f' entre dois campos. O valor de codedMBs[f'J é incrementado por nCode [f] para cada corte de cena potencial f' no sub-GOP, de acordo com a etapa 309. Ademais, o valor de predMBs[f'] é incrementado por nFwd[f] para cada corte de cena potencial f' antes ou igual a f, de acordo com a etapa 310.
De acordo com a etapa 311, é determinado se o último campo foi alcançado, e se não o processo prossegue com o próximo campo, de acordo com a etapa 308. Com a determinação de que o último campo foi alcançado, um campo f para o qual a razão de predMBs [f] em relação a coded MBs [f] (por exemplo, predMBs[f] para MBs[f] codificado) está em um mínimo é determinada, de acordo com a etapa 312. Para o campo f determinado como tendo a razão mínima, se predMBs[f] dividido por MBs [f] codificado é menor do que predRatioThresh de acordo com a etapa 313, o processo detecta e relata um corte de cena entre esse campo e o campo precedente, de acordo com a etapa 314, senão nenhum corte de cena é detectado no sub-GOP, de acordo com a etapa 315.
Observe que o número de macroblocos preditos (PredMBs) e macroblocos com campo codificado (codedMBs) são determinados para cada campo, mesmo se as imagens são imagens de quadro, desde que um corte de cena pode ocorrer entre campos de uma imagem de quadro (se a imagem de quadro é entrelaçada) . Os macroblocos de uma imagem de quadro são a-pliçados em cada campo do quadro no cálculo de predMBs e codedMBs. Isto é, nCode[f'] é o número total de macroblocos codificados no quadro quando f' se refere a qualquer campo do quadro. Similarmente, nFwd[f'] e nBwd[f'] representam o número de macroblocos de previsão para frente e macroblocos de previsão para trás no campo f', respectivamente. Quando f' está na mesma imagem do quadro que f, predMBs[f] é incrementado por nBwd[f] e codedMBs[f] é incrementado por nCo-de[f'], somente quando f ê o primeiro campo do quadro. As matrizes para o segundo campo não são incrementadas porque assume-se que as previsões para frente aplicam-se ao primeiro campo somente, e as previsões para trás ao segundo campo somente. Se isso não fosse feito, um corte de cena entre campos de uma imagem de quadro seria mascarado por previsões através do limite da cena.
Um bom valor para o limiar da razão de previsão, preRatioThresh, foi encontrado, através de experimentação, como sendo 0,05. Entretanto, experimentação adicional e/ou aplicações podem determinar que algum valor diferente desse valor, ou que um valor de limiar variável pode ser mais a- propriado em uma aplicação específica. Além disso, o valor específico escolhido para o limiar da energia AC, AcThresh, pode similarmente ser diferente do valor exemplar descrito aqui. Seria evidente para esses peritos na técnica avaliar e modificar esses e outros valores para maximizar a eficiência e precisão da invenção, tal modificação ainda incluindo os princípios da presente invenção como descrito aqui. O método específico descrito acima é o que foi implementado e testado. Ele não é planejado para limitar o escopo dessa descrição ou as reivindicações contidas na mesma. Um princípio básico da presente invenção é a detecção precisa de um corte de cena nítido pelo exame global de todas as previsões dentro de um sub-GOP. Buscando a consistência de toda informação disponível sobre as previsões, falsos positivos (relatórios falsos de cortes de cena) podem ser reduzidos .
Os princípios da presente invenção podem ser integrados com, por exemplo, métodos com base em histograma, para lidar com os casos de quadro I somente, e de uma imagem P seguida por uma imagem I, em cujos casos esse método não pode detectar um corte de cena. Extensões envolvendo histogra-mas podem também ser implementadas para detectar as transições de cena graduais tais como desaparecimentos graduais, dissoluções e apagamentos.
Tendo descrito modalidades para a detecção precisa de um corte de cena pelo exame global de todas as previsões dentro de um sub-GOP, é observado que modificações e variações podem ser feitas por pessoas peritas na técnica em vis- ta dos ensinamentos acima. Deve ser entendido, portanto, que várias mudanças e modificações podem ser feitas nas modalidades particulares da invenção descrita que estão dentro do escopo e espirito da invenção como definido pelas reivindicações anexas. Tendo assim descrito a invenção com os detalhes e particularidade exigidos pelas leis de patentes, o que é reivindicado e pretende-se proteger pela Carta Patente é apresentado nas reivindicações anexas.
Claims (21)
1. Método para detecção de cortes de cena em um fluxo de bits de video em MPEG, CARACTERIZADO pelo fato de que compreende as etapas de: determinar um número de macroblocos codificados para cada um de uma pluralidade de cortes de cena potenciais, onde a pluralidade de cortes de cena potenciais existe entre uma pluralidade de quadros e entre uma pluralidade de campos em cada quadro (309), configurar um número de macroblocos preditos igual a um número de macroblocos preditos para frente para cada um da pluralidade de cortes de cena potenciais, com a determinação de que um campo correspondente é um primeiro campo em um quadro, e configurar o número de macroblocos preditos igual a um número de macroblocos preditos para trás para cada um da pluralidade de cortes de cena potenciais, com a determinação de que o campo correspondente é um segundo campo no quadro, onde o quadro inclui o primeiro e o segundo campos (310), determinar uma razão do número de macroblocos codificados com relação ao número de macroblocos preditos para cada um de uma pluralidade de campos correspondendo à pluralidade de cortes de cena potenciais, selecionar um campo tendo a menor razão entre a pluralidade de campos (312), comparar a menor razão com um valor limiar (313), e detectar um corte de cena com a determinação de que a menor razão satisfaz o valor limiar, onde o corte de cena corresponde ao campo selecionado (314).
2. Método, de acordo com a reivindicação 1, CARACTERIZADO adicionalmente pelo fato de que compreende a etapa de processar um grupo de quadros, cada quadro incluindo dois campos, onde o grupo de quadros compreende um subgrupo de imagens e o fluxo de bits de video inclui uma pluralidade de subgrupos de imagens.
3. Método, de acordo com a reivindicação 1, CARACTERIZADO adicionalmente pelo fato de que compreende as etapas de: determinar se um primeiro quadro é uma imagem I ou P, e avançar o processamento para um próximo subgrupo de imagens, responsivo a uma determinação de que o primeiro quadro não é uma imagem I ou P.
4. Método, de acordo com a reivindicação 1, CARACTERIZADO adicionalmente pelo fato de que compreende as etapas de: determinar se a primeira imagem é uma imagem I, determinar se uma imagem prévia era uma imagem I ou P, e avançar o processamento para um próximo subgrupo de imagens, responsivo à determinação de que a primeira imagem é uma imagem P ou a imagem prévia é uma imagem B.
5. Método, de acordo com a reivindicação 1, CARACTERIZADO adicionalmente pelo fato de que compreende as etapas de: inicializar o número de macroblocos preditos para zero para cada campo, e inicializar o número de macroblocos codificados para zero para cada campo.
6. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que pelo menos um da pluralidade de cortes de cena potenciais existe entre campos entrelaçados de um quadro.
7. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que adicionalmente compreende a etapa de: determinar um número de macroblocos preditos para cada uma da pluralidade de cortes de cena potenciais (310); e selecionar um campo tendo a menor razão entre a pluralidade de campos (312) compreende selecionar um quadro tendo uma razão desejada (312) .
8. Método, de acordo com a reivindicação 7, CARACTERIZADO adicionalmente pelo fato de que compreende a etapa de processar um grupo de quadros, onde cada quadro inclui dois campos, e onde o grupo de quadros compreende um subgrupo de imagens e o fluxo de bits de video inclui uma pluralidade de subgrupos de imagens.
9. Método, de acordo com a reivindicação 7, CARACTERIZADO adicionalmente pelo fato de que compreende a etapa de determinar se um primeiro quadro é uma imagem I ou P, com a determinação de que o primeiro quadro não é uma imagem I ou P, e avançar para um próximo subgrupo de imagens .
10. Método, de acordo com a reivindicação 7, CARACTERIZADO adicionalmente pelo fato de que compreende a etapa de determinar se a primeira imagem é uma imagem I e se uma imagem prévia era uma imagem I ou P, com a determinação de que a primeira imagem é uma imagem P ou a imagem prévia é uma imagem B, e avançar para o próximo subgrupo de imagens.
11. Método, de acordo com a reivindicação 7, CARACTERIZADO adicionalmente pelo fato de que compreende as etapas de: inicializar o número de macroblocos preditos para zero para cada quadro, e inicializar o número de macroblocos codificados para zero para cada quadro.
12. Método, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de que pelo menos um dos cortes de cena potenciais existe entre campos entrelaçados de um quadro .
13. Método, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que a etapa de determinar o número de macroblocos preditos adicionalmente compreende as etapas de: configurar o número de macroblocos preditos igual a um número de macroblocos preditos para frente para cada corte de cena potencial, com a determinação de que um campo correspondente é um primeiro campo em um quadro, e configurar o número de macroblocos preditos igual a um número de macroblocos preditos para trás para cada corte de cena potencial, com a determinação de que o campo correspondente é um segundo campo no quadro, onde o quadro inclui o primeiro e o segundo campos.
14. Método, de acordo com a reivindicação 12, CARACTERIZADO pelo fato de que o corte de cena corresponde ao campo selecionado.
15. Método, de acordo com a reivindicação 7, CARACTERIZADO pelo fato de que cortes de cena potenciais existem entre os quadros de um subgrupo de imagens.
16. Dispositivo de armazenamento de programa legível por máquina, personificando de modo tangível um programa de instruções executáveis pela máquina para executar etapas do método para detecção de cortes de cena em um fluxo de bits de vídeo, as etapas do método sendo CARACTERIZADAS pelo fato de que compreendem as etapas de: determinar um número de macroblocos codificados para cada um de uma pluralidade de cortes de cena potenciais (309), determinar um número de macroblocos preditos para cada um da pluralidade de cortes de cena potenciais (310), determinar a razão do número dos macroblocos codificados com relação ao número de macroblocos preditos para cada um de uma pluralidade de quadros correspondendo à pluralidade de cortes de cena potenciais, selecionar um quadro tendo uma razão desejada (312), comparar a razão com um valor limiar (313), e detectar um corte de cena com a determinação de que a razão satisfaz o valor limiar (314).
17. Método, de acordo com a reivindicação 16, CARACTERIZADO pelo fato de que a pluralidade de cortes de cena potenciais existe entre campos entrelaçados de um quadro .
18. Método, de acordo com a reivindicação 17, CARACTERIZADO pelo fato de que a etapa de determinar o número de macroblocos preditos adicionalmente compreende as etapas de: configurar o número de macroblocos preditos igual ao número de macroblocos preditos para frente para cada corte de cena potencial, com a determinação de que um campo correspondente é um primeiro campo em um quadro, e configurar o número de macroblocos preditos igual a um número de macroblocos preditos para trás para cada corte de cena potencial, com a determinação de que o campo correspondente é um segundo campo no quadro, onde o quadro inclui o primeiro e o segundo campos.
19. Método, de acordo com a reivindicação 17, CARACTERIZADO pelo fato de que o corte de cena corresponde ao campo selecionado.
20. Método, de acordo com a reivindicação 16, CARACTERIZADO pelo fato de que a razão desejada é uma razão minima entre todas as razões determinadas.
21. Aparelho para detectar cortes de cena em um fluxo de bits de video, CARACTERIZADO pelo fato de que compreende : um dispositivo para determinar um número de macro-blocos codificados para cada um de uma pluralidade de cortes de cena potenciais, um dispositivo para determinar um número de macro-blocos preditos para cada um da pluralidade de cortes de cena potenciais, um dispositivo para determinar a razão do número de macroblocos codificados com relação ao número de macro-blocos preditos para cada um de uma pluralidade de quadros correspondendo à pluralidade de cortes de cena potenciais, um dispositivo para selecionar um quadro tendo uma razão desejada, um dispositivo para comparar a razão com um valor limiar, e um dispositivo para detectar um corte de cena com a determinação de que a razão satisfaz o valor limiar.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US32489001P | 2001-09-26 | 2001-09-26 | |
US10/014,963 US6996183B2 (en) | 2001-09-26 | 2001-12-11 | Scene cut detection in a video bitstream |
PCT/US2002/029883 WO2003028236A1 (en) | 2001-09-26 | 2002-09-20 | Scene cut detection in a video bitstream |
Publications (2)
Publication Number | Publication Date |
---|---|
BR0212828A BR0212828A (pt) | 2004-10-13 |
BRPI0212828B1 true BRPI0212828B1 (pt) | 2016-05-10 |
Family
ID=26686770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0212828A BRPI0212828B1 (pt) | 2001-09-26 | 2002-09-20 | detecção de corte de cena em um fluxo de bits de vídeo |
Country Status (10)
Country | Link |
---|---|
US (1) | US6996183B2 (pt) |
EP (1) | EP1430613B1 (pt) |
JP (1) | JP4173099B2 (pt) |
KR (1) | KR100920096B1 (pt) |
CN (1) | CN100525129C (pt) |
BR (1) | BRPI0212828B1 (pt) |
ES (1) | ES2385324T3 (pt) |
MX (1) | MXPA04002923A (pt) |
MY (1) | MY127481A (pt) |
WO (1) | WO2003028236A1 (pt) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100428801C (zh) * | 2005-11-18 | 2008-10-22 | 清华大学 | 一种视频场景切换检测方法 |
JP4719889B2 (ja) * | 2006-08-03 | 2011-07-06 | 国立大学法人電気通信大学 | カット点検出システムおよび該カット点検出システムを用いたショット識別システム、カット点検出方法、並びにカット点検出プログラム |
US20090313546A1 (en) * | 2008-06-16 | 2009-12-17 | Porto Technology, Llc | Auto-editing process for media content shared via a media sharing service |
KR101149522B1 (ko) | 2008-12-15 | 2012-05-25 | 한국전자통신연구원 | 장면 전환 검출 시스템 및 방법 |
CN101534442B (zh) * | 2009-04-13 | 2011-01-12 | 腾讯科技(深圳)有限公司 | 视频编码系统及方法 |
KR101043768B1 (ko) * | 2009-10-13 | 2011-06-22 | 중앙대학교 산학협력단 | 회화적 렌더링 장치 및 방법 |
CN109510919B (zh) | 2011-10-11 | 2021-12-24 | 瑞典爱立信有限公司 | 用于感知质量评估的场景变换检测的方法、设备和介质 |
WO2013075335A1 (en) * | 2011-11-25 | 2013-05-30 | Thomson Licensing | Video quality assessment considering scene cut artifacts |
AU2012388049A1 (en) | 2012-08-23 | 2015-02-26 | Thomson Licensing | Method and apparatus for detecting gradual transition picture in video bitstream |
CN105075273B (zh) * | 2013-02-27 | 2019-03-26 | 苹果公司 | 自适应流式传输技术 |
US9979970B2 (en) * | 2014-08-08 | 2018-05-22 | Qualcomm Incorporated | System and method for determining buffer fullness for display stream compression |
CN109194955B (zh) * | 2018-11-16 | 2021-04-30 | 深圳市梦网视讯有限公司 | 一种场景切换检测方法及系统 |
CN114071143B (zh) * | 2020-07-31 | 2024-09-06 | 中移(苏州)软件技术有限公司 | 视频处理方法、装置、设备和存储介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2294173B (en) * | 1994-10-11 | 1998-12-09 | Mitsubishi Electric Corp | Disk media, and method of and device for recording and playing back information on or from a disk media |
US5835149A (en) * | 1995-06-06 | 1998-11-10 | Intel Corporation | Bit allocation in a coded video sequence |
US5774593A (en) * | 1995-07-24 | 1998-06-30 | University Of Washington | Automatic scene decomposition and optimization of MPEG compressed video |
US5872598A (en) * | 1995-12-26 | 1999-02-16 | C-Cube Microsystems | Scene change detection using quantization scale factor rate control |
US5768537A (en) * | 1996-02-22 | 1998-06-16 | International Business Machines Corporation | Scalable MPEG2 compliant video encoder |
US5724100A (en) * | 1996-02-26 | 1998-03-03 | David Sarnoff Research Center, Inc. | Method and apparatus for detecting scene-cuts in a block-based video coding system |
US5731835A (en) * | 1996-02-26 | 1998-03-24 | David Sarnoff Research Center, Inc. | Dynamic coding rate control in a block-based video coding system |
JPH09261648A (ja) * | 1996-03-21 | 1997-10-03 | Fujitsu Ltd | シーンチェンジ検出装置 |
JP3244629B2 (ja) * | 1996-08-20 | 2002-01-07 | 株式会社日立製作所 | シーン変化点検出方法 |
US5751378A (en) * | 1996-09-27 | 1998-05-12 | General Instrument Corporation | Scene change detector for digital video |
US6735253B1 (en) * | 1997-05-16 | 2004-05-11 | The Trustees Of Columbia University In The City Of New York | Methods and architecture for indexing and editing compressed video over the world wide web |
FR2764156B1 (fr) * | 1997-05-27 | 1999-11-05 | Thomson Broadcast Systems | Dispositif de pretraitement pour codage mpeg ii |
DE69826823T2 (de) * | 1997-07-29 | 2005-10-20 | Koninklijke Philips Electronics N.V. | Verfahren zur videocodierung mit variabler bitrate und entsprechender videocodierer |
US6100940A (en) * | 1998-01-21 | 2000-08-08 | Sarnoff Corporation | Apparatus and method for using side information to improve a coding system |
JP3905969B2 (ja) * | 1998-01-30 | 2007-04-18 | 株式会社東芝 | 動画像符号化装置および動画像符号化方法 |
US6252905B1 (en) * | 1998-02-05 | 2001-06-26 | International Business Machines Corporation | Real-time evaluation of compressed picture quality within a digital video encoder |
US6125147A (en) * | 1998-05-07 | 2000-09-26 | Motorola, Inc. | Method and apparatus for reducing breathing artifacts in compressed video |
JP2001266158A (ja) | 2000-01-11 | 2001-09-28 | Canon Inc | 画像処理装置、画像処理システム、画像処理方法、及び記憶媒体 |
-
2001
- 2001-12-11 US US10/014,963 patent/US6996183B2/en not_active Expired - Lifetime
-
2002
- 2002-09-20 EP EP02775897A patent/EP1430613B1/en not_active Expired - Lifetime
- 2002-09-20 MX MXPA04002923A patent/MXPA04002923A/es active IP Right Grant
- 2002-09-20 CN CNB028232771A patent/CN100525129C/zh not_active Expired - Lifetime
- 2002-09-20 BR BRPI0212828A patent/BRPI0212828B1/pt not_active IP Right Cessation
- 2002-09-20 JP JP2003531629A patent/JP4173099B2/ja not_active Expired - Lifetime
- 2002-09-20 WO PCT/US2002/029883 patent/WO2003028236A1/en active Application Filing
- 2002-09-20 ES ES02775897T patent/ES2385324T3/es not_active Expired - Lifetime
- 2002-09-20 KR KR1020047004260A patent/KR100920096B1/ko active IP Right Grant
- 2002-09-24 MY MYPI20023551A patent/MY127481A/en unknown
Also Published As
Publication number | Publication date |
---|---|
JP2005505165A (ja) | 2005-02-17 |
CN1602592A (zh) | 2005-03-30 |
ES2385324T3 (es) | 2012-07-23 |
JP4173099B2 (ja) | 2008-10-29 |
EP1430613A4 (en) | 2010-05-26 |
EP1430613B1 (en) | 2012-05-02 |
MY127481A (en) | 2006-12-29 |
CN100525129C (zh) | 2009-08-05 |
KR20040037104A (ko) | 2004-05-04 |
MXPA04002923A (es) | 2004-07-05 |
US6996183B2 (en) | 2006-02-07 |
EP1430613A1 (en) | 2004-06-23 |
WO2003028236A1 (en) | 2003-04-03 |
US20030058947A1 (en) | 2003-03-27 |
KR100920096B1 (ko) | 2009-10-01 |
BR0212828A (pt) | 2004-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3609965B2 (ja) | 圧縮形式でのデジタルビデオデータの処理方法 | |
KR100698106B1 (ko) | 엠펙(mpeg)압축 비디오 환경에서 계층적 혼합형장면 변화 검출 방법 | |
Meng et al. | Scene change detection in an MPEG-compressed video sequence | |
US6618507B1 (en) | Methods of feature extraction of video sequences | |
US7054367B2 (en) | Edge detection based on variable-length codes of block coded video | |
US6327390B1 (en) | Methods of scene fade detection for indexing of video sequences | |
BRPI0212828B1 (pt) | detecção de corte de cena em um fluxo de bits de vídeo | |
JP2011176811A (ja) | 監視ビデオをエンコードするための方法及び装置 | |
BRPI0800008B1 (pt) | dispositivo e método de decodificação de imagem para obter sinais de imagem decodificando dados comprimidos de sinais de imagem em movimento digitais | |
BRPI0800010B1 (pt) | dispositivo de codificação de imagem em movimento, dispositivo de decodificação de imagem em movimento, método de codificação de imagem em movimento e método de decodificação de imagem em movimento | |
WO2017177675A1 (zh) | 视频编码方法和装置 | |
US5768536A (en) | Generation of a secondary video bitstream from a compressed video bitstream to enhance playback performance | |
JP3714871B2 (ja) | サンプリングされたディジタル動画シーケンス中の推移を検出する方法 | |
Sugano et al. | A fast scene change detection on MPEG coding parameter domain | |
KR100327952B1 (ko) | 영역분할기반동영상압축부호화방법및장치 | |
Fernando et al. | Sudden scene change detection in MPEG-2 video sequences | |
KR100286742B1 (ko) | 압축된 뉴스 영상의 장면전환 및 기사 검출방법 | |
Dawood et al. | Clear scene cut detection directly from MPEG bit streams | |
JP2002064823A (ja) | 圧縮動画像のシーンチェンジ検出装置、圧縮動画像のシーンチェンジ検出方法及びそのプログラムを記録した記録媒体 | |
JP2002281508A (ja) | スキップ領域検出型動画像符号化装置および記録媒体 | |
JPH118854A (ja) | カット点検出方法及び装置 | |
KR102343029B1 (ko) | 모션벡터 기반 분기처리를 이용한 압축영상의 영상분석 처리 방법 | |
KR100249829B1 (ko) | 엠펙-2 비트열 상에서 계층적 구조를 갖는 장면전환 검출 방법 | |
JP4003149B2 (ja) | 画像符号化装置及びその方法 | |
De Queiroz et al. | Fast video segmentation using encoding cost data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted [chapter 16.1 patent gazette] |
Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 10/05/2016, OBSERVADAS AS CONDICOES LEGAIS. |
|
B25D | Requested change of name of applicant approved | ||
B25G | Requested change of headquarter approved | ||
B25A | Requested transfer of rights approved | ||
B25A | Requested transfer of rights approved | ||
B21F | Lapse acc. art. 78, item iv - on non-payment of the annual fees in time |
Free format text: REFERENTE A 19A ANUIDADE. |
|
B24J | Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12) |
Free format text: EM VIRTUDE DA EXTINCAO PUBLICADA NA RPI 2640 DE 10-08-2021 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDA A EXTINCAO DA PATENTE E SEUS CERTIFICADOS, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013. |