EP1779664A1 - Procede de reduction de la taille des donnees d'un fichier numerique audio, image ou video par desynchronisation des criteres originels de lecture. - Google Patents

Procede de reduction de la taille des donnees d'un fichier numerique audio, image ou video par desynchronisation des criteres originels de lecture.

Info

Publication number
EP1779664A1
EP1779664A1 EP04767775A EP04767775A EP1779664A1 EP 1779664 A1 EP1779664 A1 EP 1779664A1 EP 04767775 A EP04767775 A EP 04767775A EP 04767775 A EP04767775 A EP 04767775A EP 1779664 A1 EP1779664 A1 EP 1779664A1
Authority
EP
European Patent Office
Prior art keywords
file
data
coefficient
image
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
EP04767775A
Other languages
German (de)
English (en)
Inventor
Pascale Loiseau
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
I-CES (INNOVATIVE COMPRESSION ENGINEERING SOLUTION
Original Assignee
Pascale Loiseau
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pascale Loiseau filed Critical Pascale Loiseau
Priority to EP08017099A priority Critical patent/EP2037686A3/fr
Publication of EP1779664A1 publication Critical patent/EP1779664A1/fr
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Definitions

  • the present invention relates to a method for reducing the size of raw or already compressed data of a digital file such as, for example, an audio file (characterized by its duration), video (characterized by its duration and resolution) and image (characterized by its resolution).
  • a digital file such as, for example, an audio file (characterized by its duration), video (characterized by its duration and resolution) and image (characterized by its resolution).
  • It can in particular adapt to any material already receiving digital data compacted by known compression systems or any material preparing to broadcast digital audio or video files, according to a known or future coding.
  • the video temporal media depend on time, their restitution imposing elementary actions of presentation regulated by quanta of time. These timed media depend on their duration, expressed for audio by a fixed number of samples per second and for video by a number of frames per second.
  • the "display duration" of each sample set to one second, determines the duration of the audio file and its quality.
  • the combination of the total number of frames (“length”) and the number of frames per second (“frame rate”) generates the duration of display of each frame of the video and therefore the total duration of the video and beyond the total volume of information to be compacted.
  • the invention is more particularly intended to solve the problems posed by an increased optimization of the compression ratio of digital files, already compressed or not, without additional perceptible degradation of quality.
  • the deregulation is carried out by modifying the pitch ("pitch") and / or by concentrating the samples and / or by deleting samples according to a fixed or variable suppression rate.
  • the method makes it possible to obtain a restitution of the lightened file in its original time quanta, so as to allow a correct execution, without any noticeable additional degradation of quality.
  • the method By reducing the length of the character string, it promotes an increase in the rate of temporal and spatial redundancies.
  • the desynchronization of the original resolution criteria according to this process then makes it possible to reduce, according to the characteristics of the values of the blocks, the size of a block up to 32 times its original resolution.
  • the desynchronization of the original criteria for reading by deletion or by adaptive data concentration makes it possible to reduce the duration of the audio and video delay media, resulting in a significant reduction in the number of information to be coded and thus requiring a lower consumption of data. bits.
  • the size of a "MPEG 1 layer 3" file, whose original reading criteria have been deregulated by 3 is three times smaller for an equivalent quality than a file not processed by the method according to the invention.
  • the desynchronization by concentration of a given number "N of data” by simple average or weighted average allows both to reduce the total string of characters to be encoded and for the video to reduce the number of color combinations, creating consequently an additional rate of redundant temporal or spatial data.
  • the method according to the invention therefore allows known algorithms to deliver higher compression ratios, because it offers a file whose digital data are likely to be better optimized.
  • the method according to the invention adapts to any timed digital audio and / or video file whose data are already compressed or raw. In this case, it acts:
  • the process modifies the uncompressed source on which the system will act.
  • the method then behaves as a preprocessing module of a source intended to be encoded by compression systems whose process allows certain functions to be more optimal.
  • the method according to the invention can be adapted to any non-timed digital file whose data is not compressed and which is intended to be reduced by a proprietary format.
  • any image file is defined by a fixed resolution represented by its height and by its width and whose ratio expresses, by color layer, the number of total digital data to be processed. Reducing the amount of information to be processed by reducing the resolution of the image is generally fixed and proportional to the original resolution.
  • known variable data reduction systems only process successive redundant values.
  • the method according to the invention proposes, on the contrary, to reduce, by color layer, the total volume of condensable information by a variable reduction of the data of the image and without respect of the image homothety. Secondly, it focuses on reducing the number of different data sequences and, eventually, on compacting the redundant data suites. It applies to both still and moving images.
  • Figure 1 is a schematic representation showing the steps of the desynchronization of the audio file, image or video
  • Figure 2 is a schematic representation showing the steps of the resynchronization of the audio file, image or video;
  • Figure 3 illustrates a mode of desynchronization and resynchronization of an image data block.
  • the process of desynchronizing an audio, image or video file comprises the following steps: A first step of opening the file: it is distinguished if the file is an uncompressed audio, image and / or video file or if it is an audio and video file already compressed by an existing system, for example type Mpeg audio or Mpeg video (block 1).
  • a second step which represents the two methods of reducing the size of the audio and / or video file by desynchronizing their original reading criteria (block 2).
  • variable deletion desynchronization of the values of the digital audio and video data block 3
  • desynchronization by adaptive concentration of the values of the audio and / or video data block 4
  • Each of these two methods can be applied to all the values of the digital data of the audio and / or video file in question, or these two methods can be applied to all or part of the audio and / or video file whose resolution is to be reduced and to therefore the size.
  • the desynchronization of the original criteria for reading the audio and / or video data by deleting the values of the digital data consists in deleting a number "N of data” according to a variable coefficient used to reducing the original duration of the file and restoring said number "N of data” while listening to the audio file or viewing the image and / or video file.
  • Numberer of data means the number of audio samples deleted, the number of deleted images or the number of groups of images deleted in a video or the number of different digital values deleted in an image or in an image. following pictures.
  • the number of "Nl of data" is the number of audio samples to be reproduced, the number of images to be restored or the number of groups of images to be rendered in a video or the number of different digital values to be rendered in an image, in order to restore the audio file, image and / or video in its original criteria of restitution.
  • the deletion coefficient C 8 of the "N data" appears in the header of the file or in the header of the group of samples, the group of images and / or the group of numerical values of which it indicates the number of data to be added to restitution. This coefficient is used to parameterize the formula for adding missing information, which is essential to restore the file to its original reading criteria.
  • the restitution of a group of data is carried out according to the following process:
  • V 2 V 1 - IR
  • V 3 V 2 - IR
  • V n - 2 V n - 3 - IR
  • V n - l V n + IR
  • the desynchronization of the original reading criteria applies to any audio and / or video file compressed by existing compression standards, to all or part of uncompressed audio, image and / or video file intended to be reduced by a format of proprietary compression and characterized by small amplitudes, all or part of an image file whose values or groups of values are characterized by close and linear values, and all or part of video files whose changes of plans are infrequent.
  • the desynchronization of the original criteria for reading by adaptive concentration of the audio and / or video data (block 4) consists in concentrating, according to a fixed coefficient, an audio number "N of samples", a number “N of images” or a number “ N of group of images "of a video and finally to concentrate according to a fixed or variable coefficient a number" N of numerical values "of an image.
  • the fixed coefficient appears in the header of the file, while the variable coefficient appears in the header of the group of concentrated values, of which it indicates the number of data to be recomposed during the restitution phase.
  • the adaptive concentration desynchronization of the digital data values of all or part of an audio, image and / or video file is performed using two types of data concentration: a simple average concentration and a weighted average concentration. adaptive.
  • the concentration of the number "N of data” per simple average applies to all or part of the values of the digital data of all or part of an audio file, image and / or video, characterized by average amplitudes or by scenes of weak movements. Only the concentrated value representing "N data" being retained, the number of samples of the audio file, the number of images or the number of the image group of the video file and / or the number of values or the number of groups of values of the image file was reduced by the or the data concentration coefficients.
  • the concentration of "N data" by adaptive weighted average is used for all or part of the audio file having large amplitudes and all or part of video files characterized by numerous changes of shots and / or scenes of movements.
  • Adaptive weighted average means the concentration of "N data" weighted with reference to a specific value whose position may vary in the group of concentrated values.
  • the weighted average concentration formula M P is the following:
  • Blocks 5, 6 and 7 describe the three possibilities of saving any unsynchronized audio, image and / or video file, depending on whether it is a file already compressed by an existing system (block 5), a uncompressed file desynchronized by the process and compressed by an existing system (block 6) and an uncompressed file, desynchronized by the method and compressed by a proprietary system (block 7).
  • Figure 2 shows the four steps of the resynchronization of an audio file, image and / or video desynchronized by the method.
  • Block 8 represents the phase of the opening of the file by a specific audio, image and / or video player distinguishing whether it is a desynchronized digital file compressed by an existing system or by a proprietary format.
  • Block 9 illustrates the resynchronization phase by adding samples, adding values, adding images and / or groups of missing images in order to restore the audio, image and / or video file in its original reading criteria.
  • the formula applied to the addition phase is performed by a reader allowing decoding and reading in real time of the desynchronized file.
  • the formula for adding the information necessary for the resynchronization depends on the coefficient of the number "N of data" deleted during the phase of desynchronization of the reading criteria, but applies indistinctly depending on whether it is the variable deletion of audio and / or video data and / or adaptive concentration desynchronization of the audio and / or video data.
  • Block 10 represents the reading phase of the audio file, image and / or video restores in its original reading criteria by the reader.
  • the blocks 11, 12 and 13 characterize the closing phase of the file listened and / or visualized (block 11), depending on whether it is desired to keep the compressed file by a standard according to its reduced duration (block 12), keep the compressed file by a proprietary format according to its reduced duration (block 13) or save the compressed file by a standard according to its original resolution (block 14).
  • FIG. 3 shows an example of desynchronization and resynchronization of an image data block comprising 64 values comprising 8 columns of 8 values between 193 and 198.
  • the first step of desynchronization is to check that the difference between the minimum and maximum values is less than or equal to 21. If this is the case, it is possible to proceed with the desynchronization.
  • the first step of the reverse phase (resynchronization) (block 19) consists in reading the previously stored grouped combination numbers.
  • An advantage of this solution lies in the two-byte or three-by-three compaction of the one-byte combination numbers, until the 256 values for eight-bit coding are used.
  • Another advantage of this solution is that it makes it possible to obtain high processing speeds and thus to save processor resources.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Le procédé selon l'invention s'applique à la réduction de taille des données brutes ou déjà compressées d'un fichier numérique provenant d'une source audio et/ou vidéo. Il comprend une séquence opératoire comportant une étape de désynchronisation des critères originaux de lecture du fichier, cette étape comprenant la compression et le compactage de données conservées et une étape de resynchronisation du fichier désynchronisé permettant sa visualisation et/ou son écoute selon ses critères de résolution et de durée d'origine.

Description

PROCEDE DE COMPRESSION D ' UN FICHIER NUMERIQUE AUDIO , IMAGE OU VIDEO PAR DESYNCHRONISATION
La présente invention concerne un procédé de réduction de la taille des données brutes ou déjà compressées d'un fichier numérique tel que, par exemple, un fichier audio (caractérisé par sa durée), vidéo (caractérisé par sa durée et sa résolution) et image (caractérisé par sa résolution).
Elle s'applique notamment, mais non exclusivement, à l'optimisation de la compression des données des encodeurs et décodeurs logiciels ou matériels existants ou à venir ainsi qu'à l'optimisation des supports de stockage de données numériques temporisées ou non.
Elle peut notamment s'adapter à tout matériel recevant déjà les données numériques compactées par les systèmes connus de compression ou à tout matériel s'apprêtant à diffuser des fichiers numériques audio ou vidéo, selon un codage connu ou à venir.
D'une manière générale, on sait que les médias temporises vidéo dépendent du temps, leur restitution imposant des actions élémentaires de présentation régulées par des quanta de temps. Ces médias temporises dépendent de leur durée, exprimée pour l'audio par un nombre fixe d'échantillons par seconde et pour la vidéo par un nombre d'images par seconde. La «durée d'affichage» de chaque échantillon, établi sur une seconde, détermine la durée du fichier audio et sa qualité. La combinaison du nombre total d'images ("length") et du nombre d'images, par seconde ("frame rate") génère la durée d'affichage de chaque image de la vidéo et par conséquent la durée totale de la vidéo et par delà le volume total d'informations à compacter.
C'est pourquoi le codage d'un fichier numérique dit temporisé obéit aussi à la règle de la durée, dans la mesure où le taux de bit "bit rate" caractérisant la qualité de l'encodage est exprimé en byte par seconde ou en kilo bit par seconde. Ainsi, un fichier audio d'une durée de 60 secondes, encodé à 128 Kbps, pèsera toujours 960 Ko quelles que soient la qualité de la source et la richesse de ses informations. Même les méthodes de compression utilisant des algorithmes reposant sur la variation du taux de bit "bit rate" ("variable bit rate") sont exprimées en byte par seconde.
L'invention a plus particulièrement pour but de résoudre les problèmes posés par une optimisation accrue du taux de compression des fichiers numériques, déjà compressés ou non, sans dégradation supplémentaire perceptible de qualité.
A cet effet, elle propose un procédé de réduction de la taille des données brutes ou déjà compressées d'un fichier numérique provenant d'une source audio et/ou vidéo comportant les étapes suivantes :
- une étape de désynchronisation des critères originaux de lecture du fichier comportant la compression et le compactage de données conservées, et - une étape de resynchronisation du fichier désynchronisé permettant sa visualisation et/ou son écoute selon ses critères de résolution et de durée d'origine. Dans le cas où le procédé selon l'invention concerne un fichier numérique temporisé, il pourra comprendre plus précisément les étapes suivantes :
- la dérégulation des quanta de temps du fichier selon un coefficient de dérégulation prédéterminé de manière à raccourcir la durée du fichier et le nombre d'informations à traiter,
- l'enregistrement du fichier dérégulé (accéléré),
- la restitution du fichier conformément à un processus comprenant :
• la détection du coefficient de dérégulation, « la restitution des quanta d'origine en multipliant la durée du fichier traité par l'inverse du coefficient de régulation,
• l'établissement des valeurs numériques restituées sur une échelle appropriée avec un pas correspondant au coefficient de dérégulation de manière à obtenir un fichier traité présentant des codes (colorimétrique ou auditif) conformes à ceux de la source.
Ainsi, dans le cas d'un fichier vidéo, la susdite dérégulation est obtenue :
- soit en modifiant la valeur du quanta qui sépare chaque image dans l'entête du fichier non compressé,
- soit en copiant dans le même espace temporel chaque image vidéo selon le coefficient de dérégulation,
- soit en concentrant une série d'images.
Par contre, dans le cas d'un fichier audio, la dérégulation s'effectue en modifiant le pas ("pitch") et/ou en concentrant les échantillons et/ou en supprimant des échantillons selon un taux de suppression fixe ou variable.
Dans tous les cas, le procédé permet d'obtenir une restitution du fichier allégé dans ses quanta de temps originels, de manière à permettre une exécution correcte, sans dégradation complémentaire perceptible de qualité. En réduisant la longueur de la chaîne de caractères, il favorise un accroissement du taux de redondances temporelles et spatiales.
En effectuant une désynchronisation des critères fondamentaux de lecture d'un fichier image non compressé il établit, par couche de couleurs et par bloc de 64 valeurs, un principe de suppression variable des valeurs en fonction de la linéarité des informations par ligne ou par colonne et/ou en fonction de leur proximité.
La désynchronisation des critères originaux de résolution selon ce processus permet alors de réduire, selon les caractéristiques des valeurs des blocs, la taille d'un bloc jusqu'à 32 fois sa résolution d'origine.
Par ailleurs, la désynchronisation des critères originaux de lecture par suppression ou par concentration adaptative des données permet de réduire la durée des médias temporises audio et vidéo, entraînant une réduction importante du nombre d'informations à coder et nécessitant de ce fait une moindre consommation de bits. Ainsi, la taille d'un fichier "MPEG 1 layer 3", dont les critères originaux de lecture ont été dérégulés par 3, est trois fois moins importante pour une qualité équivalente qu'un fichier non traité par le procédé selon l'invention.
La désynchronisation par concentration d'un nombre déterminé «N de données» par moyenne simple ou par moyenne pondérée permet à la fois de réduire la chaîne totale de caractères à coder et pour la vidéo de réduire le nombre de combinaisons de couleurs, créant par conséquence un taux supplémentaire de données redondantes temporelles ou spatiales. Le procédé selon l'invention permet donc aux algorithmes connus de livrer des ratios de compression plus élevés, car il offre un fichier dont les données numériques sont susceptibles d'une meilleure optimisation.
Comme précédemment mentionné, le procédé selon l'invention s'adapte à tout fichier numérique temporisé audio et/ou vidéo dont les données sont déjà compressées ou brutes. Dans ce cas, il agit :
- Soit en tant que mécanisme de réduction de la taille des données numériques audio et vidéo optimisant les facteurs de compression des systèmes d'encodage connus. Le procédé modifie alors la source non compressée sur laquelle le système va agir. Le procédé se comporte alors comme un module de prétraitement d'une source destinée à être encodée par des systèmes de compression dont le procédé permet à certaines fonctions d'être plus optimales.
- Soit en qualité de complément de réduction de taille de fichier numérique audio déjà encodé. Alors, il modifie le fichier compressé. Il se comporte comme un module de post compression et se définit comme un outil de surcompression destiné à réduire la taille d'un fichier numérique déjà compressé.
Bien entendu, le procédé selon l'invention peut s'adapter à tout fichier numérique non temporisé dont les données ne sont pas compressées et qui est destiné à être réduit par un format propriétaire.
Il prévoit un lecteur audiovisuel adapté, permettant la restitution du fichier image, audio et vidéo selon ses critères d'origine de résolution et de durée.
Vis-à-vis des méthodes traditionnelles de réduction de taille des fichiers, le procédé selon l'invention présente plus précisément les avantages suivants : On rappelle tout d'abord que tout fichier image est défini par une résolution fixe représentée par sa hauteur et par sa largeur et dont le rapport exprime par couche de couleurs le nombre de données numériques totales à traiter. La réduction du volume d'informations à traiter par la réduction de la résolution de l'image est généralement fixe et proportionnelle à la résolution d'origine. D'autre part, les systèmes connus de réduction variable des données ne traitent que les valeurs redondantes successives.
Le procédé selon l'invention propose, au contraire, de réduire, par couche de couleurs, le volume total d'informations condensables par une réduction variable des données de l'image et ce, sans respect de l'homothétie de l'image. En second lieu, il s'attache en priorité à réduire les suites de données différentes puis, éventuellement, à compacter les suites de données redondantes. Il s'applique aussi bien aux images fixes qu'aux images animées.
Un mode de mise en œuvre du procédé selon l'invention sera décrit ci-après, à titre d'exemple non limitatif, avec référence aux dessins annexés dans lesquels :
La figure 1 est une représentation schématique montrant les étapes de la désynchronisation du fichier audio, image ou vidéo ;
La figure 2 est une représentation schématique montrant les étapes de la resynchronisation du fichier audio, image ou vidéo ;
La figure 3 illustre un mode de désynchronisation et de resynchronisation d'un bloc de données image.
Tel qu'illustré figure 1, le processus de désynchronisation d'un fichier audio, image ou vidéo comprend les étapes suivantes : Une première étape d'ouverture du fichier : on distingue si le fichier est un fichier audio, image et/ou vidéo non compressé ou s'il s'agit d'un fichier audio et vidéo compressé déjà par un système existant, par exemple de type Mpeg audio ou Mpeg vidéo (bloc 1).
Une seconde étape qui représente les deux méthodes de réduction de la taille du fichier audio et/ou vidéo par désynchronisation de leurs critères originels de lecture (bloc 2).
En fonction de la vitesse de traitement souhaitée, des ressources du support permettant le traitement, du niveau de qualité de restitution exigée et de la complexité des composantes de couleurs de toute ou en partie du fichier vidéo et/ou des niveaux de variations entre les différents canaux caractérisant le fichier audio, deux méthodes de désynchronisation des critères originels de lecture sont utilisées : la désynchronisation par suppression variable des valeurs des données numériques audio et vidéo (bloc 3) et la désynchronisation par concentration adaptative des valeurs des données audio et/ou vidéo (bloc 4).
On peut appliquer chacune de ces deux méthodes à l'ensemble des valeurs des données numériques du fichier audio et/ou vidéo considéré ou appliquer conjointement ces deux méthodes à tout ou partie du fichier audio et/ou vidéo dont on veut réduire la résolution et par conséquent la taille.
1) La méthode de désynchronisation par suppression variable des valeurs des données numériques audio, image et/ou vidéo (bloc 3).
La désynchronisation des critères originels de lecture des données audio et/ou vidéo par suppression des valeurs des données numériques (bloc 3) consiste à supprimer un nombre «N de données» selon un coefficient variable servant à la réduction de la durée originelle du fichier et à la restitution dudit nombre «N de données» lors de l'écoute du fichier audio ou de la visualisation du fichier image et/ou vidéo.
On entend par nombre «N de données» le nombre d'échantillons audio supprimés, le nombre d'images supprimées ou le nombre de groupes d'images supprimés dans une vidéo ou encore le nombre de valeurs numériques différentes supprimées dans une image ou dans une suite d'images.
Lors de la phase de restitution, on entend par nombre «N-l de données» le nombre d'échantillons audio à restituer, le nombre d'images à restituer ou le nombre de groupes d'images à restituer dans une vidéo ou encore le nombre de valeurs numériques différentes à restituer dans une image, afin de rétablir le fichier audio, image et/ou vidéo dans ses critères originels de restitution.
Le coefficient de suppression C8 des «N données» figure dans l'entête du fichier ou en entête du groupe d'échantillons, du groupe d'images et/ou du groupe de valeurs numériques dont il indique le nombre de données à adjoindre à la restitution. Ce coefficient sert au paramétrage de la formule d'adjonction des informations manquantes, indispensable au rétablissement du fichier dans ses critères originels de lecture. La restitution d'un groupe de données s'effectue selon le processus suivant :
Soit un groupe de données à restituer V1, V2, V3 ... Vn.
On détermine un coefficient IR de restitution des informations manquantes selon la formule
A partir de la valeur IR précédemment calculée, on reconstitue ensuite les données manquantes V2 à Vn - 1 selon la formule itérative suivante
V2 = V1 - IR V3 = V2 - IR
Vn - 2 = Vn - 3 - IR Vn - l = Vn + IR
La désynchronisation des critères originels de lecture s'applique à tout fichier audio et/ou vidéo compressé par des standards de compression existants, à toute ou en partie de fichier audio, image et/ou vidéo non compressé destiné à être réduit par un format de compression propriétaire et caractérisé par de faibles amplitudes, à tout ou partie de fichier image dont les valeurs ou les groupes de valeurs se caractérisent par des valeurs proches et linéaires, et à tout ou partie de fichiers vidéo dont les changements de plans sont peu fréquents.
2) La méthode de désynchronisation des critères de lecture par concentration adaptative des valeurs des données numériques (bloc 4).
La désynchronisation des critères originels de lecture par concentration adaptative des données audio et/ou vidéo (bloc 4) consiste à concentrer selon un coefficient fixe un nombre «N d'échantillons» audio, un nombre «N d'images» ou un nombre «N de groupe d'images» d'une vidéo et enfin à concentrer selon un coefficient fixe ou variable un nombre «N de valeurs numériques» d'une image.
Le coefficient fixe figure dans l'entête du fichier, alors que le coefficient variable figure dans l'entête du groupe de valeurs concentrées dont il indique le nombre de données à recomposer lors de la phase de restitution. La désynchronisation par concentration adaptative des valeurs des données numériques de tout ou partie d'un fichier audio, image et/ou vidéo est réalisée à l'aide de deux types de concentration de données : une concentration par moyenne simple et une concentration par moyenne pondérée adaptative.
La concentration du nombre «N de données» par moyenne simple s'applique à tout ou partie des valeurs des données numériques de tout ou partie d'un fichier audio, image et/ou vidéo, caractérisé par des amplitudes moyennes ou par des scènes de faibles mouvements. Seule la valeur concentrée représentant «N données» étant conservée, le nombre des échantillons du fichier audio, le nombre d'images ou le nombre du groupe d'images du fichier vidéo et/ou le nombre de valeurs ou le nombre de groupes de valeurs du fichier image a été réduit par le ou par les coefficients de concentration des données.
La formule de la moyenne simple M8 est la suivante :
N ∑ x(n)
M - n = l
S N
formule dans laquelle x(n) représente la première valeur traitée
La concentration des «N données» par moyenne pondérée adaptative sert à tout ou partie au fichier audio comportant de grandes amplitudes et à tout ou partie de fichiers vidéo caractérisés par de nombreux changements de plans et/ou de scènes de mouvements.
On entend par moyenne pondérée adaptative, la concentration de «N données» pondérées en référence à une valeur précise dont la position peut varier dans le groupe de valeurs concentrées. La formule de concentration par moyenne MP pondérée est la suivante :
formule dans laquelle a(n) représente le coefficient de la valeur traitée x(n)
Les blocs 5, 6 et 7 décrivent les trois possibilités de sauvegarde de tout fichier audio, image et/ou vidéo désynchronisé, selon qu'il s'agit d'un fichier déjà compressé par un système existant (bloc 5), d'un fichier non compressé désynchronisé par le procédé et compressé par un système existant (bloc 6) et d'un fichier non compressé, désynchronisé par le procédé et compressé par un système propriétaire (bloc 7).
La figure 2 montre les quatre étapes de la resynchronisation d'un fichier audio, image et/ou vidéo désynchronisé par le procédé.
Le bloc 8 représente la phase de l'ouverture du fichier par un lecteur audio, image et/ou vidéo spécifique distinguant s'il s'agit d'un fichier numérique désynchronisé compressé par un système existant ou par un format propriétaire.
Le bloc 9 illustre la phase de resynchronisation par adjonction des échantillons, par adjonction de valeurs, par adjonction d'images et/ou de groupes d'images manquantes afin de restituer le fichier audio, image et/ou vidéo dans ses critères originels de lecture.
La formule appliquée à la phase d'adjonction est réalisée par un lecteur permettant un décodage et une lecture en temps réel du fichier désynchronisé. La formule d'adjonction des informations nécessaires à la resynchronisation dépend du coefficient du nombre «N de données» supprimées lors de la phase de désynchronisation des critères de lecture, mais s'applique indistinctement selon qu'il s'agisse de la suppression variable des données audio et/ou vidéo et/ou de la désynchronisation par concentration adaptative des données audio et/ou vidéo.
Le bloc 10 représente la phase de lecture du fichier audio, image et/ou vidéo rétablit dans ses critères originels de lecture par le lecteur.
Les blocs 11, 12 et 13 caractérisent la phase de fermeture du fichier écouté et/ou visualisé (bloc 11), selon que l'on souhaite conserver le fichier compressé par un standard selon sa durée réduite (bloc 12), conserver le fichier compressé par un format propriétaire selon sa durée réduite (bloc 13) ou sauvegarder le fichier compressé par un standard selon sa résolution originelle (bloc 14).
La figure 3 montre un exemple de désynchronisation et de resynchronisation d'un bloc de données image 15 comprenant 64 valeurs comportant 8 colonnes de 8 valeurs comprises entre 193 et 198.
La première étape de désynchronisation consiste à vérifier que la différence entre le minimum et le maximum des valeurs est inférieure ou égale à 21. Si tel est le cas, il est possible de procéder à la désynchronisation.
Si tel est le cas, on considère la première valeur et la dernière valeur de chaque ligne que l'on stocke dans une table annexe (bloc 16) et on attribue à chaque combinaison distincte un numéro spécifique (bloc 17). La dernière opération consiste à regrouper et à mémoriser les numéros de combinaison deux à deux (bloc 18) afin de pouvoir stocker chaque regroupement de numéro de combinaison sur un seul octet (exemple, la combinaison des numéros 1 et 2 devient 12).
La première étape de la phase inverse (resynchronisation) (bloc 19) consiste à lire les numéros de combinaison regroupés précédemment mémorisés.
On dissocie ces numéros de combinaison (bloc 20) de manière à obtenir les numéros de combinaison correspondant à la première donnée et à la dernière donnée de chaque ligne (bloc 21).
Connaissant le premier et le dernier numéro de chaque ligne ainsi que le nombre de numéros par ligne, on établit la différence entre chacun de ces couples de numéros et on divise le résultat de cette différence par le nombre de numéros cpmpris entre ce couple de numéros pour obtenir l'intervalle (le pas) entre deux numéros consécutifs. On retranche au premier numéro l'intervalle précédemment calculé et on attribue au deuxième numéro la valeur entière de cette différence, on procède de même pour établir la valeur du troisième numéro et ainsi de suite jusqu'au dernier numéro. On obtient ainsi un bloc de données resynchronisées dont les valeurs sont très proches, voire même semblables, aux valeurs d'origine (bloc 22).
On constate que selon ce processus, les frontières (premier et dernier numéro de chaque ligne) sont identiques à celles d'origine et n'entraînent donc pas de dégradation entre les blocs de données.
Un avantage de cette solution réside dans le compactage deux à deux ou trois par trois des numéros de combinaison stockés sur un octet et ce, jusqu'à l'utilisation des 256 valeurs permettant un codage sur huit bits.
Un autre avantage de cette solution consiste en ce qu'elle permet d'obtenir des vitesses de traitement élevées et ainsi d'économiser des ressources processeur.

Claims

REVENDICATIONS
1. Procédé de réduction de la taille des données brutes ou déjà compressées d'un fichier numérique provenant d'une source audio et/ou vidéo, caractérisé en ce qu'il comprend une séquence opératoire comportant les étapes suivantes :
- une étape de désynchronisation des critères originaux de lecture du fichier comportant la compression et le compactage de données conservées, et - une étape de resynchronisation du fichier désynchronisé permettant sa visualisation et/ou son écoute selon ses critères de résolution et de durée d'origine.
2. Procédé selon la revendication 1, caractérisé en ce qu'il comprend :
- la dérégulation des quanta de temps du fichier selon un coefficient de dérégulation prédéterminé de manière à raccourcir la durée du fichier et le nombre d'informations à traiter, - l'enregistrement du fichier dérégulé (accéléré),
- la restitution du fichier conformément à un processus comprenant :
• la détection du coefficient de dérégulation,
• la restitution des quanta d'origine en multipliant la durée du fichier traité par l'inverse du coefficient de régulation, • l'établissement des valeurs numériques restituées sur une échelle appropriée avec un pas correspondant au coefficient de dérégulation de manière à obtenir un fichier traité présentant des codes (colorimétrique ou auditif) conformes à ceux de la source.
3. Procédé selon la revendication 2, caractérisé en ce que dans le cas d'un fichier vidéo, la dérégulation s'effectue : - soit en modifiant la valeur du quanta qui sépare chaque image dans l'entête du fichier non compressé,
- soit en copiant dans le même espace temporel chaque image vidéo selon le coefficient de dérégulation.
4. Procédé selon la revendication 2, caractérisé en ce que dans le cas d'un fichier audio, la dérégulation s'effectue en modifiant le "pitch".
5. Procédé selon la revendication 3, caractérisé en ce qu'il comprend la réduction par couche de couleurs du volume total d'informations condensables par une réduction variable des données de l'image et ce, sans respect de l'homothétie de l'image, la réduction des suites de données différentes puis le compactage éventuel des suites de données redondantes.
6. Procédé selon la revendication 5, caractérisé en ce que pour la désynchronisation des critères fondamentaux de lecture d'un fichier image non compressé, il comprend l'établissement par couches de couleurs et par bloc de 64 valeurs, la suppression variable des valeurs en fonction de la linéarité des informations par ligne ou par colonne et/ou en fonction de leur proximité.
7. Procédé selon la revendication 6, caractérisé en ce que la désynchronisation des caractères originaux comprend la réduction de la taille des blocs jusqu'à 32 fois leur résolution d'origine selon les caractéristiques des valeurs de ces blocs.
8. Procédé selon l'une des revendications précédentes, caractérisé en ce que la désynchronisation des critères originaux de lecture s'effectue par suppression ou par concentration adaptative des données de manière à réduire la durée des médias temporises.
9. Procédé selon l'une des revendications précédentes, caractérisé en ce qu'il comprend une désynchronisation par concentration de «N données» par moyenne simple ou par moyenne pondérée de manière à réduire la chaîne totale de caractères à coder et, pour la vidéo, de réduire le nombre de combinaisons de couleurs en créant, par conséquence, un taux supplémentaire de données redondantes temporelles ou spatiales.
10. Procédé selon l'une des revendications précédentes, caractérisé en ce qu'il est utilisé en tant que module de prétraitement d'une source destinée à être encodée par des systèmes de compression.
11. Procédé selon l'une des revendications 1 à 9, caractérisé en ce qu'il est utilisé en tant que module de post compression de manière à réduire la taille d'un fichier numérique déjà compressé.
12. Procédé selon la revendication 8, caractérisé en ce qu'il comprend la suppression de «N données» selon un coefficient de suppression variable figurant dans l'entête du fichier, d'un groupe d'échantillons, d'un groupe d'images et/ou d'un groupe de valeurs numériques dont il indique le nombre de données à adjoindre à la restitution, ce coefficient servant au paramétrage d'une formule d'adjonction des informations manquantes servant au rétablissement du fichier dans ses critères originels de lecture.
13. Procédé selon la revendication 9, caractérisé en ce que la désynchronisation consiste à concentrer selon un coefficient fixe «N échantillons» audio, «N nombre d'images» ou «N groupe d'images» vidéo et à concentrer selon un coefficient fixe ou variable «N valeurs numériques» d'une image, le coefficient fixe figurant dans l'entête du fichier alors que le coefficient variable figure dans l'entête du groupe de valeurs concentrées dont il indique le nombre de données à recomposer lors de la phase de restitution.
EP04767775A 2004-07-23 2004-07-23 Procede de reduction de la taille des donnees d'un fichier numerique audio, image ou video par desynchronisation des criteres originels de lecture. Ceased EP1779664A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
EP08017099A EP2037686A3 (fr) 2004-07-23 2004-07-23 Procédé de compression d'un fichier numérique audio, image ou vidéo par désynchronisation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FR2004/001986 WO2006021626A1 (fr) 2004-07-23 2004-07-23 Procede de compression d’un fichier numerique audio, image ou video par desynchronisation

Related Child Applications (1)

Application Number Title Priority Date Filing Date
EP08017099A Division EP2037686A3 (fr) 2004-07-23 2004-07-23 Procédé de compression d'un fichier numérique audio, image ou vidéo par désynchronisation

Publications (1)

Publication Number Publication Date
EP1779664A1 true EP1779664A1 (fr) 2007-05-02

Family

ID=34958859

Family Applications (2)

Application Number Title Priority Date Filing Date
EP08017099A Withdrawn EP2037686A3 (fr) 2004-07-23 2004-07-23 Procédé de compression d'un fichier numérique audio, image ou vidéo par désynchronisation
EP04767775A Ceased EP1779664A1 (fr) 2004-07-23 2004-07-23 Procede de reduction de la taille des donnees d'un fichier numerique audio, image ou video par desynchronisation des criteres originels de lecture.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
EP08017099A Withdrawn EP2037686A3 (fr) 2004-07-23 2004-07-23 Procédé de compression d'un fichier numérique audio, image ou vidéo par désynchronisation

Country Status (5)

Country Link
US (1) US20080317135A1 (fr)
EP (2) EP2037686A3 (fr)
JP (1) JP4772046B2 (fr)
CA (1) CA2574755A1 (fr)
WO (1) WO2006021626A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110809092A (zh) * 2019-10-11 2020-02-18 中国电子科技集团公司第三十研究所 一种基于cvsd编码特征的语音失步检测方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL8801513A (nl) * 1988-06-14 1990-01-02 Philips Nv Inrichting voor het opnemen of weergeven van een elektrisch signaal op/van een magnetische registratiedrager.
EP0510182B1 (fr) * 1990-11-14 1996-10-23 Eastman Kodak Company Mise a l'echelle d'images pour imprimantes thermiques ou analogue
US5831592A (en) * 1993-07-01 1998-11-03 Intel Corporation Scaling image signals using horizontal pre scaling, vertical scaling, and horizontal scaling
DE69418942T2 (de) * 1993-08-13 1999-12-09 Nec Corp Gerät zur Komprimierung und Wiedergabe von Video/Audio-Daten
JPH08251420A (ja) * 1995-03-14 1996-09-27 Fuji Xerox Co Ltd カラー画像処理装置
JP3806453B2 (ja) * 1995-08-29 2006-08-09 三洋電機株式会社 音声信号時間軸圧縮装置及び音声信号時間軸伸長装置並びに該装置を用いた音声符号・復号化装置
JP2772518B2 (ja) * 1996-04-22 1998-07-02 三菱電機株式会社 ディジタル信号符号化・復号化装置、ディジタル信号符号化装置、ディジタル信号復号化装置
JP3873332B2 (ja) * 1996-09-13 2007-01-24 ソニー株式会社 画像記録再生装置
CN1266519A (zh) * 1998-04-29 2000-09-13 皇家菲利浦电子有限公司 图像嵌入
JP2000049620A (ja) * 1998-07-31 2000-02-18 Matsushita Electric Ind Co Ltd 音声圧縮伸長装置およびその方法
US6323412B1 (en) * 2000-08-03 2001-11-27 Mediadome, Inc. Method and apparatus for real time tempo detection
WO2003023698A1 (fr) * 2001-09-12 2003-03-20 Idetic, Inc. Transformation visant l'augmentation de la compressibilite d'images avec un minimum de distorsion visuelle reposant sur des methodes lempel-ziv
US8103104B2 (en) * 2002-01-11 2012-01-24 Hewlett-Packard Development Company, L.P. Text extraction and its application to compound document image compression
US6870542B2 (en) * 2002-06-28 2005-03-22 Nvidia Corporation System and method for filtering graphics data on scanout to a monitor

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
See also references of WO2006021626A1 *
TZOU K.-H.: "Progressive image transmission: a review and comparison of techniques", OPTICAL ENGINEERING, vol. 26, no. 7, July 1987 (1987-07-01), USA, pages 581 - 589, XP002065700 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110809092A (zh) * 2019-10-11 2020-02-18 中国电子科技集团公司第三十研究所 一种基于cvsd编码特征的语音失步检测方法
CN110809092B (zh) * 2019-10-11 2021-02-12 中国电子科技集团公司第三十研究所 一种基于cvsd编码特征的语音失步检测方法

Also Published As

Publication number Publication date
US20080317135A1 (en) 2008-12-25
CA2574755A1 (fr) 2006-03-02
JP2008507872A (ja) 2008-03-13
WO2006021626A1 (fr) 2006-03-02
JP4772046B2 (ja) 2011-09-14
EP2037686A2 (fr) 2009-03-18
EP2037686A3 (fr) 2010-09-22

Similar Documents

Publication Publication Date Title
US11557015B2 (en) System and method of data transfer in-band in video via optically encoded images
KR100579387B1 (ko) 디지털 정보의 효율적인 전송 및 재생
US7613264B2 (en) Flexible sampling-rate encoder
US6363413B2 (en) Method and apparatus for increasing the effective bandwidth of video sequences transmitted over a network by using cached data
JP4972131B2 (ja) 画像データ変換装置および逆変換装置
US20020076194A1 (en) Methods of recording/reproducing moving image data and the devices using the methods
JP2000165644A (ja) 画像処理装置および画像処理方法、提供媒体、並びに画像処理システム
EP0668004B1 (fr) Procede et dispositif de reduction de debit pour l'enregistrement d'images sur magnetoscope
FR2702914A1 (fr) Dispositif de codage de suites d'images constituées d'images de nature film et d'images de nature vidéo, et dispositif de décodage correspondant.
US8184660B2 (en) Transparent methods for altering the video decoder frame-rate in a fixed-frame-rate audio-video multiplex structure
WO2006021626A1 (fr) Procede de compression d’un fichier numerique audio, image ou video par desynchronisation
WO2017055771A1 (fr) Procédé d'encodage de flux de données vidéo basées sur des groupements d'images (gop)
EP1590959B1 (fr) Dispositif securise pour la diffusion, l ' enregistrement et la visualisation a la demande des oeuvres audiovisuelles au format de type mpeg-2 ts
CN1288906C (zh) 低速重放数字广播节目的方法
US20090257484A1 (en) Method for audio-video encoding and apparatus for multimedia storage
WO2017129880A1 (fr) Procédé de codage et décodage de données, dispositif de codage et décodage de données et programmes d'ordinateur correspondants
FR2782878A1 (fr) Systeme de compression et de decompression de signaux video numeriques
EP3939304A1 (fr) Procédés et dispositifs de codage et de décodage d'une séquence vidéo multi-vues
EP1383336B1 (fr) Procédé de décompression et de restitution d'un flux de données multimédia numériques compressées comprenant une pluralité d'entités encodées. Dispositif, système et signal correspondants
FR2769452A1 (fr) Procede de synchronisation spatiale d'une image video codee numeriquement et/ou d'identification de la syntaxe d'une sequence video
WO2022175419A1 (fr) Procédé de fourniture d'un contenu comportant au moins une image, format de fichier
KR100585673B1 (ko) 연속된 정지영상의 저장 방법 및 재생 장치
WO2006106356A1 (fr) Codage et decodage de signaux
WO2006030077A1 (fr) Procede et programme d'ordinateur de marquage de donnees a coder, codeur associe, procede et programme d'ordinateur de detection de marquage et decodeur associe
WO2006075002A1 (fr) Procede et dispositif de quantification progressive

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20070223

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LI LU MC NL PL PT RO SE SI SK TR

17Q First examination report despatched

Effective date: 20070606

DAX Request for extension of the european patent (deleted)
RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: V (6N)

RIN1 Information on inventor provided before grant (corrected)

Inventor name: LOISEAU, PASCALE

APAF Appeal reference modified

Free format text: ORIGINAL CODE: EPIDOSCREFNE

APAX Date of receipt of notice of appeal deleted

Free format text: ORIGINAL CODE: EPIDOSDNOA2E

APBK Appeal reference recorded

Free format text: ORIGINAL CODE: EPIDOSNREFNE

APBN Date of receipt of notice of appeal recorded

Free format text: ORIGINAL CODE: EPIDOSNNOA2E

APAF Appeal reference modified

Free format text: ORIGINAL CODE: EPIDOSCREFNE

APAX Date of receipt of notice of appeal deleted

Free format text: ORIGINAL CODE: EPIDOSDNOA2E

APBK Appeal reference recorded

Free format text: ORIGINAL CODE: EPIDOSNREFNE

APBN Date of receipt of notice of appeal recorded

Free format text: ORIGINAL CODE: EPIDOSNNOA2E

APBK Appeal reference recorded

Free format text: ORIGINAL CODE: EPIDOSNREFNE

APBN Date of receipt of notice of appeal recorded

Free format text: ORIGINAL CODE: EPIDOSNNOA2E

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: I-CES

APBR Date of receipt of statement of grounds of appeal recorded

Free format text: ORIGINAL CODE: EPIDOSNNOA3E

APAF Appeal reference modified

Free format text: ORIGINAL CODE: EPIDOSCREFNE

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: I-CES (INNOVATIVE COMPRESSION ENGINEERING SOLUTION

REG Reference to a national code

Ref country code: DE

Ref legal event code: R003

APBT Appeal procedure closed

Free format text: ORIGINAL CODE: EPIDOSNNOA9E

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION HAS BEEN REFUSED

18R Application refused

Effective date: 20120807