WO2003081908A2 - Stockage de donnees numeriques sur camescope dv et compatibles - Google Patents

Stockage de donnees numeriques sur camescope dv et compatibles Download PDF

Info

Publication number
WO2003081908A2
WO2003081908A2 PCT/CH2003/000168 CH0300168W WO03081908A2 WO 2003081908 A2 WO2003081908 A2 WO 2003081908A2 CH 0300168 W CH0300168 W CH 0300168W WO 03081908 A2 WO03081908 A2 WO 03081908A2
Authority
WO
WIPO (PCT)
Prior art keywords
data
video
frames
fields
file
Prior art date
Application number
PCT/CH2003/000168
Other languages
English (en)
Other versions
WO2003081908A3 (fr
Inventor
Michel Roujansky
Original Assignee
Michel Roujansky
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Michel Roujansky filed Critical Michel Roujansky
Priority to AU2003208241A priority Critical patent/AU2003208241A1/en
Publication of WO2003081908A2 publication Critical patent/WO2003081908A2/fr
Publication of WO2003081908A3 publication Critical patent/WO2003081908A3/fr

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B20/1201Formatting, e.g. arrangement of data block or words on the record carriers on tapes
    • G11B20/1207Formatting, e.g. arrangement of data block or words on the record carriers on tapes with transverse tracks only
    • G11B20/1209Formatting, e.g. arrangement of data block or words on the record carriers on tapes with transverse tracks only for discontinuous data, e.g. digital information signals, computer programme data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0682Tape device
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1833Error detection or correction; Testing, e.g. of drop-outs by adding special lists or symbols to the coded information

Definitions

  • the present invention is a method of inserting and extracting digital data in the video and audio fields of DV (Digital Video, IEC61834) video frames, allowing the transmission, recording, storage and reproduction of said data by digital video camcorders and video recorders based on the DV standard or equivalent, and making it possible to use these systems in DV format or equivalent as means of mass storage of digital data on removable media of magnetic tape type (recording of data on a DV cassette) as well as the transmission and recording of said data between transmitting, receiving and television recording devices based on the DV standard.
  • DV Digital Video
  • Camcorders and VCRs in DV format record “compressed video” data streams on magnetic tape which they can write and reproduce by high-speed digital interfaces of the IEEE 1394 type (also known as Firewire T M Apple Computers, Inc, and iLink T M Sony Corporation) (or future equivalent interfaces likely USB-2 in the future). In the current state of the art, they do not make it possible to record data other than “compressed video” streams.
  • IEEE 1394 type also known as Firewire T M Apple Computers, Inc, and iLink T M Sony Corporation
  • the method describes: • which specific fields of a video frame in DV format should be used to insert general digital data, and • the specific use of EOD (End Of Data) flags in video frames so that the data inserted do not interfere with the recording and playback mechanisms, • the audio parameters to be used so that the data can be inserted into the audio fields of these video frames, in order to allow their transmission, recording, storage and playback by camcorders and VCRs based on the DV format and formats using the same or similar encoding techniques, such as DVCAM (T M Sony Corporation), DVPRO (T M Panasonic, Inc), Digital ⁇ (T M Sony Corporation), as well as the transmission and recording of said data between transmitting, receiving and television recording devices based on the DV standard.
  • EOD End Of Data
  • the invention is applicable to any media transmission or storage system, which uses an intra-frame compression technique based on the transformation from the spatial domain to the frequency domain (such as the discrete cosine transform - DCT- or the Fourrier transform fast - FFT), with RLE encoding of the transform, and where the basic technology allows the storage of random values beyond the end of the EOD flag in the RLE encoded field (which is the DV format box).
  • an intra-frame compression technique based on the transformation from the spatial domain to the frequency domain (such as the discrete cosine transform - DCT- or the Fourrier transform fast - FFT), with RLE encoding of the transform, and where the basic technology allows the storage of random values beyond the end of the EOD flag in the RLE encoded field (which is the DV format box).
  • a DV format camcorder or VCR records 25 [NTSC: 30] frames per second.
  • Each video frame (image) in DV format includes 12 [NTSC: 10] DIF (Data In Frame) sequences, themselves composed of 150 blocks of 80 bytes: 135 macro compressed VIDEO blocks, 9 audio blocks, and 6 control blocks (1 header block, 2 SUBCODE blocks, 3 VAUX blocks).
  • Each VIDEO macro block has 4 luminance fields (Y1, Y2, Y3, Y4) of 14 bytes each corresponding to the 4 pixel blocks constituting the macro block, and 2 chrominance fields (Cr and Cb) of 12 bytes each giving the components red and blue applicable to the complete macro block.
  • These fields contain the coefficients DC (on 10 bits) and AC (on the remainder of the field) resulting from the discrete transformation in cosine of the original values of luminance and chrominance of blocks of pixels of the image, followed by the RLE encoding of AC values.
  • an overflow mechanism makes it possible to store the excess bits in other blocks of the same macro block, or in groupings of 5 macro blocks called video segment.
  • This format is strictly the same for PAL and NTSC, although the correspondence between blocks and pixels is fundamentally different between the two systems.
  • Each AUDIO block has an 8 byte header, followed by 72 bytes which can contain different audio formats (12/16 bit, 2 or 4 channel coding, sampling frequency 32, 44.1 or 48KHz), depending on the values present in the block headers ("packs").
  • the method object of this invention consists in using the following fields classified in 3 types, known as “useful fields” for the storage of data:
  • Type 1 VIDEO macro blocks Yl, Y2, Y3, Y4 fields: bytes 2-13, or 12 bytes, Cb field and
  • VIDEO macro blocks Yl, Y2, Y3, Y4, Cb and Cr fields: byte 0, i.e. 1 byte, in total: 6 bytes per VIDEO macro block. It is the least significant byte of the 10-bit field of the DC coefficient. All of these 10 bits are available, but in practice, only one full byte will be used to optimize the processing.
  • the AAUX Source control packs should be forced to specify "no use of audio field". In this case, the data inserted is processed transparently by all of the devices.
  • Figure 1 global view of the mechanisms implemented for the storage and the restitution of data on a DV compatible recorder (camcorder or video recorder).
  • Figure 2 structure of a DV frame and position of the fields used.
  • Figures 3 and 4 details of the use of type 1, 2 and 3 fields as well as AAUX control pack format Audio source to be used.
  • Figure 5 example of sequential loading of data in a frame.
  • the storage of complete data files (“loading”) is carried out on the necessary number of consecutive images (frames), constituting a “loaded sequence”.
  • the loading can be carried out in frames generated by a frame generator or in a real video sequence resulting from a video capture, which will then be called “carrier video sequence”.
  • An optimal source for a loaded sequence is AVI (Audio Video Interleaved) video file of Type 1, in fcc format ("four character code”) type "iavs", handler "dvsd”, ie a capture stream at DV audio and video interlaced format.
  • the useful loading / unloading rate is 3,029 Megabytes per second, representing a nominal storage capacity of 10.9 Gigabytes on a mini cassette with a standard duration of one hour. If they are suitable, the data can be compressed before loading. They must be decompressed after unloading.
  • FIG. 1 shows the general registration procedures.
  • the storage of complete data files (1) (“loading”) is carried out on the necessary number of consecutive images (frames), constituting a “loaded sequence”.
  • the loading can be carried out in frames generated by a frame generator (2) or in a real video sequence (3) resulting from a video capture, which will then be called "carrier video sequence”.
  • Data insertion / extraction can be carried out on the fly with direct recording / playback on the recording / playback device or in two stages with intermediate storage of loaded file (4) before transfer to the recording device (5) by a IEEE1394 interface (6).
  • Figure 6 shows the rest of the recordings on the support.
  • the beginning of the "loaded sequence” is identified by an "initial frame", marked by the insertion of a series of specific values in certain useful fields.
  • the number of values and the values inserted are chosen to make the risk of false identification of the initial frame statistically as low as desired.
  • the initial frame is also loaded with data useful for unloading: name and characteristics of the source file and size of the loaded data, when it is known beforehand. loading. Otherwise, the end of the loaded sequence is signaled by a final frame, also marked, and containing a pointer to the position of the end of the loaded data.
  • a header of several seconds must be recorded before the loaded sequence begins. It is preferable to mark the header so as to make it easily identifiable visually by the user (marking certain macro blocks of specific colors by forcing the values of the DC coefficients of these macro blocks) so that he can launch the video capture before the start of the loaded sequence. It is also recommended to add a visually identifiable end zone so as to complete the capture well after the end of the loaded sequence.
  • the first consists, on any type of computer, of a program or module capable of creating a sequence loaded onto a file, and of extracting data from such a loaded sequence, i.e.
  • the transfer of the loaded sequence to / from the camcorder or video recorder can be carried out by any suitable means (capture program capable of processing type 1 AVI files).
  • the second consists, on any type of computer, of a program or module capable of recording / reading data on the fly on the DV device, ie. who :
  • starts the DV camcorder or VCR in recording mode transfers a header and initial frame to it, opens the data file, opens an AVI file if necessary, reads the data reads or generates the video frames, inserts the data into the frames and sends the frames to the camcorder or VCR until all the data are played, sends an end zone, closes all files, stops the camcorder or VCR.
  • starts the DV camcorder or VCR in playback mode captures the frames up to an initial frame, opens the output data file, captures the frames, extracts the data and writes them to the output file, until that all the data be read, close the output file, stop the camcorder or VCR.
  • T M Microsoft Corporation On a computer running the Microsoft Windows operating system (T M Microsoft Corporation), the second implementation would normally be performed as a specific driver (Windows Device Driver) according to the Windows Driver Model (WDM) architecture, or by specific DirectX filter (T M Microsoft Corporation) DirectShow (T M Microsoft Corporation).
  • WDM Windows Driver Model
  • T M Microsoft Corporation DirectX filter
  • T M Microsoft Corporation DirectShow
  • a cyclic redundancy code can be added to the recorded data in order to check that there is no error in the data read back.
  • the data to be recorded must be transcoded into code words. Due to the transverse writing of the code words (figure 7: a, b, c, d .%) in the frames of a group, it is necessary to fully load an entire group of frames before transferring it to the recording device. Decoding is done by the reverse operation, processing groups of complete frames.
  • the invention described has made it possible to develop commercial computer programs for storing files on DV media.

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

La présente invention est une méthode d'insertion et extraction de données numériques (1) dans les champs vidéo et audio de trames vidéo DV (norme IEC61834), permettant leur enregistrement, stockage et restitution par caméscopes et magnétoscopes numériques à interfaces compatibles DV, et l'utilisation de caméscopes et magnétoscopes (5) grand public au format DV pour stockage de données numériques sur supports amovibles bande magnétique (mini-cassettes DV). Le stockage de fichiers complets de données est réalisé sur le nombre nécessaire d'images (trames) consécutives, constituant une ' séquence chargée '. Le chargement peut être effectué dans des trames générées par un générateur de trame (2) ou dans une vraie séquence vidéo (3) résultant d'une capture vidéo. L'insertion des données peut être effectuée au vol avec enregistrement direct sur le dispositif enregistreur ou en deux étapes avec stockage intermédiaire de fichier chargé (4) avant transfert vers le dispositif enregistreur par un lien IEE1394 (Firewire) (6).

Description

STOCKAGE DE DONNEES NUMERIQUES SUR CAMESCOPE DV ET
COMPATIBLES. Domaine technique
La présente invention est une méthode d'insertion et extraction de données numériques dans les champs vidéo et audio de trames vidéo DV (Digital Video, norme IEC61834), permettant la transmission, enregistrement, stockage et restitution des dites données par caméscopes et magnétoscopes numériques basés sur le standard DV ou équivalents, et rendant possible l'utilisation de ces systèmes au format DV ou équivalents comme moyens de stockage de masse de données numériques sur supports amovibles de type bande magnétique (enregistrement de données sur rnini-cassettes DV) ainsi que la transmission et l'enregistrement des dites données entre dispositifs émetteurs, récepteurs et d'enregistrement télévisuels basés sur le standard DV. Sont concernés entre autres les systèmes de transmission et d'enregistrement télévisuels conformes aux normes suivantes :
• SMPTE-370M Data structure for DV-based Audio, Data and Compressed Video at 100 Mb/s 1080/60i, 1080/50i 720/60p
• 362M-2002 Télévision - Object Data Format for the Exchange of DV-Based Audio, Data and Compressed Video using ATM Co mon Layer over Asynchronous Transfer Mode, AAL Type 1
• 322M-1999 Télévision - Format for Transmission of DV Compressed Video, Audio and Data Over a Sériai Data Transport Interface
• 321 M- 1999 Télévision - Data Stream Format for the Exchange of DV-Based Audio, Data and Compressed Video Over a Sériai Data Transport Interface
• SMPTE 316M-1999 Télévision Digital Recording - 12.65-mm Type D-9 Component Format Video Compression - 525/60 and 625/50 • SMPTE 314M- 1999 Télévision - Data Structure for DV-Based Audio, Data and
Compressed Video - 25 and 50 Mb/s
• SMPTE 306M-2002 Télévision Digital Recording - 6.35-mm Type D-7 Component Format - Video Compression at 25 Mb/s - 525/60 and 625/50
• IETF RFC 3189 RTP Payload Format for DV (IEC 61834) Video
Technique antérieure
Parmi les moyens de stockage de masse de données numériques disponibles actuellement, l'enregistrement sur support amovible de type bande magnétique procure les capacités de stockage les plus élevées et les coûts au caractère stocké les plus bas, mais fait appel à de coûteux lecteurs enregistreurs spécifiques, que ce soit sur supports à formats propriétaires ou sur supports normalisés de type DDS/DAT ou DLT.
Les caméscopes et magnétoscopes au format DV (IEC61834) enregistrent sur bande magnétique des flux de données « vidéo compressée » qu'ils peuvent écrire et restituer par des interfaces numériques à haute vitesse de type IEEE 1394 (connu aussi sous l'appellation Firewire TM Apple Computers, Inc, et iLink TM Sony Corporation) (ou futurs interfaces équivalents probablement USB-2 dans le futur). Dans l'état actuel de la technique, ils ne permettent pas d'enregistrer de données autres que des flux « vidéo compressée ».
Les brevets existant portant sur l'insertion de données dans des flux vidéos couvrent principalement l'insertion de filigrane (PCT/SG98/00039), le marquage non destructif (PCT/CH98/00310), l'insertion occasionnelle de données de faible volume dans un flux MPEG (PCT/IB98/00026) ou encore l'édition et mixage de flux vidéo (PCT/US00/29381). Aucun n'envisage une insertion massive de données, destructrice de la vidéo initiale, ayant pour but la sauvegarde de données.
Exposé de l'invention
La méthode décrit : • quels champs spécifiques d'une trame vidéo au format DV doivent être utilisés pour insérer des données numériques générales, et • l'utilisation spécifique de drapeaux EOD (End Of Data) dans les trames vidéo de sorte que les données insérées n'interfèrent pas avec les mécanismes d'enregistrement et restitution, • les paramètres audio à utiliser afin que les données puissent être insérées dans les champs audio de ces trames vidéo, afin de permettre leur transmission, enregistrement, stockage et restitution par des caméscopes et magnétoscopes basés sur le format DV et des formats utilisant la même techniques d'encodage ou des techniques similaires, tels que DVCAM (TM Sony Corporation), DVPRO (TM Panasonic, Inc), Digitalδ (TM Sony Corporation), ainsi que la transmission et l'enregistrement des dites données entre dispositifs émetteurs, récepteurs et d'enregistrement télévisuels basés sur le standard DV. L'invention est applicable à tout système de transmission ou stockage de média, qui utilise une technique de compression intra-trame basée sur la transformation du domaine spatial au domaine fréquence (telle que la transformée discrète en cosinus - DCT- ou la transformée de Fourrier rapide - FFT), avec encodage RLE de la transformée, et où la technologie de base permet le stockage de valeurs aléatoires au delà de la fin du drapeau EOD dans le champ encodé RLE (ce qui est le case du format DV).
Elle s'applique aux systèmes PAL et NTSC, les formats généraux de trame étant strictement identiques pour les deux formats. La description est faite pour le système PAL, les différences applicables au NTSC étant notées comme suit [NTSC : ].
Un caméscope ou magnétoscope au format DV enregistre 25 [NTSC : 30] images par seconde. Chaque trame (image) vidéo au format DV comporte 12 [NTSC : 10] séquences DIF (Data In Frame), elle-mêmes composées de 150 blocs de 80 octets: 135 macro blocs VIDEO compressée, 9 blocs audio, et 6 blocs de contrôle (1 bloc en-tête, 2 blocs SUBCODE, 3 blocs VAUX).
Chaque macro bloc VIDEO comporte 4 champs de luminance (Y1,Y2,Y3,Y4) de 14 octets chacun correspondant aux 4 blocs de pixels constituant le macro bloc, et 2 champs de chrominance (Cr et Cb) de 12 octets chaque donnant les composantes rouge et bleue applicables au macro bloc complet. Ces champs contiennent les coefficients DC (sur 10 bits) et AC (sur le restant du champ) résultant de la transformation discrète en cosinus des valeurs originales de luminance et chrominance de blocs de pixels de l'image, suivi de l'encodage RLE des valeurs AC. Lorsque la longueur d'un coefficient AC dépasse l'espace disponible pour le stocker, un mécanisme de débordement permet de stocker les bits excédentaires dans d'autre blocs du même macro bloc, ou de groupements de 5 macro blocs appelés segment vidéo. Ce format est strictement le même pour PAL et NTSC, bien que la correspondance entre blocs et pixels soit fondamentalement différente entre les deux systèmes.
Chaque bloc AUDIO comporte un en-tête de 8 octets, suivi de 72 octets pouvant contenir différents formats audio (codage 12/16 bits, 2 ou 4 canaux, fréquence d'échantillonnage 32, 44,1 ou 48KHz), en fonction des valeurs présentes dans les en-têtes de blocs (« packs »).
Il n'est pas possible de placer des données de façon arbitraire dans une trame vidéo, car le dispositif de reproduction traite les données comme s'il s'agissait de vidéo réelle, en particulier en effectuant la décompression vidéo. L'utilisation de champs de la trame vidéo pour y stocker des données aux valeurs aléatoires nécessite donc certaines précautions pour éviter un dysfonctionnement du dispositif d'enregistrement et de reproduction. En particulier, il est nécessaire :
• soit d'utiliser des champs qui, au sein d'une trame vidéo, peuvent admettre n'importe quelle valeur sans entraîner de dysfonctionnement du lecteur enregistreur,
• soit de désactiver le traitement de ces champs, ou partie de ces champs.
• Il est de plus nécessaire de s'assurer que les données écrites seront restituées en parfait synchronisme (respectant leur ordre d'insertion dans la trame).
La méthode objet de cette invention consiste à utiliser les champs suivants classés en 3 types, dit « champs utiles» pour le stockage de données :
• Type 1 Macro blocs VIDEO : champs Yl, Y2, Y3, Y4 : octets 2-13, soit 12 octets, champ Cb et
Cr : octets 2-11, soit 10 octets, au total 4* 12 + 2* 10 = 64 octets par macro bloc VIDEO. Il s'agit des 12 ou des 10 derniers octets du champ AC. On indique spécifiquement au dispositif de restitution de ne pas traiter ces données dans la décompression vidéo en insérant la valeur '0110' , qui est le drapeau EOB (« End Of Block ») dans l'octet 1 (par exemple sur les 4 bits de poids faible de l'octet 1).
• Type 2
Macro blocs VIDEO : champs Yl, Y2, Y3, Y4, Cb et Cr : octet 0, soit 1 octet, au total : 6 octets par macro bloc VIDEO. II s'agit de l'octet de poids faible du champ de 10 bits du coefficient DC. L'ensemble de ces 10 bits est disponible, mais en pratique, on n'utilisera qu'un octet complet pour optimiser les traitements.
1. Type 3 Blocs AUDIO octets 8-79, soit 72 octets par bloc AUDIO
Pour permettre un stockage correct des données, les packs de contrôle AAUX Source doivent être forcés pour spécifier « pas d'utilisation de champ audio ». Dans ce cas, les données insérées sont traitées de façon transparente par l'ensemble des dispositifs. Description sommaire des dessins
2. Figure 1 : vue globale des mécanismes mis en œuvre pour les stockage et la restitution des données sur enregistreur compatible DV (caméscope ou magnétoscope).
3. Figure 2 : structure d'une trame DV et position des champs utilisés.
4. Figures 3 et 4 : détail de l'utilisation des champs de type 1, 2 et 3 ainsi que format de pack de contrôle AAUX Source audio à utiliser.
5. Figure 5 : exemple de chargement séquentiel des données dans une trame.
6. Figure 6 : suite des enregistrements sur le support magnétique.
7. Figure 7 : remplissage de groupes de trame (utilisation d'un code auto correcteur)
Meilleure manière de réaliser l'invention
L'utilisation des champs utiles 1, 2 et 3 décrits ci-dessus est optionnelle, en ce sens que l'utilisation d'un type de champ pour charger des données est uniquement une question d'implémentation.
La séquence (ordre) de remplissage des champs utiles dans une trame est purement une question d'implémentation. Seul importe d'extraire les données dans le même ordre qu'elles ont été insérées. Un exemple de chargement séquentiel comme montré sur la figure 5 :
8. Séquence O, Champs A0, V0, VI, ...V14, Al, V15, ...N134,
9. Séquence 1, Champs A0, V0, VI, ...V14, Al, V15, ...N134,
10. Séquence 11, Champs A0, V0, VI, ...V14, Al, V15, ...N134,
Le stockage de fichiers complets de données (le « chargement ») est réalisé sur le nombre nécessaire d'images ( trames) consécutives, constituant une « séquence chargée ». Le chargement peut être effectué dans des trames générées par un générateur de trame ou dans une vraie séquence vidéo résultant d'une capture vidéo, qui sera alors dite « séquence vidéo porteuse ». Une source optimale pour une séquence chargée est fichier vidéo AVI (Audio Video Interleaved) de Type 1, au format fcc (« four character code ») type « iavs », handler « dvsd « , c'est à dire un flux de capture au format DV audio et vidéo entrelacés.
Lors de l'utilisation d'une séquence vidéo porteuse, le chargement des champs utiles de type 1 a pour résultat de donner un aspect « mosaïque» aux images originales, car les détails de luminosité des blocs et de couleur des macro blocs sont gommés. Il est aussi possible de ne pas utiliser l'ensemble des champs utiles de type 1 en positionant le drapeau « EOF » en position 2, 3 ou même plus loin dans le champ AC. Dans ce cas, l'effet obtenu dans l'image est celui de « neige » du au racourcissement du coefficient AC.
La capacité maximum de chargement d'une trame vidéo est de (135*(64+6) +( 9*72))*12 = 121 176 octets, soit 84,15% de la trame (144 000 octets) [NTSC : (135*(64+6) +( 9*72))*10 = 100 980 octets, soit 84,15% de la trame (120 000 octets)].
Le débit de chargement/déchargement utile, identique en PAL et NTSC, est 3,029 Megaoctets par seconde, représentant une capacité de stockage nominale de 10,9 Gigaoctets sur une mini cassette de durée standard d'une heure. Si elles s'y prêtent, les données peuvent être compressées préalablement à leur chargement. Elles devront être décompressées après déchargement.
La figure 1 montre les modalités générales de l'enregistrement. Le stockage de fichiers complets (1) de données (le « chargement ») est réalisé sur le nombre nécessaire d'images ( trames) consécutives, constituant une « séquence chargée ». Le chargement peut être effectué dans des trames générées par un générateur de trame (2 )ou dans une vraie séquence vidéo (3) résultant d'une capture vidéo, qui sera alors dite « séquence vidéo porteuse ».
L'insertion/extraction des données peut être effectuée au vol avec enregistrement/lecture direct(e) sur le dispositif enregistreur/restitution ou en deux étapes avec stockage intermédiaire de fichier chargé (4) avant transfert vers le dispositif enregistreur (5) par un interface IEEE1394 (6).
La figure 6 montre la suite des enregistrements sur le support. Le repérage du début de la « séquence chargée » se fait par une « trame initiale », marquée par l'insertion d'une série de valeurs spécifiques dans certains champs utiles. Le nombre de valeurs et les valeurs insérées sont choisis pour rendre le risque d'une fausse identification de trame initiale statistiquement aussi faible que souhaité.
La trame initiale est aussi chargée de données utiles au déchargement : nom et caractéristiques du fichier source et taille des données chargées, lorsqu'elle est connue préalablement au début du chargement. Dans le cas contraire, la fin de la séquence chargée est signalée par une trame finale, elle aussi marquée, et contenant un pointeur sur la position de la fin des données chargées.
Pour permettre le démarrage du dispositif d'enregistrement et de restitution et éviter d'utiliser les éventuelles trames perdues dans cette phase, il faut enregistrer un en-tête de plusieurs secondes préalablement au début de la séquence chargée. Il est préférable de marquer l' en-tête de façon à le rendre facilement identifiable visuellement par l'utilisateur (marquage de certains macro blocs de couleurs spécifiques en forçant les valeurs des coefficients DC de ces macro blocs) afin qu'il puisse lancer la capture vidéo avant le début de la séquence chargée. Il est aussi recommandé d'ajouter une zone de fin identifiable visuellement de façon à terminer la capture bien après la fin de la séquence chargée.
Sur un ordinateur, il y a deux implémentations distinctes de la méthode, suivant la fonctionnalité recherchée. La première consiste, sur tout type d'ordinateur, en un programme ou module capable de créer une séquence chargée sur fichier, et d'extraire les données d'une telle séquence chargée, c.a.d. qui :
1. crée un fichier de sortie AVI type 1, ouvre si nécessaire un fichier d'entrée AVI, insère un en-tete et une trame initiale, ouvre le fichier de données en entrée, lit les données, lit ou génère les trames vidéo, insère les données dans les trames et les trames dans le fichier AVI, jusqu'à ce que toute les données soient lues, insère une zone de fin, ferme tous les fichiers.
2. ouvre un fichier AVI, lit les trames jusqu'à une trame initiale, ouvre un fichier de sortie, lit les trames et extrait les données des trames dans le fichier de sortie jusqu'à ce que toutes les données soient lues, ferme les fichiers d'entrée et de sortie.
Le transfert de la séquence chargée vers/de le caméscope ou magnétoscope peut être effectué par tout moyen approprié (programme de capture capable de traiter des fichiers AVI de type 1).
La seconde consiste, sur tout type d'ordinateur, en un programme ou module capable de l' enregistrement/lecture au vol des données sur le dispositif DV, c.a.d . qui :
1. démarre le caméscope ou magnétoscope DV en mode enregistrement, lui transfère un en-tête et trame initiale, ouvre le fichier de données, ouvre si nécessaire un fichier AVI, lit les données lit ou génère les trames vidéo, insère les données dans les trames et envoie les trames au caméscope ou magnétoscope jusqu'à ce que toute les données soient lues, envoie une zone de fin, ferme tous les fichiers, stoppe le caméscope ou magnétoscope. 2. démarre le caméscope ou magnétoscope DV en mode lecture, capture les trames jusqu'q une trame initiale, ouvre le fichier de données en sortie, capture les trames, extrait les données et les écrit dans le fichier de sortie, jusqu'à ce que toute les données soient lues, ferme e fichier de sortie, stoppe le caméscope ou magnétoscope.
Sur un ordinateur fonctionnant sous le système d'exploitation Microsoft Windows (TM Microsoft Corporation), la deuxième implémentation serait normalement réalisée comme un driver spécifique (Windows Device Driver) suivant l'architecture Windows Driver Model (WDM), ou par filtre spécifique DirectX (TM Microsoft Corporation) DirectShow (TM Microsoft Corporation).
L'interface IEEE1394, et l'utilisation d'ordinateurs et d'unités de stockage (disque dur) aux performances adéquates garantissent un échange de données avec les dispositifs enregistreurs/lecteurs au format DV et compatibles sans erreur et sans perte de trame. D'autre part, ces mêmes dispositifs enregistreurs/lecteurs protègent les données enregistrées sur la bande magnétique par des mécanismes de parité longitudinale et transversale, permettant à la relecture la correction des erreurs simples sur blocs. On constate dans les faits que l'on peut réaliser l'enregistrement et la restitution de fichiers de données de plusieurs centaines de millions d'octets sans aucune erreur et sans prendre de précautions particulières.
On peut cependant ajouter aux données enregistrées un code de redondance cyclique afin de vérifier l'absence d'erreur dans les données relues.
En l'absence d'autres mécanismes, la seule façon de vérifier qu'une opération de chargement s'est effectuée correctement consiste à relire l'ensemble des données dans leur intégralité, et à vérifier leur identité aux données initiales ou la validité du code de redondance cyclique.
L'enregistrement sur bande magnétique spécifié par la norme DV est susceptible aux erreurs d'enregistrement ou de lecture pouvant être causées par des micro poussières ou des défauts localisés de la bande magnétique, entraînant la perte de blocs complets ou même de trames complètes. Les mécanismes décrits ci-dessus n'apportent pas de protection contre ce type d'erreurs, tout au plus une détection « a posteriori » de leur absence ou présence. La protection contre des pertes de blocs ou de trames complètes nécessite la mise en œuvre de codes auto correcteurs résistant aux pertes d'information, écrits transversalement à travers des groupes de plusieurs trames (le nombre de trames d'un groupe étant égal à la longueur des mots du code), ainsi que le montre la figure 7 dans laquelle « n » est le nombre de trames d'un groupe. Le choix du code ainsi que la longueur des mots de codes sont des questions d'implémentation dépendant des objectifs de protection recherchés (protection contre la perte de 1 , 2, 3... trames par groupe de trames). Les données à enregistrer doivent être transcodées dans des mots du code. Du fait de l'écriture transversale des mots du code (figure 7 : a, b, c, d ....) dans les trames d'un groupe, il est nécessaire de charger entièrement un groupe de trames complet avant de le transférer vers le dispositif enregistreur. Le décodage se fait par l'opération inverse, en traitant des groupes de trames complets.
La protection contre des pertes de trames uniques dans un bloc de « n » trames est un cas spécifique, qui peut être traité par l'utilisation de parité transversale à travers le bloc de trames, où la trame « n-1 » serait remplie par des bits de parité calculés pour les bits de position similaire dans les trames 0 à n-2.
Dans le cas de l'enregistrement et la restitution sur bande magnétique DV, il est indispensable d'offrir une protection contre la perte ou la corruption de « p » trames consécutives, avec « p » supérieur ou égal à 2. Ce résultat est obtenu en entrelaçant « p » blocs de « n » trames protégés par le mécanisme de parité décrit ci-dessus, comme décrit dans la figure 8.
Possibilités d'application industrielle
L'invention décrite a permis le dévelopement de programmes commerciaux d'ordinateur réalisant le stockage de fichiers sur support DV.
L'application dans des dispositifs de télédiffusion permettrait la télédistribution massive de données (par opposition aux débits extrêmement faibles obtenus par des dispositifs de type télétex) .

Claims

Revendications
1. Méthode d'insertion et extraction de données numériques dans les champs vidéo et audio de trames vidéo DV (norme IEC61834), caractérisée par le remplissage des données dans les champs DC et AC des blocs Yl, Y2, Y3, Y4, Cr et Cb des macro blocs vidéo, avec insertion de drapeau EOD '0110' en début des champ AC pour neutraliser le traitement vidéo des données insérées, et remplissage des champs audio avec forçage des packs de contrôle Source AAUX sur mode, codage, fréquence d'échantillonnage, mode stéréo et longueur de trame sur mode « audio non utilisée », permettant :
a. la transmission des dites données sur liens à haut-débit IEE1394 (Firewire) ou équivalents, leur enregistrement, stockage et restitution par caméscopes et magnétoscopes numériques à interfaces compatibles DV ou de format utilisant la même techniques ou des techniques similaires de compression et d'encodage (compression intra-trame, transformation DCT ou FFT, Quantification et encodage
RLE), tels que DVCAM (TM Sony Corporation), DVPRO (TM Panasonic, Inc), Digitalδ (TM Sony Corporation), b. ou la transmission et l'enregistrement des dites données sur dispositifs de transmission ou d'enregistrement télévisuels basés sur la norme DV (tels que les dispositifs conforme aux normes SMPTE-370M, 362M, 322M, 321M, 316M, 314M,
306M, IETF RFC 3189) ou similaires.
2. Méthode d'insertion et extraction de données numériques dans les champs vidéo et audio de trames vidéo DV selon la revendication 1, caractérisée par le marquage d'une trame initiale, le remplissage des données dans des trames consécutives, et le marquage optionnel d'une trame finale pour faciliter l'extraction par programme.
3. Méthode d'insertion et extraction de données numériques dans les champs vidéo et audio de trames vidéo DV selon les revendications 1 et 2, caractérisée par la compression des données préalablement à leur remplissage, et leur décompression après déchargement de façon à augmenter la capacité de stockage.
4. Méthode d'insertion et extraction de données numériques dans les champs vidéo et audio de trames vidéo DV selon les revendications 1 et 2, caractérisée par l'adjonction aux données d'un code de redondance cyclique destiné à détecter d'éventuelles erreurs.
5. Méthode d'insertion et extraction de données numériques dans les champs vidéo et audio de trames vidéo DV selon les revendications 1 et 2, caractérisée par l'utilisation d'un code auto correcteur résistant aux pertes d'information, le transcodage des données dans ce code, l'écriture (chargement) des mots de code transversalement à travers des groupes de trames consécutives, afin de protéger les données contre les pertes de blocs ou de trames complètes.
6. Dispositif ou programme utilisant une méthode d'insertion et extraction de données numériques dans les champs vidéo et audio de trames vidéo DV selon les revendication 1 à 5, caractérisé par l'utilisation de caméscopes et magnétoscopes au format DV comme moyens de sauvegarde et stockage de données numériques sur supports amovibles de type bande magnétique (mini-cassettes DV).
7. Sur tout type d'ordinateur, un programme ou module utilisant une méthode d'insertion et extraction de données numériques dans les champs vidéo et audio de trames vidéo DV selon les revendication 1 à 5, qui : a. crée un fichier de sortie AVI type 1 , ouvre si nécessaire un fichier d'entrée AVI, insère un en-tete et une trame initiale, ouvre le fichier de données en entrée, lit les données, lit ou génère les trames vidéo, insère les données dans les trames et les trames dans le fichier AVI, jusqu'à ce que toute les données soient lues, insère une zone de fin, ferme tous les fichiers. b. ouvre un fichier AVI, lit les trames jusqu'à une trame initiale, ouvre un fichier de sortie, lit les trames et extrait les données des trames dans le fichier de sortie jusqu'à ce que toutes les données soient lues, ferme les fichiers d'entrée et de sortie.
8. Sur tout type d'ordinateur, un programme ou module utilisant une méthode d'insertion et extraction de données numériques dans les champs vidéo et audio de trames vidéo DV selon les revendication 1 à 5, qui : a. démarre le caméscope ou magnétoscope DV en mode enregistrement, lui transfère un en-tête et trame initiale, ouvre le fichier de données, ouvre si nécessaire un fichier AVI, lit les données lit ou génère les trames vidéo, insère les données dans les trames et envoie les trames au caméscope ou magnétoscope jusqu'à ce que toute les données soient lues, envoie une zone de fin, ferme tous les fichiers, stoppe le caméscope ou magnétoscope. b. démarre le caméscope ou magnétoscope DV en mode lecture, capture les trames jusqu'à une trame initiale, ouvre le fichier de données en sortie, capture les trames, extrait les données et les écrit dans le fichier de sortie, jusqu'à ce que toute les données soient lues, ferme e fichier de sortie, stoppe le caméscope ou magnétoscope.
Sur un ordinateur fonctionnant sous le système d'exploitation Microsoft Windows (TM
Microsoft Corporation), un driver spécifique (Windows Device Driver) suivant l'architecture Windows Driver Model (WDM), ou un filtre spécifique DirectX (TM
Microsoft Corporation) DirectShow (TM Microsoft Corporation) utilisant une méthode d'insertion et extraction de données numériques dans les champs vidéo et audio de trames vidéo DV selon les revendication 1 à 5, pour stocker des données sur caméscopes ou magnétoscopes au format DV.
PCT/CH2003/000168 2002-03-21 2003-03-13 Stockage de donnees numeriques sur camescope dv et compatibles WO2003081908A2 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AU2003208241A AU2003208241A1 (en) 2002-03-21 2003-03-13 Storage of digital data on a dv camcorder and compatible elements

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CH4792002 2002-03-21
CH479/02 2002-03-21

Publications (2)

Publication Number Publication Date
WO2003081908A2 true WO2003081908A2 (fr) 2003-10-02
WO2003081908A3 WO2003081908A3 (fr) 2003-11-13

Family

ID=28048285

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CH2003/000168 WO2003081908A2 (fr) 2002-03-21 2003-03-13 Stockage de donnees numeriques sur camescope dv et compatibles

Country Status (2)

Country Link
AU (1) AU2003208241A1 (fr)
WO (1) WO2003081908A2 (fr)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997003441A1 (fr) * 1995-07-07 1997-01-30 Danmere Limited Sauvegarde de donnees
EP1094637A2 (fr) * 1999-10-21 2001-04-25 Matsushita Electric Industrial Co., Ltd. Unité d'interface de bus IEEE 1394

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997003441A1 (fr) * 1995-07-07 1997-01-30 Danmere Limited Sauvegarde de donnees
EP1094637A2 (fr) * 1999-10-21 2001-04-25 Matsushita Electric Industrial Co., Ltd. Unité d'interface de bus IEEE 1394

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
"PROPOSED SMPTE STANDARD FOR TELEVISION-DATA STRUCTURE FOR DV-BASED AUDIO, DATA AND COMPRESSED VIDEO-25 AND 50 MB/S" SMPTE JOURNAL, SMPTE INC. SCARSDALE, N.Y, US, vol. 108, no. 5, mai 1999 (1999-05), pages 308-330, XP000831859 ISSN: 0036-1682 cité dans la demande *
"PROPOSED SMPTE STANDARD" SMPTE JOURNAL, SMPTE INC. SCARSDALE, N.Y, US, vol. 109, no. 1, janvier 2000 (2000-01), pages 65-72, XP000894177 ISSN: 0036-1682 cité dans la demande *
"PROPOSED SMPTE STANDARD" SMPTE JOURNAL, SMPTE INC. SCARSDALE, N.Y, US, vol. 109, no. 1, janvier 2000 (2000-01), pages 72-78, XP000894178 ISSN: 0036-1682 cité dans la demande *
KOBAYASHI K. ET AL.: "IETF RFC 3189: RTP Payload Format for DV (IEC 61834) Video" INTERNET ARTICLE, [en ligne] pages 1-11, XP002253080 Extrait de l'Internet: <URL:http://www.ietf.org/rfc/rfc3189.txt> [extrait le 2003-08-28] cité dans la demande *
MAYER ALASTAIR J. W.: "Backfire design; discussion paper" INTERNET ARTICLE, [en ligne] 2001, pages 1-3, XP002253079 Extrait de l'Internet: <URL:http://backfire.sourceforge.net/backf ire.html> [extrait le 2003-08-28] *
MAYER ALASTAIR J. W.: "The backfire project" INTERNET ARTICLE, [en ligne] 20 avril 2001 (2001-04-20), pages 1-2, XP002253078 Extrait de l'Internet: <URL:http://backfire.sourceforge.net/> [extrait le 2003-08-28] *
SCHLAILE PETER AND FIALA GUIDO: "DVBACKUP" INTERNET ARTICLE, [en ligne] pages 1-2, XP002253077 Extrait de l'Internet: <URL:http://dvbackup.sourceforge.net/> [extrait le 2003-08-28] *
UCHIDA H ET AL: "DVCPRO: A COMPREHENSIVE FORMAT OVERVIEW" SMPTE JOURNAL, SMPTE INC. SCARSDALE, N.Y, US, vol. 105, no. 7, 1 juillet 1996 (1996-07-01), pages 406-418, XP000597144 ISSN: 0036-1682 *

Also Published As

Publication number Publication date
WO2003081908A3 (fr) 2003-11-13
AU2003208241A1 (en) 2003-10-08
AU2003208241A8 (en) 2003-10-08

Similar Documents

Publication Publication Date Title
US20040165665A1 (en) System stream creating apparatus which adjusts system clock reference based on total number of pictures to be stored and decoded during certain time period
CN102474588B (zh) 发送控制装置、接收控制装置、发送控制方法、接收控制方法
JPWO2006033279A1 (ja) データ処理装置
JP2007012112A (ja) データ記録装置及びその方法、プログラム、記録媒体
US20060167936A1 (en) Data processing device
US20050071724A1 (en) Error correction of stream data
EP1802117B1 (fr) Processeur de donnees
US7103069B2 (en) Block forming method and apparatus of digital bit steam
US20080031597A1 (en) Stream Recording/Reproducing Apparatus
JP3544967B2 (ja) システムヘッダを持つ音声情報の処理システム
KR100360285B1 (ko) 디지털 인터페이스를 이용한 오디오 스트림 송수신 장치 및 방법
KR101051063B1 (ko) 영상 수록 재생 장치, 영상 수록 방법, 영상 재생 방법 및 영상 수록 재생 방법
JP2002528003A (ja) 記録担体にディジタル情報信号を記録する記録装置
WO2003081908A2 (fr) Stockage de donnees numeriques sur camescope dv et compatibles
JP4825202B2 (ja) 記録再生装置、記録媒体、及び集積回路
US20050120167A1 (en) Information recording device, information reproduction devic, method, and computer program
CN100454225C (zh) 存储实时数字信息信号流的装置与方法
CN101099197A (zh) 记录装置
JP5409214B2 (ja) メディアファイル修復方法、メディアファイル作成方法及びメディアファイル再生方法並びに装置
US6008959A (en) Recording/reproducing apparatus for storing a digital information signal in a storage medium using packet a method and a record carrier, which further allows for editing the stored digital information signal by including references to additional packets
US20060193607A1 (en) Method, system and software for fast archiving from hdd to optical disk drive
JP2004310953A (ja) ディジタル信号記録再生装置及び記録再生方法並びにコンピュータ・ソフトウエア
JP4164295B2 (ja) 情報記録装置及び情報記録方法、情報処理装置及び情報処理方法並びに情報再生装置及び情報再生方法
JP2002262241A (ja) 画像処理装置及び方法
JP2004528786A (ja) Dvdレコーダにおいてデータストリームを編集する方法及びdvdストリームレコーダ

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AU BR CA CN IL JP KR NZ RU SG US ZA

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP