EP4356606A1 - Procédés et dispositifs de décodage d'une partie au moins d'un flux de données, programme d'ordinateur et flux de données associés - Google Patents
Procédés et dispositifs de décodage d'une partie au moins d'un flux de données, programme d'ordinateur et flux de données associésInfo
- Publication number
- EP4356606A1 EP4356606A1 EP22735362.0A EP22735362A EP4356606A1 EP 4356606 A1 EP4356606 A1 EP 4356606A1 EP 22735362 A EP22735362 A EP 22735362A EP 4356606 A1 EP4356606 A1 EP 4356606A1
- Authority
- EP
- European Patent Office
- Prior art keywords
- decoding
- data
- neural network
- artificial neural
- data stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000004590 computer program Methods 0.000 title claims abstract description 10
- 238000013528 artificial neural network Methods 0.000 claims description 316
- 210000002569 neuron Anatomy 0.000 claims description 30
- 230000011664 signaling Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 13
- 230000001419 dependent effect Effects 0.000 claims 1
- 230000001537 neural effect Effects 0.000 abstract 4
- 230000002123 temporal effect Effects 0.000 description 9
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/60—General implementation details not specific to a particular type of compression
- H03M7/6005—Decoder aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/192—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
Definitions
- the present invention relates to methods and devices for decoding at least part of a data stream, as well as a computer program and associated data streams.
- the present invention proposes a method for decoding a part of a data stream, said part of a data stream comprising a plurality of data units respectively associated with a plurality of images and together representative of the different images of the plurality of images, said data stream portion further comprising differential encoding data of a decoding artificial neural network relative to a reference decoding artificial neural network, the decoding method comprising the following steps:
- the differential coding data is included in the data stream, and makes it possible to simply determine the decoding artificial neural network to be used. This avoids latency and computational resource otherwise required to determine the optimal decoding artificial neural network.
- the use of differential coding data also makes it possible to limit the amount of data needed to encode this decoding artificial neural network in the data stream.
- the data stream comprises an identifier of the reference decoding artificial neural network
- the data stream comprises descriptive data of the reference decoding artificial neural network
- step of decoding said data unit produces a two-dimensional representation of the image associated with said data unit by decoding said data unit and at least one other data unit included in said data stream part;
- the reference decoding artificial neural network is defined by a plurality of first weights
- the determined decoding artificial neural network is defined by a plurality of second weights
- said differential coding data comprises data respectively representing a plurality of differences between a first weight and a second weight
- the differential coding data is contained in a set of parameters relating to the image associated with said data unit;
- the data stream comprises at least one flag signaling the presence, in at least part of the data stream, of at least one other flag signaling the presence of data indicative of another network of artificial decoding neurons, distinct from the artificial neural network of determined decoding;
- the data stream comprises at least one flag signaling the presence of said differential coding data in said part of the data stream.
- a method for decoding a data stream in which data from the stream is decoded by means of a first decoding artificial neural network into a two-dimensional representation of an image, characterized in that the stream of data comprises at least one flag signaling the presence, in at least part of the data stream, of at least one other flag signaling the presence of data indicative of a second decoding artificial neural network, distinct from the first neural network artificial decoding.
- Such a flag makes it possible to indicate whether the decoding artificial neural network will potentially be modified or not during the decoding of said at least part of the data stream.
- the proposed solution is flexible since it is the other flag that signals the presence or absence of indicative data.
- Such a method may further comprise the following steps when the flag signals the presence of the other flag:
- each part comprising a plurality of data units respectively associated with a plurality of images and together representative of the different images of the plurality of images
- said flag can signal the presence of at least one other flag within a given part among said parts.
- the method can then comprise, when said flag signals the presence of the other flag in said given part, the following steps for each data unit included in said given part: - determination (for example by reading the other flag mentioned above) of the presence of data defining a decoding artificial neural network and relating to the data unit concerned;
- the invention also relates to a device for decoding a part of a data stream, said part of a data stream comprising a plurality of data units respectively associated with a plurality of images and together representative of the different images of the plurality of images, said data stream portion further comprising differential coding data of a decoding artificial neural network relative to a reference decoding artificial neural network, the decoding device comprising:
- Such a decoding device can comprise a storage unit capable of storing characteristic data of the reference decoding artificial neural network.
- the decoding device can also comprise a module for processing descriptive data of the reference decoding artificial neural network included in the data stream.
- the decoding module may be configured to produce a two-dimensional representation of the image associated with said data unit by decoding said data unit and at least one other data unit included in said data stream portion.
- the invention also proposes a device for decoding a data stream, comprising a module for decoding data from the data stream by means of a first decoding artificial neural network and into a two-dimensional representation of an image, characterized in that the decoding device comprises a module for detecting a flag signaling the presence, in a at least part of the data stream, at least one other flag signaling the presence of data indicative of a second decoding artificial neural network, distinct from the first decoding artificial neural network.
- This decoding device may include:
- a reading module configured to read, when said flag signals the presence of the other flag, the other flag in the data stream
- a module for obtaining configured to obtain, when the other flag signals the presence of said indicative data, said indicative data by analyzing the data stream;
- a configuration module designed to configure the decoding module to decode other data of the stream by means of the second decoding artificial neural network.
- the obtaining module is configured to obtain said indicative data by analyzing said given part.
- the invention further proposes a data stream comprising at least one part comprising a plurality of data units respectively associated with a plurality of images and representative together of the different images of the plurality of images, said part further comprising differential coding data of a decoding artificial neural network relative to a reference decoding artificial neural network, wherein at least one data unit of the plurality of data units is decodable by means of the artificial neural network decoding encoded by said differential encoding data.
- the invention also proposes a data stream comprising data decodable by means of a first network of artificial neurons for decoding into a two-dimensional representation of an image, characterized in that the data stream comprises at least one flag signaling the presence , in at least part of the data stream, at least one other flag signaling the presence of data indicative of a second decoding artificial neural network, distinct from the first decoding artificial neural network.
- the flag may signal the presence of the other flag in the part of the data stream and/or the part of the data stream may include the other flag.
- the invention also proposes a computer program comprising instructions executable by a processor and designed to implement a decoding method as proposed above when these instructions are executed by the processor.
- the invention finally proposes a recording medium readable by a computer, on which such a computer program is recorded.
- FIG. 1 schematically shows an encoding device used in the context of the invention
- FIG. 2 illustrates an example of a pair of artificial neural networks for coding and decoding
- FIG. 3 is a flowchart representing an example of an encoding method that can be implemented by the encoding device of Figure 1;
- FIG. 4 shows a data stream produced by the coding method of Figure 3;
- FIG. 5 schematically shows a decoding device according to the invention.
- FIG. 6 is a flowchart representing an example of a decoding method that can be implemented by the decoding device of Figure 5.
- Figure 1 shows the main functional elements of an encoding device 2.
- This coding device 2 comprises a sequence management module 4, an image management module 6, a network determination module 8, a coding module 10 and a flow formation module 12.
- the coding device 2 can in practice be implemented by means of an electronic device comprising a processor and a memory; each of the modules 4, 6, 8, 10, 12 mentioned above can then be realized by the cooperation of the processor and computer program instructions stored in the aforementioned memory and designed to perform the functionalities of the module concerned, in particular as described below, when these instructions are executed by the processor.
- the coding device 2 receives as input a temporal succession of IMG images to be coded with a view to their storage (for later reading by means of a decoding device) or their transmission (to a decoding device).
- Each IMG image received as input is for example represented by means of at least one two-dimensional representation, such as a matrix of pixels.
- each IMG image received as input can be represented by a plurality of two-dimensional representations (or pixel matrices) corresponding respectively to a plurality of components of the image (for example a plurality of color components, or, as a variant, a luminance component and at least one chrominance component).
- the sequence management module 4 is configured to determine whether an IMG image received as input constitutes a first image of a sequence of images and to determine whether an artificial coding neural network can be updated during this sequence of images.
- the sequence management module 4 is also configured to produce an SPS set of parameters relating to the current image sequence.
- the coding device 2 notably produces at output a plurality of data units DU respectively associated with a plurality of images IMG of the temporal succession of images.
- sequence of images (within the meaning of the HEVC standard) is used here to refer to a set of images respectively associated with a plurality of such data units DU representing together the various images of the plurality of images.
- any image of a sequence of images can be decoded on the basis of data units DU associated with images of this sequence of images, without reference to other data units associated with images not included in the image sequence.
- the image management module 6 is configured to determine whether the artificial neural network of coding used is updated for the coding of the current image IMG.
- the image management module 6 is moreover configured to produce a set PPS of parameters relating to the current image IMG.
- the network determination module 8 is configured to determine an EN coding artificial neural network to be used for coding the current image IMG. Various possibilities for making this determination of the coding artificial neural network to use EN are described below with reference to Figure 3.
- the EN coding artificial neural network used is associated with a DN decoding artificial neural network which can be used for its part to decode the data units DU produced by the EN coding artificial neural network.
- the encoding artificial neural network EN and the decoding artificial neural network DN thus form a pair of artificial neural networks.
- the encoding artificial neural network EN and the decoding artificial neural network DN are each defined by a structure (comprising for example a plurality of layers of artificial neurons and/or by a set of weights associated respectively with the artificial neurons of the network concerned ).
- a representation (for example two-dimensional) of the current image IMG (or, as a variant, of a component or of a block of the current image IMG) is applied as input (that is to say on a layer input) of the EN coding artificial neural network.
- the coding artificial neural network EN then produces coded data as output, here a data unit DU.
- the coded data (here the data unit DU) is applied as input to the decoding artificial neural network DN.
- the decoding artificial neural network DN then produces as output a representation IMG' (for example two-dimensional) which corresponds to the current image IMG (or, as a variant, to the component or to the block concerned of the current image IMG).
- the coding artificial neural network EN is designed so that the data unit DU contains a lower quantity of data (at least on average) than the aforementioned representation of the current image IMG. In other words, the data of the data unit DU is compressed.
- the coding artificial neural network EN and the decoding artificial neural network DN are also trained beforehand (for example by applying a large number of images as input) so as to minimize the differences between the input representation of the current image IMG and its output representation IMG', while also minimizing the quantity of data which passes between the artificial coding neural network EN and the artificial decoding neural network DN.
- the network determination module 8 can select the artificial coding neural network to be used EN from among several distinct artificial coding neural networks (belonging respectively to several pairs of artificial coding neural network and network of artificial decoding neurons).
- the network determination module 8 is also configured to produce data NN, NN′ indicative of the decoding artificial neural network DN to be used for decoding the data units DU (within the decoding device 20 as described later) .
- this decoding artificial neural network DN (denoted by the indicative data NN, NN' mentioned above) is the decoding artificial neural network of the pair comprising the determined EN coding artificial neural network (for example selected) by the network determination module 8.
- the information useful for the smooth running of the decoding of the data units DU are contained and transmitted via the data NN, NN′. This makes it possible in particular to avoid a step of determining the optimal decoding artificial neural network and to save time on decoding.
- the coding module 10 is configured to code the representation of the current image IMG (or of a part of the current image) in coded data (here in a data unit DU) by means of the artificial neural network for coding EN determined by network determination module 8.
- the coding module 10 therefore receives at input the representation (here two-dimensional, for example a matrix of pixels) of the image IMG (or of the image part IMG) and produces at output a corresponding data unit DU.
- the coding module 10 can receive as input a representation of a component of the image IMG, or of a block only of the image IMG, or else of a plurality of images IMG.
- the coding module 10 can also receive as input at least one other image representation and/or at least one other data unit (associated with another image of the sequence current).
- the aforementioned other image representation may be a representation of another image of the current sequence, or, as a variant, a representation obtained at the output of the DN decoding artificial neural network associated with the EN coding artificial neural network used by the coding module 10 when another data unit (associated with another image of the current sequence) is applied as input to this artificial neural network for decoding DN.
- the stream forming module 12 is configured to receive as input the set SPS of parameters relating to the image sequence, the set PPS of parameters relating to the image IMG, the data NN, NN' indicative of the network of decoding artificial neurons and data units DU, and to construct a data stream S based on these elements.
- the stream forming module 12 can comprise a concatenation unit for aggregating (in a predefined manner) the data listed in the previous paragraph, and an entropy coder for entropic coding of the aggregated data.
- the entropy coding step will not be described here and the data stream S will be described in the form it presents before entropy coding.
- the data stream S can then be transmitted to another electronic device (for example a decoding device 20 as described below with reference to FIG. 5, or stored within a storage unit (such a hard disk or the aforementioned memory of the encoding device 2) for later reading and decoding.
- a decoding device 20 as described below with reference to FIG. 5, or stored within a storage unit (such a hard disk or the aforementioned memory of the encoding device 2) for later reading and decoding.
- FIG. 3 represents an example of a coding method, implemented here by the coding device 2.
- This coding method applies to a temporal (and therefore ordered) succession of IMG images.
- This temporal succession of IMG images therefore forms a video which it is desired to encode for transmission or storage (recording).
- the method of FIG. 3 begins with an initialization step E2 in which the coding device 2 selects the first image of the temporal succession of images as the current image.
- the method of FIG. 3 continues with a step E3 in which the coding device 2 (here the sequence management module 4) determines whether the current image IMG is chosen as the first image of a sequence.
- the criteria used to make this determination may vary depending on the intended application of the video encoding.
- the coding device 2 (here the sequence management module 4) starts a new sequence every second.
- the waiting time of the part of the data stream relating to a new sequence is 1 second maximum (this waiting time is necessary for example during a change chain).
- Such a change of plane can be determined automatically by analyzing the images of the temporal succession of images.
- sequences of longer duration for example between 10 seconds and 40 seconds
- the transmission rate the coding of each first image of a sequence requiring a greater quantity of data important so as to be able to reconstruct this image on the sole basis of these data, without reference to data relating to other images.
- step E3 If it is determined in step E3 that the current image IMG is chosen as the first image of a sequence (that is to say that the coding device 2 starts a new sequence), the method continues at step E4 described below.
- step E10 the method continues at step E10 described below for processing the current image IMG.
- the coding device 2 (here the network determination module 8) determines the EN coding artificial neural network to be associated with the current sequence.
- the EN coding artificial neural network thus determined becomes the current coding artificial neural network.
- the network determination module 8 chooses the artificial coding neural network EN from among a predetermined set of artificial coding neural networks, for example among a set of artificial coding neural networks associated respectively with decoding artificial neural networks available within the decoding device (a prior exchange between the coding device and the decoding device then being possible to identify this set of artificial neural networks).
- the network determination module 8 chooses the EN coding artificial neural network which obtains the best compression performance, for example in the sense of a bitrate-distortion criterion or of a quality measurement of the decoded two-dimensional representation IMG'.
- the network determination module 8 can for example apply the current image IMG (or a plurality of images including the current image IMG) to the input of several artificial coding neural networks (each possibly in association with the decoding artificial neural network associated with it) and choosing the EN coding artificial neural network which makes it possible to obtain the best compression performance as indicated above.
- the sequence has a predetermined duration (for example 1 second)
- a predetermined duration for example 1 second
- the network determination module 8 can analyze the current image IMG (or a plurality of images including the current image IMG, here the images of the sequence), for example to identify the type of content concerned (sport , synthetic image, film, videoconference, etc.), and choose an EN coding artificial neural network according to the result of this analysis, for example according to the type of content identified.
- the network determination module 8 can determine the EN coding artificial neural network by means of a learning process. Such a learning process includes for example:
- the optimization of the artificial neural network for EN coding and of the associated artificial neural network for decoding DN (in particular by modifying the weights defining each of these two neural networks EN, DN), possibly by means of several iterations, so as to to reduce (or even minimize) the bitrate-distortion cost (this cost being for example a weighted sum of the bitrate produced by the data unit(s) DU, and of the distortion between the two-dimensional representation(s) ) decoded IMG' and the IMG image(s) applied as input).
- step E6 the coding device 2 (here the sequence management module 4) determines whether the coding artificial neural network EN can be updated during the current sequence of images . If not, the EN coding artificial neural network determined in step E4 will be used to code all the images of the current sequence.
- the sequence management module 4 analyzes the images of the sequence, and chooses to make it possible to update the artificial neural network EN coding during the sequence of images when this analysis indicates an inhomogeneity of the analyzed images, and not to provide an update of the EN coding artificial neural network during the sequence when this analysis indicates a homogeneity of the analyzed images.
- the analyzed images are for example determined as homogeneous if the mean square error between the respective luminance components of two successive images is less than a predetermined threshold for all the pairs of successive images of the sequence.
- this threshold can be between 25 and 75, for example equal to 50, for images whose luminance values can vary between 0 and 255.
- the choice of making it possible to update the encoding artificial neural network during the current sequence of images is performed (by the sequence management module 4) as a function of the duration of the current sequence. For example, if the duration of the current sequence is less than 2 seconds, the coding device 2 (here the sequence management module 4) chooses not to provide an update of the artificial coding neural network EN during of the sequence; otherwise, the coding device 2 (here the sequence management module 4) chooses to make it possible to update the coding artificial neural network EN during the current sequence.
- step E8 the coding device (here the sequence management module 4) produces a set SPS of parameters relating to the current sequence.
- This SPS set of parameters comprises the data NN indicative of the DN decoding artificial neural network associated with the EN coding artificial neural network selected in step E4. As already indicated, these indicative data NN are here produced by the network determination module 8.
- these indicative data NN may be an identifier Inn of the decoding artificial neural network DN from among a predetermined set of artificial neural networks (the characteristics of the artificial neural networks of this predetermined set being for example stored within of the decoding device or accessible, possibly by downloading, by the decoding device).
- these indicative data NN can be a coded representation Rc of the decoding artificial neural network DN, for example a coded representation Rc of characteristic parameters (such as the structure and/or the weights) of the neural network artificial DN decoding.
- the aforementioned coded representation Rc can for example be constructed in accordance with a standard such as the MPEG-7 part 17 standard or in a format such as the JSON format.
- these indicative data NN may be differential coding data D of the decoding artificial neural network DN relative to a reference decoding artificial neural network R.
- the decoding artificial neural network DN (associated with the coding artificial neural network EN selected in step E4) and the reference decoding artificial neural network R have the same structure.
- the differential coding data D can then in particular contain data representative respectively of differences between each weight of the decoding artificial neural network DN and the corresponding weight (that is to say located at the same place in the common structure) of the network of artificial reference decoding neurons R.
- the differential coding data D may be representative of a subset of weights of the reference decoding artificial neural network R to be updated. These differential coding data D can indicate in this case which weights to update and/or the value of each of these weights to update.
- the differential coding data D can be representative of additional layers of artificial neural network to be inserted within the structure of the reference decoding artificial neural network R.
- the differential coding data D describe for example in this case, for each additional layer, the structure of the additional layer concerned, the weights of the artificial neurons forming the additional layer concerned and/or the place of insertion of the additional layer concerned at the within the reference decoding artificial neural network R.
- the set of SPS parameters may in this case also contain data indicative of the reference artificial neural network R, for example an identifier of the reference artificial neural network R from among a predetermined set of artificial neural networks (set of the same type as mentioned above about the Inn identifier).
- the reference artificial neural network R is determined at this stage (without requiring any additional information): it may be for example the decoding artificial neural network associated with the coding artificial neural network previously used during the various iterations of the coding method of FIG. 3, or a predetermined decoding artificial neural network (used as a reference decoding artificial neural network for the entire method decoding).
- the SPS set of parameters also includes a flag FL signaling the possibility (or impossibility) of updating the decoding artificial neural network during the current sequence, that is to say the potential presence or the absence, within the part of the data stream corresponding to the current image sequence, of data NN′ indicative of another network of artificial decoding neurons distinct from the current artificial neural network of decoding DN.
- the flag FL indicates in practice the presence or the absence of at least one other flag FL' signaling the (effective) presence or the absence of the data NN' indicative of the other decoding artificial neural network distinct from the current decoding artificial neural network DN.
- the value of the flag FL signals this impossibility, c' that is to say the absence, within the part of the data stream corresponding to the current sequence of images, of data indicative of another network of artificial decoding neurons.
- the set of SPS parameters may further contain data indicating the format of the chrominance images (or components) in the current sequence, and/or data indicating the maximum size of the images of the current sequence, and/or data indicating the minimum image block size of the current sequence.
- the set of SPS parameters is written into the data stream S to be transmitted (here by means of the stream forming module 12), for example in the header of the data stream part associated with the sequence of current images.
- step E10 for the processing of the current image
- the coding device 2 determines in step E10 if the flag FL indicates the possibility of updating the coding artificial neural network EN within the current sequence of images (i.e. here the value of the FL flag is equal to 1 ). In the affirmative at step E10 (arrow P), the method continues at step E12 described below. In the negative at step E10 (arrow N), the method continues at step E16 described below.
- the decoding device 2 determines in step E12 if the coding artificial neural network must be updated for the coding of the current image IMG or if the coding of the current image can be realized with the current coding artificial neural network.
- step E12 can be performed by analysis of the current image IMG.
- the determination of step E12 can be performed by simulating the coding of the current image IMG by means of the current coding artificial neural network and the coding of the current image IMG by means of one (or more) other(s) coding artificial neural network(s), and choosing to update the coding artificial neural network if the results obtained (according to a rate-distortion criterion) are better with at least one of those other coding artificial neural networks.
- step E14 the decoding device 2 (here the network determination module 8) determines the coding artificial neural network to be used for coding the current image IMG.
- the coding artificial neural network thus determined becomes the current coding artificial neural network.
- this other network of artificial neurons can be chosen at step E14 as the coding artificial neural network to be used for the coding of the current image IMG.
- the network determination module 8 can choose the artificial coding neural network to be used for the current image IMG from among a predetermined set of artificial coding neural networks, for example among a set artificial coding neural networks respectively associated with artificial decoding neural networks available within the decoding device.
- the network determination module 8 can also choose the coding artificial neural network which obtains the best compression performance, for example in the sense of a bitrate-distortion criterion or of a measure of quality of the decoded two-dimensional representation IMG' (possibly independently of step E12).
- the network determination module 8 can for example apply the current image IMG to the input of several artificial coding neural networks (each possibly in association with the artificial decoding neural network associated with it) and choose the coding artificial neural network that achieves the best compression performance as shown above.
- the network determination module 8 can analyze the current image IMG, for example to identify the type of content concerned, and choose a coding artificial neural network according to the result of this analysis, by example depending on the type of content identified.
- the network determination module 8 can determine the coding artificial neural network to be used to code the current image IMG by means of a learning process.
- a learning process includes for example:
- the throughput-distortion cost (this cost being for example a weighted sum of the throughput produced by the data unit DU associated with the current image IMG, and the distortion between the decoded two-dimensional representation IMG' and the current input image IMG).
- step E16 the coding device (here the image management module 6) produces a set PPS of parameters relating to the current image IMG.
- This set PPS of parameters relating to the current image IMG can include (here when the flag FL relating to the current sequence is equal to 1) the flag FL' indicating the update or absence of update of the artificial neural network coding for coding the current image IMG.
- This flag FL' therefore also indicates the presence or absence, within the set PPS of parameters relating to the current image IMG, of data indicative of a decoding artificial neural network (associated with the artificial neural network updated coding).
- the set PPS of parameters relating to the current image IMG comprises moreover, these data NN′ indicative of the decoding artificial neural network.
- These data NN′ are provided here by the network determination module 8 (following the implementation of step E14).
- these indicative data NN' can be an identifier Inn of the decoding artificial neural network from among a predetermined set of artificial neural networks (the characteristics of the artificial neural networks of this predetermined set being for example stored within of the decoding device or accessible, possibly by downloading, by the decoding device).
- these indicative data NN' can be a coded representation Rc of the decoding artificial neural network, for example a coded representation Rc of characteristic parameters (such as the structure and/or the weights) of the neural network artificial decoding.
- these indicative data NN' can be differential coding data D' of the artificial neural network of decoding relative to a reference decoding artificial neural network.
- the possibilities relating to differential coding and presented above with reference to step E8 also apply here.
- the reference decoding artificial neural network can be designated by indicative data contained in the SPS set of parameters relating to the current sequence (SPS set produced during the previous transition to step E8).
- the PPS set of parameters relating to the current image IMG can contain other parameters, such as the size of the image
- the set of PPS parameters is written in the data stream S to be transmitted
- the coding device 2 (here the coding module 10) then proceeds in step E18 to the coding of the current image IMG by means of the current coding artificial neural network, which produces at output an associated data unit DU to the current IMG image.
- This data unit DU can thus be written into the data stream S (here by the stream formation module 12).
- the coding device 2 selects the next image in the temporal succession of images as the new current image (step E20) and loops to step E3 for processing this new current image.
- FIG. 4 represents the data stream S obtained by the coding method which has just been described.
- This data stream S includes for each sequence of images:
- this header comprising an SPS set of parameters relating to the sequence of images concerned; and, for each image of the sequence of images concerned:
- this header comprising a PPS set of parameters relating to the image concerned;
- the SPS set of image sequence parameters includes:
- this flag FL thus signals the presence or absence, within each set PPS of parameters relating to an image of the sequence of images concerned, of (another) flag FL' signaling the presence or absence of data indicative of a decoding artificial neural network to be used for the decoding of the image concerned.
- the PPS set of image-related parameters includes:
- a flag FL' indicating the presence or absence (here within this same set PPS of parameters relating to the image concerned) data indicative of a decoding artificial neural network (separate from the decoding artificial neural network associated with the image sequence comprising the relevant image);
- the indicative data NN, NN′ mentioned above can be an identifier of the artificial decoding neural network from among a predetermined set of artificial neural networks, or a coded representation of the artificial decoding neural network, or even data of differential coding of the decoding artificial neural network relative to a reference decoding artificial neural network.
- Figure 5 shows the main functional elements of a decoding device 20.
- This decoding device 20 comprises a decoding module 22, a network determination module 24, a storage unit 26, a configuration module 28, a processing module 25 and an analysis unit 30.
- the decoding device 20 can in practice be implemented by means of an electronic device comprising a processor and a memory; each of the aforementioned modules 22, 24, 25, 28 and unit 30 can then be realized by the cooperation of the processor and computer program instructions stored in memory and designed to perform the functionality of the module concerned, in particular as described below, when these instructions are executed by the processor.
- the storage unit 26 may correspond to the aforementioned memory.
- the decoding device 20 receives as input a data stream, here the data stream S produced by the coding device 2 (as explained above) and represented in FIG. 4.
- the data stream S comprises several parts each comprising a plurality of data units DU associated respectively with the different images of an image sequence. (That is, each of these parts of the data stream corresponds to a sequence of images.)
- the analysis unit 30 is designed to analyze the data stream S so as to identify in this data stream S the different data that composes it, as shown schematically in FIG. 4.
- the analysis unit 30 can in practice in particular perform an entropy decoding of the data stream S to obtain these data. However, as already indicated, this aspect will not be described here in detail.
- the analysis unit 30 notably comprises a detection module 32 designed to detect a flag FL as described above in the current part of the data stream S (that is to say in the part of the data stream S relative to the current sequence).
- a FL flag signals the possibility or impossibility of updating the decoding artificial neural network within the current sequence, and therefore the potential presence or absence, here in the current part of the data stream, of data NN' indicative of a decoding artificial neural network, distinct from the decoding artificial neural network associated with the current sequence (and used for example for decoding the associated data unit to the first image of the current sequence).
- the flag FL here signals the presence or absence (in the current part of the data stream) of at least one other flag FL' itself signaling the presence or absence of these data NN' (such another flag FL' being located in each PPS set of parameters relating to an image, for any image of the current sequence, when the flag FL signals the presence of at least one such other flag, in the example described here) .
- the analysis unit 30 also comprises a reading module 33 designed to read this other flag FL' in the data stream when the flag FL (relating to the current sequence) signals the presence of at least one such other flag, that is to say the potential presence of data NN'.
- the analysis unit 30 also comprises a obtaining module 34 designed to obtain these indicative data NN' by analyzing the data stream S (specifically the current part of the data stream, associated with the current image sequence) when the other flag FL' signals the presence of such indicative data NN'.
- the analysis unit 30 is also designed to identify the data units DU within the data stream S and transmit each data unit DU to the decoding module 22 for decoding this data unit DU, as described below .
- the network determination module 24 is designed to determine the decoding artificial neural network DN to be used for decoding the current data unit DU as a function of at least one datum of the set SPS of parameters relating to the current sequence and/or at least one datum of the PPS set of parameters relating to the current image.
- the network determination module 24 can determine the DN decoding artificial neural network by decoding differential coding data D of the DN decoding artificial neural network relative to a reference decoding artificial neural network R (these differential coding data D being contained in the SPS set of parameters relative to the current sequence or in the PPS set of parameters relative to the current image, as described below).
- This method of determining the DN decoding artificial neural network with the help of data encoded in the S stream allows a fast and efficient determination of the DN decoding artificial neural network. Indeed, in this way it is not necessary to search for the optimal decoding artificial neural network.
- the decoding artificial neural network DN and the reference decoding artificial neural network R can have the same structure and the differential coding data D can then in particular contain data representative respectively of differences between each weight of the network decoding artificial neurons DN and the corresponding weight (i.e. located at the same place in the common structure) of the reference decoding artificial neural network R.
- the data item indicative of the DN decoding artificial neural network to be used is an identifier Inn of the DN decoding artificial neural network from among a predetermined set of decoding artificial neural networks .
- the network determination module 24 determines in this case the decoding artificial neural network DN to be used for decoding the current data unit DU on the basis of this identifier Inn.
- the set SPS of parameters relating to the current sequence contains a coded representation Rc of the decoding artificial neural network DN .
- the network determination module 24 determines in this case the decoding artificial neural network DN by decoding this coded representation Rc.
- the storage unit 26 can store data C characteristic of each artificial neural network of the predetermined set of artificial neural networks and/or data characteristic of at least one reference decoding artificial neural network R. These characteristic data may include in particular the weights of the artificial neural network concerned.
- the processing module 25 is itself designed to process descriptive data of the reference decoding artificial neural network included in the data stream S. This descriptive data is for example a coded representation of the reference decoding artificial neural network , for example constructed in accordance with a standard such as the MPEG-7 part 17 standard or in a format such as the JSON format (as explained above with regard to the coded representation Rc).
- the configuration module 28 is designed to configure the decoding module 22 so that this decoding module 22 can decode the current data unit DU by means of the decoding artificial neural network DN determined by the network 24.
- the decoding module 22 can thus produce a two-dimensional representation of the image associated with the current data unit DU by decoding this current data unit DU and possibly at least one other data unit included in the current part of the data stream (i.e. associated with the current sequence of images).
- the configuration module 28 is for example designed to instantiate the artificial neural network for decoding DN (determined by the network determination module 24) within the decoding module 22.
- This instantiation may include the following steps:
- the decoding module 22 can be a parallelized processing unit, for example a graphics processing unit (or GPU for "Graphical Processing Unit') or a tensor processing unit (or TPU for "Tensor Processing Unit') .
- a graphics processing unit or GPU for "Graphical Processing Unit'
- a tensor processing unit or TPU for "Tensor Processing Unit'
- FIG. 6 represents an example of a decoding method, implemented here by the decoding device of FIG. 5.
- This decoding method is for example implemented due to the execution, by a processor of the decoding device 20, of the instructions of a computer program stored in a memory of the decoding device 20 (for example in the storage unit 26).
- the decoding device 20 receives as input the data stream S produced by the method of FIG. 3 and represented in FIG. 4.
- This method begins at step E22 in which the decoding device 20 selects the first image to be decoded represented in the data stream S as the current image.
- step E24 the decoding device 20 (here the analysis unit 30) tests whether a header relating to a video sequence (containing an SPS set of parameters relating to this video sequence) is present in the data stream S received (specifically, in the portion of the data stream S being processed by the decoding device 20).
- a header relating to a video sequence containing an SPS set of parameters relating to this video sequence
- This can be achieved in practice by the detection of information characteristic of a header relating to a sequence of images (for example in the signaling of the data stream S).
- step E26 for decoding this header (that is to say consulting the data of the aforementioned SPS set).
- step E28 the method continues at step E28 described below.
- the decoding device 20 extracts from the data stream S the SPS set of parameters relating to the current sequence, which contains here in particular:
- the part of the data stream associated with the current image sequence here comprises the SPS set of parameters relating to the current sequence and the data encountered (sets PPS of parameters relating to images, units of data DU relating to images) until detection of a new header relating to a (new) sequence of images.
- the flag FL thus indicates the possibility or the impossibility of an update, during the current sequence of images, of the network of artificial decoding neurons used for the decoding of the images (i.e. i.e. in practice data units) of this current sequence.
- the indicative data NN can be an identifier Inn of the decoding artificial neural network DN from among a predetermined set of artificial neural networks.
- the characteristics C of each of the artificial neural networks of this predetermined set are for example in this case stored within the decoding device 20 (here in the storage unit 26). As a variant, these characteristics could be accessible, possibly by downloading, by the decoding device 20.
- the indicative data NN can be a coded representation Rc of the decoding artificial neural network DN, for example a coded representation Rc of characteristic parameters (such as the structure and/or the weights) of the neural network artificial DN decoding.
- the aforementioned coded representation Rc can for example be constructed in accordance with a standard such as the MPEG-7 part 17 standard or in a format such as the JSON format.
- these indicative data NN may be differential coding data D of the decoding artificial neural network DN relative to a reference decoding artificial neural network R.
- the set of SPS parameters extracted at step E26 may in this case also contain data indicative of the reference artificial neural network R, for example an identifier of the reference artificial neural network R from among a predetermined set of artificial neurons (set of the same type as mentioned above about the Inn identifier).
- the reference artificial neural network R is determined at this stage (without requiring additional information in the SPS set): it may be for example a predetermined decoding artificial neural network (used as the reference decoding artificial neural network for any decoding performed by the decoding device 20) or of the reference decoding artificial neural network previously used (during earlier iterations of the method of FIG. 6).
- the decoding artificial neural network DN (coded by the differential coding data D) and the reference decoding artificial neural network R may have the same structure.
- the differential coding data D can then in particular contain data representative respectively of differences between each weight of the decoding artificial neural network DN and the corresponding weight (that is to say located at the same place in the common structure) of the network of artificial reference decoding neurons R.
- the differential coding data D can be representative of a subset of weights of the reference decoding artificial neural network R to be updated. These differential coding data D can indicate in this case which weights to update and/or the value of each of these weights to update.
- the differential coding data D can be representative of additional layers of artificial neural network to be inserted within the structure of the reference decoding artificial neural network R.
- the differential coding data D describe for example in this case, for each additional layer, the structure of the additional layer concerned, the weights of the artificial neurons forming the additional layer concerned and/or the place of insertion of the additional layer concerned within the network of artificial neurons reference decoding R.
- the decoding device 20 determines the decoding artificial neural network DN associated with the current image sequence on the basis of the indicative data NN.
- This DN decoding artificial neural network becomes the current decoding artificial neural network.
- the configuration module 28 can then configure the decoding module 22 so that this decoding module 22 is capable of decoding one (or more) unit(s) of data (to be extracted from the data stream S as explained below) at the means of this current decoding artificial neural network.
- the method continues at step E28 at which the decoding device 20 (here the analysis unit 30) detects a header relating to an image in the data stream S and extracts therefrom a set PPS of parameters relating to this picture. This can be achieved in practice by detecting information characteristic of a header relating to an image (for example in the signaling of the data stream S).
- the decoding device 20 determines in step E30 if the flag FL (contained in the set SPS of parameters relating to the current sequence and extracted in step E26) indicates the presence potential or the absence of data indicative of another decoding artificial neural network, that is to say here in practice the presence or absence of another flag FL′ as mentioned below.
- the decoding method continues at step E42 described below for decoding the current image.
- the decoding method continues at step E32 in which the decoding device 20 (here the reading module 33) reads this other flag FL′, here within the PPS set extracted in step E28.
- This other flag FL' indicates, as already explained, the presence or absence (here within the PPS set of parameters relating to the current image) of data NN' indicative of a decoding artificial neural network (distinct from the current decoding artificial neural network and/or the decoding artificial neural network determined, during the last passage to step E26, on the basis of the indicative data NN contained in the set SPS and/or of the artificial neural network decoding determined, during a previous transition to step E36 described below, on the basis of indicative data NN′ contained in a previous set PPS).
- step E36 the decoding device 20 (here the obtaining module 34) obtains the data NN′ indicative of the artificial neural network for distinct decoding by analysis of the data stream S, here by consulting the set PPS of parameters relating to the current image (extracted from the data stream S at step E28).
- the indicative data NN′ can be differential coding data D′ of the distinct decoding artificial neural network, relative to a reference decoding artificial neural network.
- this reference decoding artificial neural network may be the decoding artificial neural network associated with the current sequence (determined in step E26 on the basis of the indicative data NN contained in the set SPS of parameters relating to the current sequence).
- this reference decoding artificial neural network can be the current decoding artificial neural network (determined during the passage to step E26 or during a previous passage to step E38 described later low).
- the reference decoding artificial neural network can be, as already indicated, a predetermined artificial neural network (for example fixed for the decoding device concerned).
- the distinct decoding artificial neural network, coded by the differential coding data D′, and the reference decoding artificial neural network may have the same structure.
- the differential coding data D′ can then in particular contain data representative respectively of differences between each weight of the distinct decoding artificial neural network and the corresponding weight (that is to say located at the same place in the common structure) of the reference decoding artificial neural network.
- the differential coding data D can be representative of a subset of weights of the reference decoding artificial neural network R to be updated. These differential coding data D can indicate in this case which weights to update and/or the value of each of these weights to update.
- the differential coding data D can be representative of additional layers of artificial neural network to be inserted within the structure of the reference decoding artificial neural network R.
- the differential coding data D describes by example in this case, for each additional layer, the structure of the additional layer concerned, the weights of the artificial neurons forming the additional layer concerned and/or the place of insertion of the additional layer concerned within the network of artificial decoding neurons reference R.
- the indicative data can be an identifier of the distinct decoding artificial neural network among a predetermined set of artificial neural networks (whose characteristics C are stored in the storage unit 26), or a coded representation of the distinct decoding artificial neurons, for example a coded representation of characteristic parameters (such as the structure and/or the weights) of the network of distinct decoding artificial neurons.
- the method of FIG. 6 then continues with a step E38 in which the decoding device 20 (here the network determination module 24) determines the distinct decoding artificial neural network, to be used for the decoding of the current image , on the basis of indicative data NN'.
- This distinct decoding artificial neural network then becomes the current decoding artificial neural network.
- the decoding device 20 (here the configuration module 28) can thus configure in step E40 the decoding module 22 so that this decoding module 22 is capable of decoding (as described below) the data unit DU relating to the current image by means of the decoding artificial neural network determined in step E38.
- the method of FIG. 6 continues at step E42 at which the decoding device 20 (here the analysis unit 30) extracts the data unit DU relating to the current image from the data stream S and the decoding module 22 decodes this data unit DU by means of the current decoding artificial neural network, which makes it possible to obtain a two-dimensional representation IMG' of the current image.
- the decoding which has just been mentioned also uses at least one other data unit included in the current part of the data stream, that is to say relating to another image of the sequence of images current
- the method of FIG. 6 then loops to step E24 for analysis of the continuation of the data stream S and processing of the following image.
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Une partie de flux de données comprend une pluralité d'unités de données (DU) respectivement associées à une pluralité d'images et représentatives ensemble des différentes images de la pluralité d'images. Ladite partie de flux de données comprend en outre des données (Δ; Δ') de codage différentiel d'un réseau de neurones artificiels de décodage relativement à un réseau de neurones artificiels de décodage de référence. Un procédé de décodage de cette partie de flux de données comprend les étapes suivantes : - détermination du réseau de neurones artificiels de décodage par décodage desdites données (Δ; Δ') de codage différentiel; et - décodage d'au moins une unité de données (DU) de la pluralité d'unités de données au moyen du réseau de neurones artificiels de décodage déterminé. Un autre procédé de décodage, des dispositifs de décodage, un programme d'ordinateur et des flux de données associés sont également décrits.
Description
Procédés et dispositifs de décodage d’une partie au moins d’un flux de données, programme d’ordinateur et flux de données associés
Domaine technique de l'invention
La présente invention concerne des procédés et des dispositifs de décodage d’une partie au moins d’un flux de données, ainsi qu’un programme d’ordinateur et des flux de données associés.
Etat de la technique
Il a été proposé de compresser des données représentatives d’un contenu vidéo au moyen d’un réseau de neurones artificiels. Le décodage des données compressées peut alors s’effectuer au moyen d’un autre réseau de neurones artificiels, comme décrit par exemple dans l’article " DVC : An End-to-end Deep Video Compression Framework', de Guo Lu et al., 2019 IEEE/CVF Conférence on Computer Vision and Pattern Récognition (CVPR), Long Beach, CA, USA, 2019, pp. 10998- 11007.
Présentation de l'invention
Dans ce contexte, la présente invention propose un procédé de décodage d’une partie de flux de données, ladite partie de flux de données comprenant une pluralité d’unités de données respectivement associées à une pluralité d’images et représentatives ensemble des différentes images de la pluralité d’images, ladite partie de flux de données comprenant en outre des données de codage différentiel d’un réseau de neurones artificiels de décodage relativement à un réseau de neurones artificiels de décodage de référence, le procédé de décodage comprenant les étapes suivantes :
- détermination du réseau de neurones artificiels de décodage par décodage desdites données de codage différentiel ; et
- décodage d’au moins une unité de données de la pluralité d’unités de données au moyen du réseau de neurones artificiels de décodage déterminé.
Ainsi, les données de codage différentiel sont incluses dans le flux de données, et permettent de déterminer simplement le réseau de neurones artificiels de décodage à utiliser. Cela évite un temps de latence et une ressource de calcul nécessaires autrement à la détermination du réseau de neurones artificiels de décodage optimal. L’utilisation de données de codage différentiel permet aussi de limiter la quantité de
données nécessaires au codage de ce réseau de neurones artificiels de décodage dans le flux de données.
D’autres caractéristiques non limitatives et avantageuses du procédé conforme à l’invention, prises individuellement ou selon toutes les combinaisons techniquement possibles, sont les suivantes :
- des données caractéristiques du réseau de neurones artificiels de décodage de référence sont mémorisées dans une mémoire du dispositif électronique mettant en oeuvre le procédé de décodage ;
- le flux de données comprend un identifiant du réseau de neurones artificiels de décodage de référence ;
- le flux de données comprend des données descriptives du réseau de neurones artificiels de décodage de référence ;
- lesdites données descriptives sont comprises dans ladite partie du flux de données ;
- ladite étape de décodage de ladite unité de données produit une représentation bidimensionnelle de l’image associée à ladite unité de données par décodage de ladite unité de données et d’au moins une autre unité de données comprise dans ladite partie de flux de données ;
- le réseau de neurones artificiels de décodage de référence est défini par une pluralité de premiers poids ;
- le réseau de neurones artificiels de décodage déterminé est défini par une pluralité de seconds poids ;
- lesdites données de codage différentiel comprennent des données représentant respectivement une pluralité de différences entre un premier poids et un second poids ;
- des données indicatives du réseau de neurones artificiels de référence sont contenues dans un ensemble de paramètres relatif à ladite partie de flux de données ;
- les données de codage différentiel sont contenues dans un ensemble de paramètres relatif à l’image associée à ladite unité de donnée ;
- le flux de données comprend au moins un drapeau signalisant la présence, dans une partie au moins du flux de données, d’au moins un autre drapeau signalisant la présence de données indicatives d’un autre réseau de neurones artificiels de décodage, distinct du réseau de neurones artificiels de décodage déterminé ;
- le flux de données comprend au moins un drapeau signalisant la présence desdites données de codage différentiel dans ladite partie de flux de données.
On propose également un procédé de décodage d’un flux de données, dans lequel des données du flux sont décodées au moyen d’un premier réseau de neurones artificiels de décodage en une représentation bidimensionnelle d’une image, caractérisé en ce que le flux de données comprend au moins un drapeau signalisant la présence, dans une partie au moins du flux de données, d’au moins un autre drapeau signalisant la présence de données indicatives d’un second réseau de neurones artificiels de décodage, distinct du premier réseau de neurones artificiels de décodage.
Un tel drapeau permet d’indiquer si le réseau de neurones artificiels de décodage sera potentiellement modifié ou non au cours du décodage de ladite au moins une partie du flux de données. La solution proposée est toutefois souple puisque c’est l’autre drapeau qui signalise la présence ou l’absence des données indicatives.
Un tel procédé peut comprendre en outre les étapes suivantes lorsque le drapeau signale la présence de l’autre drapeau :
- lecture dans le flux de données de l’autre drapeau ;
- obtention desdites données indicatives par analyse du flux de données (lorsque l’autre drapeau signalise la présence de ces données indicatives) ;
- détermination du second réseau de neurones artificiels de décodage sur la base desdites données indicatives ;
- décodage d’autres données du flux au moyen du second réseau de neurones artificiels de décodage.
Lorsque le flux de données comprend une pluralité de parties, chaque partie comprenant une pluralité d’unités de données respectivement associées à une pluralité d’images et représentatives ensemble des différentes images de la pluralité d’images, ledit drapeau peut signaliser la présence d’au moins un autre drapeau au sein d’une partie donnée parmi lesdites parties.
Le procédé peut alors comprendre, lorsque ledit drapeau signalise la présence de l’autre drapeau dans ladite partie donnée, les étapes suivantes pour chaque unité de données comprise dans ladite partie donnée :
- détermination (par exemple par lecture de l’autre drapeau susmentionné) de la présence de données définissant un réseau de neurones artificiels de décodage et relatives à l’unité de données concernée ;
- en cas de présence de ces données, décodage des données de l’unité de données concernée au moyen du réseau de neurones artificiels défini par ces données.
L’invention concerne également un dispositif de décodage d’une partie de flux de données, ladite partie de flux de données comprenant une pluralité d’unités de données respectivement associées à une pluralité d’images et représentatives ensemble des différentes images de la pluralité d’images, ladite partie de flux de données comprenant en outre des données de codage différentiel d’un réseau de neurones artificiels de décodage relativement à un réseau de neurones artificiels de décodage de référence, le dispositif de décodage comprenant :
- un module de détermination du réseau de neurones artificiels de décodage par décodage desdites données de codage différentiel ; et
- un module de décodage d’au moins une unité de données de la pluralité d’unités de données au moyen du réseau de neurones artificiels de décodage déterminé par le module de détermination.
Un tel dispositif de décodage peut comprendre une unité de mémorisation apte à mémoriser des données caractéristiques du réseau de neurones artificiels de décodage de référence.
Le dispositif de décodage peut également comprendre un module de traitement de données descriptives du réseau de neurones artificiels de décodage de référence comprises dans le flux de données.
Le module de décodage peut être configuré pour produire une représentation bidimensionnelle de l’image associée à ladite unité de données par décodage de ladite unité de données et d’au moins une autre unité de données comprise dans ladite partie de flux de données.
L’invention propose également un dispositif de décodage d’un flux de données, comprenant un module de décodage de données du flux de données au moyen d’un premier réseau de neurones artificiels de décodage et en une représentation bidimensionnelle d’une image, caractérisé en ce que le dispositif de décodage comprend un module de détection d’un drapeau signalisant la présence, dans une
partie au moins du flux de données, d’au moins un autre drapeau signalisant la présence de données indicatives d’un second réseau de neurones artificiels de décodage, distinct du premier réseau de neurones artificiels de décodage.
Ce dispositif de décodage peut comprendre :
- un module de lecture configuré pour lire, lorsque ledit drapeau signalise la présence de l’autre drapeau, l’autre drapeau dans le flux de données ; et/ou
- un module d’obtention configuré pour obtenir, lorsque l’autre drapeau signale la présence desdites données indicatives, lesdites données indicatives par analyse du flux de données ; et/ou
- un module de détermination du second réseau de neurones artificiels de décodage sur la base desdites données indicatives ; et/ou
- un module de configuration conçu pour configurer le module de décodage pour décoder d’autres données du flux au moyen du second réseau de neurones artificiels de décodage.
Le module d’obtention est configuré pour obtenir lesdites données indicatives par analyse de ladite partie donnée.
L’invention propose par ailleurs un flux de données comprenant au moins une partie comprenant une pluralité d’unités de données respectivement associées à une pluralité d’images et représentatives ensemble des différentes images de la pluralité d’images, ladite partie comprenant en outre des données de codage différentiel d’un réseau de neurones artificiels de décodage relativement à un réseau de neurones artificiels de décodage de référence, dans lequel au moins une unité de données de la pluralité d’unités de données est décodable au moyen du réseau de neurones artificiels de décodage codé par lesdites données de codage différentiel.
L’invention propose aussi un flux de données comprenant des données décodables au moyen d’un premier réseau de neurones artificiels de décodage en une représentation bidimensionnelle d’une image, caractérisé en ce que le flux de données comprend au moins un drapeau signalisant la présence, dans une partie au moins du flux de données, d’au moins un autre drapeau signalisant la présence de données indicatives d’un second réseau de neurones artificiels de décodage, distinct du premier réseau de neurones artificiels de décodage.
Le drapeau peut signaliser la présence de l’autre drapeau dans la partie du flux de données et/ou la partie du flux de données peut comprendre l’autre drapeau.
L’invention propose également un programme d’ordinateur comprenant des instructions exécutables par un processeur et conçues pour mettre en oeuvre un procédé de décodage tel que proposé ci-dessus lorsque ces instructions sont exécutées par le processeur.
L’invention propose enfin un support d’enregistrement lisible par un ordinateur, sur lequel est enregistré un tel programme d'ordinateur.
Bien entendu, les différentes caractéristiques, variantes et formes de réalisation de l'invention peuvent être associées les unes avec les autres selon diverses combinaisons dans la mesure où elles ne sont pas incompatibles ou exclusives les unes des autres.
Description détaillée de l'invention
De plus, diverses autres caractéristiques de l'invention ressortent de la description qui suit effectuée en référence aux dessins qui illustrent des formes, non limitatives, de réalisation de l'invention et où :
- la figure 1 représente schématiquement un dispositif de codage utilisé dans le cadre de l’invention ;
- la figure 2 illustre un exemple d’une paire de réseaux de neurones artificiels de codage et de décodage ;
- la figure 3 est un logigramme représentant un exemple de procédé de codage qui peut être mis en oeuvre par le dispositif de codage de la figure 1 ;
- la figure 4 représente un flux de données produit par le procédé de codage de la figure 3 ;
- la figure 5 représente schématiquement un dispositif de décodage conforme à l’invention ; et
- la figure 6 est un logigramme représentant un exemple de procédé de décodage qui peut être mis en oeuvre par le dispositif de décodage de la figure 5.
La figure 1 représente les éléments fonctionnels principaux d’un dispositif de codage 2.
Ce dispositif de codage 2 comprend un module de gestion de séquence 4, un module de gestion d’image 6, un module de détermination de réseau 8, un module de codage 10 et un module de formation de flux 12.
Le dispositif de codage 2 peut en pratique être mis en oeuvre au moyen d’un dispositif électronique comprenant un processeur et une mémoire ; chacun des
modules 4, 6, 8, 10, 12 mentionnés ci-dessus peut alors être réalisé par la coopération du processeur et d’instructions de programme d’ordinateur mémorisées dans la mémoire susmentionnée et conçues pour effectuer les fonctionnalités du module concerné, notamment comme décrit ci-dessous, lorsque ces instructions sont exécutées par le processeur.
Le dispositif de codage 2 reçoit en entrée une succession temporelle d’images IMG à coder en vue de leur stockage (pour lecture ultérieure au moyen d’un dispositif de décodage) ou de leur transmission (à destination d’un dispositif de décodage).
Chaque image IMG reçue en entrée est par exemple représentée au moyen d’au moins une représentation bidimensionnelle, telle qu’une matrice de pixels. En pratique, chaque image IMG reçue en entrée peut être représentée par une pluralité de représentations bidimensionnelles (ou matrices de pixels) correspondant respectivement à une pluralité de composantes de l’image (par exemple une pluralité de composantes de couleur, ou, en variante, une composante de luminance et au moins une composante de chrominance).
Comme cela sera décrit plus en détail plus loin en référence à la figure 3, le module de gestion de séquence 4 est configuré pour déterminer si une image IMG reçue en entrée constitue une première image d’une séquence d’images et pour déterm iner si un réseau de neurones artificiels de codage peut être mis é jour au cours de cette séquence d’images. Le module de gestion de séquence 4 est également configuré pour produire un ensemble SPS de paramètres relatif à la séquence d’image courante.
Comme décrit dans la suite, le dispositif de codage 2 produit notamment en sortie une pluralité d’unités de données DU respectivement associées à une pluralité d’images IMG de la succession temporelle d’images. On appelle ici " séquence d’images" (au sens de la norme HEVC) un ensemble d’images respectivement associées à une pluralité de telles unités de données DU représentatives ensemble des différentes images de la pluralité d’images. Autrement dit, toute image d’une séquence d’images peut être décodée sur la base d’unités de données DU associées à des images de cette séquence d’images, sans référence à d’autres unités de données associées à des images non comprises dans la séquence d’images.
Comme décrit plus en détail dans la suite en référence à la figure 3, le module de gestion d’image 6 est configuré pour déterminer si le réseau de neurones artificiels
de codage utilisé est mis à jour pour le codage de l’image courante IMG. Le module de gestion d’image 6 est par ailleurs configuré pour produire un ensemble PPS de paramètres relatif à l’image courante IMG.
Le module de détermination de réseau 8 est configuré pour déterminer un réseau de neurones artificiels de codage EN à utiliser pour le codage de l’image courante IMG. Diverses possibilités pour effectuer cette détermination du réseau de neurones artificiels de codage à utiliser EN sont décrites ci-dessous en référence à la figure 3.
Comme illustré sur la figure 2, le réseau de neurones artificiels de codage EN utilisé est associé à un réseau de neurones artificiels de décodage DN utilisable quant à lui pour décoder les unités de données DU produites par le réseau de neurones artificiels de codage EN. Le réseau de neurones artificiels de codage EN et le réseau de neurones artificiels de décodage DN forment ainsi une paire de réseaux de neurones artificiels.
Le réseau de neurones artificiels de codage EN et le réseau de neurones artificiels de décodage DN sont chacun définis par une structure (comprenant par exemple une pluralité de couches de neurones artificiels et/ou par un ensemble de poids associées respectivement aux neurones artificiels du réseau concerné).
Une représentation (par exemple bidimensionnelle) de l’image courante IMG (ou, en variante, d’une composante ou d’un bloc de l’image courante IMG) est appliquée en entrée (c’est-à-dire sur une couche d’entrée) du réseau de neurones artificiels de codage EN. Le réseau de neurones artificiels de codage EN produit alors en sortie des données codées, ici une unité de données DU.
Ultérieurement (comme décrit dans la suite en référence aux figures 5 et 6), les données codées (ici l’unité de données DU) sont appliquées en entrée du réseau de neurones artificiels de décodage DN. Le réseau de neurones artificiels de décodage DN produit alors en sortie une représentation IMG’ (par exemple bidimensionnelle) qui correspond à l’image courante IMG (ou, en variante, à la composante ou au bloc concerné de l’image courante IMG).
Le réseau de neurones artificiels de codage EN est conçu de sorte que l’unité de données DU contienne une quantité de données inférieure (au moins en moyenne) à la représentation précitée de l’image courante IMG. Autrement dit, les données de l’unité de données DU sont compressées.
Le réseau de neurones artificiels de codage EN et le réseau de neurones artificiels de décodage DN sont par ailleurs entraînés préalablement (par exemple en appliquant en entrée un grand nombre d’images) de sorte à minimiser les différences entre la représentation en entrée de l’image courante IMG et sa représentation IMG’ en sortie, tout en minimisant également la quantité de données qui transitent entre le réseau de neurones artificiels de codage EN et le réseau de neurones artificiels de décodage DN.
Comme décrit dans la suite, le module de détermination de réseau 8 peut sélectionner le réseau de neurones artificiels de codage à utiliser EN parmi plusieurs réseaux de neurones artificiels de codage distincts (appartenant respectivement à plusieurs paires de réseau de neurones artificiels de codage et de réseau de neurones artificiels de décodage).
Le module de détermination de réseau 8 est également configuré pour produire des données NN, NN’ indicatives du réseau de neurones artificiels de décodage DN à utiliser pour le décodage des unités de données DU (au sein du dispositif de décodage 20 comme décrit plus loin). Comme expliqué ci-dessus, ce réseau de neurones artificiels de décodage DN (désigné par les données indicatives NN, NN’ susmentionnées) est le réseau de neurones artificiels de décodage de la paire comprenant le réseau de neurones artificiels de codage EN déterminé (par exemple sélectionné) par le module de détermination de réseau 8. Ainsi, lors du codage des images IMG, les informations utiles au bon déroulement du décodage des unités de données DU sont contenues et transmises via les données NN, NN’. Cela permet notamment d’éviter une étape de détermination du réseau de neurones artificiels de décodage optimal et de gagner du temps au décodage.
Le module de codage 10 est configuré pour coder la représentation de l’image courante IMG (ou d’une partie de l’image courante) en données codées (ici en une unité de données DU) au moyen du réseau de neurones artificiels de codage EN déterminé par le module de détermination de réseau 8.
Le module de codage 10 reçoit donc en entrée la représentation (ici bidimensionnelle, par exemple une matrice de pixels) de l’image IMG (ou de la partie d’image IMG) et produit en sortie une unité de données DU correspondante.
En variante, le module de codage 10 peut recevoir en entrée une représentation d’une composante de l’image IMG, ou d’un bloc seulement de l’image IMG, ou encore d’une pluralité d’images IMG.
Selon une possibilité de réalisation, pour certaines images au moins, le module de codage 10 peut en outre recevoir en entrée au moins une autre représentation d’image et/ou au moins une autre unité de données (associée à une autre image de la séquence courante). L’autre représentation d’image précitée peut être une représentation d’une autre image de la séquence courante, ou, en variante, une représentation obtenue en sortie du réseau de neurones artificiels de décodage DN associé au réseau de neurones artificiels de codage EN utilisé par le module de codage 10 lorsqu’une autre unité de données (associée à une autre image de la séquence courante) est appliquée en entrée de ce réseau de neurones artificiels de décodage DN.
Le module de formation de flux 12 est configuré pour recevoir en entrée l’ensemble SPS de paramètres relatif à la séquence d’image, l’ensemble PPS de paramètres relatif à l’image IMG, les données NN, NN’ indicatives du réseau de neurones artificiels de décodage et les unités de données DU, et pour construire un flux de données S sur la base de ces éléments.
En pratique, le module de formation de flux 12 peut comprendre une unité de concaténation pour agréger (de manière prédéfinie) les données listées au paragraphe précédent, et un codeur entropique pour codage entropique des données agrégées. Toutefois, par souci de simplification, on ne décrira pas ici l’étape de codage entropique et on décrira le flux de données S sous la forme qu’il présente avant codage entropique.
Le flux de données S peut alors être émis à destination d’un autre dispositif électronique (par exemple un dispositif de décodage 20 tel que décrit ci-dessous en référence à la figure 5, ou mémorisé au sein d’une unité de mémorisation (telle qu’un disque dur ou la mémoire susmentionnée du dispositif de codage 2) pour lecture et décodage ultérieurs.
La figure 3 représente un exemple de procédé de codage, mis en oeuvre ici par le dispositif de codage 2.
Ce procédé de codage s’applique à une succession temporelle (et donc ordonnée) d’images IMG. Cette succession temporelle d’images IMG forme donc une vidéo que l’on souhaite coder pour transmission ou mémorisation (enregistrement).
Le procédé de la figure 3 débute par une étape d’initialisation E2 à laquelle le dispositif de codage 2 sélectionne la première image de la succession temporelle d’images en tant qu’imagé courante.
Le procédé de la figure 3 se poursuit par une étape E3 à laquelle le dispositif de codage 2 (ici le module de gestion de séquence 4) détermine si l’image courante IMG est choisie comme première image d’une séquence.
Le critère utilisé pour effectuer cette détermination peut varier en fonction de l’application visée par le codage vidéo.
Dans l’exemple décrit ici (utilisable éventuellement pour un flux de données destiné à être diffusé en télévision), le dispositif de codage 2 (ici le module de gestion de séquence 4) démarre une nouvelle séquence toutes les secondes. Ainsi, le temps d’attente de la partie de flux de données relative à une nouvelle séquence (qui permet d’assurer le décodage des images) est de 1 seconde maximum (ce temps d’attente est nécessaire par exemple lors d’un changement de chaîne).
En variante, il est possible de démarrer une nouvelle séquence lors d’un changement de plan dans la vidéo. Un tel changement de plan peut être déterminée automatiquement par analyse des images de la succession temporelle d’images.
Selon une autre variante, il est possible de prévoir des séquences de durée plus longue (par exemple entre 10 secondes et 40 secondes) afin de réduire le débit de transmission (le codage de chaque première image d’une séquence nécessitant une quantité de données plus importante de manière à pouvoir reconstruire cette image sur la seule base de ces données, sans référence à des données relatives à d’autres images).
S’il est déterminé à l’étape E3 que l’image courante IMG est choisie comme première image d’une séquence (c’est-à-dire que le dispositif de codage 2 démarre une nouvelle séquence), le procédé se poursuit à l’étape E4 décrite ci-dessous.
Si l’image courante IMG n’est pas choisie comme première image d’une séquence (c’est-à-dire que le dispositif de codage 2 poursuit le codage de la séquence courante), le procédé se poursuit à l’étape E10 décrite plus loin pour traitement de l’image courante IMG.
À l’étape E4, le dispositif de codage 2 (ici le module de détermination de réseau 8) détermine le réseau de neurones artificiels de codage EN à associer à la séquence courante. Le réseau de neurones artificiels de codage EN ainsi déterminé devient le réseau de neurones artificiels de codage courant.
Selon une possibilité de réalisation, le module de détermination de réseau 8 choisit le réseau de neurones artificiels de codage EN parmi un ensemble prédéterminé de réseaux de neurones artificiels de codage, par exemple parmi un ensemble de réseaux de neurones artificiels de codage associés respectivement à des réseaux de neurones artificiels de décodage disponibles au sein du dispositif de décodage (un échange préalable entre le dispositif de codage et le dispositif de décodage étant alors possible pour identifier cet ensemble de réseaux de neurones artificiels).
Selon une possibilité de réalisation, le module de détermination de réseau 8 choisit le réseau de neurones artificiels de codage EN qui obtient la meilleure performance de compression, par exemple au sens d’un critère débit-distorsion ou d’une mesure de qualité de la représentation bidimensionnelle décodée IMG’. Le module de détermination de réseau 8 peut par exemple pour ce faire appliquer l’image courante IMG (ou une pluralité d’images incluant l’image courante IMG) en entrée de plusieurs réseaux de neurones artificiels de codage (chacun en association éventuellement avec le réseau de neurones artificiels de décodage qui lui est associé) et choisir le réseau de neurones artificiels de codage EN qui permet d’obtenir la meilleure performance de compression comme indiqué ci-dessus.
Dans l’exemple décrit ici où la séquence a une durée prédéterminée (par exemple 1 seconde), on peut appliquer (successivement) l’ensemble des images de la séquence en entrée des différents réseaux de neurones artificiels de codage pour choisir le réseau de neurones artificiels de codage EN qui permet d’obtenir la meilleure performance de compression.
En variante, le module de détermination de réseau 8 peut analyser l’image courante IMG (ou une pluralité d’images incluant l’image courante IMG, ici les images de la séquence), par exemple pour identifier le type de contenu concerné (sport, image de synthèse, film, visioconférence, etc.), et choisir un réseau de neurones artificiels de codage EN en fonction du résultat de cette analyse, par exemple en fonction du type de contenu identifié.
Selon une autre possibilité de réalisation, le module de détermination de réseau 8 peut déterminer le réseau de neurones artificiels de codage EN au moyen d’un processus d’apprentissage. Un tel processus d’apprentissage comprend par exemple :
- l’application de l’image courante IMG (ou d’une pluralité d’images incluant l’image courante IMG, ici les images de la séquence courante) en entrée du réseau de neurones artificiels de codage EN ;
- l’optimisation du réseau de neurones artificiels de codage EN et du réseau de neurones artificiels de décodage DN associé (notamment par modification des poids définissant chacun de ces deux réseaux de neurones EN, DN), éventuellement au moyen de plusieurs itérations, de manière à réduire (voire minimiser) le coût débit- distorsion (ce coût étant par exemple une somme pondérée du débit produit par la ou les unité(s) de données DU, et de la distorsion entre la ou les représentation(s) bidimensionnelle(s) décodée(s) IMG’ et la ou les image(s) IMG appliquée(s) en entrée).
Le procédé se poursuit à l’étape E6 à laquelle le dispositif de codage 2 (ici le module de gestion de séquence 4) détermine si le réseau de neurones artificiels de codage EN peut être mis à jour au cours de la séquence d’images courante. Dans la négative, le réseau de neurones artificiels de codage EN déterminé à l’étape E4 sera utilisé pour coder toutes les images de la séquence courante.
Dans le mode de réalisation décrit ici (où la séquence a une durée prédéterminée, par exemple 1 seconde), le module de gestion de séquence 4 analyse les images de la séquence, et choisit de rendre possible la mise à jour du réseau de neurones artificiels de codage EN au cours de la séquence d’images lorsque cette analyse indique une inhomogénéité des images analysées, et de ne pas prévoir une mise à jour du réseau de neurones artificiels de codage EN au cours de la séquence lorsque cette analyse indique une homogénéité des images analysées.
Les images analysées (c’est-à-dire les images de la séquence concernée) sont par exemple déterminées comme homogènes si l’erreur quadratique moyenne entre les composantes de luminance respectives de deux images successives est inférieure à un seuil prédéterminé pour toutes les paires d’images successives de la séquence. (À titre d’exemple, ce seuil peut être compris entre 25 et 75, par exemple égal à 50, pour des images dont les valeurs de luminance peuvent varier en 0 et 255.)
Selon une possibilité de réalisation, il est envisageable de simuler le codage et le décodage des images de la séquence avec et sans mise à jour du réseau de neurones artificiels de codage au cours de la séquence (les mises à jour éventuelles étant réalisées conformément à ce qui est décrit ci-dessous), de calculer un critère débit-distorsion dans les deux cas, et de choisir de rendre possible ou non la mise à jour du réseau de neurones artificiels de codage EN (au cours de la séquence courante) selon la solution qui minimise le critère débit-distorsion.
Selon une autre possibilité de réalisation (envisageable lorsque le découpage de la succession temporelle d’images en séquences est réalisé préalablement, par exemple par analyse de l’ensemble des images de la succession temporelle), le choix de rendre possible la mise à jour du réseau de neurones artificiels de codage EN au cours de la séquence d’images courante est effectué (par le module de gestion de séquence 4) en fonction de la durée de la séquence courante. Par exemple, si la durée de la séquence courante est inférieure à 2 secondes, le dispositif de codage 2 (ici le module de gestion de séquence 4) choisit de ne pas prévoir une mise à jour du réseau de neurones artificiels de codage EN au cours de la séquence ; sinon, le dispositif de codage 2 (ici le module de gestion de séquence 4) choisit de rendre possible une mise à jour du réseau de neurones artificiels de codage EN au cours de la séquence courante.
Le procédé se poursuit alors à l’étape E8 à laquelle le dispositif de codage (ici le module de gestion de séquence 4) produit un ensemble SPS de paramètres relatifs à la séquence courante.
Cet ensemble SPS de paramètres comprend les données NN indicatives du réseau de neurones artificiels de décodage DN associé au réseau de neurones artificiels de codage EN sélectionné à l’étape E4. Comme déjà indiqué, ces données indicatives NN sont ici produites par le module de détermination de réseau 8.
Selon une possibilité de réalisation, ces données indicatives NN peuvent être un identifiant Inn du réseau de neurones artificiels de décodage DN parmi un ensemble prédéterminé de réseaux de neurones artificiels (les caractéristiques des réseaux de neurones artificiels de cet ensemble prédéterminé étant par exemple mémorisées au sein du dispositif de décodage ou accessibles, éventuellement par téléchargement, par le dispositif de décodage).
Selon une autre possibilité de réalisation, ces données indicatives NN peuvent être une représentation codée Rc du réseau de neurones artificiels de décodage DN, par exemple une représentation codée Rc de paramètres caractéristiques (telles que la structure et/ou les poids) du réseau de neurones artificiels de décodage DN.
La représentation codée Rc précitée peut être par exemple construite conformément à une norme telle que la norme MPEG-7 partie 17 ou à un format tel que le format JSON.
On pourra se référer à ce sujet à l’article "DeepCABAC: Context-adaptive binary arithmetic coding for deep neural network compression", de S. Wiedemann et al., in Proceedings of the 36th International Conférence on Machine Learning, Long Beach, California, PMLR 97, 2019, ou à l’article "Compact and Computationally Efficient Représentation of Deep Neural Networks", de S. Wiedemann et al., in IEEE Transactions on Neural Networks and Learning Systems (Vol. 31 , Iss. 3), mars 2020.
Selon une autre possibilité de réalisation, ces données indicatives NN peuvent être des données D de codage différentiel du réseau de neurones artificiels de décodage DN relativement à un réseau de neurones artificiels de décodage de référence R.
Dans ce contexte, il est envisageable que le réseau de neurones artificiels de décodage DN (associé au réseau de neurones artificiels de codage EN sélectionné à l’étape E4) et le réseau de neurones artificiels de décodage de référence R aient la même structure. Les données de codage différentiel D peuvent alors notamment contenir des données représentatives respectivement de différences entre chaque poids du réseau de neurones artificiels de décodage DN et le poids correspondant (c’est-à-dire situé au même endroit dans la structure commune) du réseau de neurones artificiels de décodage de référence R.
En variante, les données de codage différentiel D peuvent être représentatives d’un sous-ensemble de poids du réseau de neurones artificiels de décodage de référence R à mettre à jour. Ces données de codage différentiel D peuvent indiquer dans ce cas quels sont les poids à mettre à jour et/ou la valeur de chacun de ces poids à mettre à jour.
Selon une autre variante, les données de codage différentiel D peuvent être représentatives de couches additionnelles de réseau de neurones artificiels à insérer au sein de la structure du réseau de neurones artificiels de décodage de référence R.
Les données de codage différentiel D décrivent par exemple dans ce cas, pour chaque couche additionnelle, la structure de la couche additionnelle concernée, les poids des neurones artificiels formant la couche additionnelle concernée et/ou le lieu d’insertion de la couche additionnelle concernée au sein du réseau de neurones artificiels de décodage de référence R.
L’ensemble de paramètres SPS peut dans ce cas contenir en outre des données indicatives du réseau de neurones artificiels de référence R, par exemple un identifiant du réseau de neurones artificiels de référence R parmi un ensemble prédéterminé de réseaux de neurones artificiels (ensemble du même type que mentionné ci-dessus à propos de l’identifiant Inn). En variante, comme expliqué plus loin en ce qui concerne le décodage, le réseau de neurones artificiels de référence R est déterminé à ce stade (sans nécessiter d’information complémentaire) : il peut s’agir par exemple du réseau de neurones artificiels de décodage associé au réseau de neurones artificiels de codage précédemment utilisé au cours des différentes itérations du procédé de codage de la figure 3, ou un réseau de neurones artificiels de décodage prédéterminé (utilisé comme réseau de neurones artificiels de décodage de référence pour l’ensemble du procédé de décodage).
L’ensemble SPS de paramètres comprend par ailleurs un drapeau FL signalisant la possibilité (ou l’impossibilité) de mise à jour du réseau de neurones artificiels de décodage au cours de la séquence courante, c’est-à-dire la présence potentielle ou l’absence, au sein de la partie du flux de données correspondant à la séquence d’images courante, de données NN’ indicatives d’un autre réseau de neurones artificiels de décodage distinct du réseau de neurones artificiels de décodage DN courant. Comme cela ressortira de la suite de la description, le drapeau FL signalise en pratique la présence ou l’absence d’au moins un autre drapeau FL’ signalisant quant à lui la présence (effective) ou l’absence des données NN’ indicatives de l’autre réseau de neurones artificiels de décodage distinct du réseau de neurones artificiels de décodage DN courant.
Le dispositif de codage 2 (ici le module de gestion de séquence 4) fixe la valeur du drapeau FL en fonction du résultat de l’étape E6 de détermination de la possibilité de mise à jour du réseau de neurones artificiels de décodage au cours de la séquence d’images courante.
Précisément, lorsqu’il est déterminé à l’étape E6 que la mise à jour du réseau de neurones artificiels de décodage est possible au cours de la séquence d’images courante, la valeur du drapeau FL signale cette possibilité de mise à jour, c’est-à-dire la présence potentielle, au sein de la partie du flux de données correspondant à la séquence d’images courante, de données NN’ indicatives d’un autre réseau de neurones artificiels de décodage. Comme expliqué dans la suite, la valeur du drapeau FL signale dans ce cas la présence d’au moins un autre drapeau FL’ signalisant la présence ou l’absence de ces données indicatives NN’. Dans l’exemple décrit ici, on a dans ce cas FL = 1 .
A l’inverse, lorsqu’il est déterminé à l’étape E6 que la mise à jour du réseau de neurones artificiels de décodage est impossible au cours de la séquence d’images courante, la valeur du drapeau FL signale cette impossibilité, c’est-à-dire l’absence, au sein de la partie du flux de données correspondant à la séquence d’images courante, de données indicatives d’un autre réseau de neurones artificiels de décodage. La valeur du drapeau FL signale ici l’absence (au sein de la séquence courante) d’un autre drapeau signalisant la présence des données indicatives d’un autre réseau de neurones artificiels de décodage. Dans l’exemple décrit ici, on a dans ce cas FL = 0.
L’ensemble de paramètres SPS peut contenir en outre des données indiquant le format des images (ou composantes) de chrominance dans la séquence courante, et/ou des données indiquant la taille maximale des images de la séquence courante, et/ou des données indiquant la taille minimale de blocs d’image de la séquence courante.
L’ensemble de paramètres SPS est inscrit dans le flux de données S à émettre (ici au moyen du module de formation de flux 12), par exemple dans l’en-tête de la partie de flux de données associée à la séquence d’images courante.
Le procédé se poursuit alors à l’étape E10 pour le traitement de l’image courante
IMG.
Le dispositif de codage 2 (ici le module de gestion d’image 6) détermine à l’étape E10 si le drapeau FL indique la possibilité de mettre à jour le réseau de neurones artificiels de codage EN au sein de la séquence d’images courante (c’est-à-dire ici la valeur du drapeau FL est égale à 1 ).
Dans l’affirmative à l’étape E10 (flèche P), le procédé se poursuit à l’étape E12 décrite ci-dessous. Dans la négative à l’étape E10 (flèche N), le procédé se poursuit à l’étape E16 décrite plus loin.
Le dispositif de décodage 2 (ici le module de gestion d’image 6) détermine à l’étape E12 si le réseau de neurones artificiels de codage doit être mis à jour pour le codage de l’image courante IMG ou si le codage de l’image courante peut être réalisé avec le réseau de neurones artificiels de codage courant.
La détermination de l’étape E12 peut être réalisée par analyse de l’image courante IMG.
Selon une autre possibilité de réalisation, la détermination de l’étape E12 peut être réalisée en simulant le codage de l’image courante IMG au moyen du réseau de neurones artificiels de codage courant et le codage de l’image courante IMG au moyen d’un (ou plusieurs) autre(s) réseau(x) de neurones artificiels de codage, et en choisissant de mettre à jour le réseau de neurones artificiels de codage si les résultats obtenus (selon un critère débit-distorsion) sont meilleurs avec au moins un de ces autres réseaux de neurones artificiels de codage.
S’il est déterminé à l’étape E12 qu’une mise à jour du réseau de neurones artificiels de codage est prévue pour l’image courante IMG, le dispositif de codage (ici le module de gestion d’image 6) met un drapeau FL’ à une valeur indiquant cette mise à jour (ici FL’ = 1 dans ce cas) et le procédé se poursuit à l’étape E14.
S’il est déterminé en revanche à l’étape E12 que le réseau de neurones artificiels de codage courant est utilisé (sans mise à jour) pour le codage de l’image courante IMG, le dispositif de codage (ici le module de gestion d’image 6) met le drapeau FL’ à une valeur indiquant cette absence de mise à jour (ici FL’ = 0 dans ce cas) et le procédé se poursuit à l’étape E16.
À l’étape E14, le dispositif de décodage 2 (ici le module de détermination de réseau 8) détermine le réseau de neurones artificiels de codage à utiliser pour le codage de l’image courante IMG. Le réseau de neurones artificiels de codage ainsi déterminé devient le réseau de neurones artificiels de codage courant.
Lorsque l’étape E12 comprend la simulation du codage de l’image courante IMG avec au moins un autre réseau de neurones artificiels et que cet autre réseau de neurones artificiels permet d’obtenir le meilleur résultat selon un critère débit- distorsion, cet autre réseau de neurones artificiels peut être choisi à l’étape E14
comme le réseau de neurones artificiels de codage à utiliser pour le codage de l’image courante IMG.
Comme déjà indiqué à l’étape E4, le module de détermination de réseau 8 peut choisir le réseau de neurones artificiels de codage à utiliser pour l’image courante IMG parmi un ensemble prédéterminé de réseaux de neurones artificiels de codage, par exemple parmi un ensemble de réseaux de neurones artificiels de codage associés respectivement à des réseaux de neurones artificiels de décodage disponibles au sein du dispositif de décodage.
Le module de détermination de réseau 8 peut aussi choisir le réseau de neurones artificiels de codage qui obtient la meilleure performance de compression, par exemple au sens d’un critère débit-distorsion ou d’une mesure de qualité de la représentation bidimensionnelle décodée IMG’ (éventuellement indépendamment de l’étape E12). Le module de détermination de réseau 8 peut par exemple pour ce faire appliquer l’image courante IMG en entrée de plusieurs réseaux de neurones artificiels de codage (chacun en association éventuellement avec le réseau de neurones artificiels de décodage qui lui est associé) et choisir le réseau de neurones artificiels de codage qui permet d’obtenir la meilleure performance de compression comme indiqué ci-dessus.
Selon une autre possibilité de réalisation, le module de détermination de réseau 8 peut analyser l’image courante IMG, par exemple pour identifier le type de contenu concerné, et choisir un réseau de neurones artificiels de codage en fonction du résultat de cette analyse, par exemple en fonction du type de contenu identifié.
Selon une autre possibilité de réalisation, le module de détermination de réseau 8 peut déterminer le réseau de neurones artificiels de codage à utiliser pour coder l’image courante IMG au moyen d’un processus d’apprentissage. Un tel processus d’apprentissage comprend par exemple :
- l’application de l’image courante IMG en entrée du réseau de neurones artificiels de codage ;
- l’optimisation du réseau de neurones artificiels de codage et du réseau de neurones artificiels de décodage associé (notamment par modification des poids définissant chacun de ces deux réseaux de neurones), éventuellement au moyen de plusieurs itérations, de manière à réduire (voire minimiser) le coût débit-distorsion (ce coût étant par exemple une somme pondérée du débit produit par l’unité de données
DU associée à l’image courante IMG, et de la distorsion entre la représentation bidimensionnelle décodée IMG’ et l’image courante IMG en entrée).
Le procédé se poursuit alors à l’étape E16 à laquelle le dispositif de codage (ici le module de gestion d’image 6) produit un ensemble PPS de paramètres relatifs à l’image courante IMG.
Cet ensemble PPS de paramètres relatifs à l’image courante IMG peut comprendre (ici lorsque le drapeau FL relatif à la séquence courante vaut 1 ) le drapeau FL’ indiquant la mise à jour ou l’absence de mise à jour du réseau de neurones artificiels de codage pour le codage de l’image courante IMG. Ce drapeau FL’ indique donc également la présence ou l’absence, au sein de l’ensemble PPS de paramètres relatifs à l’image courante IMG, de données indicatives d’un réseau de neurones artificiels de décodage (associé au réseau de neurones artificiels de codage mis à jour).
Lorsque le drapeau FL’ indique une mise à jour du réseau de neurones artificiels de codage (et donc la présence de données indicatives d’un réseau de neurones artificiels de décodage), l’ensemble PPS de paramètres relatifs à l’image courante IMG comprend en outre ces données NN’ indicatives du réseau de neurones artificiels de décodage. Ces données NN’ sont ici fournies par le module de détermination de réseau 8 (suite à la mise en oeuvre de l’étape E14).
Selon une possibilité de réalisation, ces données indicatives NN’ peuvent être un identifiant Inn du réseau de neurones artificiels de décodage parmi un ensemble prédéterminé de réseaux de neurones artificiels (les caractéristiques des réseaux de neurones artificiels de cet ensemble prédéterminé étant par exemple mémorisées au sein du dispositif de décodage ou accessibles, éventuellement par téléchargement, par le dispositif de décodage).
Selon une autre possibilité de réalisation, ces données indicatives NN’ peuvent être une représentation codée Rc du réseau de neurones artificiels de décodage, par exemple une représentation codée Rc de paramètres caractéristiques (telles que la structure et/ou les poids) du réseau de neurones artificiels de décodage.
On pourra se reporter aux explications données ci-dessus en référence à l’étape E8 à ce sujet.
Selon une autre possibilité de réalisation, ces données indicatives NN’ peuvent être des données D’ de codage différentiel du réseau de neurones artificiels de
décodage relativement à un réseau de neurones artificiels de décodage de référence. Les possibilités relatives au codage différentiel et présentées ci-dessus en référence à l’étape E8 s’appliquent également ici.
En particulier, le réseau de neurones artificiels de décodage de référence peut être désigné par des données indicatives contenues dans l’ensemble SPS de paramètres relatifs à la séquence courante (ensemble SPS produit lors du précédent passage à l’étape E8).
L’ensemble PPS de paramètres relatifs à l’image courante IMG peut contenir d’autres paramètres, tels que la taille de l’image L’ensemble de paramètres PPS est inscrit dans le flux de données S à émettre
(ici au moyen du module de formation de flux 12), par exemple dans l’en-tête relatif à l’image courante IMG.
Le dispositif de codage 2 (ici le module de codage 10) procède alors à l’étape E18 au codage de l’image courante IMG au moyen du réseau de neurones artificiels de codage courant, ce qui produit en sortie une unité de données DU associée à l’image courante IMG. Cette unité de données DU peut ainsi être inscrite dans le flux de données S (ici par le module de formation de flux 12).
Le dispositif de codage 2 sélectionne alors l’image suivante dans la succession temporelle d’images en tant que nouvelle image courante (étape E20) et boucle à l’étape E3 pour traitement de cette nouvelle image courante.
La figure 4 représente le flux de données S obtenue par le procédé de codage qui vient d’être décrit.
Ce flux de données S comprend pour chaque séquence d’images :
- un en-tête relatif à la séquence d’images concernée, cet en-tête comprenant un ensemble SPS de paramètres relatifs à la séquence d’images concernée ; et, pour chaque image de la séquence d’images concernée :
- un en-tête relatif à l’image concernée, cet en-tête comprenant un ensemble PPS de paramètres relatifs à l’image concernée ;
- une unité de données (comprenant les données codées) relative à l’image concernée.
L’ensemble SPS de paramètres relatifs à une séquence d’images comprend :
- des données NN indicatives d’un réseau de neurones artificiels de décodage associé à cette séquence d’images ;
- un drapeau FL indiquant la présence potentielle ou l’absence, au sein de la partie du flux de données associée à cette séquence d’images, de données indicatives d’un autre réseau de neurones artificiels de décodage, distinct du réseau de neurones artificiels de décodage associé à cette séquence d’image.
Dans l’exemple décrit ici, ce drapeau FL signalise ainsi la présence ou l’absence, au sein de chaque ensemble PPS de paramètres relatifs à une image de la séquence d’images concernée, d’un (autre) drapeau FL’ signalisant la présence ou l’absence de données indicatives d’un réseau de neurones artificiels de décodage à utiliser pour le décodage de l’image concernée.
L’ensemble PPS de paramètres relatifs à une image comprend :
- lorsque le drapeau FL indique la possibilité de mise à jour du réseau de neurones artificiels de décodage au sein de la séquence courante, un drapeau FL’ indiquant la présence ou l’absence (ici au sein de ce même ensemble PPS de paramètres relatifs à l’image concernée) de données indicatives d’un réseau de neurones artificiels de décodage (distinct du réseau de neurones artificiels de décodage associé à la séquence d’image comprenant l’image concernée) ;
- dans le cas où le drapeau FL’ indique la présence de telles données indicatives d’un réseau de neurones artificiels de décodage, ces données indicatives NN’ elles- mêmes (afin de permettre le décodage de l’unité de données relative à l’image concernée par ce réseau de neurones artificiels de décodage).
Comme déjà indiqué, les données indicatives NN, NN’ susmentionnées peuvent être un identifiant du réseau de neurones artificiels de décodage parmi un ensemble prédéterminé de réseaux de neurones artificiels, ou une représentation codée du réseau de neurones artificiels de décodage, ou encore des données de codage différentiel du réseau de neurones artificiels de décodage relativement à un réseau de neurones artificiels de décodage de référence.
On peut prévoir par exemple que les données NN indicatives du réseau de neurones artificiels de décodage associé à une séquence d’images (contenues dans l’ensemble SPS de paramètres relatifs à cette séquence d’images) soient des données indicatives d’un réseau de neurones artificiels de décodage de référence et/ou que les données NN’ indicatives du réseau de neurones artificiels de décodage associé à une image (contenues dans l’ensemble PPS de paramètres relatifs à une image) soient des données de codage différentiel relativement à ce réseau de
neurones artificiels de décodage de référence (défini par les données NN contenues dans l’ensemble SPS de paramètres relatifs à la séquence d’images comprenant cette image).
La figure 5 représente les éléments fonctionnels principaux d’un dispositif de décodage 20.
Ce dispositif de décodage 20 comprend un module de décodage 22, un module de détermination de réseau 24, une unité de mémorisation 26, un module de configuration 28, un module de traitement 25 et une unité d’analyse 30.
Le dispositif de décodage 20 peut en pratique être mis en oeuvre au moyen d’un dispositif électronique comprenant un processeur et une mémoire ; chacun des modules 22, 24, 25, 28 et de l’unité 30 mentionnés ci-dessus peut alors être réalisé par la coopération du processeur et d’instructions de programme d’ordinateur mémorisées dans la mémoire et conçues pour effectuer les fonctionnalités du module concerné, notamment comme décrit ci-dessous, lorsque ces instructions sont exécutées par le processeur. L’unité de mémorisation 26 peut correspondre à la mémoire précitée.
Le dispositif de décodage 20 reçoit en entrée un flux de données, ici le flux de données S produit par le dispositif de codage 2 (comme expliqué ci-dessus) et représenté sur la figure 4. Le flux de données S comprend plusieurs parties comprenant chacune une pluralité d’unités de données DU associées respectivement aux différentes images d’une séquence d’image. (Autrement dit, chacune de ces parties du flux de données correspond à une séquence d’images.)
L’unité d’analyse 30 est conçue pour analyser le flux de données S de manière à identifier dans ce flux de données S les différentes données qui le compose, comme schématiquement représenté en figure 4. L’unité d’analyse 30 peut en pratique effectuer notamment un décodage entropique du flux de données S pour obtenir ces données. Toutefois, comme déjà indiqué, cet aspect ne sera pas décrit ici en détail.
L’unité d’analyse 30 comprend notamment un module de détection 32 conçu pour détecter un drapeau FL tel que décrit ci-dessus dans la partie courante du flux de données S (c’est-à-dire dans la partie du flux de données S relative à la séquence courante). Comme indiqué ci-dessus, un tel drapeau FL signalise la possibilité ou l’impossibilité de mise à jour du réseau de neurones artificiels de décodage au sein de la séquence courante, et donc la présence potentielle ou l’absence, ici dans la
partie courante du flux de données, de données NN’ indicatives d’un réseau de neurones artificiels de décodage, distinct du réseau de neurones artificiels de décodage associé à la séquence courante (et utilisé par exemple pour le décodage de l’unité de données associée à la première image de la séquence courante). Comme déjà indiqué, le drapeau FL signalise ici la présence ou l’absence (dans la partie courante du flux de données) d’au moins un autre drapeau FL’ signalisant lui-même la présence ou l’absence de ces données NN’ (un tel autre drapeau FL’ étant situé dans chaque ensemble PPS de paramètres relatifs à une image, pour toute image de la séquence courante, lorsque le drapeau FL signalise la présence d’au moins un tel autre drapeau, dans l’exemple décrit ici).
L’unité d’analyse 30 comprend également un module de lecture 33 conçu pour lire cet autre drapeau FL’ dans le flux de données lorsque le drapeau FL (relatif à la séquence courante) signalise la présence d’au moins un tel autre drapeau, c’est-à- dire la présence potentielle des données NN’.
L’unité d’analyse 30 comprend également un module d’obtention 34 conçu pour obtenir ces données indicatives NN’ par analyse du flux de données S (précisément de la partie courante du flux de données, associée à la séquence d’images courante) lorsque l’autre drapeau FL’ signale la présence de telles données indicatives NN’.
L’unité d’analyse 30 est par ailleurs conçue pour identifier les unités de données DU au sein du flux de données S et transmettre chaque unité de données DU au module de décodage 22 pour décodage de cette unité de données DU, comme décrit plus loin.
Le module de détermination de réseau 24 est conçu pour déterminer le réseau de neurones artificiels de décodage DN à utiliser pour le décodage de l’unité de données courante DU en fonction d’au moins une donnée de l’ensemble SPS de paramètres relatif à la séquence courante et/ou d’au moins une donnée de l’ensemble PPS de paramètres relatif à l’image courante.
Selon une possibilité de réalisation, le module de détermination de réseau 24 peut déterminer le réseau de neurones artificiels de décodage DN par décodage de données D de codage différentiel du réseau de neurones artificiels de décodage DN relativement à un réseau de neurones artificiels de décodage de référence R (ces données de codage différentiel D étant contenues dans l’ensemble SPS de
paramètres relatif à la séquence courante ou dans l’ensemble PPS de paramètres relatif à l’image courante, comme décrit plus loin).
Cette méthode de détermination du réseau de neurones artificiel de décodage DN avec l’aide de données codées dans le flux S permet une détermination rapide et efficace du réseau de neurones artificiels de décodage DN. En effet, de cette manière il n’est pas nécessaire de faire une recherche du réseau de neurones artificiels de décodage optimal.
Comme déjà indiqué, le réseau de neurones artificiels de décodage DN et le réseau de neurones artificiels de décodage de référence R peuvent avoir la même structure et les données de codage différentiel D peuvent alors notamment contenir des données représentatives respectivement de différences entre chaque poids du réseau de neurones artificiels de décodage DN et le poids correspondant (c’est-à-dire situé au même endroit dans la structure commune) du réseau de neurones artificiels de décodage de référence R.
En variante, la donnée indicative du réseau de neurones artificiels de décodage DN à utiliser (donnée contenue dans l’ensemble SPS ou PPS) est un identifiant Inn du réseau de neurones artificiels de décodage DN parmi un ensemble prédéterminé de réseaux de neurones artificiels de décodage. Le module de détermination de réseau 24 détermine dans ce cas le réseau de neurones artificiels de décodage DN à utiliser pour le décodage de l’unité de données courante DU sur la base de cet identifiant Inn.
Selon une autre variante encore, l’ensemble SPS de paramètres relatif à la séquence courante (ou, le cas échéant, l’ensemble PPS de paramètres relatif à l’image courante) contient une représentation codée Rc du réseau de neurones artificiels de décodage DN. Le module de détermination de réseau 24 détermine dans ce cas le réseau de neurones artificiels de décodage DN par décodage de cette représentation codée Rc.
L’unité de mémorisation 26 peut mémoriser des données C caractéristiques de chaque réseau de neurones artificiels de l’ensemble prédéterminé de réseau de neurones artificiels et/ou des données caractéristiques d’au moins un réseau de neurones artificiels de décodage de référence R. Ces données caractéristiques peuvent inclure notamment les poids du réseau de neurones artificiels concerné.
Le module de traitement 25 est quant à lui conçu pour traiter des données descriptives du réseau de neurones artificiels de décodage de référence comprises dans le flux de données S. Ces données descriptives sont par exemple une représentation codée du réseau de neurones artificiels de décodage de référence, par exemple construite conformément à une norme telle que la norme MPEG-7 partie 17 ou à un format tel que le format JSON (comme expliqué plus haut à propos de la représentation codée Rc).
Le module de configuration 28 est conçu pour configurer le module de décodage 22 de manière à ce que ce module de décodage 22 puisse décoder l’unité de données DU courante au moyen du réseau de neurones artificiels de décodage DN déterminé par le module de détermination de réseau 24.
Le module de décodage 22 peut ainsi produire une représentation bidimensionnelle de l’image associée à l’unité de données DU courante par décodage de cette unité de données DU courante et éventuellement d’au moins une autre unité de données comprise dans la partie courante du flux de données (c’est-à-dire associée à la séquence d’images courante).
Le module de configuration 28 est par exemple conçu pour instancier le réseau de neurones artificiels de décodage DN (déterminé par le module de détermination de réseau 24) au sein du module de décodage 22.
Cette instanciation peut notamment comprendre les étapes suivantes :
- réservation, au sein du module de décodage 22, de l’espace mémoire nécessaire à la mise en oeuvre du réseau de neurones artificiels de décodage DN ; et/ou
- programmation du module de décodage 22 avec les caractéristiques (notamment les poids) du réseau de neurones artificiels de décodage DN ; et/ou
- chargement d’une partie au moins de l’unité de données DU à décoder sur une mémoire locale du module de décodage 22.
En pratique, le module de décodage 22 peut être une unité de traitement parallélisé, par exemple une unité de traitement graphique (ou GPU pour "Graphical Processing Unit') ou une unité de traitement de tenseur (ou TPU pour " Tensor Processing Unit').
La figure 6 représente un exemple de procédé de décodage, mis en oeuvre ici par le dispositif de décodage de la figure 5. Ce procédé de décodage est par exemple
mis en œuvre du fait de l’exécution, par un processeur du dispositif de décodage 20, des instructions d’un programme d’ordinateur mémorisé dans une mémoire du dispositif de décodage 20 (par exemple dans l’unité de mémorisation 26).
On considère ici que le dispositif de décodage 20 reçoit en entrée le flux de données S produit par le procédé de la figure 3 et représenté sur la figure 4.
Ce procédé débute à l’étape E22 à laquelle le dispositif de décodage 20 sélectionne la première image à décoder représentée dans le flux de données S en tant qu’imagé courante.
Le procédé se poursuit à l’étape E24 où le dispositif de décodage 20 (ici l’unité d’analyse 30) teste si un en-tête relatif à une séquence vidéo (contenant un ensemble SPS de paramètres relatif à cette séquence vidéo) est présent dans le flux de données S reçu (précisément, dans la portion du flux de données S en cours de traitement par le dispositif de décodage 20). Cela peut être réalisé en pratique par la détection d’une information caractéristique d’un en-tête relatif à une séquence d’images (par exemple dans la signalisation du flux de données S).
Dans l’affirmative, le procédé se poursuit à l’étape E26 pour décodage de cet en tête (c’est-à-dire consultation des données de l’ensemble SPS précité).
Dans la négative, le procédé se poursuit à l’étape E28 décrite plus bas.
Lorsqu’un en-tête relatif à une séquence d’images est détecté (ici par l’unité d’analyse 30), à l’étape E26, le dispositif de décodage 20 (ici l’unité d’analyse 30) extrait du flux de données S l’ensemble SPS de paramètres relatifs à la séquence courante, qui contient ici notamment :
- des données NN indicatives d’un réseau de neurones artificiels de décodage DN (associé à la séquence d’images courante) ;
- un drapeau FL signalisant la présence (ou l’absence), ici dans la partie du flux de données associée à la séquence d’images courante, d’un autre drapeau FL’ signalisant la présence (ou l’absence) de données indicatives d’un autre réseau de neurones artificiels de décodage, distinct du réseau de neurones artificiels de décodage DN indiqué par les données NN (ce drapeau FL signalisant ainsi la présence potentielle ou l’absence, de ces données indicatives de cet autre réseau de neurones artificiels de décodage).
La partie du flux de données associée à la séquence d’images courante comprend ici l’ensemble SPS de paramètres relatif à la séquence courante et les
données rencontrées (ensembles PPS de paramètres relatif à des images, unités de données DU relatives à des images) jusqu’à détection d’un nouvel en-tête relatif à une (nouvelle) séquence d’images.
Le drapeau FL indique ainsi quant à lui la possibilité ou l’impossibilité d’une mise à jour, au cours de la séquence d’images courante, du réseau de neurones artificiels de décodage utilisé pour le décodage des images (c’est-à-dire en pratique des unités de données) de cette séquence courante.
Selon une possibilité de réalisation, les données indicatives NN peuvent être un identifiant Inn du réseau de neurones artificiels de décodage DN parmi un ensemble prédéterminé de réseaux de neurones artificiels. Les caractéristiques C de chacun des réseaux de neurones artificiels de cet ensemble prédéterminé sont par exemple dans ce cas mémorisées au sein du dispositif de décodage 20 (ici dans l’unité de mémorisation 26). En variante, ces caractéristiques pourraient être accessibles, éventuellement par téléchargement, par le dispositif de décodage 20.
Selon une autre possibilité de réalisation, les données indicatives NN peuvent être une représentation codée Rc du réseau de neurones artificiels de décodage DN, par exemple une représentation codée Rc de paramètres caractéristiques (telles que la structure et/ou les poids) du réseau de neurones artificiels de décodage DN.
La représentation codée Rc précitée peut être par exemple construite conformément à une norme telle que la norme MPEG-7 partie 17 ou à un format tel que le format JSON.
Selon une autre possibilité de réalisation, ces données indicatives NN peuvent être des données D de codage différentiel du réseau de neurones artificiels de décodage DN relativement à un réseau de neurones artificiels de décodage de référence R.
L’ensemble de paramètres SPS extrait à l’étape E26 peut dans ce cas contenir en outre des données indicatives du réseau de neurones artificiels de référence R, par exemple un identifiant du réseau de neurones artificiels de référence R parmi un ensemble prédéterminé de réseaux de neurones artificiels (ensemble du même type que mentionné ci-dessus à propos de l’identifiant Inn).
En variante, le réseau de neurones artificiels de référence R est déterminé à ce stade (sans nécessiter d’information complémentaire dans l’ensemble SPS) : il peut s’agir par exemple d’un réseau de neurones artificiels de décodage prédéterminé
(utilisé comme réseau de neurones artificiels de décodage de référence pour tout décodage effectué par le dispositif de décodage 20) ou du réseau de neurones artificiels de décodage de référence précédemment utilisé (lors d’itérations antérieures du procédé de la figure 6).
Comme déjà indiqué, le réseau de neurones artificiels de décodage DN (codé par les données de codage différentiel D) et le réseau de neurones artificiels de décodage de référence R peuvent avoir la même structure. Les données de codage différentiel D peuvent alors notamment contenir des données représentatives respectivement de différences entre chaque poids du réseau de neurones artificiels de décodage DN et le poids correspondant (c’est-à-dire situé au même endroit dans la structure commune) du réseau de neurones artificiels de décodage de référence R.
Selon une variante déjà mentionnée, les données de codage différentiel D peuvent être représentatives d’un sous-ensemble de poids du réseau de neurones artificiels de décodage de référence R à mettre à jour. Ces données de codage différentiel D peuvent indiquer dans ce cas quels sont les poids à mettre à jour et/ou la valeur de chacun de ces poids à mettre à jour.
Selon une autre variante également mentionnée plus haut, les données de codage différentiel D peuvent être représentatives de couches additionnelles de réseau de neurones artificiels à insérer au sein de la structure du réseau de neurones artificiels de décodage de référence R. Les données de codage différentiel D décrivent par exemple dans ce cas, pour chaque couche additionnelle, la structure de la couche additionnelle concernée, les poids des neurones artificiels formant la couche additionnelle concernée et/ou le lieu d’insertion de la couche additionnelle concernée au sein du réseau de neurones artificiels de décodage de référence R.
Dans les différents cas, le dispositif de décodage 20 (ici le module de détermination de réseau 24) détermine le réseau de neurones artificiels de décodage DN associé à la séquence d’images courante sur la base des données indicatives NN. Ce réseau de neurones artificiels de décodage DN devient le réseau de neurones artificiels de décodage courant.
Le module de configuration 28 peut alors configurer le module de décodage 22 de sorte que ce module de décodage 22 soit apte à décoder une (ou plusieurs) unité(s) de données (à extraire du flux de données S comme expliqué plus loin) au moyen de ce réseau de neurones artificiels de décodage courant.
Le procédé se poursuit à l’étape E28 à laquelle le dispositif de décodage 20 (ici l’unité d’analyse 30) détecte un en-tête relatif à une image dans le flux de données S et en extrait un ensemble PPS de paramètres relatif à cette image. Cela peut être réalisé en pratique par la détection d’une information caractéristique d’un en-tête relatif à une image (par exemple dans la signalisation du flux de données S).
Le dispositif de décodage 20 (ici l’unité d’analyse 30) détermine à l’étape E30 si le drapeau FL (contenu dans l’ensemble SPS de paramètres relatif à la séquence courante et extrait à l’étape E26) indique la présence potentielle ou l’absence de données indicatives d’un autre réseau de neurones artificiels de décodage, c’est-à- dire ici en pratique la présence ou l’absence d’un autre drapeau FL’ comme mentionné ci-après.
Si le drapeau FL indique l’absence de données indicatives d’un autre réseau de neurones artificiels de décodage (ici au sein de la partie courante du flux de données S, c’est-à-dire pour la séquence d’images courante), c’est-à-dire si FL = 0 dans l’exemple décrit, le procédé de décodage se poursuit à l’étape E42 décrite plus bas pour décodage de l’image courante.
Si le drapeau FL indique la présence potentielle de telles données indicatives (cas où FL = 1 dans l’exemple décrit), c’est-à-dire ici la présence de l’autre drapeau FL’, le procédé de décodage se poursuit à l’étape E32 à laquelle le dispositif de décodage 20 (ici le module de lecture 33) lit cet autre drapeau FL’, ici au sein de l’ensemble PPS extrait à l’étape E28.
Cet autre drapeau FL’ indique comme déjà expliqué la présence ou l’absence (ici au sein de l’ensemble PPS de paramètres relatif à l’image courante) de données NN’ indicatives d’un réseau de neurones artificiels de décodage (distinct du réseau de neurones artificiels de décodage courant et/ou du réseau de neurones artificiels de décodage déterminé, lors du dernier passage à l’étape E26, sur la base des données indicatives NN contenues dans l’ensemble SPS et/ou du réseau de neurones artificiels de décodage déterminé, lors d’un précédent passage à l’étape E36 décrite plus bas, sur la base de données indicatives NN’ contenues dans un précédent ensemble PPS).
Le procédé de la figure 6 se poursuit alors par une étape E34 à laquelle le dispositif de décodage 20 (ici l’unité d’analyse 30) détermine si l’autre drapeau FL’ (lu à l’étape E32) indique la présence (ici lorsque FL’ = 1) ou l’absence (ici lorsque FL’ = 0) des données NN’ indicatives d’un réseau de neurones artificiels distinct. Autrement
dit, le dispositif de décodage 20 détermine ici si le réseau de neurones artificiels de décodage doit être mis à jour (ici lorsque FL’ = 1 ) ou non (ici lorsque FL’ = 0) pour le décodage de l’image courante (associée à l’ensemble PPS courant).
Si l’autre drapeau FL’ indique l’absence des données NN’ (cas où FL’ = 0), le procédé se poursuit à l’étape E42 décrite plus bas pour décodage de l’image courante.
Si l’autre drapeau FL’ indique la présence des données NN’ (cas où FL’ = 1 ), le procédé se poursuit à l’étape E36 à laquelle le dispositif de décodage 20 (ici le module d’obtention 34) obtient les données NN’ indicatives du réseau de neurones artificiels de décodage distinct par analyse du flux de données S, ici par consultation de l’ensemble PPS de paramètres relatif à l’image courante (extrait du flux de données S à l’étape E28).
Comme déjà indiqué, les données indicatives NN’ peuvent être des données D’ de codage différentiel du réseau de neurones artificiels de décodage distinct, relativement à un réseau de neurones artificiels de décodage de référence.
Selon une possibilité de réalisation, ce réseau de neurones artificiels de décodage de référence peut être le réseau de neurones artificiels de décodage associé à la séquence courante (déterminé à l’étape E26 sur la base des données indicatives NN contenues dans l’ensemble SPS de paramètres relatif à la séquence courante).
Selon une autre possibilité de réalisation, ce réseau de neurones artificiels de décodage de référence peut être le réseau de neurones artificiels de décodage courant (déterminé lors du passage à l’étape E26 ou lors d’un précédent passage à l’étape E38 décrite plus bas).
Selon encore une autre possibilité de réalisation, le réseau de neurones artificiels de décodage de référence peut être comme déjà indiqué un réseau de neurones artificiels prédéterminé (par exemple fixe pour le dispositif de décodage concerné).
Comme déjà expliqué, le réseau de neurones artificiels de décodage distinct, codé par les données de codage différentiel D’, et le réseau de neurones artificiels de décodage de référence peuvent avoir la même structure. Les données de codage différentiel D’ peuvent alors notamment contenir des données représentatives respectivement de différences entre chaque poids du réseau de neurones artificiels de décodage distinct et le poids correspondant (c’est-à-dire situé au même endroit
dans la structure commune) du réseau de neurones artificiels de décodage de référence.
Selon la variante déjà indiquée, les données de codage différentiel D peuvent être représentatives d’un sous-ensemble de poids du réseau de neurones artificiels de décodage de référence R à mettre à jour. Ces données de codage différentiel D peuvent indiquer dans ce cas quels sont les poids à mettre à jour et/ou la valeur de chacun de ces poids à mettre à jour.
Selon une autre variante déjà envisagée, les données de codage différentiel D peuvent être représentatives de couches additionnelles de réseau de neurones artificiels à insérer au sein de la structure du réseau de neurones artificiels de décodage de référence R. Les données de codage différentiel D décrivent par exemple dans ce cas, pour chaque couche additionnelle, la structure de la couche additionnelle concernée, les poids des neurones artificiels formant la couche additionnelle concernée et/ou le lieu d’insertion de la couche additionnelle concernée au sein du réseau de neurones artificiels de décodage de référence R.
En variante, les données indicatives peuvent être un identifiant du réseau de neurones artificiels de décodage distinct parmi un ensemble prédéterminé de réseaux de neurones artificiels (dont les caractéristiques C sont mémorisées dans l’unité de mémorisation 26), ou une représentation codée du réseau de neurones artificiels de décodage distinct, par exemple une représentation codée de paramètres caractéristiques (telles que la structure et/ou les poids) du réseau de neurones artificiels de décodage distinct.
Le procédé de la figure 6 se poursuit alors par une étape E38 à laquelle le dispositif de décodage 20 (ici le module de détermination de réseau 24) détermine le réseau de neurones artificiels de décodage distinct, à utiliser pour le décodage de l’image courante, sur la base des données indicatives NN’. Ce réseau de neurones artificiels de décodage distinct devient alors le réseau de neurones artificiels de décodage courant.
Le dispositif de décodage 20 (ici le module de configuration 28) peut ainsi configurer à l’étape E40 le module de décodage 22 de sorte que ce module de décodage 22 soit apte à décoder (comme décrit ci-dessous) l’unité de données DU relative à l’image courante au moyen du réseau de neurones artificiels de décodage déterminé à l’étape E38.
Le procédé de la figure 6 se poursuit à l’étape E42 à laquelle le dispositif de décodage 20 (ici l’unité d’analyse 30) extrait l’unité de données DU relative à l’image courante du flux de données S et le module de décodage 22 procède au décodage de cette unité de données DU au moyen du réseau de neurones artificiels de décodage courant, ce qui permet d’obtenir une représentation bidimensionnelle IMG’ de l’image courante.
Selon une possibilité, le décodage qui vient d’être mentionné utilise en outre au moins une autre unité de données comprise dans la partie courante du flux de données, c’est-à-dire relative à une autre image de la séquence d’images courante Le procédé de la figure 6 boucle alors à l’étape E24 pour analyse de la suite du flux de données S et traitement de l’image suivante.
Claims
1 . Procédé de décodage d’une partie de flux de données (S), ladite partie de flux de données comprenant une pluralité d’unités de données respectivement associées à une pluralité d’images et représentatives ensemble des différentes images de la pluralité d’images, ladite partie de flux de données comprenant en outre des données de codage différentiel (D ; D’) d’un réseau de neurones artificiels de décodage (DN) relativement à un réseau de neurones artificiels de décodage de référence, le procédé de décodage comprenant les étapes suivantes :
- détermination (E26 ; E38) du réseau de neurones artificiels de décodage (DN) par décodage desdites données de codage différentiel (D ; D’) ; et
- décodage d’au moins une unité de données (DU) de la pluralité d’unités de données au moyen du réseau de neurones artificiels de décodage (DN) déterminé.
2. Procédé de décodage selon la revendication 1 , dans lequel des données caractéristiques (C) du réseau de neurones artificiels de décodage de référence sont mémorisées dans une mémoire (26) du dispositif électronique (20) mettant en oeuvre le procédé de décodage.
3. Procédé de décodage selon la revendication 2, dans lequel le flux de données (S) comprend un identifiant (Inn) du réseau de neurones artificiels de décodage de référence.
4. Procédé de décodage selon la revendication 1 , dans lequel le flux de données comprend des données (Rc) descriptives du réseau de neurones artificiels de décodage de référence.
5. Procédé de décodage selon la revendication 4, dans lequel lesdites données descriptives (Rc) sont comprises dans ladite partie du flux de données.
6. Procédé de décodage selon l’une des revendications 1 à 5, dans lequel ladite étape de décodage de ladite unité de données produit une représentation bidimensionnelle (IMG’) de l’image (IMG) associée à ladite unité de données (DU) par décodage de ladite unité de données (DU) et d’au moins une autre unité de données comprise dans ladite partie de flux de données.
7. Procédé de décodage selon l’une des revendications 1 à 6, dans lequel le réseau de neurones artificiels de décodage de référence est défini par une pluralité de premiers poids, dans lequel le réseau de neurones artificiels de décodage déterminé est défini par
une pluralité de seconds poids et dans lequel lesdites données de codage différentiel (D ; D’) comprennent des données représentant respectivement une pluralité de différences entre un premier poids et un second poids.
8. Procédé de décodage selon l’une des revendications 1 à 7, dans lequel des données indicatives du réseau de neurones artificiels de référence sont contenues dans un ensemble (SPS) de paramètres relatif à ladite partie de flux de données (S) et dans lequel les données de codage différentiel (D’) sont contenues dans un ensemble (PPS) de paramètres relatif à l’image (IMG) associée à ladite unité de donnée (DU).
9. Procédé de décodage selon l’une des revendications 1 à 8, dans lequel le flux de données comprend au moins un drapeau (FL) signalisant la présence, dans une partie au moins du flux de données, d’au moins un autre drapeau (FL’) signalisant la présence de données (NN’) indicatives d’un autre réseau de neurones artificiels de décodage, distinct du réseau de neurones artificiels de décodage déterminé.
10. Procédé de décodage selon l’une des revendications 1 à 8, dans lequel le flux de données (S) comprend au moins un drapeau (FL’) signalisant la présence desdites données de codage différentiel (D’) dans ladite partie de flux de données.
11 . Procédé de décodage d’un flux de données (S), dans lequel des données du flux sont décodées au moyen d’un premier réseau de neurones artificiels de décodage en une représentation bidimensionnelle (IMG’) d’une image, caractérisé en ce que le flux de données (S) comprend au moins un drapeau (FL) signalisant la présence, dans une partie au moins du flux de données, d’au moins un autre drapeau (FL’) signalisant la présence de données (NN’) indicatives d’un second réseau de neurones artificiels de décodage, distinct du premier réseau de neurones artificiels de décodage.
12. Procédé de décodage selon la revendication 11 , comprenant les étapes suivantes lorsque le drapeau (FL) signale la présence de l’autre drapeau (FL’) :
- lecture (E32) dans le flux de données (S) de l’autre drapeau (FL’) ;
- obtention desdites données indicatives (NN’) par analyse du flux de données (S) ;
- détermination du second réseau de neurones artificiels de décodage sur la base desdites données indicatives (NN’) ;
- décodage d’autres données du flux de données (S) au moyen du second réseau de neurones artificiels de décodage.
13. Procédé de décodage selon la revendication 11 ou 12, dans lequel le flux de données (S) comprend une pluralité de parties, chaque partie comprenant une pluralité d’unités de données (DU) respectivement associées à une pluralité d’images (IMG) et représentatives ensemble des différentes images de la pluralité d’images, et dans lequel ledit drapeau (FL) signalise la présence d’au moins un autre drapeau (FL’) au sein d’une partie donnée parmi lesdites parties.
14. Procédé de décodage selon la revendication 13, comprenant, lorsque ledit drapeau (FL) signalise la présence de l’autre drapeau (FL’) dans ladite partie donnée, les étapes suivantes pour chaque unité de données (DU) comprise dans ladite partie donnée :
- détermination (E34) de la présence de données (NN’) définissant un réseau de neurones artificiels de décodage et relatives à l’unité de données (DU) concernée ;
- en cas de présence de ces données (NN’), décodage des données de l’unité de données (DU) concernée au moyen du réseau de neurones artificiels défini par ces données (NN’).
15. Dispositif de décodage (20) d’une partie de flux de données (S), ladite partie de flux de données (S) comprenant une pluralité d’unités de données respectivement associées à une pluralité d’images et représentatives ensemble des différentes images de la pluralité d’images, ladite partie de flux de données (S) comprenant en outre des données de codage différentiel (D ; D’) d’un réseau de neurones artificiels de décodage (DN) relativement à un réseau de neurones artificiels de décodage de référence, le dispositif de décodage comprenant :
- un module (24) de détermination du réseau de neurones artificiels de décodage (DN) par décodage desdites données de codage différentiel (D ; D’) ; et
- un module de décodage (22) d’au moins une unité de données (DU) de la pluralité d’unités de données au moyen du réseau de neurones artificiels de décodage (DN) déterminé par le module de détermination (24).
16. Dispositif de décodage (20) selon la revendication 15, comprenant une unité de mémorisation (26) apte à mémoriser des données (C) caractéristiques du réseau de neurones artificiels de décodage de référence.
17. Dispositif de décodage (20) selon la revendication 15, comprenant un module (25) de traitement de données descriptives du réseau de neurones artificiels de décodage de référence comprises dans le flux de données (S).
18. Dispositif de décodage (20) selon l’une des revendications 15 à 17, dans lequel le module de décodage (22) est configuré pour produire une représentation bidimensionnelle (IMG’) de l’image associée à ladite unité de données (DU) par décodage de ladite unité de données (DU) et d’au moins une autre unité de données comprise dans ladite partie de flux de données.
19. Dispositif de décodage (20) d’un flux de données (S), comprenant un module (22) de décodage de données du flux de données (S) au moyen d’un premier réseau de neurones artificiels de décodage et en une représentation bidimensionnelle (IMG’) d’une image, caractérisé en ce que le dispositif de décodage (20) comprend un module (32) de détection d’un drapeau (FL) signalisant la présence, dans une partie au moins du flux de données (S), d’au moins un autre drapeau (FU) signalisant la présence de données (NN’) indicatives d’un second réseau de neurones artificiels de décodage, distinct du premier réseau de neurones artificiels de décodage.
20. Dispositif de décodage (20) selon la revendication 19, comprenant :
- un module de lecture (33) configuré pour lire, lorsque ledit drapeau (FL) signalise la présence de l’autre drapeau (FU), l’autre drapeau (FL) dans le flux de données (S) ;
- un module d’obtention (34) configuré pour obtenir, lorsque l’autre drapeau (FU) signale la présence desdites données indicatives (NN’), lesdites données indicatives (NN’) par analyse du flux de données (S) ;
- un module (24) de détermination du second réseau de neurones artificiels de décodage sur la base desdites données indicatives (NN’) ; et
- un module de configuration (28) conçu pour configurer le module de décodage (22) pour décoder d’autres données du flux de données (S) au moyen du second réseau de neurones artificiels de décodage.
21. Dispositif de décodage selon la revendication 19 ou 20, dans lequel le flux de données (S) comprend une pluralité de parties, chaque partie comprenant une pluralité d’unités de données (DU) respectivement associées à une pluralité d’images et représentatives ensemble des différentes images de la pluralité d’images, et dans lequel
ledit drapeau (FL) signalise la présence de l’autre drapeau (FL’) dans une partie donnée parmi lesdites parties.
22. Dispositif de décodage selon la revendication 21 prise dans la dépendance de la revendication 20, dans lequel le module d’obtention (34) est configuré pour obtenir lesdites données indicatives (NN’) par analyse de ladite partie donnée.
23. Programme d’ordinateur comprenant des instructions exécutables par un processeur et conçues pour mettre en œuvre un procédé de décodage selon l’une des revendications 1 à 14 lorsque ces instructions sont exécutées par le processeur.
24. Flux de données (S) comprenant au moins une partie comprenant une pluralité d’unités de données respectivement associées à une pluralité d’images et représentatives ensemble des différentes images de la pluralité d’images, ladite partie comprenant en outre des données de codage différentiel (D ; D’) d’un réseau de neurones artificiels de décodage (DN) relativement à un réseau de neurones artificiels de décodage de référence, dans lequel au moins une unité de données (DU) de la pluralité d’unités de données est décodable au moyen du réseau de neurones artificiels de décodage (DN) codé par lesdites données de codage différentiel (D ; D’).
25. Flux de données (S) comprenant des données décodables au moyen d’un premier réseau de neurones artificiels de décodage en une représentation bidimensionnelle (IMG’) d’une image, caractérisé en ce que le flux de données (S) comprend au moins un drapeau (FL) signalisant la présence, dans une partie au moins du flux de données (S), d’au moins un autre drapeau (FL’) signalisant la présence de données indicatives (NN’) d’un second réseau de neurones artificiels de décodage, distinct du premier réseau de neurones artificiels de décodage.
26. Flux de données selon la revendication 25, dans lequel le drapeau (FL) signalise la présence de l’autre drapeau (FL’) dans la partie du flux de données et dans lequel la partie du flux de données comprend l’autre drapeau (FL’).
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR2106455A FR3124342B1 (fr) | 2021-06-17 | 2021-06-17 | Procédés et dispositifs de décodage d’une partie au moins d’un flux de données, programme d’ordinateur et flux de données associés |
PCT/EP2022/065774 WO2022263297A1 (fr) | 2021-06-17 | 2022-06-09 | Procédés et dispositifs de décodage d'une partie au moins d'un flux de données, programme d'ordinateur et flux de données associés |
Publications (1)
Publication Number | Publication Date |
---|---|
EP4356606A1 true EP4356606A1 (fr) | 2024-04-24 |
Family
ID=76807885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP22735362.0A Pending EP4356606A1 (fr) | 2021-06-17 | 2022-06-09 | Procédés et dispositifs de décodage d'une partie au moins d'un flux de données, programme d'ordinateur et flux de données associés |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240267542A1 (fr) |
EP (1) | EP4356606A1 (fr) |
JP (1) | JP2024520961A (fr) |
KR (1) | KR20240021897A (fr) |
CN (1) | CN117882369A (fr) |
FR (1) | FR3124342B1 (fr) |
WO (1) | WO2022263297A1 (fr) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020146007A1 (fr) * | 2019-01-09 | 2020-07-16 | Futurewei Technologies, Inc. | Compression de modèle de réseau d'apprentissage automatique |
EP3767549A1 (fr) * | 2019-07-03 | 2021-01-20 | Nokia Technologies Oy | Fourniture de réseaux neuronaux comprimés |
-
2021
- 2021-06-17 FR FR2106455A patent/FR3124342B1/fr active Active
-
2022
- 2022-06-09 US US18/570,513 patent/US20240267542A1/en active Pending
- 2022-06-09 CN CN202280043231.3A patent/CN117882369A/zh active Pending
- 2022-06-09 JP JP2023577692A patent/JP2024520961A/ja active Pending
- 2022-06-09 WO PCT/EP2022/065774 patent/WO2022263297A1/fr active Application Filing
- 2022-06-09 EP EP22735362.0A patent/EP4356606A1/fr active Pending
- 2022-06-09 KR KR1020247001236A patent/KR20240021897A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
WO2022263297A1 (fr) | 2022-12-22 |
US20240267542A1 (en) | 2024-08-08 |
JP2024520961A (ja) | 2024-05-27 |
FR3124342A1 (fr) | 2022-12-23 |
FR3124342B1 (fr) | 2024-01-12 |
KR20240021897A (ko) | 2024-02-19 |
CN117882369A (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FR3098072A1 (fr) | Procédé de traitement d’un ensemble d’images d’une séquence vidéo | |
FR2702914A1 (fr) | Dispositif de codage de suites d'images constituées d'images de nature film et d'images de nature vidéo, et dispositif de décodage correspondant. | |
EP3449634B1 (fr) | Procédé de composition contextuelle d'une représentation vidéo intermédiaire | |
FR3029381A1 (fr) | Procede de composition d’une representation video intermediaire | |
CA2377808C (fr) | Procede d'evaluation de la qualite de sequences audiovisuelles | |
FR3084552A1 (fr) | Procede de formation d'une sequence d'images de sortie a partir d'une sequence d'images d'entree, procede de reconstruction d'une sequence d'images d'entree a partir d'une sequence d'images de sortie, dispositifs, equipement serveur, equipement client et programmes d'ordinateurs associes | |
FR2792150A1 (fr) | Procedes et dispositis de codage et de decodage de signaux numeriques, et systemes les mettant en oeuvre | |
WO2022263297A1 (fr) | Procédés et dispositifs de décodage d'une partie au moins d'un flux de données, programme d'ordinateur et flux de données associés | |
WO2022013249A2 (fr) | Procédé de décodage d'un flux de données, dispositif et flux de données associés | |
EP1241894A1 (fr) | Procédé de codage d'images numériques basé sur la dissimulation d'erreurs | |
EP1603341A1 (fr) | Procede et dispositif pour les systemes d'interpolation d'images par estimation et compensation de mouvement. | |
US10885343B1 (en) | Repairing missing frames in recorded video with machine learning | |
WO2022069437A1 (fr) | Procédé et dispositif électronique de décodage d'un flux de données, programme d'ordinateur et flux de données associés | |
WO2022013247A1 (fr) | Decodage video parallelise utilisant un reseau de neurones | |
WO2023247208A1 (fr) | Procede de segmentation d'une pluralite de donnees, procede de codage, procede de decodage, dispositifs, systemes et programme d'ordinateur correspondants | |
FR3143246A1 (fr) | Procédé et dispositif de codage et décodage d’images. | |
WO2022073885A1 (fr) | Procédé et dispositif électronique de décodage d'un flux de données, et programme d'ordinateur associé | |
EP3991436A1 (fr) | Procédé d'encodage et de décodage vidéo par signalisation d'un sous-ensemble de candidat | |
WO2024003191A1 (fr) | Procédé et dispositif de décodage, programme d'ordinateur et flux de données associés | |
FR3107383A1 (fr) | Procédé et dispositif de traitement de données de vidéo multi-vues | |
FR2795276A1 (fr) | Controle de debit d'un systeme de compression de donnees numeriques avec pertes | |
FR2769454A1 (fr) | Procede et dispositif de codage et decodage de donnees, notamment de sequences d'images numeriques | |
EP0524871A1 (fr) | Un procédé de codage de signaux hybride adaptatif | |
FR2761554A1 (fr) | Procedes et dispositifs de traitement d'un ensemble de donnees et notamment de compression et de decompression de donnees d'images | |
FR2768888A1 (fr) | Dispositif et procede de traitement d'un ensemble de donnees et notamment de compression et de decompression de donnees d'images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: UNKNOWN |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE INTERNATIONAL PUBLICATION HAS BEEN MADE |
|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: REQUEST FOR EXAMINATION WAS MADE |
|
17P | Request for examination filed |
Effective date: 20240112 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR |
|
DAV | Request for validation of the european patent (deleted) | ||
DAX | Request for extension of the european patent (deleted) |