WO2012122836A1 - 视频编解码处理方法和装置 - Google Patents

视频编解码处理方法和装置 Download PDF

Info

Publication number
WO2012122836A1
WO2012122836A1 PCT/CN2011/083831 CN2011083831W WO2012122836A1 WO 2012122836 A1 WO2012122836 A1 WO 2012122836A1 CN 2011083831 W CN2011083831 W CN 2011083831W WO 2012122836 A1 WO2012122836 A1 WO 2012122836A1
Authority
WO
WIPO (PCT)
Prior art keywords
derivation information
motion derivation
candidate motion
level
time domain
Prior art date
Application number
PCT/CN2011/083831
Other languages
English (en)
French (fr)
Inventor
张雷
谢清鹏
沈秋
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2012122836A1 publication Critical patent/WO2012122836A1/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/56Motion estimation with initialisation of the vector search, e.g. estimating a good candidate to initiate a search

Definitions

  • Embodiments of the present invention relate to image video technologies, and in particular, to a video codec processing method and apparatus. Background technique
  • Moving Pictures Experts Group -2 (hereinafter referred to as: Moving Pictures Experts Group - 2) is widely used.
  • MPEG-2 Motion Picture Experts Group Series 4
  • MPEG-4 Motion Picture Experts Group Series 4
  • video coding and decoding technologies such as ⁇ .264 have put forward new requirements, such as hoping to meet the requirements of high definition and 3D, thus meeting the new home theater.
  • HEVC High Efficiency Video Coding
  • MV Motion Vector
  • MVP Motion Vector Prediction
  • the interframe predictive coding carries the MVD and the residual in the code stream, thereby greatly reducing the amount of data.
  • HEVC In order to improve the compression efficiency, many improved techniques have been added in deriving the MV of the current block by using the MV of the coding block, including improvements to the MVP module, improvement of the MVP index coding, and addition of a merge (hereinafter referred to as Merge) mode.
  • the spatial domain left neighbor MVP, the spatial upper neighbor MVP, and the time domain MVP may be selected as candidates in the MVP module.
  • 1 is a schematic diagram of a search method of a prior art hollow domain MVP. As shown in FIG.
  • the first MV available block is selected from bottom to top. , using the MV of the block as the spatial neighboring MVP of the current block; selecting the first MV available block from right to left in all blocks adjacent to (A, B, C, D, E), to the block MV as a
  • the MVP of the front block is adjacent to the airspace.
  • 2 is a schematic diagram of a search method of a time domain MVP in the prior art. As shown in FIG. 2, a reference block corresponding to a current block is selected in a reference frame, and an MV of a center position of the reference block is used as a time domain MVP of the current block. .
  • the optimal MVP is selected from the three candidate MVPs according to the rate distortion cost, and the index of the MVP in the candidate MVP is written into the code stream.
  • the MVP index coding in order to reduce the number of bits used, the MVP index is coded according to the number of candidate MVPs, and specifically, according to the number of MVPs, whether to encode the MVP index and the number of bits occupied by the speculative MVP index is determined.
  • HEVC also adds the Merge mode in the process of motion information derivation, that is, takes the MV of the coded block adjacent to the spatial domain and the time domain as the candidate MV of the current block, and selects the candidate MV in all Merge modes according to the rate distortion cost.
  • the MV of the motion search is selected as the MV of the current block. If the MV of the current block is the MV selected in the Merge mode, then only the Merge mode is used in the encoding and the index of the MV used in the block is indicated in the candidate MV.
  • the prior art guides the encoding of the MV index according to the number of candidate MVs, and specifically determines whether to encode the MV index and the number of bits occupied by the speculative MV index according to the number of candidate MVs. Regardless of whether it is a candidate MVP or a candidate MV, it may be referred to as candidate motion derivation information, and a set composed of candidate MVPs or candidate MVs may be referred to as a candidate motion derivation information set.
  • the time domain candidate motion derivation information of the decoding end may not be searched, so that the estimated candidate motion derivation information may be The number is incorrect, resulting in an error in the process of decoding the encoded stream of the current block.
  • the embodiment of the invention provides a video encoding and decoding processing method and device, which solves the problem that the process of decoding the encoded code stream of the current block is incorrect due to the incorrect number of estimated candidate motion derivation information in the prior art. .
  • the embodiment of the invention provides a video encoding processing method, including:
  • the candidate motion derivation information in the first-level candidate motion derivation information set is a row merging process, the second-level candidate motion derivation information set is obtained, and the number of candidate motion derivation information included in the second-level candidate motion derivation information set is less than or equal to 2;
  • An embodiment of the present invention provides another video encoding processing method, including:
  • the embodiment of the invention provides a video decoding processing method, including:
  • the candidate motion derivation information in the first-level candidate motion derivation information set is combined to obtain a second-level candidate.
  • a motion derivation information set where the number of candidate motion derivation information included in the second-level candidate motion derivation information set is less than or equal to 2;
  • An embodiment of the present invention provides another video decoding processing method, including:
  • An embodiment of the present invention provides an encoding apparatus, including:
  • a first acquiring module configured to acquire a first-level candidate motion derivation information set of the current block
  • the first merge processing module is configured to: if the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 2 And performing a combining process on the candidate motion derivation information in the first-level candidate motion derivation information set, and acquiring a second-level candidate motion derivation information set, where the candidate motion derivation information included in the second-level candidate motion derivation information set is included.
  • the number of the number is less than or equal to 2;
  • the first encoding processing module is configured to perform encoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • An embodiment of the present invention provides another coding apparatus, including:
  • a second acquiring module configured to acquire a candidate motion derivation information set of the current block
  • a second encoding processing module configured to: if the spatial motion candidate derivation information does not exist in the candidate motion derivation information set, perform encoding processing on the current block, and obtain an encoded code stream of the current block, where the encoded code stream The index encoding of the motion derivation information is not included.
  • An embodiment of the present invention provides a decoding apparatus, including:
  • a first receiving module configured to receive an encoded code stream of the current block
  • a third acquiring module configured to acquire a first-level candidate motion derivation information set of the current block
  • a second merging processing module configured to: if the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 2, perform candidate motion derivation information in the first-level candidate motion derivation information set a merging process, the second-level candidate motion derivation information set is obtained, and the number of candidate motion derivation information included in the second-level candidate motion derivation information set is less than or equal to 2;
  • the first decoding processing module performs decoding processing on the encoded code stream of the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • An embodiment of the present invention provides another decoding apparatus, including:
  • a second receiving module configured to receive an encoded code stream of the current block
  • a fourth acquiring module configured to acquire a candidate motion derivation information set of the current block
  • a second decoding processing module configured to: if the spatial candidate motion derivation information does not exist in the candidate motion derivation information set, decode the encoded code stream of the current block according to the non-airspace candidate motion derivation information.
  • the encoding end may, in the case that the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 2, the candidate motion derivation information in the first-level candidate motion derivation information set The number is processed into at least two candidate motion derivation information by combining to obtain a second-level candidate motion derivation information set, and the second-level candidate motion derivation information set is applied to perform coding processing, so that the second-level candidate motion derivation information set is obtained.
  • the index of the motion derivation information selected at most one bit is required.
  • the decoding end can be taken After obtaining the second-level candidate motion derivation information set by using the same combining processing manner as described above, the decoding end only needs to decode the index encoding of one bit, and does not appear to encode the index, regardless of whether there is a loss of the reference frame. A part of the error is considered to be the other part of the code stream of the current block, so that the coded stream of the current block can be prevented from being erroneously decoded.
  • FIG. 1 is a schematic diagram of a search method of a prior art hollow domain MVP
  • FIG. 2 is a schematic diagram of a search method of a time domain MVP in the prior art
  • Embodiment 3 is a flowchart of Embodiment 1 of a video encoding processing method according to the present invention.
  • Embodiment 4 is a flowchart of Embodiment 2 of a video encoding processing method according to the present invention.
  • FIG. 5 is a flowchart of Embodiment 3 of a video encoding processing method according to the present invention.
  • FIG. 6 is a flowchart of Embodiment 4 of a video encoding processing method according to the present invention.
  • FIG. 7 is a flowchart of Embodiment 5 of a video encoding processing method according to the present invention.
  • Embodiment 8 is a flowchart of Embodiment 6 of a video encoding processing method according to the present invention.
  • Embodiment 9 is a flowchart of Embodiment 7 of a video encoding processing method according to the present invention.
  • FIG. 10 is a flowchart of Embodiment 8 of a video encoding processing method according to the present invention.
  • FIG. 11 is a flowchart of Embodiment 9 of a video encoding processing method according to the present invention.
  • Embodiment 10 is a flowchart of Embodiment 10 of a video encoding processing method according to the present invention.
  • FIG. 13 is a flowchart of Embodiment 1 of a video decoding processing method according to the present invention.
  • FIG. 16 is a flowchart of Embodiment 4 of a video decoding processing method according to the present invention.
  • FIG. 17 is a flowchart of Embodiment 5 of a video decoding processing method according to the present invention.
  • Embodiment 7 of a video decoding processing method according to the present invention is a flowchart of Embodiment 7 of a video decoding processing method according to the present invention.
  • 20 is a flowchart of Embodiment 8 of a video decoding processing method according to the present invention
  • 21 is a flowchart of Embodiment 9 of a video decoding processing method according to the present invention.
  • FIG. 22 is a flowchart of Embodiment 10 of a video decoding processing method according to the present invention.
  • Embodiment 23 is a schematic structural diagram of Embodiment 1 of an encoding apparatus according to the present invention.
  • Embodiment 2 is a schematic structural diagram of Embodiment 2 of an encoding apparatus according to the present invention.
  • FIG. 25 is a schematic structural diagram of Embodiment 1 of a decoding apparatus according to the present invention.
  • FIG. 26 is a schematic structural diagram of Embodiment 2 of a decoding apparatus according to the present invention. detailed description
  • FIG. 3 is a flowchart of a first embodiment of a video encoding processing method according to the present invention. As shown in FIG. 3, the method in this embodiment may include:
  • Step 301 Acquire a first-level candidate motion derivation information set of the current block.
  • the encoding device can acquire a first level candidate motion derivation information set of the current block.
  • the so-called current block is the video block currently to be encoded.
  • the motion derivation information in this embodiment may be an MV in MVP or Merge mode. It can be understood by those skilled in the art that other motion derivation information for inter prediction of a video block can also be applied to the technical solution of the embodiment.
  • the step 301 in the embodiment may be implemented by using the prior art.
  • all the blocks adjacent to the left side (F, G, H, I) are from the bottom.
  • Select the block available for the first MV and use the MV of the block as the spatial neighboring MVP of the current block; select the right from left to left in all blocks adjacent to (A, B, C, D, E)
  • An MV-available block with the MV of the block as the adjacent MVP of the current block; as shown in FIG. 2, the reference block corresponding to the current block is selected in the reference frame, and the MV of the reference block center position is used The time domain MVP of the current block.
  • the first-level candidate MVP set obtained by using the prior art method may include any one of the following set forms. : ⁇ time domain MVP ⁇ , ⁇ empty Domain left neighbor MVP ⁇ , ⁇ space neighbor MVP ⁇ , ⁇ time domain MVP, airspace left neighbor MVP ⁇ , ⁇ time domain MVP, airspace upper neighbor MVP ⁇ , ⁇ airspace left neighbor MVP, airspace upper neighbor MVP ⁇ , and ⁇ time domain MVP, airspace left neighbor MVP, airspace upper neighbor MVP ⁇ .
  • the step 301 in this embodiment can also be implemented in the prior art.
  • the candidate MV may include a spatial neighbor MV, a spatial neighbor MV, a time domain MV, a spatial right upper neighbor MV, and a spatial lower left adjacent MV. Therefore, similar to the candidate MVP, the first candidate MV set may also include the above five Several collection forms of at least one of the candidate MVs.
  • step 301 can also be implemented without using the prior art.
  • a candidate MVP it may also include more other air domain candidate MVPs or include more other time domain candidate MVPs;
  • a candidate MV in the Merge mode it may also include more other spatial domain candidate MVs or include more other time domain candidate MVs.
  • the present embodiment does not limit the specific content of the candidate motion derivation information included in the first-level candidate motion derivation information set obtained by the encoding device, as long as it is motion derivation information capable of inter-frame predictive coding.
  • Step 302 If the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 2, perform candidate processing on the candidate motion derivation information in the first-level candidate motion derivation information set to obtain the first And a second set of candidate motion derivation information sets, where the number of candidate motion derivation information included in the second-level candidate motion derivation information set is less than or equal to two.
  • Step 303 Perform encoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • Table 1 is a coding scheme for the three candidate MVPs that may exist in the prior art.
  • the two candidate MVPs may be any one of a time domain candidate MVP, a spatial domain left neighbor candidate MVP, and an airspace upper neighbor candidate MVP; if FIG. 1 and FIG.
  • the MVPIdx is 1, and the corresponding index code is 10.
  • the MVPidx corresponding to the third candidate MVP in the first-level candidate MVP set is 2, and the corresponding index code is 11, and the three candidate MVPs are time domain candidate MVPs.
  • the spatial domain left neighbor candidate MVP and the spatial domain adjacent candidate MVP. Therefore, the coding mode of the prior art is related to the number of candidate MVPs.
  • the prior art pairs the three candidate MVPs in the first-level candidate MVP set.
  • the index encoding may be one bit or two bits. Therefore, when the decoding end decodes the index encoding, it may need to decode one bit and decode two bits.
  • the number of candidate MVPs in the first-level candidate MVP set obtained by the decoding end in the manner shown in FIG. 1 and FIG. 2 if the number is 2, only one bit needs to be decoded, and if the number is 3, decoding is needed. One or two bits. However, under error-prone channel conditions, there may be a loss of reference frames.
  • the decoder may have a problem when searching for the time domain MVP in the manner shown in FIG. 2, resulting in an error in the number of candidate MVPs at the decoding end.
  • the first-level candidate MVP set obtained by the encoding end is ⁇ time domain candidate MVP, spatial domain left neighbor candidate MVP, and spatial domain adjacent candidate MVP ⁇ , and the MVP selected therefrom is a spatial domain left neighbor candidate MVP whose index is 1, and the corresponding The index code is 10.
  • the time domain candidate MVP cannot be obtained due to the loss of the reference frame, so the obtained first-level candidate MVP set is ⁇ the spatial neighbor candidate MVP and the spatial neighbor candidate. MVP ⁇ .
  • the decoding end Since the number of candidate MVPs obtained by the decoding end is 2, the decoding end only decodes the first bit "1" of the index encoding, and erroneously sets the second bit "0" as the current block.
  • the encoding of other parts causes the decoding end to error when decoding the encoded code stream other than the index encoding, and even causes the entire decoding to crash, and cannot continue the subsequent decoding process.
  • For the MV in the Merge mode there is also a similar The problem is not described here.
  • the embodiment may determine whether the number of candidate motion derivation information in the first-level candidate motion derivation information set acquired in step 301 is greater than 2, and if greater than 2, in the first-level candidate motion derivation information set.
  • the candidate motion derivation information is combined to obtain a second-level candidate motion derivation information set, where the number of candidate motion derivation information included in the second-level candidate motion derivation information set is less than or equal to two. Therefore, when the current block is encoded by the second-level candidate motion derivation information set, the index of the motion derivation information needs only one bit to represent.
  • Table 2 is an encoding method of the candidate MVP adopting the technical solution of the embodiment.
  • the maximum number of candidate MVPs in the prior art is three.
  • the case where the number of candidate MVPs in the first-level candidate MVP set is greater than 2 can only be ⁇ time domain candidate MVP, spatial domain neighbor candidate MVP, In the spatial domain, the candidate MVPs can be merged into at most two candidate MVPs by using the method in this embodiment.
  • the merged candidate MVPs can be indexed in the manner shown in Table 2. Therefore, at the time of decoding, the decoding end can acquire the merged two candidate MVPs by using the same processing manner as described above.
  • the decoder only needs to decode the index code of one bit, and the rest is used as the other part of the code stream of the current block, and no part of the index code is mistaken for the current
  • the block encodes the rest of the code stream to avoid erroneous decoding.
  • the number of candidate MVs in the Merge mode is up to five.
  • the number of candidate MVs in the first-level candidate MV set is greater than 2, for example, it may be a ⁇ space neighbor candidate.
  • the MV, the spatial neighboring candidate MV, and the time domain candidate MV ⁇ may be ⁇ a spatial neighbor candidate MV, a time domain candidate MV, a spatial upper right neighbor candidate MV, a spatial lower left neighbor candidate MV ⁇ , and the like, and the method of this embodiment is adopted.
  • the three or more candidate MVs can be combined into at most two candidate MVs, so that only one bit is needed to encode the index of the MV selected from the second level candidate MV set.
  • the encoding apparatus may use the number of candidate motion derivation information in the first-level candidate motion derivation information set if the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 2. Processing, by combining, into at least two candidate motion derivation information, to obtain a second-level candidate motion derivation information set, and applying the second-level candidate motion derivation information set to perform encoding processing, so that the second-level candidate motion derivation information set is used
  • the index of the selected motion derivation information is encoded, at most one bit is needed, so that the decoding end acquires the second-level candidate motion derivation information set after using the same merge processing manner as described above, and decodes whether or not there is a reference frame loss.
  • the terminal only needs to decode the index code of one bit, and does not misinterpret a part of the index code as the other part of the code stream of the current block, so that the coded stream of the current block can be prevented from being erroneously decoded.
  • FIG. 4 is a flowchart of a second embodiment of a video encoding processing method according to the present invention. As shown in FIG. 4, the method in this embodiment may include:
  • Step 401 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 402 If there is time domain candidate motion derivation information in the first-level candidate motion derivation information set and the number of spatial domain motion estimation information is greater than 1, the airspace candidate motion is performed.
  • the derivation information combining process is an airspace candidate motion derivation information
  • the second-level candidate motion derivation information set includes the merged spatial domain candidate motion derivation information and the time domain candidate motion derivation information.
  • the encoding apparatus may combine all the airspace candidate MVPs.
  • the merging processing method in this embodiment may specifically take the average of all the spatial domain candidate MVPs as the spatial domain candidate MVP after the merging process. Therefore, the second-level candidate MVP set may include two candidate MVPs. One is a spatial domain candidate MVP after merging, and one is a time domain candidate MVP.
  • the encoding device may select an MVP in the second-level candidate MVP set to perform prediction, and obtain the final MV through motion search. It should be noted that if only a candidate MVP exists in the second-level candidate MVP set, the encoding apparatus can directly use the only candidate MVP for prediction.
  • Step 403 Perform encoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the encoding apparatus may perform encoding processing on the current block. If the second-level candidate motion derivation information set includes spatial domain candidate motion derivation information, the encoding apparatus may use one bit pair to select the selected motion derivation information in the second The index in the set of candidate motion derivation information is encoded into the encoded code stream of the current block. If the second-level candidate motion derivation information set does not contain any spatial domain candidate motion derivation information, the encoding device does not encode the index of the candidate motion derivation information. It can be understood that the advantage of not coding is that it can save overhead and simplify the coding method.
  • the difference from the MVP process is that the motion estimation process selects the best one as the MV of the current block in the candidate MV of the Merge mode and the MV obtained by the motion search.
  • FIG. 5 is a flowchart of a third embodiment of a video encoding processing method according to the present invention. As shown in FIG. 5, the method in this embodiment may include:
  • Step 501 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 502 If there is no time domain candidate motion derivation information in the first-level candidate motion derivation information and the number of spatial domain motion estimation information is greater than 2, the air domain candidate motion derivation information is combined into at most two airspaces.
  • Candidate motion derivation information, the second-level candidate motion derivation information set includes at most two airspace candidate motion derivation information after the merging process.
  • the encoding apparatus may combine the spatial domain candidate MVP into at most two airspace candidate MVPs.
  • the merging processing method in this embodiment may be specifically: selecting, according to a preset policy, at most two airspace candidate motion derivation information from the first-level candidate motion derivation information set as a spatial processing candidate motion derivation after the merging process.
  • the information may be set by the person skilled in the art, for example, according to information such as the size and/or location of the value of each candidate MVP. Therefore, one or two candidate airspace MVPs may be included in the second-level candidate MVP set. It should be noted that, in all embodiments of the present invention, the preset policies may be selected according to information such as the size and/or location of the values of the candidate MVPs.
  • the encoding device may select an MVP in the second-level candidate MVP set to perform prediction, and obtain the final MV through motion search. It should be noted that if only a candidate MVP exists in the second-level candidate MVP set, the encoding apparatus can directly use the only candidate MVP for prediction.
  • Step 503 Perform encoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the encoding apparatus may perform encoding processing on the current block. If the second-level candidate motion derivation information set includes spatial domain candidate motion derivation information, the encoding apparatus may use one bit pair to select the selected motion derivation information in the second The index in the set of candidate motion derivation information is encoded into the encoded code stream of the current block. If the second-level candidate motion derivation information set does not include any spatial domain candidate motion derivation information, the encoding device does not encode the index of the candidate motion derivation information. It can be understood that, for the MV in the Merge mode, the difference from the MVP processing process is that the motion estimation process selects the best one as the MV of the current block in the candidate MV of the Merge mode and the MV obtained by the motion search.
  • the time domain candidate motion derivation information does not exist in the first-level candidate motion derivation information set, and at most two airspaces are selected from the spatial domain candidate motion derivation information according to the preset policy.
  • the candidate motion derivation information is used as candidate motion derivation information in the second-level candidate motion derivation information set, so that the encoding apparatus can encode the index of the motion derivation information using only at most one bit.
  • FIG. 6 is a flowchart of Embodiment 4 of a video encoding processing method according to the present invention. As shown in FIG. 6, the method in this embodiment may include:
  • Step 601 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 602 If there is no airspace candidate motion derivation information in the first-level candidate motion derivation information set, and the number of time domain candidate motion derivation information is greater than 2, the time domain candidate motion derivation information is combined into at most two Time domain candidate motion derivation information, the second level candidate motion derivation information set includes at most two time domain candidate motion derivation information after the combining process.
  • the present embodiment is for the time domain candidate motion derivation information and the time domain candidate motion derivation information in the first level candidate motion derivation information set.
  • the number is greater than 2.
  • the encoding apparatus may combine the number of time domain candidate motion derivation information into at most two time domain candidate motion derivation information, and therefore, the second level candidate motion derivation information set includes only at most two of the combined processing. Time domain candidate motion derivation information.
  • Step 603 Perform coding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the encoding apparatus may perform encoding processing on the current block, and the encoding apparatus may use one bit pair to encode the index of the selected motion derivation information in the second-level candidate motion derivation information set to the encoded stream of the current block. in.
  • the merging process in this embodiment may be configured to select at most two time domain candidate motion derivation information from the first-level candidate motion derivation information set as the time domain candidate motion derivation information after the merging process according to the preset policy.
  • Other consolidation methods can be used, such as averaging.
  • the second-level candidate motion derivation is performed by the combining process.
  • the number of time domain candidate motion derivation information in the information set is at most two, so that the encoding apparatus can encode the index of the motion derivation information using only one bit.
  • FIG. 7 is a flowchart of Embodiment 5 of a video encoding processing method according to the present invention. As shown in FIG. 7, the method in this embodiment may include:
  • Step 701 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 702 If there is one airspace candidate motion derivation information in the first-level candidate motion derivation information set, and the number of time domain candidate motion derivation information is greater than 1, the time domain candidate motion derivation information is combined into one time.
  • Domain candidate motion derivation information, the second-level candidate motion derivation information set includes one time domain candidate motion derivation information and the airspace candidate motion derivation information.
  • This embodiment is directed to the case where there is one airspace candidate motion derivation information and more than one time domain candidate motion derivation information in the first-level candidate motion derivation information set.
  • the encoding apparatus may combine the number of time domain candidate motion derivation information into one time domain candidate motion derivation information, and therefore, the second level candidate motion derivation information set includes only one time domain after the merge processing.
  • Candidate motion derivation information and an airspace candidate motion derivation information may be combined.
  • the merging process in this embodiment may be: selecting a time domain candidate motion derivation information from the first-level candidate motion derivation information set as the time domain candidate motion derivation information after the merging process according to a preset policy, or The plurality of time domain candidate motion derivation information is averaged to be combined into one time domain candidate motion derivation information.
  • Step 703 Perform encoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the encoding apparatus may perform encoding processing on the current block, and the encoding apparatus may use one bit pair to encode the index of the selected motion derivation information in the second-level candidate motion derivation information set to the encoded stream of the current block. in.
  • Time domain candidate motion derivation information is combined into one time domain
  • the motion derivation information is selected such that the number of candidate motion derivation information in the second-level candidate motion derivation information set is only two, so that the encoding apparatus can encode the motion derivation information index using only one bit.
  • FIG. 8 is a flowchart of Embodiment 6 of a video encoding processing method according to the present invention. As shown in FIG. 8, the method in this embodiment may include:
  • Step 801 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 802 If the number of the spatial domain candidate motion derivation information and the time domain candidate motion derivation information in the first-level candidate motion derivation information set are both greater than 1, the time domain candidate motion derivation information is combined into one time.
  • the domain candidate motion derivation information is merged into one airspace candidate motion derivation information, and the second-level candidate motion derivation information set includes a time domain candidate motion derivation information after the merge processing and the merge processing An airspace candidate motion derivation information.
  • This embodiment is directed to the case where there are more than one airspace candidate motion derivation information and more than one time domain candidate motion derivation information in the first level candidate motion derivation information set.
  • the encoding means can process the spatial domain candidate motion derivation information and the time domain candidate motion derivation information, respectively.
  • the encoding device may combine the plurality of spatial domain candidate motion derivation information into one airspace candidate motion derivation information, and for the time domain candidate motion derivation information, the encoding device may move the plurality of time domain candidate motions.
  • the derivation information combining process is a time domain candidate motion derivation information. Therefore, the second-level candidate motion derivation information set includes a time domain candidate motion derivation information after the merging process and a spatial domain candidate motion derivation information after the merging process.
  • the merging process in this embodiment may be: selecting a time domain candidate motion derivation information from the first-level candidate motion derivation information set as the time domain candidate motion derivation information after the merging process according to the preset policy, from the first level Selecting one spatial domain candidate motion derivation information as the spatial domain candidate motion derivation information in the candidate motion derivation information set, or averaging the plurality of time domain candidate motion derivation information to be combined into one time domain candidate motion derivation Information, averaging the plurality of spatial domain candidate motion derivation information to be combined into one airspace candidate motion derivation information.
  • Step 803 Perform encoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the encoding apparatus may perform encoding processing on the current block. If the second-level candidate motion derivation information set includes spatial domain candidate motion derivation information, the encoding apparatus may use one bit pair to select the selected motion derivation information in the second The index in the set of candidate motion derivation information is encoded into the encoded code stream of the current block. If the second-level candidate motion derivation information set does not include any spatial domain candidate motion derivation information, the encoding device does not encode the index of the candidate motion derivation information.
  • the plurality of time domain candidate motion derivation information is merged into one time domain candidate motion derivation information and the plurality of air domain candidate motion derivation information is combined into one air domain candidate motion derivation information, so that the second level candidate motion derivation information set
  • the number of candidate motion derivation information is only two, so that the encoding apparatus can encode the index of the motion derivation information using only at most one bit.
  • FIG. 9 is a flowchart of Embodiment 7 of a video encoding processing method according to the present invention. As shown in FIG. 9, the method in this embodiment may include:
  • Step 901 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 902 If the first-level candidate motion derivation information set includes at least spatial neighboring motion derivation information and/or spatial neighboring motion derivation information, retaining only the spatial neighboring motion from the first-level candidate motion derivation information set.
  • the derivation information and/or spatial neighboring motion derivation information is used as the candidate motion derivation information after the merging process.
  • the spatial neighboring motion derivation information is taken from one of the left side of the current block (such as the front left, the lower left, and the like) and the motion information of the coded block, and the spatial adjacent motion derivation information is taken from the longitudinal position at the current position.
  • One of the motion information of the block is encoded above the block (eg, up, up, and so on).
  • the encoding apparatus may directly use the spatial left neighbor motion derivation information and the spatial adjacent motion derivation information as the merged candidate motion derivation information, and discard other candidate motion derivation information. Therefore, the second-level candidate motion derivation information set includes the following sets: ⁇ no motion derivation information ⁇ , ⁇ air-domain left-side motion derivation information ⁇ , ⁇ air-space adjacent motion derivation information ⁇ , ⁇ air-domain left-neighbor motion derivation information, null Neighborhood motion estimation information on the domain ⁇ .
  • Step 903 Perform encoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the encoding device may perform encoding processing on the current block. Since the second level candidate motion derivation information set includes at most two candidate motion derivation information, the encoding apparatus may use one bit pair to encode the index of the selected motion derivation information in the second level candidate motion derivation information set to the current The block is encoded in the code stream. For example, the coding method shown in Table 2 is adopted.
  • the encoding apparatus can encode the motion derivation information index using only one bit.
  • FIG. 10 is a flowchart of Embodiment 8 of a video encoding processing method according to the present invention. As shown in FIG. 10, the method in this embodiment may include:
  • Step 101 Acquire a first-level candidate motion derivation information set of a current block.
  • Step 102 If the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 1, all candidate motion derivation information in the first-level candidate motion derivation information is combined into one motion derivation information.
  • the second-level candidate motion derivation information set includes only one combined motion estimation signal.
  • the merge processing manner in this embodiment may be: if there is no motion derivation information in the first-level candidate motion derivation information set, the merged motion derivation information is a zero vector, if the first-level candidate motion derivation information set The sum of the number of the spatial domain candidate motion derivation information and the time domain candidate motion derivation information is an odd number, and the combined motion derivation information is a vector median value of the spatial domain candidate motion derivation information and the time domain candidate motion derivation information, If the sum of the number of the spatial domain candidate motion derivation information and the time domain candidate motion derivation information in the first-level candidate motion derivation information set is an even number, the motion-derived motion derivation information is a spatial domain candidate motion derivation signal.
  • the interest and time domain candidate motion derivation information are arranged in order of magnitude and the average of the two motion estimation information in the middle.
  • Step 103 Perform encoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the encoding apparatus may encode the index of the candidate motion derivation information, or may not perform indexing on the candidate motion derivation information. coding. It can be understood that the advantage of not coding is that it can save overhead and simplify the coding method.
  • the present embodiment based on the method embodiment shown in FIG. 3, combines all motion derivation information into one motion derivation information when the motion derivation information included in the first-level candidate motion derivation information set is greater than 1.
  • the second-level candidate motion derivation information set includes only one motion derivation information, so that the encoding apparatus can perform encoding processing on the index of the motion derivation information by using only one bit without index encoding.
  • FIG. 11 is a flowchart of Embodiment 9 of a video encoding processing method according to the present invention. As shown in FIG. 11, the method in this embodiment may include:
  • Step 111 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 112 If the first-level candidate motion derivation information set includes one time domain candidate motion derivation information and more than one airspace candidate motion derivation information, then more than one airspace candidate motion derivation information is combined and processed. And a second-level candidate motion derivation information set, where the second-level candidate motion derivation information set includes the combined spatial domain candidate motion derivation information and the time domain candidate motion derivation information.
  • Step 113 If the selected motion derivation information is time domain motion derivation information, encode an index of the time domain motion derivation information in the second level candidate motion derivation information set as a first code; if the selected motion derivation The information is spatial domain motion derivation information, and the index of the spatial domain motion derivation information in the second-level candidate motion derivation information set is encoded as a second code.
  • the present embodiment may perform fixed coding on the selected motion derivation information by using only one bit, and the coded bits carry information that the MVP belongs to the time domain or the airspace.
  • the foregoing embodiment has been described in detail only for the process of encoding the current block using the MV in the MVP or Merge mode. It can be understood that these two modes can also be used in combination. Before use, only the merge mode flag MergeFlag needs to be set.
  • the encoding device may set the MergeFlag to 1 if the current block does not use the Merge mode or uses the Merge mode and selects the MV obtained by the motion search. , the encoding device can set MergeFlag to 0.
  • the specific process refer to the process in any of the foregoing embodiments, and details are not described herein again.
  • FIG. 12 is a flowchart of a tenth embodiment of a video encoding processing method according to the present invention. As shown in FIG. 12, the method in this embodiment may include:
  • Step 121 Acquire a candidate motion derivation information set of the current block.
  • Step 121 of this embodiment is similar to the implementation principle of step 301 of the method embodiment shown in FIG. 3, and details are not described herein again.
  • Step 122 If there is no spatial domain candidate motion derivation information in the candidate motion derivation information set, perform coding processing on the current block to obtain an encoded code stream of the current block, where the coded stream does not include motion derivation The index encoding of the information.
  • the encoding device may encode the index of the selected motion derivation information in the candidate motion derivation information set, perform encoding processing on the current block, and obtain the An encoded code stream of a current block, the encoded code stream including an index code.
  • the embodiment can adopt the fixed length coding shown in Table 3.
  • the encoding apparatus does not encode the index of the motion derivation information, and therefore, the encoded stream of the current block does not include The index code of the motion derivation information.
  • the candidate motion derivation information set After the candidate motion derivation information set is acquired in the same manner as the encoding end, the candidate motion derivation information set has no candidate motion derivation information, or only one time domain candidate motion derivation information.
  • the decoding end may obtain a candidate motion derivation information in any manner to decode the current block.
  • This embodiment does not limit the acquisition mode, and only has one time domain candidate motion derivation information.
  • the decoding end may use the unique time domain candidate motion derivation information or obtain the candidate motion derivation information in other manners on the premise that the domain candidate motion derivation information cannot be obtained, and perform the code stream of the current block.
  • Decoding processing can be.
  • the encoding processing method in this embodiment saves coding overhead and simplifies the encoding mode.
  • the motion derivation information in this embodiment may also be an MV in MVP or Merge mode.
  • FIG. 13 is a flowchart of Embodiment 1 of a video decoding processing method according to the present invention. As shown in FIG. 13, the method in this embodiment may include:
  • Step 131 Receive an encoded code stream of a current block.
  • the decoding device can receive the encoded code stream of the current block.
  • the coded stream may be the coded stream obtained after the technical solution of the coding embodiment shown in Fig. 3 is executed.
  • Step 132 Acquire a first-level candidate motion derivation information set of the current block.
  • the decoding device may acquire a first-level candidate motion derivation information set of the current block.
  • the motion derivation information is the MVP.
  • the step 132 in this embodiment may be implemented by using the prior art. For example, as shown in FIG. 1, all the blocks adjacent to the left side (F, G, H, I) are from below. Select the block available for the first MV, and use the MV of the block as the spatial neighboring MVP of the current block; select the right from left to left in all blocks adjacent to (A, B, C, D, E) An MV-available block, with the MV of the block as the neighboring MVP of the airspace of the current block; as shown in FIG. 2, A reference block corresponding to the current block is selected in the reference frame, and the MV of the reference block center position is used as the time domain MVP of the current block.
  • the MVP of the time domain MVP, the spatial neighboring MVP, and the neighboring MVP in the airspace may not exist. Therefore, the first-level candidate MVP set obtained by using the prior art method may include any one of the following set forms. : ⁇ Time Domain MVP ⁇ , ⁇ Space Left MVP ⁇ , ⁇ Airspace Top MVP ⁇ , ⁇ Time Domain MVP, Airspace Left MVP ⁇ , ⁇ Time Domain MVP, Airspace Upper MVP ⁇ , ⁇ Space Left MVP, Airspace Upper neighbor MVP ⁇ and ⁇ time domain MVP, airspace left neighbor MVP, airspace upper neighbor MVP ⁇ .
  • the step 301 in this embodiment can also be implemented in the prior art.
  • the candidate MV may include a spatial neighbor MV, a spatial neighbor MV, a time domain MV, a spatial right upper neighbor MV, and a spatial lower left adjacent MV. Therefore, similar to the candidate MVP, the first candidate MV set may also include the above five Several collection forms of at least one of the candidate MVs.
  • step 132 may also be implemented without using the prior art.
  • a candidate MVP it may also include more other air domain candidate MVPs or include more other time domain candidate MVPs;
  • a candidate MV in the Merge mode it may also include more other spatial domain candidate MVs or include more other time domain candidate MVs.
  • the present embodiment does not limit the specific content of the candidate motion derivation information included in the first-level candidate motion derivation information set obtained by the decoding device, as long as it is motion derivation information capable of inter-prediction decoding.
  • Step 133 If the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 2, perform candidate processing on the candidate motion derivation information in the first-level candidate motion derivation information set to obtain the first And a second set of candidate motion derivation information sets, where the number of candidate motion derivation information included in the second-level candidate motion derivation information set is less than or equal to two.
  • Step 134 Perform decoding processing on the encoded code stream of the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the encoding device may not encode the index of the candidate MVP.
  • the unique candidate MVP may be any one of a time domain candidate MVP, a spatial domain left neighbor candidate MVP, and an airspace upper neighbor candidate MVP.
  • the MVPidx corresponding to the first candidate MVP in the first-level candidate MVP set is 0, and the corresponding index code is 0, and the MVPidx corresponding to the second candidate MVP in the first-level candidate MVP set 1 , the corresponding index code is 1, and the two candidate MVPs may be any one of a time domain candidate MVP, a spatial domain left neighbor candidate MVP, and an airspace upper neighbor candidate MVP; if the manner shown in FIG. 1 and FIG. 2 is adopted
  • the MVPidx corresponding to the second candidate MVP in the first-level candidate MVP set is 1, and the corresponding index code is 10, and the MVPidx corresponding to the third candidate MVP in the first-level candidate MVP set is 2, and the corresponding index is
  • the code is 11
  • the three candidate MVPs are a time domain candidate MVP, a spatial domain left neighbor candidate MVP, and an airspace upper neighbor candidate MVP. Therefore, when encoding the indexes of the three candidate MVPs in the first-level candidate MVP set by using the coding method of the prior art, the index coding may be one bit or two bits.
  • the decoding end When the decoding end decodes the index code by using the prior art, it may need to decode one bit and decode two bits, depending on the first stage obtained by the decoding end in the manner shown in FIG. 1 and FIG. 2 .
  • the number of candidate MVPs in the candidate MVP set. If the number is 2, only one bit needs to be decoded. If the number is 3, one or two bits need to be decoded.
  • the first-level candidate MVP set obtained by the encoding end is ⁇ time domain candidate MVP, spatial domain left neighbor candidate MVP, and spatial domain adjacent candidate MVP ⁇ , and the MVP selected therefrom is a spatial domain left neighbor candidate MVP whose index is 1, and the corresponding The index code is 10.
  • the time domain candidate MVP cannot be obtained because the reference frame is lost. Therefore, the obtained first-level candidate MVP set is ⁇ a spatial neighbor candidate MVP and a spatially adjacent candidate MVP ⁇ . Since the number of candidate MVPs obtained by the decoding end is 2, the decoding end only decodes the first bit "1" of the index encoding, and erroneously sets the second bit "0" as the current block.
  • the decoding apparatus may determine whether the number of candidate motion derivation information in the first-level candidate motion derivation information set acquired in step 132 is greater than 2, and if greater than 2, candidate in the first-level candidate motion derivation information set.
  • the motion derivation information is combined to obtain a second-level candidate motion derivation information set, where the number of candidate motion derivation information included in the second-level candidate motion derivation information set is less than or equal to two. Therefore, when the current block is decoded by using the second-level candidate motion derivation information set, the index of the motion derivation information occupies only one bit, and the decoding apparatus can decode only the index coding of one bit.
  • the maximum number of candidate MVPs in the prior art is three.
  • the case where the number of candidate MVPs in the first-level candidate MVP set is greater than 2 can only be ⁇ time domain candidate MVP, spatial domain neighbor candidate MVP, In the spatial domain adjacent candidate MVP ⁇ , the decoding apparatus may combine the three candidate MVPs into at most two candidate MVPs by using the method of this embodiment. Since the encoding end also combines the candidate MVPs in the first-level candidate MVP set into at most two candidate MVPs in the same manner, only one bit is used to encode the index of the selected MVP, and accordingly, At the decoding end, the decoding device may use Table 2 to select an MVP from the merged two candidate MVPs, and use the MVP to decode the encoded code stream of the current block.
  • the decoder regardless of whether the reference frame is lost, the decoder only needs to decode the index code of one bit, and the rest is used as the other part of the code stream of the current block, without misinterpreting part of the index code. It is the other part of the code stream of the current block, thus avoiding erroneous decoding.
  • the number of candidate MVs in the Merge mode is up to five.
  • the number of candidate MVs in the first-level candidate MV set is greater than 2, for example, it may be a ⁇ space neighbor candidate.
  • MV, spatial neighbor candidate MV, time domain candidate MV ⁇ may be ⁇ space neighbor candidate MV, time domain candidate MV, spatial upper right neighbor candidate MV, spatial lower left neighbor candidate MV ⁇ , etc., using the decoding method of this embodiment
  • the three or more candidate MVs can be combined into at most two candidate MVs, so that only the MV selected from the second-level candidate MV set can be encoded by decoding one bit.
  • the code stream is decoded.
  • the maximum number of candidate MVPs in the prior art is only three, and the number of candidate MVs in the Merge mode is up to five, as will be understood by those skilled in the art. Development, the number of candidate MVPs or MVs can be more.
  • Another The prior art or a combination thereof combines three or more candidate motion derivation information into one or two candidate motion derivation information.
  • the encoding device of the encoding end may be incorrect.
  • the candidate motion derivation information is encoded.
  • the decoding device at the decoding end may not decode the index encoding, but directly adopts the candidate.
  • the motion derivation information decodes the encoded code stream of the current block or obtains a candidate motion derivation information by other means, and decodes the encoded code stream of the current block.
  • the decoding apparatus at the decoding end may derivate the candidate motion derivation information in the first-level candidate motion derivation information set if the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 2.
  • the number is processed into two candidate motion derivation information by combining to obtain a second-level candidate motion derivation information set, and the second-level candidate motion derivation information set is used to decode the encoded code stream of the current block, when decoding
  • the decoding device only needs to decode one bit. Regardless of whether there is a loss of the reference frame, the decoder does not misinterpret a part of the index code as the other part of the code stream of the current block, thereby avoiding the current block.
  • the encoded code stream is decoded incorrectly.
  • FIG. 14 is a flowchart of Embodiment 2 of a video decoding processing method according to the present invention. As shown in FIG. 14, the method in this embodiment may include:
  • Step 141 Receive an encoded code stream of a current block.
  • Step 142 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 143 If there is time domain candidate motion derivation information in the first level candidate motion derivation information set and the number of spatial domain motion estimation information is greater than 1, the air domain candidate motion derivation information is combined into one air domain candidate motion. Deriving information, the second-level candidate motion derivation information set includes the combined spatial domain candidate motion derivation information and the time domain candidate motion derivation information.
  • the decoding apparatus may combine all the air domain candidate MVPs into one airspace candidate.
  • the second-level candidate MVP set may include two candidate MVPs, where one is the combined spatial domain i MVP and the other is the time domain candidate MVP. .
  • Step 144 Perform decoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the decoding apparatus may perform decoding processing on the current block, and if the second-level candidate motion derivation information set includes spatial domain candidate motion derivation information, decode the motion derivation information index encoding of the current block, Obtaining index information, selecting motion derivation information from the second-level candidate motion derivation information set according to the index information; if the second-level candidate motion derivation information does not include any airspace candidate motion derivation information, The candidate motion derivation information performs a decoding process on the encoded code stream of the current block.
  • the number of candidate motion derivation information in the first-level candidate motion derivation information is combined into at most two by using a merging processing method of averaging, so that the decoding device
  • the index of the motion derivation information can be decoded using only a maximum of one bit.
  • FIG. 15 is a flowchart of a third embodiment of a video decoding processing method according to the present invention. As shown in FIG. 15, the method in this embodiment may include:
  • Step 151 Receive an encoded code stream of the current block.
  • Step 152 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 153 If there is no time domain candidate motion derivation information in the first-level candidate motion derivation information and the number of spatial domain motion estimation information is greater than 2, the airspace candidate motion derivation information is combined into at most two airspaces.
  • Candidate motion derivation information, the second-level candidate motion derivation information set includes at most two airspace candidate motion derivation information after the merging process.
  • the decoding apparatus may combine the spatial domain candidate MVP into at most two airspace candidate MVPs.
  • the merging processing method in this embodiment may be specifically: selecting, according to a preset policy, at most two airspace candidate motion derivation information from the first-level candidate motion derivation information set as a spatial processing candidate motion derivation after the merging process.
  • the information may be set by the person skilled in the art, for example, according to information such as the size and/or location of the value of each candidate MVP. Therefore, one or two candidate airspace MVPs may be included in the second-level candidate MVP set.
  • Step 154 Perform decoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the decoding apparatus may perform decoding processing on the current block, and if the second-level candidate motion derivation information set includes spatial domain candidate motion derivation information, decode the motion derivation information index encoding of the current block, Obtaining index information, selecting motion derivation information from the second-level candidate motion derivation information set according to the index information; if the second-level candidate motion derivation information does not include any airspace candidate motion derivation information, The candidate motion derivation information performs a decoding process on the encoded code stream of the current block.
  • the time domain candidate motion derivation information does not exist in the first-level candidate motion derivation information set, and at most two airspaces are selected from the spatial domain candidate motion derivation information according to the preset policy.
  • the candidate motion derivation information is used as candidate motion derivation information in the second-level candidate motion derivation information set, so that the decoding apparatus can decode the index of the motion derivation information using only at most one bit.
  • FIG. 16 is a flowchart of Embodiment 4 of a video decoding processing method according to the present invention. As shown in FIG. 16, the method in this embodiment may include:
  • Step 161 Receive an encoded code stream of the current block.
  • Step 162 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 163 If there is no airspace candidate motion derivation information in the first-level candidate motion derivation information set, and the number of time domain candidate motion derivation information is greater than 2, the time domain candidate motion derivation information is combined into at most two Time domain candidate motion derivation information, the second level candidate
  • the motion derivation information set includes up to two time domain candidate motion derivation information after the merging process.
  • there is only one time domain motion derivation information there is only one time domain motion derivation information, but the present embodiment is for the time domain candidate motion derivation information and the time domain candidate motion derivation information in the first level candidate motion derivation information set. The number is greater than 2.
  • the decoding apparatus may combine the number of time domain candidate motion derivation information into at most two time domain candidate motion derivation information, and therefore, the second level candidate motion derivation information set includes only at most two after the merge processing. Time domain candidate motion derivation information.
  • Step 164 Perform decoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the decoding apparatus may perform decoding processing on the current block, perform decoding processing on the motion derivation information index code of the current block, acquire index information, and derive an information set from the second-level candidate motion according to the index information.
  • the motion derivation information is selected, and the encoded code stream of the current block is decoded according to the selected motion derivation information.
  • the merging process in this embodiment may be configured to select at most two time domain candidate motion derivation information from the first-level candidate motion derivation information set as the time domain candidate motion derivation information after the merging process according to the preset policy.
  • Other consolidation methods can be used, such as averaging.
  • the second-level candidate motion derivation is performed by the combining process.
  • the number of time domain candidate motion derivation information in the information set is at most two, so that the decoding apparatus can decode only one bit to obtain an index of the motion derivation information.
  • FIG. 17 is a flowchart of Embodiment 5 of a video decoding processing method according to the present invention. As shown in FIG. 17, the method in this embodiment may include:
  • Step 171 Receive an encoded code stream of a current block.
  • Step 172 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 173 If there is one airspace candidate motion derivation information in the first-level candidate motion derivation information set, and the number of time domain candidate motion derivation information is greater than 1, the time domain candidate motion derivation information is combined into one time.
  • Domain candidate motion derivation information, the second-level candidate motion derivation information set includes a time domain candidate motion derivation information after the combining process, and the Airspace candidate motion derivation information.
  • This embodiment is directed to the case where there is one airspace candidate motion derivation information and more than one time domain candidate motion derivation information in the first-level candidate motion derivation information set.
  • the decoding apparatus may combine the number of time domain candidate motion derivation information into one time domain candidate motion derivation information, and therefore, the second level candidate motion derivation information set includes only one time domain after the merge processing.
  • Candidate motion derivation information and an airspace candidate motion derivation information may be combined.
  • the merging process in this embodiment may be: selecting a time domain candidate motion derivation information from the first-level candidate motion derivation information set as the time domain candidate motion derivation information after the merging process according to a preset policy, or The plurality of time domain candidate motion derivation information is averaged to be combined into one time domain candidate motion derivation information.
  • Step 174 Perform decoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the decoding apparatus may perform decoding processing on the current block, perform decoding processing on the motion derivation information index code of the current block, acquire index information, and derive an information set from the second-level candidate motion according to the index information.
  • the motion derivation information is selected, and the encoded code stream of the current block is decoded according to the selected motion derivation information.
  • the time domain candidate motion derivation information is merged into one time domain candidate motion derivation information, so that the number of candidate motion derivation information in the second level candidate motion derivation information set is only two, so that the decoding device can decode only one bit.
  • the bit gets an index of the motion derivation information.
  • FIG. 18 is a flowchart of Embodiment 6 of a video decoding processing method according to the present invention. As shown in FIG. 18, the method in this embodiment may include:
  • Step 181 Receive an encoded code stream of a current block.
  • Step 182 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 183 If the number of the spatial domain candidate motion derivation information and the time domain candidate motion derivation information in the first-level candidate motion derivation information set are both greater than 1, the time domain candidate motion derivation information is combined into one time.
  • Domain candidate motion derivation information which combines the spatial domain candidate motion derivation information into one airspace candidate motion derivation information, and the second-level candidate motion estimation
  • the set of information includes a time domain candidate motion derivation information after the merge processing and a spatial domain candidate motion derivation information after the merge processing.
  • the decoding means can process the spatial domain candidate motion derivation information and the time domain candidate motion derivation information, respectively.
  • the decoding device may combine the plurality of spatial domain candidate motion derivation information into one airspace candidate motion derivation information, and for the time domain candidate motion derivation information, the decoding device may move the plurality of time domain candidate motions.
  • the derivation information combining process is a time domain candidate motion derivation information. Therefore, the second-level candidate motion derivation information set includes a time domain candidate motion derivation information after the merging process and a spatial domain candidate motion derivation information after the merging process.
  • the merging process in this embodiment may be: selecting a time domain candidate motion derivation information from the first-level candidate motion derivation information set as the time domain candidate motion derivation information after the merging process according to the preset policy, from the first level Selecting one spatial domain candidate motion derivation information as the spatial domain candidate motion derivation information in the candidate motion derivation information set, or averaging the plurality of time domain candidate motion derivation information to be combined into one time domain candidate motion derivation Information, averaging the plurality of spatial domain candidate motion derivation information to be combined into one airspace candidate motion derivation information.
  • Step 184 Perform decoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the decoding apparatus may perform decoding processing on the current block, and if the second-level candidate motion derivation information set includes spatial domain candidate motion derivation information, decode the motion derivation information index encoding of the current block, Obtaining index information, selecting motion derivation information from the second-level candidate motion derivation information set according to the index information, and performing decoding processing on the encoded code stream of the current block according to the selected motion derivation information;
  • the candidate motion derivation information is not included in the second candidate motion derivation information, and the encoded code stream of the current block is decoded according to the only candidate motion derivation information.
  • the device may decode the index of the motion derivation information using only a maximum of one bit.
  • FIG. 19 is a flowchart of Embodiment 7 of a video decoding processing method according to the present invention. As shown in FIG. 19, the method in this embodiment may include:
  • Step 191 Receive an encoded code stream of a current block.
  • Step 192 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 193 If the first-level candidate motion derivation information set includes at least spatial neighboring motion derivation information and/or spatial neighboring motion derivation information, only the spatial left neighbor motion is reserved from the first-level candidate motion derivation information set.
  • the derivation information and/or spatial neighboring motion derivation information is used as the candidate motion derivation information after the merging process.
  • the spatial neighboring motion derivation information is taken from the motion information of the decoded block located at the left of the current block
  • the spatial adjacent motion derivation information is taken from the motion information of the decoded block located above the current block.
  • This embodiment is directed to the case where there are any combinations of a plurality of spatial domain motion derivation information and time domain motion derivation information in the first-level candidate motion derivation information set.
  • the decoding apparatus may directly use the spatial left neighbor motion derivation information and the spatial adjacent motion derivation information as the combined candidate motion derivation information, and discard other candidate motion derivation information. Therefore, the second-level candidate motion derivation information set includes the following sets: ⁇ no motion derivation information ⁇ , ⁇ air-domain left-side motion derivation information ⁇ , ⁇ air-space adjacent motion derivation information ⁇ , ⁇ air-domain left-neighbor motion derivation information, and airspace Neighboring motion derivation information ⁇ .
  • Step 194 Perform decoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the decoding apparatus may perform decoding processing on the current block. Since at least two candidate motion derivation information are included in the second-level candidate motion derivation information set, the decoding apparatus can decode only one bit to obtain an index of motion derivation information.
  • FIG. 20 is a flowchart of Embodiment 8 of a video decoding processing method according to the present invention. As shown in FIG. 20, the method in this embodiment may include:
  • Step 201 Receive an encoded code stream of a current block.
  • Step 202 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 203 If the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 1, all candidate motion derivation information in the first-level candidate motion derivation information is combined into one motion derivation information.
  • the second-level candidate motion derivation information set includes only one combined motion estimation signal.
  • the merge processing manner in this embodiment may be: if there is no motion derivation information in the first-level candidate motion derivation information set, the merged motion derivation information is a zero vector, if the first-level candidate motion derivation information set The sum of the number of the spatial domain candidate motion derivation information and the time domain candidate motion derivation information is an odd number, and the combined motion derivation information is a vector median value of the spatial domain candidate motion derivation information and the time domain candidate motion derivation information, If the sum of the number of the spatial domain candidate motion derivation information and the time domain candidate motion derivation information in the first-level candidate motion derivation information set is an even number, the motion-derived motion derivation information is the spatial domain candidate motion derivation information and the time domain candidate motion.
  • the derivation information is arranged in order of magnitude and the average of the two motion derivation information in the middle.
  • Step 204 Perform decoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the decoding apparatus can decode the index coding or not the index coding.
  • FIG. 21 is a flowchart of Embodiment 9 of the video decoding processing method of the present invention. As shown in FIG. 21, the method in this embodiment may include:
  • Step 211 Receive an encoded code stream of a current block.
  • Step 212 Acquire a first-level candidate motion derivation information set of the current block.
  • Step 213 If the first-level candidate motion derivation information set includes more than one time domain candidate motion derivation information and more than one airspace candidate motion derivation information, the time domain candidate motion derivation information is combined and the spatial domain candidate is combined. The motion derivation information is combined to obtain a second-level candidate motion derivation information set, where the second-level candidate motion derivation information set includes the combined spatial domain candidate motion derivation information and/or the combined time domain candidate motion derivation information. .
  • Step 214 Perform decoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the decoding apparatus may perform decoding processing on the current block. Since at least two candidate motion derivation information are included in the second-level candidate motion derivation information set, the decoding apparatus can decode only one bit to obtain an index of motion derivation information.
  • the encoding end selects the time domain MVP and marks the current block using the time domain MVP. If the decoding MVP index is 1, it can be seen that the encoding end selects the spatial domain MVP. And mark the current block using the airspace MVP.
  • FIG. 22 is a flowchart of a tenth embodiment of a video decoding processing method according to the present invention. As shown in FIG. 22, the method in this embodiment may include: Step 221: Receive an encoded code stream of a current block.
  • Step 222 Acquire a candidate motion derivation information set of the current block.
  • Step 222 of this embodiment is similar to the implementation principle of step 131 of the method embodiment shown in FIG. 13, and details are not described herein again.
  • Step 223 If there is no airspace candidate motion derivation information in the candidate motion derivation information set, decoding the coded code stream of the current block according to the non-airspace candidate motion derivation information. If the time domain motion derivation information and the spatial domain motion derivation information are present in the candidate motion derivation information, the decoding device may perform decoding processing on the first bit of the index coding of the motion derivation information to obtain the first bit information; The bit information is corresponding to the first index, and the motion derivation information in the candidate motion derivation information is determined according to the first index; if the first bit information corresponds to the second index, performing the next bit of the index coding Decoding processing, acquiring the next bit information, if the first bit information and the next bit information correspond to the second index, determining motion derivation information in the candidate motion derivation information according to the second index; and so on, until The index value of the motion derivation information takes up the maximum number of bits.
  • the present embodiment can perform decoding processing using the fixed length coding method shown in Table 3. For example, if the index code is 0, the index of the MV is 0. If the index code is 1, the decoding continues with 1 bit. If the next bit is 0, the index of the MV is 1, if the next bit is 1. Then, the index of the MV is 2, and so on until parsing to 0 or the maximum number of bits that the MV index may occupy. In the case where there is no candidate MV or only the time domain candidate MV exists, the decoding device may not decode, and the index of the MV is zero. The decoding device can select a corresponding MV in the candidate MV based on the parsed index.
  • the decoding apparatus does not perform decoding processing on the index coding of the motion derivation information, and in the case where there is no candidate motion derivation information,
  • the decoding device may obtain a candidate motion derivation information in any manner to perform decoding processing on the current block. This embodiment does not limit the acquisition mode.
  • the decoding device may adopt the unique Under the premise that the time domain candidate motion derivation information is not available or not, the candidate motion derivation information is obtained by other methods, and the encoded code stream of the current block is decoded.
  • the motion derivation information can also be an MV in MVP or Merge mode.
  • FIG. 23 is a schematic structural diagram of Embodiment 1 of an encoding apparatus according to the present invention.
  • the apparatus in this embodiment may include: a first acquiring module 1 1 , a first combining processing module 12 , and a first encoding processing module 13 .
  • the first obtaining module 11 is configured to acquire a first-level candidate motion derivation information set of the current block, where the first merge processing module 12 is configured to: if the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 2, performing a combining process on the candidate motion derivation information in the first-level candidate motion derivation information set, and acquiring a second-level candidate motion derivation information set, where the candidate motion derivation included in the second-level candidate motion derivation information set is included The number of pieces of information is less than or equal to 2; the first encoding processing module 13 is configured to perform encoding processing on the current block according to the candidate motion derivation information included in the second-level candidate motion derivation information set.
  • the device in this embodiment may be used to perform the method in the method embodiment shown in FIG. 3, and the implementation principle and technical effect are similar, and details are not described herein again.
  • the first merge processing module 12 can be specifically used for:
  • the air domain candidate motion derivation information is combined into one air domain candidate motion derivation information
  • the second-level candidate motion derivation information set includes the combined spatial domain candidate motion derivation information and the time domain candidate motion derivation information
  • the spatial domain motion estimation information is combined into at most two airspace candidate motions.
  • the second-level candidate motion derivation information set includes at most two spatial domain candidate motion derivation information after the merging process; or, if there is no airspace candidate motion derivation information in the first-level candidate motion derivation information set, If the number of domain candidate motion derivation information is greater than 2, the time domain candidate motion derivation information is processed into at most two time domain candidate motion derivation information, where the second level candidate motion derivation information set includes at most merge processing Two time domain candidate motion derivation information; or, if there is one air domain candidate motion derivation information in the first level candidate motion derivation information set and the number of time domain candidate motion derivation information is greater than 1, the time domain candidate is Motion derivation
  • the information merging process is a time domain candidate motion derivation information, and the second level candidate
  • the time domain candidate motion derivation information is combined into one time domain candidate motion.
  • All candidate motion derivation information in the first level candidate motion derivation information is combined into one motion derivation information.
  • the first encoding processing module 13 may be specifically configured to: if the second-level candidate motion derivation information set includes two candidate motion derivation information, select one motion derivation information from the second-level candidate motion derivation information set. Encoding the current block to obtain an encoded code stream of the current block, where the encoded code stream includes an index code of the selected motion derivation information in the second-level candidate motion derivation information set; The second-level candidate motion derivation information set includes one candidate motion derivation information, and then the current block is encoded. The encoded code stream of the current block does not include an index code.
  • the processing procedure of the first merge processing module 12 and the processing procedure of the first encoding processing module 13 in this embodiment can be specifically referred to the implementation process of the embodiment shown in FIG. 4 to FIG. 1 , and the implementation principle and technical effects are similar. I won't go into details here.
  • FIG. 24 is a schematic structural diagram of Embodiment 2 of an encoding apparatus according to the present invention.
  • the apparatus in this embodiment may include: a second obtaining module 21 and a second encoding processing module 22, where the second acquiring module 21 is used.
  • the second encoding processing module 22 is configured to perform coding processing on the current block to obtain the current block if the spatial domain candidate motion derivation information does not exist in the candidate motion derivation information set
  • the coded code stream, the index code of the motion derivation information is not included in the coded code stream.
  • the apparatus of this embodiment may be used to implement the method of the method embodiment shown in FIG. 12, which is implemented The principle and technical effects are similar and will not be described here.
  • FIG. 25 is a schematic structural diagram of Embodiment 1 of a decoding apparatus according to the present invention.
  • the apparatus in this embodiment may include: a first receiving module 3 1 , a third obtaining module 32 , a second combining processing module 33 , and a first a decoding processing module 34, wherein the first receiving module 31 is configured to receive the encoded code stream of the current block; the third obtaining module 32 is configured to acquire the first-level candidate motion derivation information set of the current block; and the second merge processing module 33 If the number of candidate motion derivation information in the first-level candidate motion derivation information set is greater than 2, the candidate motion derivation information in the first-level candidate motion derivation information set is combined to obtain a second a set of candidate motion derivation information, wherein the number of candidate motion derivation information included in the second-level candidate motion derivation information set is less than or equal to 2; the first decoding processing module 34 includes, according to the second-level candidate motion derivation information set The candidate motion
  • the device in this embodiment may be used to perform the method in the method embodiment shown in FIG. 13, and the implementation principle and technical effects are similar, and details are not described herein again.
  • the second merge processing module 33 may be specifically configured to:
  • the air domain candidate motion derivation information is combined into one air domain candidate motion derivation information
  • the second-level candidate motion derivation information set includes the combined spatial domain candidate motion derivation information and the time domain candidate motion derivation information
  • the airspace candidate motion derivation information is combined into at most two airspace candidate motions.
  • the second-level candidate motion derivation information set includes at most two spatial domain candidate motion derivation information after the merging process; or, if there is no airspace candidate motion derivation information in the first-level candidate motion derivation information set, If the number of domain candidate motion derivation information is greater than 2, the time domain candidate motion derivation information is merged into at most two time domain candidate motion derivation information, and the second level candidate motion derivation information set includes at most merge processing Two time domain candidate motion derivation information; or, if there is one air domain candidate motion derivation in the first level candidate motion derivation information set And combining the time domain candidate motion derivation information into one time domain candidate motion derivation information, where the second level candidate motion derivation information set includes the merged process, and the number of
  • the time domain candidate motion derivation information is combined into one time domain candidate motion.
  • All candidate motion derivation information in the first level candidate motion derivation information is combined into one motion derivation information.
  • the first decoding processing module 34 is specifically configured to: if the second-level candidate motion derivation information set includes two candidate motion derivation information, perform decoding processing on the motion derivation information index code of the current block, and obtain index information. And selecting motion derivation information from the second-level candidate motion derivation information set according to the index information, and performing decoding processing on the encoded code stream of the current block according to the selected motion derivation information; if the second-level candidate The motion derivation information includes a candidate motion derivation information, and the encoded code stream of the current block is decoded according to the one candidate motion derivation information.
  • the processing procedure of the second merging processing module 33 and the processing procedure of the first decoding processing module 34 in this embodiment can be specifically referred to the implementation process of the embodiment shown in FIG. 14 to FIG. 21, and the implementation principle and technical effects are similar. No longer.
  • FIG. 26 is a schematic structural diagram of Embodiment 2 of a decoding apparatus according to the present invention.
  • the apparatus in this embodiment may include: a second receiving module 41, a fourth obtaining module 42, and a second decoding processing module 43, where The second receiving module 42 is configured to receive the encoded code stream of the current block; the fourth obtaining module 42 is configured to obtain the candidate motion derivation information set of the current block; the second decoding processing module 43 is configured to: if the candidate motion derivation information set does not exist The spatial domain candidate motion derivation information is used to decode the encoded code stream of the current block according to the non-airspace candidate motion derivation information.
  • the device in this embodiment may be used to perform the method in the method embodiment shown in FIG. 22, and the implementation principle and the technical effect are similar, and details are not described herein again.
  • Video encoders, decoders are widely used in a variety of communication devices or electronic devices, such as: digital TV, set-top box, media gateway, mobile phone, wireless device, personal data assistant (PDA), handheld or portable computer, GPS receiver / navigator, camera, video player, camcorder, video recorder, surveillance equipment, video conferencing and video telephony equipment, etc.
  • PDA personal data assistant
  • Such devices include processors, memory, and interfaces for transmitting data.
  • the video codec can be implemented directly by a digital circuit or chip such as a DSP (digital signal processor) or by a software code that drives a processor to execute the flow in the software code.
  • DSP digital signal processor

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

视频编解码处理方法和装置
技术领域
本发明实施例涉及图像视频技术, 尤其涉及一种视频编解码处理方法 和装置。 背景技术
随着网络技术和终端处理能力的不断提高, 人们对目前广泛使用的运 动图像专家组系列 2 ( Moving Pictures Experts Group -2 , 以下简称:
MPEG-2 ) , 运动图像专家组系列 4 (以下简称: MPEG-4 ) , Η.264等视 频编解码技术提出了新的要求, 例如希望能够满足高清、 3D的要求, 从 而满足新的家庭影院、 远程监控、 数字广播、 移动流媒体、 便携摄像、 医 学成像等新领域的应用, 为了满足这些应用, 新一代视频编码标准( High Efficiency Video Coding , 以下简称: HEVC )应运而生。
现有的视频编码往往采用帧间预测来消除时域冗余, 从而对视频进行 压缩。 在帧间预测编码中, 需要搜索运动矢量(Motion Vector, 以下简称: MV ) 来确定当前编码块在参考帧中最相似的参考块, 并将该参考块与原 始视频进行比较, 计算出残差。 为了进一步提高压缩率, 还增加了运动矢 量预测 ( Motion Vector Prediction , 以下简称: MVP )模块 , 通过已经编 码的相邻块的 MV来预测当前块的 MV , 并用运动矢量差 ( Motion Vector Difference , 以下简称: MVD ) 来表示 MV和 MVP之间的差。 最终 , 帧 间预测编码在码流中携带 MVD和残差, 从而大大降低了数据量。 HEVC 为了提高压缩效率,在利用编码块的 MV来推导当前块的 MV方面增加了 许多改进技术, 其中包括对 MVP模块的改进、对 MVP索引编码的改进以 及增加了合并(以下简称: Merge )模式。具体来说,现有技术可以在 MVP 模块中分别选用空域左邻 MVP、 空域上邻 MVP和时域 MVP三个作为候 选。 图 1为现有技术中空域 MVP的搜索方法示意图, 如图 1所示, 在左 侧相邻的所有块中 (F、 G、 H、 I )从下到上选择第一个 MV可用的块, 以该块的 MV作为当前块的空域左邻 MVP; 在上方相邻的所有块中 (A、 B、 C、 D、 E )从右到左选择第一个 MV可用的块, 以该块的 MV作为当 前块的空域上邻 MVP。 图 2为现有技术中时域 MVP的搜索方法示意图, 如图 2所示, 在参考帧中选择与当前块对应位置的参考块, 以该参考块中 心位置的 MV作为当前块的时域 MVP。 通过上述搜索方法, 即可获取三 个候选 MVP, 根据率失真代价从三个候选 MVP中选择最优的 MVP, 并 将该 MVP在候选 MVP中的索引写入码流。 在 MVP索引编码时 , 现有技 术为了降低使用的比特数,根据候选 MVP的个数来指导 MVP索引的编码, 具体地根据 MVP个数来判断是否编码 MVP索引以及推测 MVP索引所占 用的比特数。另外, HEVC在运动信息推导的过程中还增加了 Merge模式, 即取空域和时域相邻的已编码块的 MV作为当前块的候选 MV, 并根据率 失真代价在所有 Merge模式选取的候选 MV以及运动搜索出的 MV之中选 取最优者作为当前块的 MV。若当前块的 MV为 Merge模式中选取的 MV, 那么在编码时只需要指明该块使用了 Merge模式以及指明该块所用 MV在 候选 MV中的索引。 为了降低编码 MV索引所需比特数, 现有技术根据候 选 MV的个数指导 MV索引的编码,具体地根据候选 MV个数来判断是否 编码 MV索引以及推测 MV索引所占用的比特数。 不管是候选 MVP还是 候选 MV, 其均可以称为候选运动推导信息, 由候选 MVP或者候选 MV 所组成的集合则可以称为候选运动推导信息集合。
然而, 由于候选运动推导信息的编码和解析过程依赖于候选运动推导 信息的个数, 一旦发生丟包, 解码端的时域候选运动推导信息可能无法被 搜索到, 以致估计的候选运动推导信息的个数不正确, 从而导致对当前块 的编码码流进行解码的过程出错。 发明内容
本发明实施例提供一种视频编解码处理方法和装置, 以解决现有技术 因估计的候选运动推导信息的个数不正确, 而导致的对当前块的编码码流 进行解码的过程出错的问题。
本发明实施例提供一种视频编码处理方法, 包括:
获取当前块的第一级候选运动推导信息集合;
若所述第一级候选运动推导信息集合中的候选运动推导信息的个数 大于 2, 则对所述第一级候选运动推导信息集合中的候选运动推导信息进 行合并处理, 获取第二级候选运动推导信息集合, 所述第二级候选运动推 导信息集合中包含的候选运动推导信息的个数小于等于 2;
根据所述第二级候选运动推导信息集合中包含的候选运动推导信息, 对所述当前块进行编码处理。
本发明实施例提供另一种视频编码处理方法, 包括:
获取当前块的候选运动推导信息集合;
若所述候选运动推导信息集合中不存在空域候选运动推导信息, 则对 所述当前块进行编码处理, 获取所述当前块的编码码流, 所述编码码流中 不包含运动推导信息的索引编码。
本发明实施例提供一种视频解码处理方法, 包括:
接收当前块的编码码流;
获取当前块的第一级候选运动推导信息集合;
若所述第一级候选运动推导信息集合中的候选运动推导信息的个数 大于 2 , 则对所述第一级候选运动推导信息集合中的候选运动推导信息进 行合并处理, 获取第二级候选运动推导信息集合, 所述第二级候选运动推 导信息集合中包含的候选运动推导信息的个数小于等于 2;
根据所述第二级候选运动推导信息集合中包含的候选运动推导信息 对所述当前块的编码码流进行解码处理。
本发明实施例提供另一种视频解码处理方法, 包括:
接收当前块的编码码流;
获取当前块的候选运动推导信息集合;
若所述候选运动推导信息集合中不存在空域候选运动推导信息, 则根 据非空域候选运动推导信息对所述当前块的编码码流进行解码处理。
本发明实施例提供一种编码装置, 包括:
第一获取模块, 用于获取当前块的第一级候选运动推导信息集合; 第一合并处理模块, 用于若所述第一级候选运动推导信息集合中的候 选运动推导信息的个数大于 2 , 则对所述第一级候选运动推导信息集合中 的候选运动推导信息进行合并处理, 获取第二级候选运动推导信息集合, 所述第二级候选运动推导信息集合中包含的候选运动推导信息的个数小 于等于 2; 第一编码处理模块, 用于根据所述第二级候选运动推导信息集合中包 含的候选运动推导信息, 对所述当前块进行编码处理。
本发明实施例提供另一种编码装置, 包括:
第二获取模块, 用于获取当前块的候选运动推导信息集合;
第二编码处理模块, 用于若所述候选运动推导信息集合中不存在空域 候选运动推导信息, 则对所述当前块进行编码处理, 获取所述当前块的编 码码流, 所述编码码流中不包含运动推导信息的索引编码。
本发明实施例提供一种解码装置, 包括:
第一接收模块, 用于接收当前块的编码码流;
第三获取模块, 用于获取所述当前块的第一级候选运动推导信息集 合;
第二合并处理模块, 用于若所述第一级候选运动推导信息集合中的候 选运动推导信息的个数大于 2 , 则对所述第一级候选运动推导信息集合中 的候选运动推导信息进行合并处理, 获取第二级候选运动推导信息集合, 所述第二级候选运动推导信息集合中包含的候选运动推导信息的个数小 于等于 2;
第一解码处理模块, 根据所述第二级候选运动推导信息集合中包含的 候选运动推导信息对所述当前块的编码码流进行解码处理。
本发明实施例提供另一种解码装置, 包括:
第二接收模块, 用于接收当前块的编码码流;
第四获取模块, 用于获取当前块的候选运动推导信息集合;
第二解码处理模块, 用于若所述候选运动推导信息集合中不存在空域 候选运动推导信息, 则根据非空域候选运动推导信息对所述当前块的编码 码流进行解码处理。
本发明实施例中, 编码端可以在第一级候选运动推导信息集合中的候 选运动推导信息的个数大于 2的情况下, 将第一级候选运动推导信息集合 中的候选运动推导信息的个数通过合并处理成至多两个候选运动推导信 息, 以获取第二级候选运动推导信息集合, 并应用该第二级候选运动推导 信息集合进行编码处理, 使得对该第二级候选运动推导信息集合中选择的 运动推导信息的索引进行编码时, 至多需要一个比特位。 解码端可以在采 用上述相同的合并处理方式获取第二级候选运动推导信息集合后, 不管是 否存在参考帧丟失的情况, 解码端仅需要对一个比特位的索引编码进行解 码处理, 而不会出现将索引编码的一部分误认为是当前块的编码码流的其 它部分, 从而可以避免对当前块的编码码流错误地解码。 附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实 施例或现有技术描述中所需要使用的附图作一简单地介绍, 显而易见地, 下 面描述中的附图是本发明的一些实施例, 对于本领域普通技术人员来讲, 在 不付出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图 1为现有技术中空域 MVP的搜索方法示意图;
图 2为现有技术中时域 MVP的搜索方法示意图;
图 3为本发明视频编码处理方法实施例一的流程图;
图 4为本发明视频编码处理方法实施例二的流程图;
图 5为本发明视频编码处理方法实施例三的流程图;
图 6为本发明视频编码处理方法实施例四的流程图;
图 7为本发明视频编码处理方法实施例五的流程图;
图 8为本发明视频编码处理方法实施例六的流程图;
图 9为本发明视频编码处理方法实施例七的流程图;
图 10为本发明视频编码处理方法实施例八的流程图;
图 1 1为本发明视频编码处理方法实施例九的流程图;
图 12为本发明视频编码处理方法实施例十的流程图;
图 13为本发明视频解码处理方法实施例一的流程图;
图 14为本发明视频解码处理方法实施例二的流程图;
图 15为本发明视频解码处理方法实施例三的流程图;
图 16为本发明视频解码处理方法实施例四的流程图;
图 17为本发明视频解码处理方法实施例五的流程图;
图 18为本发明视频解码处理方法实施例六的流程图;
图 19为本发明视频解码处理方法实施例七的流程图;
图 20为本发明视频解码处理方法实施例八的流程图; 图 21为本发明视频解码处理方法实施例九的流程图;
图 22为本发明视频解码处理方法实施例十的流程图;
图 23为本发明编码装置实施例一的结构示意图;
图 24为本发明编码装置实施例二的结构示意图;
图 25为本发明解码装置实施例一的结构示意图;
图 26为本发明解码装置实施例二的结构示意图。 具体实施方式
为使本发明实施例的目的、 技术方案和优点更加清楚, 下面将结合本 发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完整地描 述, 显然, 所描述的实施例是本发明一部分实施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人员在没有作出创造性劳动前提 下所获得的所有其他实施例, 都属于本发明保护的范围。
图 3为本发明视频编码处理方法实施例一的流程图, 如图 3所示, 本 实施例的方法可以包括:
步骤 301、 获取当前块的第一级候选运动推导信息集合。
举例来说, 编码装置可以获取当前块的第一级候选运动推导信息集 合。 所谓当前块, 即为当前待编码的视频块。 本实施例中的运动推导信息 可以为 MVP或者 Merge模式下的 MV。 本领域技术人员可以理解的是, 用于对视频块进行帧间预测的其它运动推导信息也可以适用于本实施例 的技术方案。
以运动推导信息为 MVP举例来说, 本实施例中的步骤 301可以采用 现有技术实现, 例如图 1所示, 在左侧相邻的所有块中 (F、 G、 H、 I )从 下到上选择第一个 MV可用的块, 以该块的 MV作为当前块的空域左邻 MVP; 在上方相邻的所有块中 (A、 B、 C、 D、 E )从右到左选择第一个 MV可用的块, 以该块的 MV作为当前块的空域上邻 MVP; 如图 2所示, 在参考帧中选择与当前块对应位置的参考块, 以该参考块中心位置的 MV 作为当前块的时域 MVP。 由于上述的时域 MVP、 空域左邻 MVP、 空域上 邻 MVP中任一种 MVP有可能不存在, 因此, 采用现有技术的方法获得的 第一级候选 MVP集合可以包括以下任一种集合形式: {时域 MVP}、 {空 域左邻 MVP}、 {空域上邻 MVP}、 {时域 MVP、 空域左邻 MVP}、 {时域 MVP,空域上邻 MVP}、 {空域左邻 MVP、空域上邻 MVP}以及 {时域 MVP、 空域左邻 MVP、 空域上邻 MVP}。
以运动推导信息为 Merge模式下的 MV举例来说,本实施例中的步骤 301也可以采用现有技术实现。 候选 MV可能包括空域左邻 MV、 空域上 邻 MV、 时域 MV、 空域右上邻 MV、 空域左下邻 MV, 因此, 与上述候选 MVP类似地, 第一级候选 MV集合也可以包括有上述五种候选 MV中的 至少一个组成的若干种集合形式。
本领域技术人员可以理解的是,步骤 301也可以不采用现有技术实现, 例如,对于候选 MVP来说, 其也可能包括更多其它空域候选 MVP或者包 括更多其它的时域候选 MVP; 对于 Merge模式下的候选 MV来说, 其也 可能包括更多其它空域候选 MV或者包括更多其它的时域候选 MV。 本实 施例不对编码装置获得的第一级候选运动推导信息集合中包括的候选运 动推导信息的具体内容进行限定, 只要是能够进行帧间预测编码的运动推 导信息即可。
步骤 302、 若所述第一级候选运动推导信息集合中的候选运动推导信 息的个数大于 2, 则对所述第一级候选运动推导信息集合中的候选运动推 导信息进行合并处理, 获取第二级候选运动推导信息集合, 所述第二级候 选运动推导信息集合中包含的候选运动推导信息的个数小于等于 2。
步骤 303、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行编码处理。
表 1为现有技术中针对可能存在的三个候选 MVP的一种编码方式。
表 1
Figure imgf000009_0001
如表 1所示,其中 MVPIdx为选择的 MVP在第一级候选 MVP集合中 的索引, MVPNum为第一级候选 MVP集合中的候选 MVP的数量。 具体 来说, 若采用图 1和图 2所示方式获取的第一级候选 MVP集合中仅包括 1个候选 MVP , 即对应 MVPNum= 1的情况 , 则不对该候选 MVP的索引 进行编码, 该唯一的一个候选 MVP可能是时域候选 MVP、 空域左邻候选 MVP和空域上邻候选 MVP中的任一个; 若采用图 1和图 2所示方式获取 的第一级候选 MVP集合中包括 2个候选 MVP , 即对应 MVPNum=2的情 况, 第一级候选 MVP集合中的第 1个候选 MVP对应的 MVPIdx为 0, 其 对应的索引编码为 0, 第一级候选 MVP集合中的第 2个候选 MVP对应的 MVPIdx为 1 , 其对应的索引编码为 1 , 这两个候选 MVP可能是时域候选 MVP、 空域左邻候选 MVP和空域上邻候选 MVP中的任两个; 若采用图 1 和图 2所示方式获取的第一级候选 MVP集合中包括 3个候选 MVP, 即对 应 MVPNum=3的情况, 第一级候选 MVP集合中的第 1个候选 MVP对应 的 MVPIdx为 0, 其对应的索引编码为 0, 第一级候选 MVP集合中的第 2 个候选 MVP对应的 MVPIdx为 1 , 其对应的索引编码为 10, 第一级候选 MVP集合中的第 3个候选 MVP对应的 MVPIdx为 2, 其对应的索引编码 为 11 , 这 3个候选 MVP是时域候选 MVP、 空域左邻候选 MVP和空域上 邻候选 MVP。 由此可知, 现有技术的编码方式是与候选 MVP的个数有关 的,由于上述可能的候选 MVP有 3个,因此,现有技术对这 3个候选 MVP 在第一级候选 MVP集合中的索引进行编码时, 该索引编码可能是一个比 特位, 也可能是两个比特位, 因此,解码端在对索引编码进行解码处理时, 既可能需要解码一个比特位, 也需要解码两个比特位, 这取决于解码端采 用图 1和图 2所示方式获得的第一级候选 MVP集合中候选 MVP的数量, 如果数量为 2, 则只需要解码一个比特位, 如果数量为 3 , 则需要解码一 个或两个比特位。但是,在易错信道条件下, 参考帧可能存在丟失的情况。 一旦参考帧丟失, 则解码端采用图 2所示方式搜索时域 MVP时就有可能 出现问题, 从而导致解码端候选 MVP个数错误。 假设编码端获得的第一 级候选 MVP集合为 {时域候选 MVP、 空域左邻候选 MVP、 空域上邻候选 MVP } , 从中选择的 MVP为空域左邻候选 MVP , 其索引为 1 , 则对应的 索引编码为 10。 在解码端, 由于参考帧丟失无法获得时域候选 MVP, 因 此获得的第一级候选 MVP集合为 {空域左邻候选 MVP、 空域上邻候选 MVP }。 由于解码端获得的候选 MVP的个数为 2, 则解码端只会对索引编 码的第一个比特位 "1"进行解码, 而错误地将第二个比特位" 0,,作为当前块 的其它部分的编码, 从而导致解码端对除索引编码之外的编码码流进行解 码时出现错误, 甚至导致整个解码崩溃, 无法继续后续的解码过程。 针对 Merge模式下的 MV来说, 亦存在类似问题, 此处不再赘述。
鉴于此, 本实施例可以判断步骤 301中获取的第一级候选运动推导信 息集合中的候选运动推导信息的个数是否大于 2, 若大于 2, 则对第一级 候选运动推导信息集合中的候选运动推导信息进行合并处理, 获取第二级 候选运动推导信息集合, 该第二级候选运动推导信息集合中包含的候选运 动推导信息的个数小于等于 2。 因此, 采用第二级候选运动推导信息集合 对当前块进行编码处理时, 其运动推导信息的索引仅需要一个比特位即可 表示。 表 2即为采用本实施例的技术方案的候选 MVP的一种编码方式。 需要说明的是, 表 2中针对第二级候选 MVP集合中仅存在一个候选 MVP 的情况, 即 MVPNum = 1的情况也进行了编码, 本领域技术人员可以理解 的是, 本实施例针对这一情况也可以不进行编码。 表 2
Figure imgf000011_0001
以现有技术中候选 MVP的个数最大为 3个举例来说, 第一级候选 MVP集合中的候选 MVP的个数大于 2的情况只能是 {时域候选 MVP、 空 域左邻候选 MVP、 空域上邻候选 MVP } , 采用本实施例的方法, 即可将 这 3个候选 MVP合并成至多两个候选 MVP。 合并后的这两个候选 MVP 即可采用表 2所示的方式进行索引编码。 因此, 在解码时, 解码端可以采 用上述相同的处理方式获取合并后的这两个候选 MVP。 不管参考帧是否 丟失, 解码端均只需对一个比特位的索引编码进行解码, 而将其余部分均 作为当前块的编码码流的其它部分, 而不会出现将索引编码的一部分误认 为是当前块的编码码流的其它部分, 从而避免错误的解码。 以现有技术中 Merge模式下的候选 MV的个数最大为 5个举例来说, 第一级候选 MV集合中的候选 MV的个数大于 2的情况较多,例如可以是 {空域左邻候选 MV、 空域上邻候选 MV、 时域候选 MV }、 可以是 {空域左 邻候选 MV、 时域候选 MV、 空域右上邻候选 MV、 空域左下邻候选 MV } 等等, 采用本实施例的方法, 即可将这 3个或者 3个以上的候选 MV合并 成至多两个候选 MV, 从而仅需要一个比特位对从第二级候选 MV集合中 选择的 MV的索引进行编码。
需要说明的是,本实施例仅是以现有技术中候选 MVP最多仅有 3个, Merge模式下的候选 MV最多有 5个为例进行说明, 本领域技术人员可以 理解的是, 随着技术的发展, 候选 MVP或者 MV的个数也可以更多。 另 现有技术或其组合将 3个或者 3个以上的候选运动推导信息合并为 1个或 者 2个候选运动推导信息。
本实施例中, 编码装置可以在第一级候选运动推导信息集合中的候选 运动推导信息的个数大于 2的情况下, 将第一级候选运动推导信息集合中 的候选运动推导信息的个数通过合并处理成至多两个候选运动推导信息, 以获取第二级候选运动推导信息集合, 并应用该第二级候选运动推导信息 集合进行编码处理, 使得对该第二级候选运动推导信息集合中选择的运动 推导信息的索引进行编码时, 至多需要一个比特位, 从而使得解码端在采 用上述相同的合并处理方式获取第二级候选运动推导信息集合后, 不管是 否存在参考帧丟失的情况, 解码端仅需要对一个比特位的索引编码进行解 码处理, 而不会出现将索引编码的一部分误认为是当前块的编码码流的其 它部分, 从而可以避免对当前块的编码码流错误地解码。
下面采用几种具体的合并处理方式, 实现图 3所示编码处理方法实施 例的技术方案。
图 4为本发明视频编码处理方法实施例二的流程图, 如图 4所示, 本 实施例的方法可以包括:
步骤 401、 获取当前块的第一级候选运动推导信息集合。
步骤 402、 若所述第一级候选运动推导信息集合中存在时域候选运动 推导信息且空域候选运动推导信息的个数大于 1 , 则将所述空域候选运动 推导信息合并处理为一个空域候选运动推导信息, 所述第二级候选运动推 导信息集合包括合并处理后的空域候选运动推导信息和所述时域候选运 动推导信息。
以运动推导信息是 MVP为例来说,若当前块的第一级候选 MVP集合 中的候选 MVP总个数小于等于 2, 则编码装置不进行任何合并操作; 若 当前块的第一级候选 MVP集合中存在时域候选 MVP, 且空域候选 MVP 的个数大于 1 , 则编码装置可以合并全部空域候选 MVP。 举例来说, 本实 施例中的合并处理方法可以具体为取所有空域候选 MVP的平均值作为合 并处理后的空域候选 MVP, 因此, 该第二级候选 MVP集合中即可包括两 个候选 MVP,—个是合并处理后的空域候选 MVP,—个是时域候选 MVP。
在运动估计过程中, 编码装置可以在第二级候选 MVP集合中选择一 个 MVP来进行预测, 并通过运动搜索得到最终的 MV。 需要说明的是, 如果第二级候选 MVP集合中只存在唯——个候选 MVP, 则编码装置可以 直接利用该唯——个候选 MVP进行预测。
步骤 403、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行编码处理。
本实施例中, 编码装置可以对当前块进行编码处理, 如果第二级候选 运动推导信息集合中包括空域候选运动推导信息, 则编码装置可以采用一 个比特位对选择的运动推导信息在该第二级候选运动推导信息集合中的 索引编码到该当前块的编码码流中。 如果第二级候选运动推导信息集合中 不包含任何空域候选运动推导信息, 则编码装置不对该候选运动推导信息 的索引进行编码。 可以理解的是, 不进行编码的好处在于可以节约开销, 简化编码方式。
可以理解的是, 针对 Merge模式下的 MV来说, 其与 MVP处理过程 的区别在于,运动估计过程是在 Merge模式的候选 MV以及运动搜索得到 的 MV中选取最优者作为当前块的 MV。
本实施例在图 3所示方法实施例的基础上, 通过采用求平均值的合并 处理方式将第一级候选运动推导信息中的候选运动推导信息的个数合并 为至多两个, 使得编码装置可以至多仅采用一个比特位对运动推导信息的 索引进行编码处理。 图 5为本发明视频编码处理方法实施例三的流程图, 如图 5所示, 本 实施例的方法可以包括:
步骤 501、 获取当前块的第一级候选运动推导信息集合。
步骤 502、 若所述第一级候选运动推导信息中不存在时域候选运动推 导信息且空域候选运动推导信息的个数大于 2, 则将所述空域候选运动推 导信息合并处理为至多两个空域候选运动推导信息, 所述第二级候选运动 推导信息集合包括合并处理后的至多两个空域候选运动推导信息。
仍以运动推导信息是 MVP为例来说, 若当前块的第一级候选 MVP 集合中的候选 MVP总个数小于等于 2, 则编码装置不进行任何合并操作; 若当前块的第一级候选 MVP集合中不存在时域候选 MVP且空域候选 MVP的个数大于 2, 则编码装置可以将空域候选 MVP合并处理为至多两 个空域候选 MVP。 举例来说, 本实施例中的合并处理方法可以具体为根 据预设策略, 从所述第一级候选运动推导信息集合中选择至多两个空域候 选运动推导信息作为合并处理后的空域候选运动推导信息, 其中本领域技 术人员可以对该预设策略自行设定, 例如可以根据各候选 MVP的值的大 小和 /或位置等信息进行选择。 因此, 该第二级候选 MVP集合中即可包括 一个或者两个候选空域 MVP。 需要说明的是, 本发明所有实施例中, 预 设策略均可以为根据各候选 MVP的值的大小和 /或位置等信息进行选择。
在运动估计过程中, 编码装置可以在第二级候选 MVP集合中选择一 个 MVP来进行预测, 并通过运动搜索得到最终的 MV。 需要说明的是, 如果第二级候选 MVP集合中只存在唯——个候选 MVP, 则编码装置可以 直接利用该唯——个候选 MVP进行预测。
步骤 503、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行编码处理。
本实施例中, 编码装置可以对当前块进行编码处理, 如果第二级候选 运动推导信息集合中包括空域候选运动推导信息, 则编码装置可以采用一 个比特位对选择的运动推导信息在该第二级候选运动推导信息集合中的 索引编码到该当前块的编码码流中。 如果第二级候选运动推导信息集合中 不包含任何空域候选运动推导信息, 则编码装置不对该候选运动推导信息 的索引进行编码。 可以理解的是, 针对 Merge模式下的 MV来说, 其与 MVP处理过程 的区别在于,运动估计过程是在 Merge模式的候选 MV以及运动搜索得到 的 MV中选取最优者作为当前块的 MV。
本实施例在图 3所示方法实施例的基础上, 在第一级候选运动推导信 息集合中不存在时域候选运动推导信息, 根据预设策略从空域候选运动推 导信息中选择至多两个空域候选运动推导信息作为第二级候选运动推导 信息集合中的候选运动推导信息, 使得编码装置可以仅采用最多一个比特 位对运动推导信息的索引进行编码处理。
图 6为本发明视频编码处理方法实施例四的流程图, 如图 6所示, 本 实施例的方法可以包括:
步骤 601、 获取当前块的第一级候选运动推导信息集合。
步骤 602、 若所述第一级候选运动推导信息集合中不存在空域候选运 动推导信息且时域候选运动推导信息的个数大于 2, 则将所述时域候选运 动推导信息合并处理为至多两个时域候选运动推导信息, 所述第二级候选 运动推导信息集合包括合并处理后的至多两个时域候选运动推导信息。
前几个实施例中, 时域运动推导信息最多只存在 1个, 但是本实施例 是针对第一级候选运动推导信息集合中仅存在时域候选运动推导信息且 时域候选运动推导信息的个数大于 2的情况。 在该情况下, 编码装置可以 将时域候选运动推导信息的个数合并处理为至多两个时域候选运动推导 信息, 因此, 第二级候选运动推导信息集合中仅包含合并处理后的至多两 个时域候选运动推导信息。
步骤 603、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行编码处理。
本实施例中, 编码装置可以对当前块进行编码处理, 编码装置可以采 用一个比特位对选择的运动推导信息在该第二级候选运动推导信息集合 中的索引编码到该当前块的编码码流中。
本实施例中的合并处理既可以是根据预设策略, 从所述第一级候选运 动推导信息集合中选择至多两个时域候选运动推导信息作为合并处理后 的时域候选运动推导信息, 也可以采用其它合并处理方式, 例如求平均值 的方式。 本实施例在图 3所示方法实施例的基础上, 在第一级候选运动推导信 息集合中仅存在多个时域候选运动推导信息的情况下, 通过合并处理, 使 得第二级候选运动推导信息集合中的时域候选运动推导信息的个数至多 只有两个, 从而使得编码装置可以仅采用一个比特位对运动推导信息的索 引进行编码处理。
图 7为本发明视频编码处理方法实施例五的流程图, 如图 7所示, 本 实施例的方法可以包括:
步骤 701、 获取当前块的第一级候选运动推导信息集合。
步骤 702、 若所述第一级候选运动推导信息集合中存在一个空域候选 运动推导信息且时域候选运动推导信息的个数大于 1 , 则将所述时域候选 运动推导信息合并处理为一个时域候选运动推导信息, 所述第二级候选运 动推导信息集合包括合并处理后的一个时域候选运动推导信息以及所述 空域候选运动推导信息。
本实施例针对第一级候选运动推导信息集合中存在一个空域候选运 动推导信息以及多于 1个时域候选运动推导信息的情况。 在该情况下, 编 码装置可以将时域候选运动推导信息的个数合并处理为 1个时域候选运动 推导信息, 因此, 第二级候选运动推导信息集合中仅包含合并处理后的一 个时域候选运动推导信息以及一个空域候选运动推导信息。
本实施例中的合并处理, 既可以是根据预设策略, 从所述第一级候选 运动推导信息集合中选择一个时域候选运动推导信息作为合并处理后的 时域候选运动推导信息, 又可以是对多个时域候选运动推导信息求平均值 以合并处理为 1个时域候选运动推导信息。
步骤 703、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行编码处理。
本实施例中, 编码装置可以对当前块进行编码处理, 编码装置可以采 用一个比特位对选择的运动推导信息在该第二级候选运动推导信息集合 中的索引编码到该当前块的编码码流中。
本实施例在图 3所示方法实施例的基础上, 在第一级候选运动推导信 息集合中存在一个空域候选运动推导信息以及多于 1个时域候选运动推导 信息的情况下, 通过将多个时域候选运动推导信息合并处理为 1个时域候 选运动推导信息, 使得第二级候选运动推导信息集合中的候选运动推导信 息的个数只有两个, 从而使得编码装置可以仅采用一个比特位对运动推导 信息的索引进行编码处理。
图 8为本发明视频编码处理方法实施例六的流程图, 如图 8所示, 本 实施例的方法可以包括:
步骤 801、 获取当前块的第一级候选运动推导信息集合。
步骤 802、 若所述第一级候选运动推导信息集合中的空域候选运动推 导信息以及时域候选运动推导信息的个数均大于 1 , 则将所述时域候选运 动推导信息合并处理为一个时域候选运动推导信息, 将所述空域候选运动 推导信息合并处理为一个空域候选运动推导信息, 所述第二级候选运动推 导信息集合包括合并处理后的一个时域候选运动推导信息以及合并处理 后的一个空域候选运动推导信息。
本实施例针对第一级候选运动推导信息集合中既存在多于 1个空域候 选运动推导信息又存在多于 1个时域候选运动推导信息的情况。 在该情况 下, 编码装置可以分别对空域候选运动推导信息和时域候选运动推导信息 进行处理。 对于空域候选运动推导信息来说, 编码装置可以将多个空域候 选运动推导信息合并处理为一个空域候选运动推导信息, 对于时域候选运 动推导信息来说, 编码装置可以将多个时域候选运动推导信息合并处理为 一个时域候选运动推导信息, 因此, 第二级候选运动推导信息集合包括合 并处理后的一个时域候选运动推导信息以及合并处理后的一个空域候选 运动推导信息。
本实施例中的合并处理, 既可以是根据预设策略, 从第一级候选运动 推导信息集合中选择一个时域候选运动推导信息作为合并处理后的时域 候选运动推导信息, 从第一级候选运动推导信息集合中选择一个空域候选 运动推导信息作为合并处理后的空域候选运动推导信息, 又可以是对多个 时域候选运动推导信息求平均值以合并处理为 1个时域候选运动推导信 息, 对多个空域候选运动推导信息求平均值以合并处理为 1个空域候选运 动推导信息。
步骤 803、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行编码处理。 本实施例中, 编码装置可以对当前块进行编码处理, 如果第二级候选 运动推导信息集合中包括空域候选运动推导信息, 则编码装置可以采用一 个比特位对选择的运动推导信息在该第二级候选运动推导信息集合中的 索引编码到该当前块的编码码流中。 如果第二级候选运动推导信息集合中 不包含任何空域候选运动推导信息, 则编码装置不对该候选运动推导信息 的索引进行编码。
本实施例在图 3所示方法实施例的基础上, 在第一级候选运动推导信 息集合中既存在多个空域候选运动推导信息又存在多个时域候选运动推 导信息的情况下, 通过将多个时域候选运动推导信息合并处理为 1个时域 候选运动推导信息并将多个空域候选运动推导信息合并处理为 1个空域候 选运动推导信息, 使得第二级候选运动推导信息集合中的候选运动推导信 息的个数只有两个, 从而使得编码装置可以仅采用最多一个比特位对运动 推导信息的索引进行编码处理。
图 9为本发明视频编码处理方法实施例七的流程图, 如图 9所示, 本 实施例的方法可以包括:
步骤 901、 获取当前块的第一级候选运动推导信息集合。
步骤 902、 若所述第一级候选运动推导信息集合中至少包含空域左邻 运动推导信息和 /或空域上邻运动推导信息,则从第一级候选运动推导信息 集合中仅保留空域左邻运动推导信息和 /或空域上邻运动推导信息作为合 并处理后的候选运动推导信息。
此处,空域左邻运动推导信息取自横向坐标在当前块的左方(如正左、 左下等)且已编码块的运动信息中的一个, 空域上邻运动推导信息取自纵 向位置在当前块的上方 (如正上、 后上等)且已编码块的运动信息中的一 个。
本实施例针对第一级候选运动推导信息集合中存在多种空域运动推 导信息和时域运动推导信息任意组合的情况。 在该情况下, 编码装置可以 直接将空域左邻运动推导信息和空域上邻运动推导信息作为合并处理后 的候选运动推导信息, 而舍弃其它候选运动推导信息。 因此, 第二级候选 运动推导信息集合包括以下集合: {没有任何运动推导信息}、 {空域左邻 运动推导信息 }、 {空域上邻运动推导信息}、 {空域左邻运动推导信息、 空 域上邻运动推导信息 }。
步骤 903、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行编码处理。
本实施例中, 编码装置可以对当前块进行编码处理。 由于第二级候选 运动推导信息集合中包括至多两个候选运动推导信息, 因此编码装置可以 采用一个比特位对选择的运动推导信息在该第二级候选运动推导信息集 合中的索引编码到该当前块的编码码流中。例如采用表 2所示的编码方式。
本实施例在图 3所示方法实施例的基础上, 在第一级候选运动推导信 息集合中存在多种空域运动推导信息和时域运动推导信息任意组合的情 况下,仅保留空域左邻运动推导信息和 /或空域上邻运动推导信息作为第二 级候选运动推导信息集合中的候选运动推导信息, 从而使得编码装置可以 仅采用一个比特位对运动推导信息的索引进行编码处理。
图 10为本发明视频编码处理方法实施例八的流程图, 如图 10所示, 本实施例的方法可以包括:
步骤 101、 获取当前块的第一级候选运动推导信息集合。
步骤 102、 若所述第一级候选运动推导信息集合中的候选运动推导信 息的个数大于 1 , 将第一级候选运动推导信息中的全部候选运动推导信息 合并处理为一个运动推导信息。
本实施例不管第一级候选运动推导信息集合中包括的运动推导信息 的具体内容, 只要第一级候选运动推导信息集合中的候选运动推导信息的 个数大于 1 , 就将全部候选运动推导信息合并处理为一个运动推导信息。 因此, 第二级候选运动推导信息集合仅包括一个合并处理后的运动推导信 自
举例来说, 本实施例的合并处理方式可以为若第一级候选运动推导信 息集合中不存在运动推导信息, 则合并处理后的运动推导信息为零向量, 若第一级候选运动推导信息集合中的空域候选运动推导信息和时域候选 运动推导信息的个数之和为奇数, 则合并处理后的运动推导信息为所述空 域候选运动推导信息和时域候选运动推导信息的向量中值, 若第一级候选 运动推导信息集合中的空域候选运动推导信息和时域候选运动推导信息 的个数之和为偶数, 则合并处理后的运动推导信息为空域候选运动推导信 息和时域候选运动推导信息按大小顺序排列后中间两个运动推导信息的 平均值。
步骤 103、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行编码处理。
由于本实施例中, 第二级候选运动推导信息集合中只有一个候选运动 推导信息, 因此,编码装置既可以对该候选运动推导信息的索引进行编码, 又可以不对该候选运动推导信息的索引进行编码。 可以理解的是, 不进行 编码的好处在于可以节约开销, 简化编码方式。
本实施例在图 3所示方法实施例的基础上, 在第一级候选运动推导信 息集合中包括的运动推导信息大于 1的情况下, 将全部运动推导信息合并 成一个运动推导信息, 因此, 第二级候选运动推导信息集合中仅包括一个 运动推导信息, 从而使得编码装置既可以不进行索引编码, 又可以仅采用 一个比特位对运动推导信息的索引进行编码处理。
图 11为本发明视频编码处理方法实施例九的流程图, 如图 11所示, 本实施例的方法可以包括:
步骤 111、 获取当前块的第一级候选运动推导信息集合。
步骤 112、 若第一级候选运动推导信息集合中包含 1个时域候选运动 推导信息以及多于 1个空域候选运动推导信息, 则对多于 1个空域候选运 动推导信息进行合并处理, 获取第二级候选运动推导信息集合, 该第二级 候选运动推导信息集合中包含合并处理后的空域候选运动推导信息以及 时域候选运动推导信息。
步骤 113、 若选择的运动推导信息为时域运动推导信息, 则将所述时 域运动推导信息在所述第二级候选运动推导信息集合中的索引编码为第 一编码; 若选择的运动推导信息为空域运动推导信息, 则将所述空域运动 推导信息在所述第二级候选运动推导信息集合中的索引编码为第二编码。
以 MVP举例来说, 若选择的 MVP为第二级候选 MVP集合中的时域 MVP,则编码为 0,若选择的 MVP为第二级候选 MVP集合中的空域 MVP, 则编码为 1。 因此, 本实施例在前述实施例的基础上, 可以仅采用一个比 特位对选择出的运动推导信息进行固定编码,且编码的比特位携带了 MVP 属于时域或空域的信息。 前述实施例仅针对采用 MVP或者 Merge模式下的 MV对当前块进行 编码处理的过程进行了详细说明。 可以理解的是, 这两种模式也可以融合 使用, 在使用之前, 只需要设定合并模式标识位 MergeFlag即可。 举例来 说, 若当前块使用了 Merge模式, 且选择了 Merge模式的 MV, 则编码装 置可以将 MergeFlag设置为 1 ,若当前块未使用 Merge模式或使用了 Merge 模式且选择了运动搜索得到的 MV, 则编码装置可以将 MergeFlag设置为 0。 MergeFlag=0, 则编码装置需要对选用的 MVP在第二候选运动推导信 息集合中的索引进行编码, 其具体过程可以采用上述任一实施例的过程; 若 MergeFlag=l , 则需要对所选的 MV在 Merge模式下的候选 MV中的索 引进行编码, 其具体过程亦可以参考上述任一实施例的过程, 此处不再赘 述。
图 12为本发明视频编码处理方法实施例十的流程图, 如图 12所示, 本实施例的方法可以包括:
步骤 121、 获取当前块的候选运动推导信息集合。
本实施例的步骤 121与图 3所示方法实施例的步骤 301的实现原理类 似, 此处不再赘述。
步骤 122、 若所述候选运动推导信息集合中不存在空域候选运动推导 信息, 则对所述当前块进行编码处理, 获取所述当前块的编码码流, 所述 编码码流中不包含运动推导信息的索引编码。
若候选运动推导信息集合中存在时域运动推导信息和空域运动推导 信息, 则从候选运动推导信息集合中选择一个运动推导信息; 对选择的运 动推导信息进行定长编码处理, 以使编码码流与所述候选运动推导信息的 个数无关, 然后编码装置即可对选择的运动推导信息在所述候选运动推导 信息集合中的索引进行编码处理, 对所述当前块进行编码处理, 获取所述 当前块的编码码流, 所述编码码流中包含索引编码。 针对这种情况, 本实 施例可以采用表 3所示的定长编码。
表 3
Figure imgf000021_0001
1 10 10
2 11 由表 3可以看出, 该定长编码也可以使得编码码流与所述候选运动推 导信息的个数无关。
本实施例针对候选运动推导信息集合中没有候选运动推导信息或者 仅存在一个时域运动推导信息的情况, 编码装置不对运动推导信息的索引 进行编码处理, 因此, 当前块的编码码流中不包含运动推导信息的索引编 码。 对于不对索引进行编码的处理方式, 在解码端, 由于采用编码端相同 的方式获取候选运动推导信息集合后, 该候选运动推导信息集合要么没有 候选运动推导信息, 要么只有一个时域候选运动推导信息, 对于没有候选 运动推导信息的情况来说, 解码端可以采用任意方式获取一个候选运动推 导信息对当前块进行解码处理, 本实施例不对获取方式进行限定, 对于只 有一个时域候选运动推导信息的情况来说, 解码端可采用该唯一的时域候 选运动推导信息或在此时域候选运动推导信息无法得到的前提下, 采用其 它方式获取一个候选运动推导信息, 对当前块的编码码流进行解码处理即 可。 本实施例编码处理方法, 节约了编码开销, 且简化了编码方式。 需要 说明的是, 本实施例中的运动推导信息亦可以为 MVP或者 Merge模式下 的 MV。
图 13为本发明视频解码处理方法实施例一的流程图, 如图 13所示, 本实施例的方法可以包括:
步骤 131、 接收当前块的编码码流。
举例来说, 解码设备可以接收当前块的编码码流。 该编码码流即可以 是执行了图 3所示编码实施例的技术方案之后获取的编码码流。
步骤 132、 获取当前块的第一级候选运动推导信息集合。
解码设备可以获取当前块的第一级候选运动推导信息集合。
以运动推导信息为 MVP举例来说, 本实施例中的步骤 132可以采用 现有技术实现, 例如图 1所示, 在左侧相邻的所有块中 (F、 G、 H、 I )从 下到上选择第一个 MV可用的块, 以该块的 MV作为当前块的空域左邻 MVP; 在上方相邻的所有块中 (A、 B、 C、 D、 E )从右到左选择第一个 MV可用的块, 以该块的 MV作为当前块的空域上邻 MVP; 如图 2所示, 在参考帧中选择与当前块对应位置的参考块, 以该参考块中心位置的 MV 作为当前块的时域 MVP。 由于上述的时域 MVP、 空域左邻 MVP、 空域上 邻 MVP中任一种 MVP有可能不存在, 因此, 采用现有技术的方法获得的 第一级候选 MVP集合可以包括以下任一种集合形式: {时域 MVP}、 {空 域左邻 MVP}、 {空域上邻 MVP}、 {时域 MVP、 空域左邻 MVP}、 {时域 MVP、空域上邻 MVP}、 {空域左邻 MVP、空域上邻 MVP}以及 {时域 MVP、 空域左邻 MVP、 空域上邻 MVP}。
以运动推导信息为 Merge模式下的 MV举例来说,本实施例中的步骤 301也可以采用现有技术实现。 候选 MV可能包括空域左邻 MV、 空域上 邻 MV、 时域 MV、 空域右上邻 MV、 空域左下邻 MV, 因此, 与上述候选 MVP类似地, 第一级候选 MV集合也可以包括有上述五种候选 MV中的 至少一个组成的若干种集合形式。
本领域技术人员可以理解的是,步骤 132也可以不采用现有技术实现, 例如,对于候选 MVP来说, 其也可能包括更多其它空域候选 MVP或者包 括更多其它的时域候选 MVP; 对于 Merge模式下的候选 MV来说, 其也 可能包括更多其它空域候选 MV或者包括更多其它的时域候选 MV。 本实 施例不对解码装置获得的第一级候选运动推导信息集合中包括的候选运 动推导信息的具体内容进行限定, 只要是能够进行帧间预测解码的运动推 导信息即可。
步骤 133、 若所述第一级候选运动推导信息集合中的候选运动推导信 息的个数大于 2, 则对所述第一级候选运动推导信息集合中的候选运动推 导信息进行合并处理, 获取第二级候选运动推导信息集合, 所述第二级候 选运动推导信息集合中包含的候选运动推导信息的个数小于等于 2。
步骤 134、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息对所述当前块的编码码流进行解码处理。 在编码端, 若采用图 1和图 2所示方式获取的第一级候选 MVP集合 中仅包括 1个候选 MVP, 即对应 MVPNum=l的情况, 则编码设备可以不 对该候选 MVP的索引进行编码,该唯一的一个候选 MVP可能是时域候选 MVP、 空域左邻候选 MVP和空域上邻候选 MVP中的任一个; 若采用图 1 和图 2所示方式获取的第一级候选 MVP集合中包括 2个候选 MVP, 即对 应 MVPNum=2的情况, 第一级候选 MVP集合中的第 1个候选 MVP对应 的 MVPIdx为 0, 其对应的索引编码为 0, 第一级候选 MVP集合中的第 2 个候选 MVP对应的 MVPIdx为 1 , 其对应的索引编码为 1 , 这两个候选 MVP可能是时域候选 MVP、 空域左邻候选 MVP和空域上邻候选 MVP中 的任两个; 若采用图 1和图 2所示方式获取的第一级候选 MVP集合中包 括 3个候选 MVP , 即对应 MVPNum=3的情况, 第一级候选 MVP集合中 的第 1个候选 MVP对应的 MVPIdx为 0, 其对应的索引编码为 0, 第一级 候选 MVP集合中的第 2个候选 MVP对应的 MVPIdx为 1 , 其对应的索引 编码为 10, 第一级候选 MVP集合中的第 3个候选 MVP对应的 MVPIdx 为 2, 其对应的索引编码为 11 , 这 3个候选 MVP是时域候选 MVP、 空域 左邻候选 MVP和空域上邻候选 MVP。 由此可知, 采用现有技术的编码方 法对这 3个候选 MVP在第一级候选 MVP集合中的索引进行编码时,该索 引编码可能是一个比特位, 也可能是两个比特位, 因此, 解码端在采用现 有技术对索引编码进行解码处理时, 既可能需要解码一个比特位, 也需要 解码两个比特位, 这取决于解码端采用图 1和图 2所示方式获得的第一级 候选 MVP集合中候选 MVP的数量, 如果数量为 2, 则只需要解码一个比 特位, 如果数量为 3 , 则需要解码一个或两个比特位。 但是, 在易错信道 条件下, 参考帧可能存在丟失的情况。 一旦参考帧丟失, 则解码端采用图 2所示方式搜索时域 MVP时就有可能出现问题,从而导致解码端候选 MVP 个数错误。 假设编码端获得的第一级候选 MVP集合为 {时域候选 MVP、 空域左邻候选 MVP、 空域上邻候选 MVP } , 从中选择的 MVP为空域左邻 候选 MVP, 其索引为 1 , 则对应的索引编码为 10。 在解码端, 由于参考 帧丟失无法获得时域候选 MVP, 因此获得的第一级候选 MVP集合为 {空 域左邻候选 MVP、 空域上邻候选 MVP }。 由于解码端获得的候选 MVP的 个数为 2, 则解码端只会对索引编码的第一个比特位 "1"进行解码, 而错误 地将第二个比特位" 0,,作为当前块的其它部分的编码, 从而导致解码端对 除索引编码之外的编码码流进行解码时出现错误, 甚至导致整个解码崩 溃, 无法继续后续的解码过程。 针对 Merge模式下的 MV来说, 亦存在类 似问题, 此处不再赘述。
鉴于此, 与图 3所示的编码处理实施例的技术方案相应地, 在本实施 例中, 解码装置可以判断步骤 132中获取的第一级候选运动推导信息集合 中的候选运动推导信息的个数是否大于 2, 若大于 2, 则对第一级候选运 动推导信息集合中的候选运动推导信息进行合并处理, 获取第二级候选运 动推导信息集合, 该第二级候选运动推导信息集合中包含的候选运动推导 信息的个数小于等于 2。 因此, 采用第二级候选运动推导信息集合对当前 块进行解码处理时, 其运动推导信息的索引仅占一个比特位, 解码装置即 可只对一个比特位的索引编码进行解码处理。
以现有技术中候选 MVP的个数最大为 3个举例来说, 第一级候选 MVP集合中的候选 MVP的个数大于 2的情况只能是 {时域候选 MVP、 空 域左邻候选 MVP、 空域上邻候选 MVP } , 采用本实施例的方法, 解码装 置可以将这 3个候选 MVP合并成至多两个候选 MVP。 由于编码端也采用 相同的方式对第一级候选 MVP集合中的候选 MVP进行合并处理成至多两 个候选 MVP以只需采用一个比特位对选择的 MVP的索引进行编码,因此, 相应地, 在解码端, 解码装置可以采用表 2从合并后的这两个候选 MVP 中选择 MVP, 并利用该 MVP对当前块的编码码流进行解码处理。 因此, 不管参考帧是否丟失, 解码端均只需对一个比特位的索引编码进行解码, 而将其余部分均作为当前块的编码码流的其它部分, 而不会出现将索引编 码的一部分误认为是当前块的编码码流的其它部分, 从而避免错误的解 码。
以现有技术中 Merge模式下的候选 MV的个数最大为 5个举例来说, 第一级候选 MV集合中的候选 MV的个数大于 2的情况较多,例如可以是 {空域左邻候选 MV、 空域上邻候选 MV、 时域候选 MV }、 可以是 {空域左 邻候选 MV、 时域候选 MV、 空域右上邻候选 MV、 空域左下邻候选 MV } 等等, 采用本实施例的解码方法, 即可将这 3个或者 3个以上的候选 MV 合并成至多两个候选 MV, 从而仅需要通过解码一个比特位, 即可从第二 级候选 MV集合中选择的 MV以对当前块的编码码流进行解码处理。
需要说明的是,本实施例仅是以现有技术中候选 MVP最多仅有 3个, Merge模式下的候选 MV最多有 5个为例进行说明, 本领域技术人员可以 理解的是, 随着技术的发展, 候选 MVP或者 MV的个数也可以更多。 另 现有技术或其组合将 3个或者 3个以上的候选运动推导信息合并为 1个或 者 2个候选运动推导信息。
另外, 需要说明的是, 上述实施例仅以表 2为例进行说明, 本领域技 术人员可以理解的是, 对于合并处理后至多只有一个候选运动推导信息的 情况来说, 编码端的编码装置可以不对该候选运动推导信息进行编码处 理, 相应地, 当解码端采用相同的合并处理方式也至多只有一个候选运动 推导信息, 则解码端的解码设备也可以不对索引编码进行解码处理, 而直 接采用这一个候选运动推导信息对当前块的编码码流进行解码处理或者 采用其它方式获取一个候选运动推导信息, 对当前块的编码码流进行解码 处理即可
本实施例中, 解码端的解码装置可以在第一级候选运动推导信息集合 中的候选运动推导信息的个数大于 2的情况下, 将第一级候选运动推导信 息集合中的候选运动推导信息的个数通过合并处理成至多两个候选运动 推导信息, 以获取第二级候选运动推导信息集合, 并应用该第二级候选运 动推导信息集合对当前块的编码码流进行解码处理, 在解码时, 解码装置 仅需要解码一个比特位, 不管是否存在参考帧丟失的情况, 解码端均不会 出现将索引编码的一部分误认为是当前块的编码码流的其它部分, 从而可 以避免对当前块的编码码流错误地解码。
图 14为本发明视频解码处理方法实施例二的流程图, 如图 14所示, 本实施例的方法可以包括:
步骤 141、 接收当前块的编码码流。
步骤 142、 获取当前块的第一级候选运动推导信息集合。
步骤 142的实现原理与上述步骤 132的实现原理类似,此处不再赘述。 步骤 143、 若所述第一级候选运动推导信息集合中存在时域候选运动 推导信息且空域候选运动推导信息的个数大于 1 , 则将所述空域候选运动 推导信息合并处理为一个空域候选运动推导信息, 所述第二级候选运动推 导信息集合包括合并处理后的空域候选运动推导信息和所述时域候选运 动推导信息。
以运动推导信息是 MVP为例来说,若当前块的第一级候选 MVP集合 中的候选 MVP总个数小于等于 2, 则解码装置不进行任何合并操作; 若 当前块的第一级候选 MVP集合中存在时域候选 MVP, 且空域候选 MVP 的个数大于 1 , 则解码装置可以合并全部空域候选 MVP为一个空域候选
MVP的平均值作为合并处理后的空域候选 MVP, 因此, 该第二级候选 MVP集合中即可包括两个候选 MVP, 其中, 一个是合并处理后的空域候 i MVP, 一个是时域候选 MVP。
步骤 144、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行解码处理。
本实施例中, 解码装置可以对当前块进行解码处理, 若所述第二级候 选运动推导信息集合中包含空域候选运动推导信息, 则对所述当前块的运 动推导信息索引编码进行解码处理, 获取索引信息, 根据所述索引信息从 所述第二级候选运动推导信息集合中选择运动推导信息; 若所述第二级候 选运动推导信息中不包含任何空域候选运动推导信息, 则根据仅有候选运 动推导信息对所述当前块的编码码流进行解码处理。
可以理解的是, 针对 Merge模式下的 MV来说, 其与 MVP处理过程 类似, 此处不再赘述。
本实施例在图 13所示方法实施例的基础上, 通过采用求平均值的合 并处理方式将第一级候选运动推导信息中的候选运动推导信息的个数合 并为至多两个, 使得解码装置可以仅采用最多一个比特位对运动推导信息 的索引进行解码处理。
图 15为本发明视频解码处理方法实施例三的流程图, 如图 15所示, 本实施例的方法可以包括:
步骤 151、 接收当前块的编码码流。
步骤 152、 获取当前块的第一级候选运动推导信息集合。
步骤 153、 若所述第一级候选运动推导信息中不存在时域候选运动推 导信息且空域候选运动推导信息的个数大于 2, 则将所述空域候选运动推 导信息合并处理为至多两个空域候选运动推导信息, 所述第二级候选运动 推导信息集合包括合并处理后的至多两个空域候选运动推导信息。
仍以运动推导信息是 MVP为例来说, 若当前块的第一级候选 MVP 集合中的候选 MVP总个数小于等于 2, 则解码装置不进行任何合并操作; 若当前块的第一级候选 MVP集合中不存在时域候选 MVP且空域候选 MVP的个数大于 2, 则解码装置可以将空域候选 MVP合并处理为至多两 个空域候选 MVP。 举例来说, 本实施例中的合并处理方法可以具体为根 据预设策略, 从所述第一级候选运动推导信息集合中选择至多两个空域候 选运动推导信息作为合并处理后的空域候选运动推导信息, 其中本领域技 术人员可以对该预设策略自行设定, 例如可以根据各候选 MVP的值的大 小和 /或位置等信息进行选择。 因此, 该第二级候选 MVP集合中即可包括 一个或者两个候选空域 MVP。
步骤 154、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行解码处理。
本实施例中, 解码装置可以对当前块进行解码处理, 若所述第二级候 选运动推导信息集合中包含空域候选运动推导信息, 则对所述当前块的运 动推导信息索引编码进行解码处理, 获取索引信息, 根据所述索引信息从 所述第二级候选运动推导信息集合中选择运动推导信息; 若所述第二级候 选运动推导信息中不包含任何空域候选运动推导信息, 则根据仅有的候选 运动推导信息对所述当前块的编码码流进行解码处理。
可以理解的是, 针对 Merge模式下的 MV来说, 其与 MVP处理过程 类似, 此处不再赘述。
本实施例在图 13所示方法实施例的基础上, 在第一级候选运动推导 信息集合中不存在时域候选运动推导信息, 根据预设策略从空域候选运动 推导信息中选择至多两个空域候选运动推导信息作为第二级候选运动推 导信息集合中的候选运动推导信息, 使得解码装置可以仅采用最多一个比 特位对运动推导信息的索引进行解码处理。
图 16为本发明视频解码处理方法实施例四的流程图, 如图 16所示, 本实施例的方法可以包括:
步骤 161、 接收当前块的编码码流。
步骤 162、 获取当前块的第一级候选运动推导信息集合。
步骤 163、 若所述第一级候选运动推导信息集合中不存在空域候选运 动推导信息且时域候选运动推导信息的个数大于 2, 则将所述时域候选运 动推导信息合并处理为至多两个时域候选运动推导信息, 所述第二级候选 运动推导信息集合包括合并处理后的至多两个时域候选运动推导信息。 前几个实施例中, 时域运动推导信息最多只存在 1个, 但是本实施例 是针对第一级候选运动推导信息集合中仅存在时域候选运动推导信息且 时域候选运动推导信息的个数大于 2的情况。 在该情况下, 解码装置可以 将时域候选运动推导信息的个数合并处理为至多两个时域候选运动推导 信息, 因此, 第二级候选运动推导信息集合中仅包含合并处理后的至多两 个时域候选运动推导信息。
步骤 164、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行解码处理。
本实施例中, 解码装置可以对当前块进行解码处理, 对所述当前块的 运动推导信息索引编码进行解码处理, 获取索引信息, 根据所述索引信息 从所述第二级候选运动推导信息集合中选择运动推导信息, 并根据选择的 运动推导信息对所述当前块的编码码流进行解码处理。
本实施例中的合并处理既可以是根据预设策略, 从所述第一级候选运 动推导信息集合中选择至多两个时域候选运动推导信息作为合并处理后 的时域候选运动推导信息, 也可以采用其它合并处理方式, 例如求平均值 的方式。
本实施例在图 13所示方法实施例的基础上, 在第一级候选运动推导 信息集合中仅存在多个时域候选运动推导信息的情况下, 通过合并处理, 使得第二级候选运动推导信息集合中的时域候选运动推导信息的个数至 多只有两个, 从而使得解码装置可以仅解码一个比特位得到运动推导信息 的索引。
图 17为本发明视频解码处理方法实施例五的流程图, 如图 17所示, 本实施例的方法可以包括:
步骤 171、 接收当前块的编码码流。
步骤 172、 获取当前块的第一级候选运动推导信息集合。
步骤 173、 若所述第一级候选运动推导信息集合中存在一个空域候选 运动推导信息且时域候选运动推导信息的个数大于 1 , 则将所述时域候选 运动推导信息合并处理为一个时域候选运动推导信息, 所述第二级候选运 动推导信息集合包括合并处理后的一个时域候选运动推导信息以及所述 空域候选运动推导信息。
本实施例针对第一级候选运动推导信息集合中存在一个空域候选运 动推导信息以及多于 1个时域候选运动推导信息的情况。 在该情况下, 解 码装置可以将时域候选运动推导信息的个数合并处理为 1个时域候选运动 推导信息, 因此, 第二级候选运动推导信息集合中仅包含合并处理后的一 个时域候选运动推导信息以及一个空域候选运动推导信息。
本实施例中的合并处理, 既可以是根据预设策略, 从所述第一级候选 运动推导信息集合中选择一个时域候选运动推导信息作为合并处理后的 时域候选运动推导信息, 又可以是对多个时域候选运动推导信息求平均值 以合并处理为 1个时域候选运动推导信息。
步骤 174、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行解码处理。
本实施例中, 解码装置可以对当前块进行解码处理, 对所述当前块的 运动推导信息索引编码进行解码处理, 获取索引信息, 根据所述索引信息 从所述第二级候选运动推导信息集合中选择运动推导信息, 并根据选择的 运动推导信息对所述当前块的编码码流进行解码处理。
本实施例在图 13所示方法实施例的基础上, 在第一级候选运动推导 信息集合中存在一个空域候选运动推导信息以及多于 1个时域候选运动推 导信息的情况下, 通过将多个时域候选运动推导信息合并处理为 1个时域 候选运动推导信息, 使得第二级候选运动推导信息集合中的候选运动推导 信息的个数只有两个, 从而使得解码装置可以仅解码一个比特位得到运动 推导信息的索引。
图 18为本发明视频解码处理方法实施例六的流程图, 如图 18所示, 本实施例的方法可以包括:
步骤 181、 接收当前块的编码码流。
步骤 182、 获取当前块的第一级候选运动推导信息集合。
步骤 183、 若所述第一级候选运动推导信息集合中的空域候选运动推 导信息以及时域候选运动推导信息的个数均大于 1 , 则将所述时域候选运 动推导信息合并处理为一个时域候选运动推导信息, 将所述空域候选运动 推导信息合并处理为一个空域候选运动推导信息, 所述第二级候选运动推 导信息集合包括合并处理后的一个时域候选运动推导信息以及合并处理 后的一个空域候选运动推导信息。
本实施例针对第一级候选运动推导信息集合中既存在多于 1个空域候 选运动推导信息又存在多于 1个时域候选运动推导信息的情况。 在该情况 下, 解码装置可以分别对空域候选运动推导信息和时域候选运动推导信息 进行处理。 对于空域候选运动推导信息来说, 解码装置可以将多个空域候 选运动推导信息合并处理为一个空域候选运动推导信息, 对于时域候选运 动推导信息来说, 解码装置可以将多个时域候选运动推导信息合并处理为 一个时域候选运动推导信息, 因此, 第二级候选运动推导信息集合包括合 并处理后的一个时域候选运动推导信息以及合并处理后的一个空域候选 运动推导信息。
本实施例中的合并处理, 既可以是根据预设策略, 从第一级候选运动 推导信息集合中选择一个时域候选运动推导信息作为合并处理后的时域 候选运动推导信息, 从第一级候选运动推导信息集合中选择一个空域候选 运动推导信息作为合并处理后的空域候选运动推导信息, 又可以是对多个 时域候选运动推导信息求平均值以合并处理为 1个时域候选运动推导信 息, 对多个空域候选运动推导信息求平均值以合并处理为 1个空域候选运 动推导信息。
步骤 184、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行解码处理。
本实施例中, 解码装置可以对当前块进行解码处理, 若所述第二级候 选运动推导信息集合中包含空域候选运动推导信息, 则对所述当前块的运 动推导信息索引编码进行解码处理, 获取索引信息, 根据所述索引信息从 所述第二级候选运动推导信息集合中选择运动推导信息, 并根据选择的运 动推导信息对所述当前块的编码码流进行解码处理; 若所述第二级候选运 动推导信息中不包含任何候选运动推导信息, 则根据仅有的候选运动推导 信息对所述当前块的编码码流进行解码处理。
本实施例在图 13所示方法实施例的基础上, 在第一级候选运动推导 信息集合中既存在多个空域候选运动推导信息又存在多个时域候选运动 推导信息的情况下, 通过将多个时域候选运动推导信息合并处理为 1个时 域候选运动推导信息并将多个空域候选运动推导信息合并处理为 1个空域 候选运动推导信息, 使得第二级候选运动推导信息集合中的候选运动推导 信息的个数只有两个, 从而使得解码装置可以仅采用最多一个比特位对运 动推导信息的索引进行解码处理。
图 19为本发明视频解码处理方法实施例七的流程图, 如图 19所示, 本实施例的方法可以包括:
步骤 191、 接收当前块的编码码流。
步骤 192、 获取当前块的第一级候选运动推导信息集合。
步骤 193、 若所述第一级候选运动推导信息集合中至少包含空域左邻 运动推导信息和 /或空域上邻运动推导信息,则从第一级候选运动推导信息 集合中仅保留空域左邻运动推导信息和 /或空域上邻运动推导信息作为合 并处理后的候选运动推导信息。
此处, 空域左邻运动推导信息取自位置在当前块的左方且已解码块的 运动信息, 空域上邻运动推导信息取自位置在当前块的上方且已解码块的 运动信息。
本实施例针对第一级候选运动推导信息集合中存在多种空域运动推 导信息和时域运动推导信息任意组合的情况。 在该情况下, 解码装置可以 直接将空域左邻运动推导信息和空域上邻运动推导信息作为合并处理后 的候选运动推导信息, 而舍弃其它候选运动推导信息。 因此, 第二级候选 运动推导信息集合包括以下集合: {没有任何运动推导信息}、 {空域左邻 运动推导信息 }、 {空域上邻运动推导信息}、 {空域左邻运动推导信息、 空 域上邻运动推导信息 }。
步骤 194、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行解码处理。
本实施例中, 解码装置可以对当前块进行解码处理。 由于第二级候选 运动推导信息集合中包括至多两个候选运动推导信息, 因此解码装置可以 仅解码一个比特位得到运动推导信息的索引。
本实施例在图 13所示方法实施例的基础上, 在第一级候选运动推导 信息集合中存在多种空域运动推导信息和时域运动推导信息任意组合的 情况下,仅保留空域左邻运动推导信息和 /或空域上邻运动推导信息作为第 二级候选运动推导信息集合中的候选运动推导信息, 从而使得解码装置可 以仅解码一个比特位得到运动推导信息的索引。
图 20为本发明视频解码处理方法实施例八的流程图, 如图 20所示, 本实施例的方法可以包括:
步骤 201、 接收当前块的编码码流。
步骤 202、 获取当前块的第一级候选运动推导信息集合。
步骤 203、 若所述第一级候选运动推导信息集合中的候选运动推导信 息的个数大于 1 , 将第一级候选运动推导信息中的全部候选运动推导信息 合并处理为一个运动推导信息。
本实施例不管第一级候选运动推导信息集合中包括的运动推导信息 的具体内容, 只要第一级候选运动推导信息集合中的候选运动推导信息的 个数大于 1 , 就将全部候选运动推导信息合并处理为一个运动推导信息。 因此, 第二级候选运动推导信息集合仅包括一个合并处理后的运动推导信 自
举例来说, 本实施例的合并处理方式可以为若第一级候选运动推导信 息集合中不存在运动推导信息, 则合并处理后的运动推导信息为零向量, 若第一级候选运动推导信息集合中的空域候选运动推导信息和时域候选 运动推导信息的个数之和为奇数, 则合并处理后的运动推导信息为所述空 域候选运动推导信息和时域候选运动推导信息的向量中值, 若第一级候选 运动推导信息集合中的空域候选运动推导信息和时域候选运动推导信息 的个数之和为偶数, 则合并处理后的运动推导信息为空域候选运动推导信 息和时域候选运动推导信息按大小顺序排列后中间两个运动推导信息的 平均值。
步骤 204、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行解码处理。
由于本实施例中, 第二级候选运动推导信息集合中只有一个候选运动 推导信息, 因此, 解码装置既可以对索引编码进行解码, 又可以不对索引 编码进行解码。
本实施例在图 13所示方法实施例的基础上, 在第一级候选运动推导 信息集合中包括的运动推导信息大于 1的情况下, 将全部运动推导信息合 并成一个运动推导信息, 因此, 第二级候选运动推导信息集合中仅包括一 个运动推导信息, 从而使得解码装置既可以不进行索引编码的解码处理, 又可以仅对一个比特位的索引编码进行解码处理。
图 21为本发明视频解码处理方法实施例九的流程图, 如图 21所示, 本实施例的方法可以包括:
步骤 211、 接收当前块的编码码流。
步骤 212、 获取当前块的第一级候选运动推导信息集合。
步骤 213、 若第一级候选运动推导信息集合中包含多于 1个时域候选 运动推导信息以及多于 1个空域候选运动推导信息, 则对时域候选运动推 导信息进行合并处理并对空域候选运动推导信息进行合并处理, 获取第二 级候选运动推导信息集合, 该第二级候选运动推导信息集合中包含合并处 理后的空域候选运动推导信息和 /或合并处理后的时域候选运动推导信息。
步骤 214、 根据所述第二级候选运动推导信息集合中包含的候选运动 推导信息, 对所述当前块进行解码处理。
本实施例中, 解码装置可以对当前块进行解码处理。 由于第二级候选 运动推导信息集合中包括至多两个候选运动推导信息, 因此解码装置可以 仅解码一个比特位得到运动推导信息的索引。
以 MVP举例来说, 若解码 MVP索引为 0, 则可知编码端选择了时域 MVP, 并标记当前块使用的是时域 MVP; 若解码 MVP索引为 1 , 则可知 编码端选择了空域 MVP, 并标记当前块使用的是空域 MVP。
前述实施例仅针对采用 MVP或者 Merge模式下的 MV对当前块进行 解码处理的过程进行了详细说明。 可以理解的是, 这两种模式也可以融合 使用, 在使用之前, 只需要判断合并模式标识位 MergeFlag即可。 举例来 说,若 MergeFlag=0, 则解码装置需要对选用的 MVP在第二候选运动推导 信息集合中的索引编码进行解码, 其具体过程可以采用上述任一实施例的 过程; 若 MergeFlag=l , 则解码装置需要对所选的 MV在 Merge模式下的 候选 MV中的索引编码进行解码,其具体过程亦可以参考上述任一实施例 的过程, 此处不再赘述。
图 22为本发明视频解码处理方法实施例十的流程图, 如图 22所示, 本实施例的方法可以包括: 步骤 221、 接收当前块的编码码流。
步骤 222、 获取当前块的候选运动推导信息集合。
本实施例的步骤 222与图 13所示方法实施例的步骤 131的实现原理 类似, 此处不再赘述。
步骤 223、 若所述候选运动推导信息集合中不存在空域候选运动推导 信息, 则根据非空域候选运动推导信息对所述当前块的编码码流进行解码 处理。 若所述候选运动推导信息中存在时域运动推导信息和空域运动推导 信息, 则解码装置可以对运动推导信息的索引编码的第一位进行解码处 理, 获取第一位信息; 若所述第一位信息对应第一索引, 则根据所述第一 索引确定所述候选运动推导信息中的运动推导信息; 若所述第一位信息对 应第二索引,则对所述索引编码的下一位进行解码处理,获取下一位信息, 若所述第一位信息和下一位信息对应第二索引, 则根据所述第二索引确定 所述候选运动推导信息中的运动推导信息; 依次类推, 直到运动推导信息 的索引值所占比特数达到最大。 针对这种情况, 本实施例可以采用表 3所示的定长编码方式进行解码 处理。 举例来说, 若索引编码为 0, 则 MV的索引为 0, 若索引编码为 1 , 则继续解码 1个比特, 若下一比特为 0, 则 MV的索引为 1 , 若下一比特 为 1 , 则 MV的索引为 2, 以此类推直到解析至 0或者 MV索引可能占用 的最大比特数。 在没有候选 MV或仅存在时域候选 MV的情况下, 解码装 置可以不解码, 且 MV的索引为 0。 解码装置可以根据解析出的索引在候 选 MV中选择对应的 MV。
本实施例针对候选运动推导信息集合中没有候选运动推导信息或者 仅存在一个时域运动推导信息的情况, 解码装置不对运动推导信息的索引 编码进行解码处理, 对于没有候选运动推导信息的情况来说, 解码装置可 以采用任意方式获取一个候选运动推导信息对当前块进行解码处理, 本实 施例不对获取方式进行限定, 对于只有一个时域候选运动推导信息的情况 来说, 解码装置可采用该唯一的时域候选运动推导信息或在此时域候选运 动推导信息无法得到的前提下, 采用其它方式获取一个候选运动推导信 息, 对当前块的编码码流进行解码处理即可。 需要说明的是, 本实施例中 的运动推导信息亦可以为 MVP或者 Merge模式下的 MV。
图 23为本发明编码装置实施例一的结构示意图, 如图 23所示, 本实 施例的装置可以包括: 第一获取模块 1 1、 第一合并处理模块 12以及第一 编码处理模块 13 , 其中, 第一获取模块 11用于获取当前块的第一级候选 运动推导信息集合; 第一合并处理模块 12用于若所述第一级候选运动推 导信息集合中的候选运动推导信息的个数大于 2, 则对所述第一级候选运 动推导信息集合中的候选运动推导信息进行合并处理, 获取第二级候选运 动推导信息集合, 所述第二级候选运动推导信息集合中包含的候选运动推 导信息的个数小于等于 2;第一编码处理模块 13用于根据所述第二级候选 运动推导信息集合中包含的候选运动推导信息, 对所述当前块进行编码处 理。
本实施例的装置可以用于执行图 3所示方法实施例的方法, 其实现原 理和技术效果类似, 此处不再赘述。
在图 23所示装置结构的基础上, 在编码装置的另一个实施例中, 第 一合并处理模块 12可以具体用于:
若所述第一级候选运动推导信息集合中存在时域候选运动推导信息 且空域候选运动推导信息的个数大于 1 , 则将所述空域候选运动推导信息 合并处理为一个空域候选运动推导信息, 所述第二级候选运动推导信息集 合包括合并处理后的空域候选运动推导信息和所述时域候选运动推导信 息; 或者,
若所述第一级候选运动推导信息集合中不存在时域候选运动推导信 息且空域候选运动推导信息的个数大于 2, 则将所述空域候选运动推导信 息合并处理为至多两个空域候选运动推导信息, 所述第二级候选运动推导 信息集合包括合并处理后的至多两个空域候选运动推导信息; 或者, 若所述第一级候选运动推导信息集合中不存在空域候选运动推导信 息且时域候选运动推导信息的个数大于 2, 则将所述时域候选运动推导信 息合并处理为至多两个时域候选运动推导信息, 所述第二级候选运动推导 信息集合包括合并处理后的至多两个时域候选运动推导信息; 或者, 若所述第一级候选运动推导信息集合中存在一个空域候选运动推导 信息且时域候选运动推导信息的个数大于 1 , 则将所述时域候选运动推导 信息合并处理为一个时域候选运动推导信息, 所述第二级候选运动推导信 息集合包括合并处理后的一个时域候选运动推导信息以及所述空域候选 运动推导信息; 或者,
若所述第一级候选运动推导信息集合中的空域候选运动推导信息以 及时域候选运动推导信息的个数均大于 1 , 则将所述时域候选运动推导信 息合并处理为一个时域候选运动推导信息, 将所述空域候选运动推导信息 合并处理为一个空域候选运动推导信息, 所述第二级候选运动推导信息集 合包括合并处理后的一个时域候选运动推导信息以及合并处理后的一个 空域候选运动推导信息; 或者,
从第一级候选运动推导信息集合中选择空域左邻运动推导信息和空 域上邻运动推导信息作为合并处理后的候选运动推导信息; 或者,
将所述第一级候选运动推导信息中的全部候选运动推导信息合并处 理为一个运动推导信息。
另外, 第一编码处理模块 13可以具体用于若所述第二级候选运动推 导信息集合中包含两个候选运动推导信息, 则从所述第二级候选运动推导 信息集合中选择一个运动推导信息, 对所述当前块进行编码处理, 获取所 述当前块的编码码流, 所述编码码流中包含选择的运动推导信息在所述第 二级候选运动推导信息集合中的索引编码; 若所述第二级候选运动推导信 息集合中包含一个候选运动推导信息, 则对所述当前块进行编码处理, 所 述当前块的编码码流中不包含索引编码。
本实施例中的第一合并处理模块 12的处理过程以及第一编码处理模 块 13的处理过程均可以具体参见图 4〜1 1所示实施例的实现过程, 其实现 原理和技术效果类似, 此处不再赘述。
图 24为本发明编码装置实施例二的结构示意图, 如图 24所示, 本实 施例的装置可以包括: 第二获取模块 21和第二编码处理模块 22, 其中, 第二获取模块 21用于获取当前块的候选运动推导信息集合; 第二编码处 理模块 22用于若所述候选运动推导信息集合中不存在空域候选运动推导 信息, 则对所述当前块进行编码处理, 获取所述当前块的编码码流, 所述 编码码流中不包含运动推导信息的索引编码。
本实施例的装置可以用于执行图 12所示方法实施例的方法, 其实现 原理和技术效果类似, 此处不再赘述。
图 25为本发明解码装置实施例一的结构示意图, 如图 25所示, 本实 施例的装置可以包括: 第一接收模块 3 1、 第三获取模块 32、 第二合并处 理模块 33以及第一解码处理模块 34 , 其中, 第一接收模块 31用于接收当 前块的编码码流; 第三获取模块 32用于获取所述当前块的第一级候选运 动推导信息集合; 第二合并处理模块 33用于若所述第一级候选运动推导 信息集合中的候选运动推导信息的个数大于 2, 则对所述第一级候选运动 推导信息集合中的候选运动推导信息进行合并处理, 获取第二级候选运动 推导信息集合, 所述第二级候选运动推导信息集合中包含的候选运动推导 信息的个数小于等于 2;第一解码处理模块 34根据所述第二级候选运动推 导信息集合中包含的候选运动推导信息对所述当前块的编码码流进行解 码处理。
本实施例的装置可以用于执行图 13所示方法实施例的方法, 其实现 原理和技术效果类似, 此处不再赘述。
在图 25所示装置结构的基础上, 在解码装置的另一个实施例中, 第 二合并处理模块 33可以具体用于:
若所述第一级候选运动推导信息集合中存在时域候选运动推导信息 且空域候选运动推导信息的个数大于 1 , 则将所述空域候选运动推导信息 合并处理为一个空域候选运动推导信息, 所述第二级候选运动推导信息集 合包括合并处理后的空域候选运动推导信息和所述时域候选运动推导信 息; 或者,
若所述第一级候选运动推导信息集合中不存在时域候选运动推导信 息且空域候选运动推导信息的个数大于 2 , 则将所述空域候选运动推导信 息合并处理为至多两个空域候选运动推导信息, 所述第二级候选运动推导 信息集合包括合并处理后的至多两个空域候选运动推导信息; 或者, 若所述第一级候选运动推导信息集合中不存在空域候选运动推导信 息且时域候选运动推导信息的个数大于 2 , 则将所述时域候选运动推导信 息合并处理为至多两个时域候选运动推导信息, 所述第二级候选运动推导 信息集合包括合并处理后的至多两个时域候选运动推导信息; 或者, 若所述第一级候选运动推导信息集合中存在一个空域候选运动推导 信息且时域候选运动推导信息的个数大于 1 , 则将所述时域候选运动推导 信息合并处理为一个时域候选运动推导信息, 所述第二级候选运动推导信 息集合包括合并处理后的一个时域候选运动推导信息以及所述空域候选 运动推导信息; 或者,
若所述第一级候选运动推导信息集合中的空域候选运动推导信息以 及时域候选运动推导信息的个数均大于 1 , 则将所述时域候选运动推导信 息合并处理为一个时域候选运动推导信息, 将所述空域候选运动推导信息 合并处理为一个空域候选运动推导信息, 所述第二级候选运动推导信息集 合包括合并处理后的一个时域候选运动推导信息以及合并处理后的一个 空域候选运动推导信息; 或者,
从第一级候选运动推导信息集合中选择空域左邻运动推导信息和空 域上邻运动推导信息作为合并处理后的候选运动推导信息; 或者,
将所述第一级候选运动推导信息中的全部候选运动推导信息合并处 理为一个运动推导信息。
另外, 第一解码处理模块 34具体用于若所述第二级候选运动推导信 息集合中包含两个候选运动推导信息, 则对所述当前块的运动推导信息索 引编码进行解码处理, 获取索引信息, 根据所述索引信息从所述第二级候 选运动推导信息集合中选择运动推导信息, 并根据选择的运动推导信息对 所述当前块的编码码流进行解码处理; 若所述第二级候选运动推导信息中 包含一个候选运动推导信息, 则根据这一个候选运动推导信息对所述当前 块的编码码流进行解码处理。
本实施例中的第二合并处理模块 33的处理过程以及第一解码处理模 块 34的处理过程均可以具体参见图 14〜21所示实施例的实现过程, 其实 现原理和技术效果类似, 此处不再赘述。
图 26为本发明解码装置实施例二的结构示意图, 如图 26所示, 本实 施例的装置可以包括: 第二接收模块 41、 第四获取模块 42以及第二解码 处理模块 43 , 其中, 第二接收模块 41用于接收当前块的编码码流; 第四 获取模块 42用于获取当前块的候选运动推导信息集合; 第二解码处理模 块 43用于若所述候选运动推导信息集合中不存在空域候选运动推导信息, 则根据非空域候选运动推导信息对所述当前块的编码码流进行解码处理。 本实施例的装置可以用于执行图 22所示方法实施例的方法, 其实现 原理和技术效果类似, 此处不再赘述。
本发明实施例提供的技术可以应用在数字信号处理领域中, 通过编码 器, 解码器实现。 视频编码器, 解码器广泛应用于各种通讯设备或电子设 备中, 例如: 数字电视、 机顶盒、 媒体网关, 移动电话, 无线装置, 个人 数据助理(PDA ) , 手持式或便携式计算机, GPS接收机 /导航器, 照相机, 视频播放器, 摄像机, 录像机, 监控设备, 视频会议和可视电话设备等等。 这类设备中包括处理器, 存储器, 以及传输数据的接口。 视频编解码器可 以直接由数字电路或芯片例如 DSP ( digital signal processor ) 实现, 或者 由软件代码驱动一处理器执行软件代码中的流程而实现。
本领域普通技术人员可以理解: 实现上述方法实施例的全部或部分步 骤可以通过程序指令相关的硬件来完成, 前述的程序可以存储于一计算机 可读取存储介质中, 该程序在执行时, 执行包括上述方法实施例的步骤; 而前述的存储介质包括: ROM、 RAM, 磁碟或者光盘等各种可以存储程 序代码的介质。
最后应说明的是: 以上实施例仅用以说明本发明的技术方案, 而非对 其限制; 尽管参照前述实施例对本发明进行了详细的说明, 本领域的普通 技术人员应当理解: 其依然可以对前述各实施例所记载的技术方案进行修 改, 或者对其中部分技术特征进行等同替换; 而这些修改或者替换, 并不 使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

权 利 要 求 书
1、 一种视频编码处理方法, 其特征在于, 包括:
获取当前块的第一级候选运动推导信息集合;
若所述第一级候选运动推导信息集合中的候选运动推导信息的个数 大于 2 , 则对所述第一级候选运动推导信息集合中的候选运动推导信息进 行合并处理, 获取第二级候选运动推导信息集合, 所述第二级候选运动推 导信息集合中包含的候选运动推导信息的个数小于等于 2;
根据所述第二级候选运动推导信息集合中包含的候选运动推导信息, 对所述当前块进行编码处理。
2、 根据权利要求 1所述的方法, 其特征在于, 所述对所述第一级候 选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
若所述第一级候选运动推导信息集合中存在时域候选运动推导信息 且空域候选运动推导信息的个数大于 1 , 则将所述空域候选运动推导信息 合并处理为一个空域候选运动推导信息, 所述第二级候选运动推导信息集 合包括合并处理后的空域候选运动推导信息和所述时域候选运动推导信 自
3、 根据权利要求 2所述的方法, 其特征在于, 所述合并处理, 包括: 将所述第一级候选运动推导信息集合中的全部空域候选运动推导信 息的平均值作为合并处理后的空域候选运动推导信息。
4、 根据权利要求 1所述的方法, 其特征在于, 所述对所述第一级候 选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
若所述第一级候选运动推导信息集合中不存在时域候选运动推导信 息且空域候选运动推导信息的个数大于 2 , 则将所述空域候选运动推导信 息合并处理为至多两个空域候选运动推导信息, 所述第二级候选运动推导 信息集合包括合并处理后的至多两个空域候选运动推导信息。
5、 根据权利要求 4所述的方法, 其特征在于, 所述合并处理包括: 根据预设策略, 从所述第一级候选运动推导信息集合中选择至多两个 空域候选运动推导信息作为合并处理后的空域候选运动推导信息。
6、 根据权利要求 1所述的方法, 其特征在于, 所述对所述第一级候 选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
若所述第一级候选运动推导信息集合中不存在空域候选运动推导信 息且时域候选运动推导信息的个数大于 2 , 则将所述时域候选运动推导信 息合并处理为至多两个时域候选运动推导信息, 所述第二级候选运动推导 信息集合包括合并处理后的至多两个时域候选运动推导信息。
7、 根据权利要求 6所述的方法, 其特征在于, 所述合并处理, 包括: 根据预设策略, 从所述第一级候选运动推导信息集合中选择至多两个 时域候选运动推导信息作为合并处理后的时域候选运动推导信息。
8、 根据权利要求 1所述的方法, 其特征在于, 所述对所述第一级候 选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
若所述第一级候选运动推导信息集合中存在一个空域候选运动推导 信息且时域候选运动推导信息的个数大于 1 , 则将所述时域候选运动推导 信息合并处理为一个时域候选运动推导信息, 所述第二级候选运动推导信 息集合包括合并处理后的一个时域候选运动推导信息以及所述空域候选 运动推导信息。
9、 根据权利要求 8所述的方法, 其特征在于, 所述合并处理, 包括: 根据预设策略, 从所述第一级候选运动推导信息集合中选择一个时域 候选运动推导信息作为合并处理后的时域候选运动推导信息。
10、 根据权利要求 1所述的方法, 其特征在于, 所述对所述第一级候 选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
若所述第一级候选运动推导信息集合中的空域候选运动推导信息以 及时域候选运动推导信息的个数均大于 1 , 则将所述时域候选运动推导信 息合并处理为一个时域候选运动推导信息, 将所述空域候选运动推导信息 合并处理为一个空域候选运动推导信息, 所述第二级候选运动推导信息集 合包括合并处理后的一个时域候选运动推导信息以及合并处理后的一个 空域候选运动推导信息。
1 1、 根据权利要求 10所述的方法, 其特征在于, 所述合并处理, 包 括: 根据预设策略, 从所述第一级候选运动推导信息集合中选择一个时域 候选运动推导信息作为合并处理后的时域候选运动推导信息, 从所述第一 级候选运动推导信息集合中选择一个空域候选运动推导信息作为合并处 理后的空域候选运动推导信息。
12、 根据权利要求 1所述的方法, 其特征在于, 所述对所述第一级候 选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
从第一级候选运动推导信息集合中选择空域左邻运动推导信息和空 域上邻运动推导信息作为合并处理后的候选运动推导信息。
13、 根据权利要求 1所述的方法, 其特征在于, 所述对所述第一级候 选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
将所述第一级候选运动推导信息中的全部候选运动推导信息合并处 理为一个运动推导信息。
14、 根据权利要求 13所述的方法, 其特征在于, 所述合并处理, 包 括:
若所述第一级候选运动推导信息集合中不存在运动推导信息, 则所述 合并处理后的运动推导信息为零向量;
若所述第一级候选运动推导信息集合中的空域候选运动推导信息和 时域候选运动推导信息的个数之和为奇数, 则所述合并处理后的运动推导 信息为所述空域候选运动推导信息和时域候选运动推导信息的向量中值; 若所述第一级候选运动推导信息集合中的空域候选运动推导信息和 时域候选运动推导信息的个数之和为偶数, 则所述合并处理后的运动推导 信息为所述空域候选运动推导信息和时域候选运动推导信息按大小顺序 排列后中间两个运动推导信息的平均值。
15、 根据权利要求 1〜14中任一权利要求所述的方法, 其特征在于, 所述根据所述第二级候选运动推导信息集合中包含的候选运动推导信息, 对所述当前块进行编码处理, 包括:
若所述第二级候选运动推导信息集合中包含两个候选运动推导信息, 则从所述第二级候选运动推导信息集合中选择一个运动推导信息, 对所述 当前块进行编码处理, 获取所述当前块的编码码流, 所述编码码流中包含 选择的运动推导信息在所述第二级候选运动推导信息集合中的索引编码; 若所述第二级候选运动推导信息集合中包含一个候选运动推导信息, 则对所述当前块进行编码处理, 所述当前块的编码码流中不包含索引编 码。
16、 根据权利要求 15所述的方法, 其特征在于, 对选择的运动推导 信息在所述第二级候选运动推导信息集合中的索引进行编码处理, 包括: 若选择的运动推导信息为时域运动推导信息, 则将所述时域运动推导 信息在所述第二级候选运动推导信息集合中的索引编码为第一编码; 若选 择的运动推导信息为空域运动推导信息, 则将所述空域运动推导信息在所 述第二级候选运动推导信息集合中的索引编码为第二编码。
17、 根据权利要求 1〜14中任一权利要求所述的方法, 其特征在于, 所述运动推导信息为 MVP或者 Merge模式下的 MV。
18、 一种视频编码处理方法, 其特征在于, 包括:
获取当前块的候选运动推导信息集合;
若所述候选运动推导信息集合中不存在空域候选运动推导信息, 则对 所述当前块进行编码处理, 获取所述当前块的编码码流, 所述编码码流中 不包含运动推导信息的索引编码。
19、 根据权利要求 18所述的方法, 其特征在于, 所述方法还包括, 若所述候选运动推导信息集合中存在时域运动推导信息和空域运动推导 信息, 则:
从所述候选运动推导信息集合中选择一个运动推导信息;
对选择的运动推导信息进行定长编码处理, 以使编码码流与所述候选 运动推导信息的个数无关;
对选择的运动推导信息在所述候选运动推导信息集合中的索引进行 编码处理, 对所述当前块进行编码处理, 获取所述当前块的编码码流, 所 述编码码流中包含索引编码。
20、 根据权利要求 18或 19所述的方法, 其特征在于, 所述运动推导 信息为 MVP或者 Merge模式下的 MV。
21、 一种视频解码处理方法, 其特征在于, 包括:
接收当前块的编码码流;
获取当前块的第一级候选运动推导信息集合;
若所述第一级候选运动推导信息集合中的候选运动推导信息的个数 大于 2, 则对所述第一级候选运动推导信息集合中的候选运动推导信息进 行合并处理, 获取第二级候选运动推导信息集合, 所述第二级候选运动推 导信息集合中包含的候选运动推导信息的个数小于等于 2;
根据所述第二级候选运动推导信息集合中包含的候选运动推导信息 对所述当前块的编码码流进行解码处理。
22、 根据权利要求 21所述的方法, 其特征在于, 所述对所述第一级 候选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
若所述第一级候选运动推导信息集合中存在时域候选运动推导信息 且空域候选运动推导信息的个数大于 1 , 则将所述空域候选运动推导信息 合并处理为一个空域候选运动推导信息, 所述第二级候选运动推导信息集 合包括合并处理后的空域候选运动推导信息和所述时域候选运动推导信 自
23、 根据权利要求 22所述的方法, 其特征在于, 所述合并处理, 包 括:
将所述第一级候选运动推导信息集合中的全部空域候选运动推导信 息的平均值作为合并处理后的空域候选运动推导信息。
24、 根据权利要求 21所述的方法, 其特征在于, 所述对所述第一级 候选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
若所述第一级候选运动推导信息集合中不存在时域候选运动推导信 息且空域候选运动推导信息的个数大于 2, 则将所述空域候选运动推导信 息合并处理为至多两个空域候选运动推导信息, 所述第二级候选运动推导 信息集合包括合并处理后的至多两个空域候选运动推导信息。
25、 根据权利要求 24所述的方法, 其特征在于, 所述合并处理包括: 根据预设策略, 从所述第一级候选运动推导信息集合中选择至多两个 空域候选运动推导信息作为合并处理后的空域候选运动推导信息。
26、 根据权利要求 21所述的方法, 其特征在于, 所述对所述第一级 候选运动推导信息集合中的候选运动推导信息进行合并处理, 包括: 若所述第一级候选运动推导信息集合中不存在空域候选运动推导信 息且时域候选运动推导信息的个数大于 2, 则将所述时域候选运动推导信 息合并处理为至多两个时域候选运动推导信息, 所述第二级候选运动推导 信息集合包括合并处理后的至多两个时域候选运动推导信息。
27、 根据权利要求 26所述的方法, 其特征在于, 所述合并处理, 包 括:
根据预设策略, 从所述第一级候选运动推导信息集合中选择至多两个 时域候选运动推导信息作为合并处理后的时域候选运动推导信息。
28、 根据权利要求 21所述的方法, 其特征在于, 所述对所述第一级 候选运动推导信息集合中的候选运动推导信息进行合并处理, 包括: 若所述第一级候选运动推导信息集合中存在一个空域候选运动推导 信息且时域候选运动推导信息的个数大于 1 , 则将所述时域候选运动推导 信息合并处理为一个时域候选运动推导信息, 所述第二级候选运动推导信 息集合包括合并处理后的一个时域候选运动推导信息以及所述空域候选 运动推导信息。
29、 根据权利要求 28所述的方法, 其特征在于, 所述合并处理, 包 括:
根据预设策略, 从所述第一级候选运动推导信息集合中选择一个时域 候选运动推导信息作为合并处理后的时域候选运动推导信息。
30、 根据权利要求 21所述的方法, 其特征在于, 所述对所述第一级 候选运动推导信息集合中的候选运动推导信息进行合并处理, 包括: 若所述第一级候选运动推导信息集合中的空域候选运动推导信息以 及时域候选运动推导信息的个数均大于 1 , 则将所述时域候选运动推导信 息合并处理为一个时域候选运动推导信息, 将所述空域候选运动推导信息 合并处理为一个空域候选运动推导信息, 所述第二级候选运动推导信息集 合包括合并处理后的一个时域候选运动推导信息以及合并处理后的一个 空域候选运动推导信息。
31、 根据权利要求 30所述的方法, 其特征在于, 所述合并处理, 包 括:
根据预设策略, 从所述第一级候选运动推导信息集合中选择一个时域 候选运动推导信息作为合并处理后的时域候选运动推导信息, 从所述第一 级候选运动推导信息集合中选择一个空域候选运动推导信息作为合并处 理后的空域候选运动推导信息。
32、 根据权利要求 21所述的方法, 其特征在于, 所述对所述第一级 候选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
从第一级候选运动推导信息集合中选择空域左邻运动推导信息和空 域上邻运动推导信息作为合并处理后的候选运动推导信息。
33、 根据权利要求 21所述的方法, 其特征在于, 所述对所述第一级 候选运动推导信息集合中的候选运动推导信息进行合并处理, 包括:
将所述第一级候选运动推导信息中的全部候选运动推导信息合并处 理为一个运动推导信息。
34、 根据权利要求 33所述的方法, 其特征在于, 所述合并处理, 包 括:
若所述第一级候选运动推导信息集合中不存在运动推导信息, 则所述 合并处理后的运动推导信息为零向量;
若所述第一级候选运动推导信息集合中的空域候选运动推导信息和 时域候选运动推导信息的个数之和为奇数, 则所述合并处理后的运动推导 信息为所述空域候选运动推导信息和时域候选运动推导信息的向量中值; 若所述第一级候选运动推导信息集合中的空域候选运动推导信息和 时域候选运动推导信息的个数之和为偶数, 则所述合并处理后的运动推导 信息为所述空域候选运动推导信息和时域候选运动推导信息按大小顺序 排列后中间两个运动推导信息的平均值。
35、 根据权利要求 21〜34中任一权利要求所述的方法, 其特征在于, 所述根据所述第二级候选运动推导信息中包含的候选运动推导信息对所 述当前块的编码码流进行解码处理, 包括:
若所述第二级候选运动推导信息集合中包含两个候选运动推导信息, 则对所述当前块的运动推导信息索引编码进行解码处理, 获取索引信息, 根据所述索引信息从所述第二级候选运动推导信息集合中选择运动推导 信息, 并根据选择的运动推导信息对所述当前块的编码码流进行解码处 理;
若所述第二级候选运动推导信息中包含一个候选运动推导信息, 则根 据这一个候选运动推导信息对所述当前块的编码码流进行解码处理。
36、 根据权利要求 21〜34中任一权利要求所述的方法, 其特征在于, 所述运动推导信息为 MVP或者 Merge模式下的 MV。
37、 一种视频解码处理方法, 其特征在于, 包括:
接收当前块的编码码流;
获取当前块的候选运动推导信息集合;
若所述候选运动推导信息集合中不存在空域候选运动推导信息, 则根 据非空域候选运动推导信息对所述当前块的编码码流进行解码处理。
38、 根据权利要求 37所述的方法, 其特征在于, 所述方法还包括, 若所述候选运动推导信息中存在时域运动推导信息和空域运动推导信息, 则:
对运动推导信息的索引编码的第一位进行解码处理, 获取第一位信 息;
若所述第一位信息对应第一索引, 则根据所述第一索引确定所述候选 运动推导信息中的运动推导信息;
若所述第一位信息对应第二索引, 则对所述索引编码的下一位进行解 码处理,获取下一位信息,若所述第一位信息和下一位信息对应第二索引, 则根据所述第二索引确定所述候选运动推导信息中的运动推导信息;
依次类推, 直到运动推导信息的索引值所占比特数达到最大。
39、 一种编码装置, 其特征在于, 包括:
第一获取模块, 用于获取当前块的第一级候选运动推导信息集合; 第一合并处理模块, 用于若所述第一级候选运动推导信息集合中的候 选运动推导信息的个数大于 2, 则对所述第一级候选运动推导信息集合中 的候选运动推导信息进行合并处理, 获取第二级候选运动推导信息集合, 所述第二级候选运动推导信息集合中包含的候选运动推导信息的个数小 于等于 2;
第一编码处理模块, 用于根据所述第二级候选运动推导信息集合中包 含的候选运动推导信息, 对所述当前块进行编码处理。
40、 根据权利要求 39所述的装置, 其特征在于, 所述第一合并处理 模块具体用于若所述第一级候选运动推导信息集合中存在时域候选运动 推导信息且空域候选运动推导信息的个数大于 1 , 则将所述空域候选运动 推导信息合并处理为一个空域候选运动推导信息, 所述第二级候选运动推 导信息集合包括合并处理后的空域候选运动推导信息和所述时域候选运 动推导信息; 或者,
具体用于若所述第一级候选运动推导信息集合中不存在时域候选运 动推导信息且空域候选运动推导信息的个数大于 2 , 则将所述空域候选运 动推导信息合并处理为至多两个空域候选运动推导信息, 所述第二级候选 运动推导信息集合包括合并处理后的至多两个空域候选运动推导信息; 或 者,
具体用于若所述第一级候选运动推导信息集合中不存在空域候选运 动推导信息且时域候选运动推导信息的个数大于 2 , 则将所述时域候选运 动推导信息合并处理为至多两个时域候选运动推导信息, 所述第二级候选 运动推导信息集合包括合并处理后的至多两个时域候选运动推导信息; 或 者,
具体用于若所述第一级候选运动推导信息集合中存在一个空域候选 运动推导信息且时域候选运动推导信息的个数大于 1 , 则将所述时域候选 运动推导信息合并处理为一个时域候选运动推导信息, 所述第二级候选运 动推导信息集合包括合并处理后的一个时域候选运动推导信息以及所述 空域候选运动推导信息; 或者,
具体用于若所述第一级候选运动推导信息集合中的空域候选运动推 导信息以及时域候选运动推导信息的个数均大于 1 , 则将所述时域候选运 动推导信息合并处理为一个时域候选运动推导信息, 将所述空域候选运动 推导信息合并处理为一个空域候选运动推导信息, 所述第二级候选运动推 导信息集合包括合并处理后的一个时域候选运动推导信息以及合并处理 后的一个空域候选运动推导信息; 或者,
具体用于从第一级候选运动推导信息集合中选择空域左邻运动推导 信息和空域上邻运动推导信息作为合并处理后的候选运动推导信息; 或 者,
具体用于将所述第一级候选运动推导信息中的全部候选运动推导信 息合并处理为一个运动推导信息。
41、 根据权利要求 39或 40所述的装置, 其特征在于, 所述第一编码 处理模块具体用于若所述第二级候选运动推导信息集合中包含两个候选 运动推导信息, 则从所述第二级候选运动推导信息集合中选择一个运动推 导信息, 对所述当前块进行编码处理, 获取所述当前块的编码码流, 所述 编码码流中包含选择的运动推导信息在所述第二级候选运动推导信息集 合中的索引编码; 若所述第二级候选运动推导信息集合中包含一个候选运 动推导信息, 则对所述当前块进行编码处理, 所述当前块的编码码流中不 包含索引编码。
42、 一种编码装置, 其特征在于, 包括:
第二获取模块, 用于获取当前块的候选运动推导信息集合;
第二编码处理模块, 用于若所述候选运动推导信息集合中不存在空域 候选运动推导信息, 则对所述当前块进行编码处理, 获取所述当前块的编 码码流, 所述编码码流中不包含运动推导信息的索引编码。
43、 一种解码装置, 其特征在于, 包括:
第一接收模块, 用于接收当前块的编码码流;
第三获取模块, 用于获取所述当前块的第一级候选运动推导信息集 合;
第二合并处理模块, 用于若所述第一级候选运动推导信息集合中的候 选运动推导信息的个数大于 2 , 则对所述第一级候选运动推导信息集合中 的候选运动推导信息进行合并处理, 获取第二级候选运动推导信息集合, 所述第二级候选运动推导信息集合中包含的候选运动推导信息的个数小 于等于 2;
第一解码处理模块, 根据所述第二级候选运动推导信息集合中包含的 候选运动推导信息对所述当前块的编码码流进行解码处理。
44、 根据权利要求 43所述的装置, 其特征在于, 所述第二合并处理 模块具体用于若所述第一级候选运动推导信息集合中存在时域候选运动 推导信息且空域候选运动推导信息的个数大于 1 , 则将所述空域候选运动 推导信息合并处理为一个空域候选运动推导信息, 所述第二级候选运动推 导信息集合包括合并处理后的空域候选运动推导信息和所述时域候选运 动推导信息; 或者,
具体用于若所述第一级候选运动推导信息集合中不存在时域候选运 动推导信息且空域候选运动推导信息的个数大于 2 , 则将所述空域候选运 动推导信息合并处理为至多两个空域候选运动推导信息, 所述第二级候选 运动推导信息集合包括合并处理后的至多两个空域候选运动推导信息; 或 者,
具体用于若所述第一级候选运动推导信息集合中不存在空域候选运 动推导信息且时域候选运动推导信息的个数大于 2 , 则将所述时域候选运 动推导信息合并处理为至多两个时域候选运动推导信息, 所述第二级候选 运动推导信息集合包括合并处理后的至多两个时域候选运动推导信息; 或 者,
具体用于若所述第一级候选运动推导信息集合中存在一个空域候选 运动推导信息且时域候选运动推导信息的个数大于 1 , 则将所述时域候选 运动推导信息合并处理为一个时域候选运动推导信息, 所述第二级候选运 动推导信息集合包括合并处理后的一个时域候选运动推导信息以及所述 空域候选运动推导信息; 或者,
具体用于若所述第一级候选运动推导信息集合中的空域候选运动推 导信息以及时域候选运动推导信息的个数均大于 1 , 则将所述时域候选运 动推导信息合并处理为一个时域候选运动推导信息, 将所述空域候选运动 推导信息合并处理为一个空域候选运动推导信息, 所述第二级候选运动推 导信息集合包括合并处理后的一个时域候选运动推导信息以及合并处理 后的一个空域候选运动推导信息; 或者,
具体用于从第一级候选运动推导信息集合中选择空域左邻运动推导 信息和空域上邻运动推导信息作为合并处理后的候选运动推导信息; 或 者, 具体用于将所述第一级候选运动推导信息中的全部候选运动推导信 息合并处理为一个运动推导信息。
45、 根据权利要求 43或 44所述的装置, 其特征在于, 所述第一解码 处理模块具体用于若所述第二级候选运动推导信息集合中包含两个候选 运动推导信息, 则对所述当前块的运动推导信息索引编码进行解码处理, 获取索引信息, 根据所述索引信息从所述第二级候选运动推导信息集合中 选择运动推导信息, 并根据选择的运动推导信息对所述当前块的编码码流 进行解码处理; 若所述第二级候选运动推导信息中包含一个候选运动推导 信息, 则根据这一个候选运动推导信息对所述当前块的编码码流进行解码 处理。
46、 一种解码装置, 其特征在于, 包括:
第二接收模块, 用于接收当前块的编码码流;
第四获取模块, 用于获取当前块的候选运动推导信息集合;
第二解码处理模块, 用于若所述候选运动推导信息集合中不存在空域 候选运动推导信息, 则根据非空域候选运动推导信息对所述当前块的编码 码流进行解码处理。
PCT/CN2011/083831 2011-03-11 2011-12-12 视频编解码处理方法和装置 WO2012122836A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2011100600562A CN102685479A (zh) 2011-03-11 2011-03-11 视频编解码处理方法和装置
CN201110060056.2 2011-03-11

Publications (1)

Publication Number Publication Date
WO2012122836A1 true WO2012122836A1 (zh) 2012-09-20

Family

ID=46816770

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2011/083831 WO2012122836A1 (zh) 2011-03-11 2011-12-12 视频编解码处理方法和装置

Country Status (2)

Country Link
CN (1) CN102685479A (zh)
WO (1) WO2012122836A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104704835B (zh) * 2012-10-03 2017-11-24 联发科技股份有限公司 视频编码中运动信息管理的装置与方法
WO2014175647A1 (ko) * 2013-04-23 2014-10-30 삼성전자 주식회사 시점 합성 예측을 이용한 다시점 비디오 부호화 방법 및 그 장치, 다시점 비디오 복호화 방법 및 그 장치
WO2019234600A1 (en) 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Interaction between pairwise average merging candidates and intra-block copy (ibc)
WO2019244117A1 (en) 2018-06-21 2019-12-26 Beijing Bytedance Network Technology Co., Ltd. Unified constrains for the merge affine mode and the non-merge affine mode
TWI826486B (zh) * 2018-07-14 2023-12-21 大陸商北京字節跳動網絡技術有限公司 用時間資訊擴展基於查找表的運動向量預測
CN112970262B (zh) 2018-11-10 2024-02-20 北京字节跳动网络技术有限公司 三角预测模式中的取整

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1518833A (zh) * 2002-04-19 2004-08-04 ���µ�����ҵ��ʽ���� 运动矢量的计算方法
CN101072356A (zh) * 2006-05-12 2007-11-14 中国科学院计算技术研究所 一种运动矢量预测方法
CN101389024A (zh) * 2002-11-25 2009-03-18 松下电器产业株式会社 动态图像的编码方法及编码装置
CN101860754A (zh) * 2009-12-16 2010-10-13 香港应用科技研究院有限公司 运动矢量编码和解码的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8787685B2 (en) * 2008-02-21 2014-07-22 France Telecom Encoding and decoding an image or image sequence divided into pixel blocks

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1518833A (zh) * 2002-04-19 2004-08-04 ���µ�����ҵ��ʽ���� 运动矢量的计算方法
CN101389024A (zh) * 2002-11-25 2009-03-18 松下电器产业株式会社 动态图像的编码方法及编码装置
CN101072356A (zh) * 2006-05-12 2007-11-14 中国科学院计算技术研究所 一种运动矢量预测方法
CN101860754A (zh) * 2009-12-16 2010-10-13 香港应用科技研究院有限公司 运动矢量编码和解码的方法和装置

Also Published As

Publication number Publication date
CN102685479A (zh) 2012-09-19

Similar Documents

Publication Publication Date Title
TWI690195B (zh) 硬體友善限制之運動向量細化修正
JP7343398B2 (ja) 動きベクトル予測
CN113824966B (zh) 获取视频图像运动矢量的方法与装置
TWI690194B (zh) 用於視訊編解碼的子預測單元時間運動向量預測
TWI619374B (zh) 利用仿射運動補償的視訊編碼方法與裝置
CN112956190B (zh) 仿射运动预测
US20160191939A1 (en) Method and Apparatus for Removing Redundancy in Motion Vector Predictors
TW201924343A (zh) 視訊寫碼中之仿射預測
WO2012122836A1 (zh) 视频编解码处理方法和装置
CN111448800B (zh) 在图像编码系统中使用仿射mvp候选列表的基于仿射运动预测的图像解码方法及设备
TWI738081B (zh) 視訊編碼系統中結合多重預測子用於區塊預測之方法和裝置
WO2005027520A1 (en) Bi-directional predicting method for video coding/decoding
TWI737142B (zh) 視訊編碼中結合畫面間和畫面內預測之方法和裝置
US20140016704A1 (en) Encoding/decoding method, encoding apparatus, decoding apparatus, and system for video image
US20220191548A1 (en) Picture prediction method, encoder, decoder and storage medium
WO2019154424A1 (zh) 视频解码方法、视频解码器以及电子设备
WO2014005426A1 (zh) 帧间预测编码运动信息的处理方法、装置和编解码系统
KR102572012B1 (ko) 시점 간 움직임 병합 후보 유도 방법 및 장치
CN113519161A (zh) 处理视频信号用于帧间预测的方法和设备
WO2020048205A1 (zh) 应用于双向帧间预测中的参考帧获取方法及装置
WO2019184556A1 (zh) 一种双向帧间预测方法及装置
JP2012151576A (ja) 画像符号化方法、画像符号化装置、画像復号方法及び画像復号装置
WO2019183906A1 (zh) 帧间预测的方法和装置
JP2024059909A (ja) 画像エンコーディングおよびデコーディングのための方法およびデバイス
KR20120039967A (ko) 차분 움직임벡터 부호화/복호화 장치 및 방법, 및 그것을 이용한 영상 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11860746

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11860746

Country of ref document: EP

Kind code of ref document: A1