JP2020108032A - Video code stream editing device and program - Google Patents

Video code stream editing device and program Download PDF

Info

Publication number
JP2020108032A
JP2020108032A JP2018245893A JP2018245893A JP2020108032A JP 2020108032 A JP2020108032 A JP 2020108032A JP 2018245893 A JP2018245893 A JP 2018245893A JP 2018245893 A JP2018245893 A JP 2018245893A JP 2020108032 A JP2020108032 A JP 2020108032A
Authority
JP
Japan
Prior art keywords
replacement
video
stream
picture
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018245893A
Other languages
Japanese (ja)
Other versions
JP7273504B2 (en
Inventor
奈緒 中島
Nao Nakajima
奈緒 中島
慎平 根本
Shimpei Nemoto
慎平 根本
市ヶ谷 敦郎
Atsuro Ichigaya
敦郎 市ヶ谷
井口 和久
Kazuhisa Iguchi
和久 井口
菊文 神田
Kikufumi Kanda
菊文 神田
英一 宮下
Hidekazu Miyashita
英一 宮下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2018245893A priority Critical patent/JP7273504B2/en
Publication of JP2020108032A publication Critical patent/JP2020108032A/en
Application granted granted Critical
Publication of JP7273504B2 publication Critical patent/JP7273504B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

To reduce deterioration of quality when partially editing a video code stream.SOLUTION: A code stream editing device 1 includes a decoder 12 that generates a pre-replacement video by decoding a GOP including a replacement section in a pre-replacement stream, a video replacement unit 13 that replaces a video in the replacement section of the video before replacement with the replacement video to generate a video after replacement, a video clipping unit 14 that generates a clipped video obtained by excluding frames that do not refer to frames after a start point frame during encoding, which are frames positioned before the start point frame of the replacement section in the display order in the post-replacement video, an encoder 15 that encodes the clipped video and generates a replacement stream, and a partial replacement unit 16 that replaces the section corresponding to the clipped video of the pre-replacement stream with the replacement stream to generate a post-replacement stream.SELECTED DRAWING: Figure 1

Description

本発明は、映像符号化ストリームの編集を行う映像符号化ストリーム編集装置及びプログラムに関する。 The present invention relates to a video coded stream editing device and a program for editing a video coded stream.

放送局では、そのまま番組として放送可能な完成プログラムを、AVC(Advanced Video Coding)/H.264などの映像符号化方式を用いて符号化した映像符号化ストリームの形態でファイル管理することが多い(例えば、非特許文献1参照)。完成プログラムのファイルは送出サーバに記録され、その送出時刻(放送時刻)を待つ。 At the broadcasting station, the completed program that can be broadcast as a program as it is is AVC (Advanced Video Coding)/H. File management is often performed in the form of a video coded stream coded using a video coding method such as H.264 (see Non-Patent Document 1, for example). The file of the completed program is recorded in the transmission server and waits for its transmission time (broadcast time).

送出サーバに記録された完成プログラムに修正の必要な箇所が発見された場合には、その修正必要箇所のみを正しいコンテンツに差替える部分差替編集を行う。部分差替編集は、特定のカットに問題が有りこのカットのみを差替える場合や、テロップの文字に誤りが有りこのテロップが付加されたフレームのみを修正する場合などにしばしば行われる。 When a portion requiring correction is found in the completed program recorded in the sending server, partial replacement editing is performed to replace only the portion requiring correction with the correct content. Partial replacement editing is often performed when there is a problem with a specific cut and only this cut is replaced, or when only the frame to which this telop is added due to an error in the text of the telop is corrected.

非特許文献1に開示されたシステムでは、表1に記載するように、完成プログラムをAVC/H.264映像符号化方式で、フレーム内予測のみを用いて符号化したIピクチャのみで映像符号化ストリームを構成している。この映像符号化ストリームは、単体での復号が可能なIピクチャのみで構成されるため、部分差替編集を行う際に映像符号化ストリームをいったん復号して再度符号化する必要がない。そのため、任意のフレームを始点、終点とした区間の部分差替編集を容易に行うことができる。 In the system disclosed in Non-Patent Document 1, as shown in Table 1, the completed program is AVC/H. In the H.264 video coding system, a video coded stream is composed of only I pictures coded using only intra-frame prediction. Since this video coded stream is composed of only I pictures that can be decoded by itself, it is not necessary to once decode and code the video coded stream when performing partial replacement editing. Therefore, it is possible to easily perform partial replacement editing of a section having an arbitrary frame as a start point and an end point.

このように、非特許文献1に開示されたシステムでは、編集の容易さからIピクチャのみの構造(Intra Only)を採用している。ただし、Intra Onlyは編集が容易であるが、符号化効率が低くなる。一方、片方向予測によるフレーム間予測を用いて符号化されたPピクチャ、及び双方向予測によるフレーム間予測を用いて符号化されたBピクチャを用いた構造(Long GOP(Group of Picture))は、編集の容易さには難があるが、フレーム間の相関を活用する符号化を行うため、符号化効率が高いといった利点がある。 As described above, the system disclosed in Non-Patent Document 1 adopts the structure (Intra Only) of only I pictures for ease of editing. However, although the Intra Only is easy to edit, the coding efficiency is low. On the other hand, the structure (Long GOP (Group of Pictures)) using a P picture encoded using inter-frame prediction by unidirectional prediction and a B picture encoded using inter-frame prediction by bidirectional prediction is Although it is difficult to edit, it has an advantage of high coding efficiency because the coding is performed by utilizing the correlation between frames.

非特許文献1に開示されたシステムはHD(High Definition)映像を対象とし、AVC/H.264、Intra Only、50Mbpsで運用しているが、今後の普及が見込まれる8Kスーパーハイビジョン映像を対象とする場合には、映像信号の情報量の増加に伴い、より符号化効率の高い符号化方式、GOP構造の採用が要求される。 The system disclosed in Non-Patent Document 1 targets HD (High Definition) video and is intended for AVC/H. It is operated at H.264, Intra Only, and 50 Mbps, but when targeting 8K Super Hi-Vision video, which is expected to spread in the future, a coding method with higher coding efficiency due to an increase in the amount of video signal information. , GOP structure is required.

図6に、8Kスーパーハイビジョン映像をHEVC(High Efficiency Video Coding)/H.265で、Intra Only及びLong GOPで符号化した際の、ビットレートとPSNR(Peak Signal Noise Ratio)のグラフを示す。なお、PSNRの値が高いほど画質劣化が少ない。使用した符号化対象画像は、一般社団法人映像情報メディア学会(ITE)が提供する超高精細・広色域標準動画像−Aシリーズのテストチャートである楓(図6(a))及び気動車(図6(b))である。Long GOPのGOP構造は、M=4、N=32、Temporal_ID=2とした。この図から、8Kスーパーハイビジョン映像をHEVC/H.265で符号化する場合、Intra Onlyに対してLong GOPが有利であることが確認できる。 In FIG. 6, an 8K Super Hi-Vision image is displayed in HEVC (High Efficiency Video Coding)/H. 265 shows a graph of bit rate and PSNR (Peak Signal Noise Ratio) when encoded with Intra Only and Long GOP. Note that the higher the PSNR value, the less the image quality deterioration. The image to be encoded used is Kaede (Fig. 6(a)) and diesel train (Fig. 6(a)), which is a test chart of the ultra-high definition/wide color gamut standard moving image-A series provided by the Institute of Image Information and Television Engineers (ITE). It is FIG.6(b)). The GOP structure of the Long GOP was M=4, N=32, and Temporal_ID=2. From this figure, an 8K Super Hi-Vision image can be recorded in HEVC/H. When encoding with H.265, it can be confirmed that Long GOP is advantageous over Intra Only.

また、特許文献1には、MPEGビデオストリーム1からI又はPピクチャの直前までの第1部分ストリームを切り出し、MPEGビデオストリーム2からI又はPピクチャ以降の第2部分ストリームを切り出し、第1部分ストリームと第2部分ストリームを結合して、編集後ストリーム3を生成する技術が開示されている。より詳細には、第2部分ストリームの直前に表示されるピクチャがIピクチャである場合には、該ピクチャをフレーム内符号化ピクチャとする。また、第2部分ストリームの直前に表示されるピクチャがIピクチャでない場合には、該ピクチャの直前にあるIピクチャから該ピクチャまでの片方向フレーム間予測符号化ピクチャを順に復号化することで、該ピクチャの復号画像を得て、フレーム内符号化により再符号化したピクチャをフレーム内符号化ピクチャとする。最後に、第1部分ストリームと、第2部分ストリームとの間に、フレーム内符号化ピクチャを挿入し、連結処理を行う。 Further, in Patent Document 1, a first partial stream from the MPEG video stream 1 to immediately before an I or P picture is cut out, a second partial stream after an I or P picture is cut out from the MPEG video stream 2, and a first partial stream is cut out. And a second partial stream are combined to generate the edited stream 3. More specifically, when the picture displayed immediately before the second partial stream is an I picture, the picture is an intra-frame coded picture. When the picture displayed immediately before the second partial stream is not the I picture, the unidirectional inter-frame predictive coded pictures from the I picture immediately before the picture to the picture are sequentially decoded, The decoded image of the picture is obtained, and the picture re-encoded by the intra-frame encoding is the intra-frame encoded picture. Finally, the intra-frame coded picture is inserted between the first partial stream and the second partial stream, and the concatenation process is performed.

特開2002−300528号公報JP, 2002-300258, A

「ファイルベース制作設備の導入」、新見他、映像メディア学会誌、Vol.67、No.5、pp.374〜378、2013年“Introduction of file-based production equipment”, Niimi et al., Journal of Image Media Society, Vol.67, No. 5, pp.374-378, 2013

HD映像を対象とした非特許文献1のシステムでは、完成プログラムをIntra Onlyで符号化しているが、8Kスーパーハイビジョン映像などの大容量映像を対象とする場合には、符号化効率の観点からLong GOPで符号化することが求められる。 In the system of Non-Patent Document 1 for HD video, the completed program is encoded by Intra Only. However, when targeting large-capacity video such as 8K Super Hi-Vision video, Long is used from the viewpoint of coding efficiency. Encoding with GOP is required.

しかし、Pピクチャ及びBピクチャは単独での復号が不可能なため、GOP単位ではない区間を編集する場合、編集後の符号化ストリームを正しく復号することができない。この理由を、図4を参照して説明する。図中のI,B,Pは、それぞれIピクチャ、Bピクチャ、Pピクチャを意味する。部分差替編集前の映像符号化ストリームである差替前ストリームのGOP構造が図4(a)に示すものであった場合、2フレーム目から4フレーム目はBピクチャであるため、復号する際には前方のIピクチャである1フレーム目及び後方のPピクチャである5フレーム目を参照する。10フレーム目から12フレーム目はBピクチャであるため、復号する際には前方のPピクチャである9フレーム目及び後方のPピクチャである13フレーム目を参照する。13フレーム目はPピクチャであるため、復号する際には前方のPピクチャである9フレーム目を参照する。14フレーム目から16フレーム目はBピクチャであるため、復号する際には前方のPピクチャである13フレーム目及び後方のPピクチャ又はIピクチャを参照する。 However, since P picture and B picture cannot be independently decoded, when editing a section that is not a GOP unit, the coded stream after editing cannot be correctly decoded. The reason for this will be described with reference to FIG. I, B, and P in the figure mean I picture, B picture, and P picture, respectively. When the GOP structure of the pre-replacement stream, which is the video encoded stream before partial replacement and editing, is as shown in FIG. 4A, since the second frame to the fourth frame are B pictures, decoding is performed. Refers to the first I-frame, which is the front I-picture, and the fifth P-frame, which is the rear P-picture. Since the 10th frame to the 12th frame are B pictures, when decoding, the 9th frame which is the front P picture and the 13th frame which is the rear P picture are referred to. Since the 13th frame is a P picture, the 9th frame, which is the preceding P picture, is referred to when decoding. Since the 14th frame to the 16th frame are B pictures, when decoding, the 13th frame which is the front P picture and the rear P picture or I picture are referred to.

図4(b)は、部分差替編集前の映像符号化ストリームである差替前ストリームに対して、表示順で5フレーム目から9フレーム目までのフレーム(P#5,B#6,B#7,B#8,P#9)を、差替ストリーム(I#1’,B#2’,B#3’,B#4’,P#5’)に部分差替する場合を示している。このとき、部分差替編集後の映像符号化ストリームである差替後ストリームの2フレーム目から4フレーム目まで(B#2,B#3,B#4)は、参照すべきフレームであるP#5が存在しないため、正しく復号することができない。同様に、差替後ストリームの10フレーム目から13フレーム目まで(B#10,B#11,B#12,P#13)は、参照すべきフレームであるP#9が存在しないため、正しく復号することができない。また、13フレーム目(P#13)を正しく復号することができないため、13フレーム目を参照先フレームとする14フレーム目から16フレーム目まで(B#14,B#15,B#16)についても、正しく復号することができない。 FIG. 4B shows frames (P#5, B#6, B) from the fifth frame to the ninth frame in the display order with respect to the stream before replacement, which is the video encoded stream before partial replacement editing. #7, B#8, P#9) is partially replaced with the replacement stream (I#1', B#2', B#3', B#4', P#5'). ing. At this time, the second to fourth frames (B#2, B#3, B#4) of the post-substitution stream, which is the video encoded stream after the partial substituting edit, are the frames to be referred to P Since #5 does not exist, correct decoding cannot be performed. Similarly, from the 10th frame to the 13th frame (B#10, B#11, B#12, P#13) of the stream after replacement, there is no P#9 which is a frame to be referred to, and therefore, it is correct. Can't decrypt. Further, since the 13th frame (P#13) cannot be correctly decoded, the 14th frame to the 16th frame (B#14, B#15, B#16) with the 13th frame as the reference frame Even, it cannot be decrypted correctly.

そこで、編集後の符号化ストリームを正しく復号可能なものとする手法を、図5を参照して説明する。図5は、部分差替編集前の映像符号化ストリームである差替前ストリームに対して、表示順で5フレーム目から9フレーム目までのフレーム(P#5,B#6,B#7,B#8,P#9)を、差替ストリーム(I#1’,B#2’,B#3’,B#4’,P#5’)に部分差替する場合を示している。まず、部分差替区間を含むGOPをGOP単位で復号し、差替前映像を生成する。その後、差替前映像を編集し、5フレーム目から9フレーム目(#5,#6,#7,#8,#9)を差替映像(#1’,#2’,#3’,#4’,#5’)に差替えて差替後映像を生成する。なお、差替えるべきデータを映像符号化ストリーム(差替ストリーム)として与えられた場合には、図5に示すように差替ストリームを復号して差替映像を生成する必要がある。この方法によれば、差替後映像を正しく符号化することができる。しかしながら、既に符号化劣化の生じている差替前ストリームをいったん復号し、再度符号化するため、差替後ストリームの品質がさらに悪化してしまう。 Therefore, a method of making it possible to correctly decode the encoded stream after editing will be described with reference to FIG. FIG. 5 shows frames (P#5, B#6, B#7, P#5, B#6, B#7, P) from the fifth frame to the ninth frame in the display order with respect to the pre-replacement stream which is a video encoded stream before partial replacement editing. It shows a case where the B#8, P#9) is partially replaced by the replacement stream (I#1', B#2', B#3', B#4', P#5'). First, a GOP including a partial replacement section is decoded in GOP units to generate a pre-replacement video. After that, the pre-replacement video is edited, and the fifth to ninth frames (#5, #6, #7, #8, #9) are replaced with the replacement video (#1', #2', #3', #4', #5') to generate the post-replacement image. When the data to be replaced is given as a video encoded stream (replacement stream), it is necessary to decode the replacement stream as shown in FIG. 5 to generate a replacement video. According to this method, the video after replacement can be correctly encoded. However, the quality of the post-replacement stream is further deteriorated because the pre-replacement stream that has already undergone coding degradation is decoded and re-encoded.

また、特許文献1に開示された技術では、上述したフレーム内符号化ピクチャを生成することにより、映像符号化ストリームを切り出して連結させることができるが、映像符号化ストリームの部分差替編集を行うことができないという問題があった。 Further, in the technique disclosed in Patent Document 1, the video coded stream can be cut out and concatenated by generating the intra-frame coded picture described above, but partial replacement editing of the video coded stream is performed. There was a problem that I could not.

かかる事情に鑑みてなされた本発明の目的は、映像符号化ストリームの任意の区間を部分編集でき、且つ部分編集による品質の劣化を低減することが可能な映像符号化ストリーム編集装置、及びプログラムを提供することにある。 An object of the present invention made in view of such circumstances is to provide a video coded stream editing device and a program capable of partially editing an arbitrary section of a video coded stream and reducing deterioration of quality due to partial editing. To provide.

上記課題を解決するため、本発明に係る映像符号化ストリーム編集装置は、フレーム間予測を用いて符号化された映像符号化ストリームに対して部分差替編集を行い、部分差替編集前の映像符号化ストリームである差替前ストリームから、部分差替編集後の映像符号化ストリームである差替後ストリームを生成する映像符号化ストリーム編集装置であって、前記差替前ストリームのうち差替区間を含むGOPを復号して差替前映像を生成するデコーダと、前記差替前映像の前記差替区間の映像を差替映像に入れ換えて差替後映像を生成する映像差替部と、前記差替後映像のうち、前記差替区間の始点フレームよりも表示順で前に位置するフレームであって、符号化時に前記始点フレーム以降のフレームを参照しないフレームを除外した切出映像を生成する映像切出部と、前記切出映像を符号化して、差替ストリームを生成するエンコーダと、前記差替前ストリームの前記切出映像に該当する区間を前記差替ストリームに差替えて、前記差替後ストリームを生成する部分差替部と、を備えることを特徴とする。 In order to solve the above problems, a video coded stream editing device according to the present invention performs partial replacement editing on a video coded stream coded using interframe prediction, and a video before partial replacement editing is performed. A video coded stream editing apparatus for generating a post-replacement stream, which is a video coded stream after partial substitution editing, from a pre-replacement stream, which is a coded stream, wherein a replacement section of the pre-replacement stream A decoder that decodes a GOP including the following to generate a pre-replacement video, and a video replacement unit that replaces a video in the replacement section of the pre-replacement video with a replacement video to generate a post-replacement video, A cutout image is generated by excluding a frame that is positioned before the start point frame of the replacement section in the display order in the post-replacement video and does not refer to a frame after the start point frame at the time of encoding. A video cutout unit, an encoder that encodes the cutout video to generate a replacement stream, and a section corresponding to the cutout video of the pre-replacement stream is replaced with the replacement stream, and the replacement is performed. And a partial replacement unit that generates a subsequent stream.

さらに、本発明に係る映像符号化ストリーム編集装置において、前記映像切出部は、前記差替区間を含むGOPの、前記差替区間の前記始点フレームのピクチャタイプを識別し、該ピクチャタイプがIピクチャである場合には、前記差替後映像のうち、前記始点フレームから最終フレームまでを前記切出映像とし、該ピクチャタイプがIピクチャでない場合には、前記差替後映像のうち、表示順で前記始点フレームの前方の直近に位置するPピクチャ又はIピクチャの1枚後のフレームから最終フレームまでを前記切出映像とすることを特徴とする。 Further, in the video coded stream editing device according to the present invention, the video cutout unit identifies a picture type of the start point frame of the replacement section of a GOP including the replacement section, and the picture type is I. When the picture is a picture, the cutout video is from the start point frame to the last frame in the post-replacement video, and when the picture type is not an I picture, the display order of the post-replacement video is displayed. Then, the frame from the frame immediately after the P picture or I picture located immediately before the start point frame to the final frame is set as the cutout image.

また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記映像符号化ストリーム編集装置として機能させることを特徴とする。 Further, in order to solve the above problems, a program according to the present invention causes a computer to function as the above-mentioned video coded stream editing device.

本発明によれば、映像符号化ストリームの任意のフレームを始点、終点とした区間を部分編集することができる。また、映像符号化ストリームを部分編集する際の品質劣化を低減することができる。 According to the present invention, it is possible to partially edit a section having an arbitrary frame of a video coded stream as a start point and an end point. Further, it is possible to reduce the quality deterioration when the video coded stream is partially edited.

本発明の一実施形態に係る映像符号化ストリーム編集装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of the video coding stream edit apparatus which concerns on one Embodiment of this invention. 本発明の一実施形態に係る映像符号化ストリーム編集装置の動作例を示すフローチャートである。6 is a flowchart showing an operation example of the video coded stream editing device according to the embodiment of the present invention. 本発明の一実施形態に係る映像符号化ストリーム編集装置の処理の具体例を説明する図である。It is a figure explaining an example of processing of a video coding stream editing device concerning one embodiment of the present invention. 編集後の符号化ストリームを正しく復号することができない例を説明する図である。It is a figure explaining the example which cannot correctly decode the encoding stream after edit. 編集後の符号化ストリームを正しく復号可能なものとする手法を説明する図である。It is a figure explaining the method of making the coded stream after edit correctly decodable. 8Kスーパーハイビジョン映像を符号化した際における、ビットレートに対するPSNRを示すグラフである。It is a graph which shows PSNR with respect to a bit rate at the time of encoding 8K super high-definition video.

以下、本発明の一実施形態について、図面を参照して詳細に説明する。 Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.

図1に、本発明の一実施形態に係る映像符号化ストリーム編集装置1の構成例を示す。図1に示す映像符号化ストリーム編集装置1は、差替位置指定部11と、デコーダ12と、映像差替部13と、映像切出部14と、エンコーダ15と、部分差替部16と、を備える。 FIG. 1 shows a configuration example of a video coded stream editing device 1 according to an embodiment of the present invention. The video coded stream editing device 1 shown in FIG. 1 includes a replacement position designation unit 11, a decoder 12, a video replacement unit 13, a video cutout unit 14, an encoder 15, and a partial replacement unit 16. Equipped with.

映像符号化ストリーム編集装置1は、フレーム間予測を用いて符号化された映像符号化ストリームの一部を別のストリームに差替える部分差替編集を行う装置である。以下の説明において、部分差替編集前の映像符号化ストリームを「差替前ストリーム」と称し、部分差替編集後の映像符号化ストリームを「差替後ストリーム」と称する。映像符号化ストリームはフレーム間予測を用いて符号化されているため、GOP構造はLong GOPとなる。ただし、本発明はClosed GOPを対象とし、Open GOPは対象外とする。 The video coded stream editing device 1 is a device that performs partial replacement editing for replacing a part of a video coded stream coded using interframe prediction with another stream. In the following description, the video coded stream before partial replacement editing is referred to as “pre-replacement stream”, and the video coded stream after partial replacement editing is referred to as “post-replacement stream”. Since the video coded stream is coded using inter-frame prediction, the GOP structure is Long GOP. However, the present invention targets Closed GOP and does not target Open GOP.

送出サーバ20は、差替前ストリームを映像符号化ストリーム編集装置1のデコーダ12、部分差替部16、及び映像切出部14に送信する。また、送出サーバ20は、部分差替部16から、差替後ストリームを受信する。 The sending server 20 sends the pre-replacement stream to the decoder 12, the partial replacement unit 16, and the video cutout unit 14 of the video coded stream editing apparatus 1. Further, the transmission server 20 receives the post-substitution stream from the partial substitution unit 16.

差替位置指定部11は、映像符号化ストリーム編集装置1の操作者により部分差替編集の始点及び終点が指定されると、部分差替編集の始点及び終点を示す始点・終点情報を生成する。そして、差替位置指定部11は、始点・終点情報をデコーダ12、映像差替部13、映像切出部14、及び部分差替部16に出力する。始点及び終点の指定は、例えばストリーム内のタイムコードや、表示順のフレーム番号を用いて指定することができる。また、映像符号化ストリームの任意の2枚フレームをそれぞれ始点、終点として指定することができ、始点及び終点で設定される差替区間はGOP単位でなくてもよい。 When the operator of the video coded stream editing device 1 specifies the start point and the end point of the partial replacement edit, the replacement position specifying unit 11 generates start point/end point information indicating the start point and the end point of the partial replacement edit. .. Then, the replacement position designation unit 11 outputs the start point/end point information to the decoder 12, the video replacement unit 13, the video cutout unit 14, and the partial replacement unit 16. The start point and the end point can be specified using, for example, a time code in the stream or a frame number in the display order. Further, any two frames of the video coded stream can be designated as the start point and the end point, respectively, and the replacement section set at the start point and the end point need not be in GOP units.

デコーダ12は、差替位置指定部11から入力された始点・終点情報に基づいて、送出サーバ20から入力された差替前ストリームのうち、始点及び終点を含むGOP(すなわち、差替区間を含むGOPであり複数のGOPであってもよい)を復号して差替前映像を生成する。そして、デコーダ12は、生成した差替前映像を映像差替部13に出力する。 The decoder 12 includes a GOP including a start point and an end point in the pre-replacement stream input from the transmission server 20, based on the start point/end point information input from the replacement position specifying unit 11, that is, includes a replacement section. A GOP and may be a plurality of GOPs) are decoded to generate a pre-replacement image. Then, the decoder 12 outputs the generated pre-replacement video to the video replacement unit 13.

映像差替部13は、映像符号化ストリーム編集装置1の周辺機器である編集機、録再機などから差替映像を取得する。また、映像差替部13は、デコーダ12から差替前映像を取得する。そして、映像差替部13は、差替位置指定部11から入力された始点・終点情報に基づいて、差替前映像の始点から終点(差替区間)の映像を差替映像に入れ換えて差替後映像を生成する。映像差替部13は、生成した差替後映像を映像切出部14に出力する。 The video replacement unit 13 acquires the replacement video from an editing device, a recording/playback device, or the like that is a peripheral device of the video coded stream editing device 1. The video replacement unit 13 also acquires the pre-replacement video from the decoder 12. Then, the video replacement unit 13 replaces the video from the start point to the end point (replacement section) of the pre-replacement video with the replacement video based on the start point/end point information input from the replacement position designation unit 11. A video after replacement is generated. The video replacement unit 13 outputs the generated post-replacement video to the video cutout unit 14.

映像切出部14は、映像差替部13から入力された差替後映像のうち、差替区間の始点フレームよりも表示順で前に位置するフレームであって、符号化時に始点フレーム以降のフレームを参照しないフレームを除外した切出映像を生成する。そして、映像切出部14は、生成した切出映像をエンコーダ15に出力する。 The video cutout unit 14 is a frame that is positioned before the start point frame of the replacement section in the display order in the post-replacement video input from the video replacement unit 13, and is a frame located after the start point frame at the time of encoding. A cutout image is generated by excluding frames that do not refer to frames. Then, the video cutout unit 14 outputs the generated cutout video to the encoder 15.

エンコーダ15は、映像切出部14から入力された切出映像を符号化して、差替ストリームを生成する。そして、エンコーダ15は、生成した差替ストリームを部分差替部16に出力する。差替ストリームの復号順で先頭のフレームは、Iピクチャとなる。 The encoder 15 encodes the cutout video input from the video cutout unit 14 to generate a replacement stream. Then, the encoder 15 outputs the generated replacement stream to the partial replacement unit 16. The first frame in the decoding order of the replacement stream is the I picture.

部分差替部16は、送出サーバ20から受信した差替前ストリームの切出映像に該当する区間を、エンコーダ15から入力された差替ストリームに差替えて差替後ストリームを生成する。そして、部分差替部16は、生成した差替後ストリームを送出サーバ20に送信する。 The partial replacement unit 16 replaces the section corresponding to the cut-out video of the pre-replacement stream received from the transmission server 20 with the replacement stream input from the encoder 15 to generate the post-replacement stream. Then, the partial replacement unit 16 transmits the generated post-replacement stream to the transmission server 20.

図2は、映像符号化ストリーム編集装置1の動作例を示すフローチャートである。図3は、映像符号化ストリーム編集装置1の処理の具体例を説明する図である。図2及び図3を参照して、映像符号化ストリーム編集装置1の動作について説明する。なお、図3において、フレームのカウントは表示順で行うものとする。すなわち、図3中のフレーム番号は表示順番号であるPOC(Picture Order Count)を意味するものとする。 FIG. 2 is a flowchart showing an operation example of the video coded stream editing device 1. FIG. 3 is a diagram illustrating a specific example of the process of the video coded stream editing device 1. The operation of the video coded stream editing apparatus 1 will be described with reference to FIGS. 2 and 3. In addition, in FIG. 3, it is assumed that the frames are counted in the display order. That is, the frame number in FIG. 3 means a POC (Picture Order Count) which is a display order number.

映像符号化ストリーム編集装置1は、差替位置指定部11により、差替位置を指定する(ステップS101)。図3に示す例では、送出サーバ20から受信した差替前ストリームに対して、第nGOPの7フレーム目から10フレーム目の部分差替編集を行う。この場合、差替位置指定部11は、第nGOPの7フレーム目及び10フレーム目を示す情報を始点・終点情報として生成する。 In the video coded stream editing device 1, the replacement position specifying unit 11 specifies the replacement position (step S101). In the example shown in FIG. 3, partial replacement editing of the 7th frame to the 10th frame of the nth GOP is performed on the pre-replacement stream received from the transmission server 20. In this case, the replacement position specifying unit 11 generates information indicating the 7th frame and the 10th frame of the nth GOP as the start point/end point information.

次に、映像符号化ストリーム編集装置1は、デコーダ12により、差替前ストリームのうち、差替区間を含むGOPを復号して差替前映像を生成する(ステップS102)。図3に示す例では、デコーダ12は第nGOPを復号して差替前映像を生成する。 Next, the video coded stream editing apparatus 1 decodes the GOP including the replacement section in the pre-replacement stream by the decoder 12 to generate the pre-replacement video (step S102). In the example shown in FIG. 3, the decoder 12 decodes the nth GOP to generate a pre-replacement image.

次に、映像符号化ストリーム編集装置1は、映像差替部13により、差替映像を取得し、差替前映像の差替区間の映像を差替映像に入れ換えて、差替後映像を生成する(ステップS103)。図3に示す例では、映像差替部13は、差替映像として#1’,#2’,#3’,#4’を取得する。 Next, in the video coded stream editing apparatus 1, the video replacement unit 13 acquires the replacement video, replaces the video in the replacement section of the pre-replacement video with the replacement video, and generates the post-replacement video. Yes (step S103). In the example shown in FIG. 3, the image replacement unit 13 acquires #1', #2', #3', #4' as replacement images.

次に、映像符号化ストリーム編集装置1は、映像切出部14により、差替区間を含むGOPのGOP構造を確認し、差替区間の始点フレームのピクチャタイプを識別する。映像切出部14は、差替区間の始点フレームのピクチャタイプがIピクチャである場合には(ステップS104−Yes)、差替後映像のうち、始点フレームから最終フレームまでを切出映像とする(ステップS105)。 Next, the video coded stream editing device 1 confirms the GOP structure of the GOP including the replacement section by the video cutout unit 14, and identifies the picture type of the start point frame of the replacement section. When the picture type of the start point frame of the replacement section is an I picture (step S104-Yes), the video cutout unit 14 determines the cutout video from the start point frame to the final frame of the post-replacement video. (Step S105).

一方、映像切出部14は、差替区間の始点フレームのピクチャタイプがPピクチャ又はBピクチャである場合には(ステップS104−No)、差替後映像のうち、差替前ストリームの表示順(POC順)で始点フレームの前方の直近に位置するPピクチャ又はIピクチャの1枚後のフレーム位置(POC)を特定する。そして、差替後映像のうち、先に特定したフレーム位置(POC)に該当するフレームから最終フレームまでを切出映像とする(ステップS106)。 On the other hand, when the picture type of the start point frame of the replacement section is the P picture or the B picture (step S104-No), the video cutout unit 14 displays the pre-replacement stream of the post-replacement video in the display order. The frame position (POC) one frame after the P picture or I picture located immediately before the start point frame is specified in (POC order). Then, among the images after the replacement, the frames from the frame corresponding to the previously specified frame position (POC) to the final frame are set as the cut-out images (step S106).

図3に示す例では、差替区間の始点フレーム(B#7)のピクチャタイプがBピクチャであるため、映像切出部14は、始点フレーム(B#7)の前方の直近に位置するPピクチャ(P#5)の1枚後のフレーム位置(6フレーム目)を特定する。そして、差替後映像のうち、6フレーム目(#6)から最終フレーム(#12)までを切出映像とする。 In the example shown in FIG. 3, since the picture type of the start point frame (B#7) of the replacement section is B picture, the video cutout unit 14 is positioned at the position P immediately before the start point frame (B#7). The frame position (sixth frame) after the picture (P#5) is specified. Then, among the images after replacement, the sixth frame (#6) to the final frame (#12) are set as cutout images.

次に、映像符号化ストリーム編集装置1は、エンコーダ15により、切出映像を符号化して差替ストリームを生成する(ステップS107)。その際、図3に示すように、差替ストリームの復号順で先頭のフレームをIピクチャとする。また、差替ストリームの表示順で最終のフレームをPピクチャ又はIピクチャとする。差替ストリームの他のピクチャタイプは任意であるが、Iピクチャが増えると符号化効率が低下するため、Bピクチャ又はPピクチャとするのが好適である。 Next, the video coded stream editing device 1 uses the encoder 15 to code the cut video and generate a replacement stream (step S107). At that time, as shown in FIG. 3, the first frame in the decoding order of the replacement stream is the I picture. The last frame in the display order of the replacement stream is a P picture or an I picture. Other picture types of the replacement stream are arbitrary, but since the coding efficiency decreases as the number of I pictures increases, it is preferable to use B pictures or P pictures.

次に、映像符号化ストリーム編集装置1は、部分差替部16により、差替前ストリームの切出映像に該当する区間を差替ストリームに差替えて差替後ストリームを生成する(ステップS108)。図3に示す例では、差替後ストリームの第nGOPについて、最初の5フレーム(I#1,B#2,B#3,B#4,P#5)、及び最後の4フレーム(I#13,B#14,B#15,B#16)は差替前ストリームと同一である。よって、これらのフレームに関しては、再符号化による品質劣化が生じることはない。 Next, in the video coded stream editing device 1, the partial replacement unit 16 replaces the section corresponding to the cutout video of the stream before replacement with the replacement stream to generate a post-replacement stream (step S108). In the example shown in FIG. 3, for the nGOP of the stream after replacement, the first 5 frames (I#1, B#2, B#3, B#4, P#5) and the last 4 frames (I# 13, B#14, B#15, B#16) are the same as the stream before replacement. Therefore, regarding these frames, quality deterioration due to re-encoding does not occur.

以上、映像符号化ストリーム編集装置1について説明したが、映像符号化ストリーム編集装置1として機能させるためにコンピュータを用いることも可能である。そのようなコンピュータは、映像符号化ストリーム編集装置1の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。 The video coded stream editing device 1 has been described above, but a computer may be used to cause the video coded stream editing device 1 to function. Such a computer stores a program describing processing contents for realizing each function of the video coded stream editing apparatus 1 in a storage unit of the computer, and causes the CPU of the computer to read and execute the program. Can be achieved with.

また、このプログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD−ROMやDVD−ROMなどの記録媒体であってもよい。 Further, this program may be recorded in a computer-readable medium. The computer readable medium can be used for installation on a computer. Here, the computer-readable medium in which the program is recorded may be a non-transitory recording medium. The non-transitory recording medium is not particularly limited, but may be a recording medium such as a CD-ROM or a DVD-ROM.

上述したように、本発明においては、GOP構造がLong GOPである符号化ストリームに対して部分差替編集を施す際に、表示順で始点フレームより前に位置するフレームのうち、始点フレーム以降のフレームを参照しないフレームについては、元の編集前の映像符号化ストリームをそのまま利用する。よって、本発明によれば、映像符号化ストリームの部分編集を行っても、再符号化による画質劣化を低減することが可能となる。 As described above, in the present invention, when partial replacement editing is performed on a coded stream having a GOP structure of Long GOP, among the frames positioned before the start point frame in the display order, the frames after the start point frame are displayed. For the frame that does not refer to the frame, the original video coded stream before editing is used as it is. Therefore, according to the present invention, it is possible to reduce the image quality deterioration due to re-encoding even when the video encoded stream is partially edited.

上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。 Although the above embodiments have been described as representative examples, it will be apparent to those skilled in the art that many modifications and substitutions can be made within the spirit and scope of the present invention. Therefore, the present invention should not be construed as being limited by the above-described embodiments, and various modifications and changes can be made without departing from the scope of the claims. For example, it is possible to combine a plurality of configuration blocks described in the configuration diagram of the embodiment into one or to divide one configuration block.

1 映像符号化ストリーム編集装置
11 差替位置指定部
12 デコーダ
13 映像差替部
14 映像切出部
15 エンコーダ
16 部分差替部
20 送出サーバ
DESCRIPTION OF SYMBOLS 1 Video coded stream editing apparatus 11 Replacement position designation section 12 Decoder 13 Video replacement section 14 Video cutout section 15 Encoder 16 Partial replacement section 20 Sending server

Claims (3)

フレーム間予測を用いて符号化された映像符号化ストリームに対して部分差替編集を行い、部分差替編集前の映像符号化ストリームである差替前ストリームから、部分差替編集後の映像符号化ストリームである差替後ストリームを生成する映像符号化ストリーム編集装置であって、
前記差替前ストリームのうち差替区間を含むGOPを復号して差替前映像を生成するデコーダと、
前記差替前映像の前記差替区間の映像を差替映像に入れ換えて差替後映像を生成する映像差替部と、
前記差替後映像のうち、前記差替区間の始点フレームよりも表示順で前に位置するフレームであって、符号化時に前記始点フレーム以降のフレームを参照しないフレームを除外した切出映像を生成する映像切出部と、
前記切出映像を符号化して、差替ストリームを生成するエンコーダと、
前記差替前ストリームの前記切出映像に該当する区間を前記差替ストリームに差替えて、前記差替後ストリームを生成する部分差替部と、
を備えることを特徴とする、映像符号化ストリーム編集装置。
Partial replacement editing is performed on a video coded stream encoded using interframe prediction, and a video code after partial replacement editing is performed from a pre-replacement stream that is a video coding stream before partial replacement editing. A video coded stream editing device for generating a post-replacement stream that is a coded stream,
A decoder that decodes a GOP including a replacement section of the pre-replacement stream to generate a pre-replacement video;
A video replacement unit that replaces the video in the replacement section of the video before replacement with a replacement video to generate a video after replacement,
In the post-substitution video, a cut-out video is generated that excludes frames that are located in the display order before the start point frame of the replacement section and that do not refer to frames after the start point frame during encoding. And the video cutout part
An encoder that encodes the cutout video to generate a replacement stream,
A partial replacement unit that replaces a section corresponding to the cutout image of the pre-replacement stream with the replacement stream to generate the post-replacement stream;
A video coded stream editing device, comprising:
前記映像切出部は、前記差替区間を含むGOPの、前記差替区間の前記始点フレームのピクチャタイプを識別し、
該ピクチャタイプがIピクチャである場合には、前記差替後映像のうち、前記始点フレームから最終フレームまでを前記切出映像とし、
該ピクチャタイプがIピクチャでない場合には、前記差替後映像のうち、表示順で前記始点フレームの前方の直近に位置するPピクチャ又はIピクチャの1枚後のフレームから最終フレームまでを前記切出映像とする
ことを特徴とする、請求項1に記載の映像符号化ストリーム編集装置。
The video cutout unit identifies a picture type of the start point frame of the replacement section of a GOP including the replacement section,
When the picture type is an I picture, the cutout video is the video from the start point frame to the final frame in the post-replacement video,
If the picture type is not an I-picture, in the post-replacement video, the P-picture or the I-picture located immediately before the start-point frame in the display order and the frame immediately after the first picture to the last frame are switched to the cut-off picture. The video coded stream editing device according to claim 1, wherein the video coded stream editing device is an outgoing video.
コンピュータを、請求項1又は2に記載の映像符号化ストリーム編集装置として機能させるためのプログラム。 A program for causing a computer to function as the video coded stream editing device according to claim 1.
JP2018245893A 2018-12-27 2018-12-27 VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM Active JP7273504B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018245893A JP7273504B2 (en) 2018-12-27 2018-12-27 VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018245893A JP7273504B2 (en) 2018-12-27 2018-12-27 VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM

Publications (2)

Publication Number Publication Date
JP2020108032A true JP2020108032A (en) 2020-07-09
JP7273504B2 JP7273504B2 (en) 2023-05-15

Family

ID=71449553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018245893A Active JP7273504B2 (en) 2018-12-27 2018-12-27 VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM

Country Status (1)

Country Link
JP (1) JP7273504B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113079406A (en) * 2021-03-19 2021-07-06 上海哔哩哔哩科技有限公司 Video processing method and device

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09238347A (en) * 1996-02-29 1997-09-09 Sony Corp Image data processing method and device therefor
JP2002058023A (en) * 2000-08-09 2002-02-22 Mitsubishi Electric Corp Encoding picture signal transmitting system
JP2002300528A (en) * 2001-03-30 2002-10-11 Toshiba Corp Method and device for editing video stream
JP2007104182A (en) * 2005-10-03 2007-04-19 Nec Electronics Corp Image coding device, image coding method, and image editing device
JP2008066845A (en) * 2006-09-05 2008-03-21 Sony Corp Information processing apparatus and method, recording medium, and program
JP2010154502A (en) * 2008-11-28 2010-07-08 Sony Corp Device and method for editing image
US20160217827A1 (en) * 2015-01-28 2016-07-28 Electronics And Telecommunications Research Institute Method and apparatus for processing video stream

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09238347A (en) * 1996-02-29 1997-09-09 Sony Corp Image data processing method and device therefor
JP2002058023A (en) * 2000-08-09 2002-02-22 Mitsubishi Electric Corp Encoding picture signal transmitting system
JP2002300528A (en) * 2001-03-30 2002-10-11 Toshiba Corp Method and device for editing video stream
JP2007104182A (en) * 2005-10-03 2007-04-19 Nec Electronics Corp Image coding device, image coding method, and image editing device
JP2008066845A (en) * 2006-09-05 2008-03-21 Sony Corp Information processing apparatus and method, recording medium, and program
JP2010154502A (en) * 2008-11-28 2010-07-08 Sony Corp Device and method for editing image
US20160217827A1 (en) * 2015-01-28 2016-07-28 Electronics And Telecommunications Research Institute Method and apparatus for processing video stream

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113079406A (en) * 2021-03-19 2021-07-06 上海哔哩哔哩科技有限公司 Video processing method and device

Also Published As

Publication number Publication date
JP7273504B2 (en) 2023-05-15

Similar Documents

Publication Publication Date Title
US11943480B2 (en) Constraints and unit types to simplify video random access
US10070144B2 (en) Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method
US20200177907A1 (en) Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method
US8811483B2 (en) Video processing apparatus and method
EP2642764B1 (en) Transcoding a video stream to facilitate accurate display
KR101915079B1 (en) Dynamic image predictive encoding and decoding device, method, and program
US20140003519A1 (en) Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method
JP2020108032A (en) Video code stream editing device and program
JP2021197643A (en) Video code stream editing device and program
JP2015065528A (en) Picture editing device, picture editing method and program
JP2006100947A (en) Wipe switching method of mpeg-2 stream

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230428

R150 Certificate of patent or registration of utility model

Ref document number: 7273504

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150