JP7273504B2 - VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM - Google Patents

VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM Download PDF

Info

Publication number
JP7273504B2
JP7273504B2 JP2018245893A JP2018245893A JP7273504B2 JP 7273504 B2 JP7273504 B2 JP 7273504B2 JP 2018245893 A JP2018245893 A JP 2018245893A JP 2018245893 A JP2018245893 A JP 2018245893A JP 7273504 B2 JP7273504 B2 JP 7273504B2
Authority
JP
Japan
Prior art keywords
replacement
video
stream
frame
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018245893A
Other languages
Japanese (ja)
Other versions
JP2020108032A (en
Inventor
奈緒 中島
慎平 根本
敦郎 市ヶ谷
和久 井口
菊文 神田
英一 宮下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2018245893A priority Critical patent/JP7273504B2/en
Publication of JP2020108032A publication Critical patent/JP2020108032A/en
Application granted granted Critical
Publication of JP7273504B2 publication Critical patent/JP7273504B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、映像符号化ストリームの編集を行う映像符号化ストリーム編集装置及びプログラムに関する。 The present invention relates to a video encoded stream editing apparatus and program for editing a video encoded stream.

放送局では、そのまま番組として放送可能な完成プログラムを、AVC(Advanced Video Coding)/H.264などの映像符号化方式を用いて符号化した映像符号化ストリームの形態でファイル管理することが多い(例えば、非特許文献1参照)。完成プログラムのファイルは送出サーバに記録され、その送出時刻(放送時刻)を待つ。 A broadcasting station converts a complete program that can be broadcast as a program as it is into AVC (Advanced Video Coding)/H.264. Files are often managed in the form of video encoded streams encoded using a video encoding method such as H.264 (see, for example, Non-Patent Document 1). The completed program file is recorded in the delivery server and waits for its delivery time (broadcast time).

送出サーバに記録された完成プログラムに修正の必要な箇所が発見された場合には、その修正必要箇所のみを正しいコンテンツに差替える部分差替編集を行う。部分差替編集は、特定のカットに問題が有りこのカットのみを差替える場合や、テロップの文字に誤りが有りこのテロップが付加されたフレームのみを修正する場合などにしばしば行われる。 When a portion requiring correction is found in the completed program recorded in the transmission server, partial replacement editing is performed to replace only the portion requiring correction with correct content. Partial replacement editing is often performed when there is a problem with a specific cut and only this cut is replaced, or when there is an error in characters in a telop and only the frame to which this telop is added is corrected.

非特許文献1に開示されたシステムでは、表1に記載するように、完成プログラムをAVC/H.264映像符号化方式で、フレーム内予測のみを用いて符号化したIピクチャのみで映像符号化ストリームを構成している。この映像符号化ストリームは、単体での復号が可能なIピクチャのみで構成されるため、部分差替編集を行う際に映像符号化ストリームをいったん復号して再度符号化する必要がない。そのため、任意のフレームを始点、終点とした区間の部分差替編集を容易に行うことができる。 In the system disclosed in Non-Patent Document 1, as shown in Table 1, the completed program is converted to AVC/H. In the H.264 video coding system, a video coded stream consists of only I pictures coded using only intra-frame prediction. Since this coded video stream is composed only of I pictures that can be decoded individually, it is not necessary to once decode and re-encode the coded video stream when performing partial replacement editing. Therefore, it is possible to easily perform partial replacement editing of a section with an arbitrary frame as a start point and an end point.

このように、非特許文献1に開示されたシステムでは、編集の容易さからIピクチャのみの構造(Intra Only)を採用している。ただし、Intra Onlyは編集が容易であるが、符号化効率が低くなる。一方、片方向予測によるフレーム間予測を用いて符号化されたPピクチャ、及び双方向予測によるフレーム間予測を用いて符号化されたBピクチャを用いた構造(Long GOP(Group of Picture))は、編集の容易さには難があるが、フレーム間の相関を活用する符号化を行うため、符号化効率が高いといった利点がある。 In this way, the system disclosed in Non-Patent Document 1 adopts a structure of only I pictures (Intra Only) for ease of editing. However, although Intra Only is easy to edit, the coding efficiency is low. On the other hand, a structure (Long GOP (Group of Picture)) using P pictures coded using inter-frame prediction by unidirectional prediction and B pictures coded using inter-frame prediction by bi-directional prediction is , there is a drawback in terms of easiness of editing, but there is an advantage that the encoding efficiency is high because the encoding is performed by utilizing the correlation between frames.

非特許文献1に開示されたシステムはHD(High Definition)映像を対象とし、AVC/H.264、Intra Only、50Mbpsで運用しているが、今後の普及が見込まれる8Kスーパーハイビジョン映像を対象とする場合には、映像信号の情報量の増加に伴い、より符号化効率の高い符号化方式、GOP構造の採用が要求される。 The system disclosed in Non-Patent Document 1 is intended for HD (High Definition) video, and uses AVC/H. 264, Intra Only, 50 Mbps, but when targeting 8K Super Hi-Vision video, which is expected to spread in the future, as the amount of information in the video signal increases, a coding method with higher coding efficiency , GOP structure is required.

図6に、8Kスーパーハイビジョン映像をHEVC(High Efficiency Video Coding)/H.265で、Intra Only及びLong GOPで符号化した際の、ビットレートとPSNR(Peak Signal Noise Ratio)のグラフを示す。なお、PSNRの値が高いほど画質劣化が少ない。使用した符号化対象画像は、一般社団法人映像情報メディア学会(ITE)が提供する超高精細・広色域標準動画像-Aシリーズのテストチャートである楓(図6(a))及び気動車(図6(b))である。Long GOPのGOP構造は、M=4、N=32、Temporal_ID=2とした。この図から、8Kスーパーハイビジョン映像をHEVC/H.265で符号化する場合、Intra Onlyに対してLong GOPが有利であることが確認できる。 FIG. 6 shows 8K Super Hi-Vision video encoded by HEVC (High Efficiency Video Coding)/H.264. 1 shows graphs of bit rate and PSNR (Peak Signal Noise Ratio) when H.265 is encoded with Intra Only and Long GOP. Note that the higher the PSNR value, the less image quality deterioration. The images to be coded used are maple (Fig. 6(a)) and railcar ( FIG. 6(b)). The GOP structure of Long GOP was M=4, N=32, and Temporal_ID=2. From this figure, it can be seen that the 8K Super Hi-Vision video is converted to HEVC/H. It can be seen that Long GOP is advantageous over Intra Only when encoding with H.265.

また、特許文献1には、MPEGビデオストリーム1からI又はPピクチャの直前までの第1部分ストリームを切り出し、MPEGビデオストリーム2からI又はPピクチャ以降の第2部分ストリームを切り出し、第1部分ストリームと第2部分ストリームを結合して、編集後ストリーム3を生成する技術が開示されている。より詳細には、第2部分ストリームの直前に表示されるピクチャがIピクチャである場合には、該ピクチャをフレーム内符号化ピクチャとする。また、第2部分ストリームの直前に表示されるピクチャがIピクチャでない場合には、該ピクチャの直前にあるIピクチャから該ピクチャまでの片方向フレーム間予測符号化ピクチャを順に復号化することで、該ピクチャの復号画像を得て、フレーム内符号化により再符号化したピクチャをフレーム内符号化ピクチャとする。最後に、第1部分ストリームと、第2部分ストリームとの間に、フレーム内符号化ピクチャを挿入し、連結処理を行う。 Further, in Patent Document 1, a first partial stream from MPEG video stream 1 to immediately before an I or P picture is cut out, a second partial stream after the I or P picture is cut out from MPEG video stream 2, and the first partial stream is cut out. and a second partial stream to generate an edited stream 3 is disclosed. More specifically, if the picture displayed immediately before the second partial stream is an I picture, that picture is an intra-frame coded picture. Further, when the picture displayed immediately before the second partial stream is not an I-picture, by sequentially decoding the unidirectional inter-frame predictive coded pictures from the I-picture immediately before this picture to this picture, A picture obtained by obtaining a decoded image of the picture and re-encoded by intra-frame coding is defined as an intra-frame coded picture. Finally, an intra-frame coded picture is inserted between the first partial stream and the second partial stream, and concatenation processing is performed.

特開2002-300528号公報JP-A-2002-300528

「ファイルベース制作設備の導入」、新見他、映像メディア学会誌、Vol.67、No.5、pp.374~378、2013年"Introduction of file-based production facilities", Niimi et al., Journal of the Institute of Image Media, Vol.67, No. 5, pp.374-378, 2013

HD映像を対象とした非特許文献1のシステムでは、完成プログラムをIntra Onlyで符号化しているが、8Kスーパーハイビジョン映像などの大容量映像を対象とする場合には、符号化効率の観点からLong GOPで符号化することが求められる。 In the system of Non-Patent Document 1, which targets HD video, the completed program is encoded in Intra Only. GOP encoding is required.

しかし、Pピクチャ及びBピクチャは単独での復号が不可能なため、GOP単位ではない区間を編集する場合、編集後の符号化ストリームを正しく復号することができない。この理由を、図4を参照して説明する。図中のI,B,Pは、それぞれIピクチャ、Bピクチャ、Pピクチャを意味する。部分差替編集前の映像符号化ストリームである差替前ストリームのGOP構造が図4(a)に示すものであった場合、2フレーム目から4フレーム目はBピクチャであるため、復号する際には前方のIピクチャである1フレーム目及び後方のPピクチャである5フレーム目を参照する。10フレーム目から12フレーム目はBピクチャであるため、復号する際には前方のPピクチャである9フレーム目及び後方のPピクチャである13フレーム目を参照する。13フレーム目はPピクチャであるため、復号する際には前方のPピクチャである9フレーム目を参照する。14フレーム目から16フレーム目はBピクチャであるため、復号する際には前方のPピクチャである13フレーム目及び後方のPピクチャ又はIピクチャを参照する。 However, since P-pictures and B-pictures cannot be decoded individually, when editing a section that is not a GOP unit, the coded stream after editing cannot be correctly decoded. The reason for this will be explained with reference to FIG. I, B, and P in the drawing mean I picture, B picture, and P picture, respectively. If the GOP structure of the pre-replacement stream, which is the video encoded stream before partial replacement editing, is as shown in FIG. 4A, the second to fourth frames are B pictures. , refer to the 1st frame, which is the I picture in the front, and the 5th frame, which is the P picture in the rear. Since the 10th to 12th frames are B pictures, the 9th frame, which is the forward P picture, and the 13th frame, which is the backward P picture, are referred to when decoding. Since the 13th frame is a P-picture, the 9th frame, which is the preceding P-picture, is referred to during decoding. Since the 14th to 16th frames are B-pictures, the 13th frame, which is the forward P-picture, and the backward P-picture or I-picture are referred to during decoding.

図4(b)は、部分差替編集前の映像符号化ストリームである差替前ストリームに対して、表示順で5フレーム目から9フレーム目までのフレーム(P#5,B#6,B#7,B#8,P#9)を、差替ストリーム(I#1’,B#2’,B#3’,B#4’,P#5’)に部分差替する場合を示している。このとき、部分差替編集後の映像符号化ストリームである差替後ストリームの2フレーム目から4フレーム目まで(B#2,B#3,B#4)は、参照すべきフレームであるP#5が存在しないため、正しく復号することができない。同様に、差替後ストリームの10フレーム目から13フレーム目まで(B#10,B#11,B#12,P#13)は、参照すべきフレームであるP#9が存在しないため、正しく復号することができない。また、13フレーム目(P#13)を正しく復号することができないため、13フレーム目を参照先フレームとする14フレーム目から16フレーム目まで(B#14,B#15,B#16)についても、正しく復号することができない。 FIG. 4(b) shows frames from the fifth frame to the ninth frame (P#5, B#6, B #7, B#8, P#9) are partially replaced with replacement streams (I#1′, B#2′, B#3′, B#4′, P#5′). ing. At this time, the 2nd to 4th frames (B#2, B#3, B#4) of the post-replacement stream, which is the coded video stream after the partial replacement editing, are frames to be referred to P Since #5 does not exist, it cannot be decoded correctly. Similarly, the 10th to 13th frames (B#10, B#11, B#12, P#13) of the post-replacement stream do not have P#9, which is the frame to be referred to, so cannot be decrypted. Also, since the 13th frame (P#13) cannot be decoded correctly, the 14th to 16th frames (B#14, B#15, B#16) with the 13th frame as the reference frame cannot be decoded correctly.

そこで、編集後の符号化ストリームを正しく復号可能なものとする手法を、図5を参照して説明する。図5は、部分差替編集前の映像符号化ストリームである差替前ストリームに対して、表示順で5フレーム目から9フレーム目までのフレーム(P#5,B#6,B#7,B#8,P#9)を、差替ストリーム(I#1’,B#2’,B#3’,B#4’,P#5’)に部分差替する場合を示している。まず、部分差替区間を含むGOPをGOP単位で復号し、差替前映像を生成する。その後、差替前映像を編集し、5フレーム目から9フレーム目(#5,#6,#7,#8,#9)を差替映像(#1’,#2’,#3’,#4’,#5’)に差替えて差替後映像を生成する。なお、差替えるべきデータを映像符号化ストリーム(差替ストリーム)として与えられた場合には、図5に示すように差替ストリームを復号して差替映像を生成する必要がある。この方法によれば、差替後映像を正しく符号化することができる。しかしながら、既に符号化劣化の生じている差替前ストリームをいったん復号し、再度符号化するため、差替後ストリームの品質がさらに悪化してしまう。 Therefore, a technique for making the coded stream after editing correctly decodable will be described with reference to FIG. FIG. 5 shows frames from the fifth frame to the ninth frame (P#5, B#6, B#7, B#8, P#9) are partially replaced with replacement streams (I#1′, B#2′, B#3′, B#4′, P#5′). First, a GOP including a partial replacement section is decoded in GOP units to generate a video before replacement. After that, the pre-replacement video is edited, and the 5th to 9th frames (#5, #6, #7, #8, #9) are replaced with the replacement video (#1', #2', #3', #4', #5') to generate a post-replacement video. When data to be replaced is given as a video encoded stream (replacement stream), it is necessary to decode the replacement stream to generate a replacement video as shown in FIG. According to this method, the post-substitution video can be encoded correctly. However, since the pre-replacement stream, in which coding deterioration has already occurred, is once decoded and re-encoded, the quality of the post-replacement stream further deteriorates.

また、特許文献1に開示された技術では、上述したフレーム内符号化ピクチャを生成することにより、映像符号化ストリームを切り出して連結させることができるが、映像符号化ストリームの部分差替編集を行うことができないという問題があった。 Further, in the technique disclosed in Patent Document 1, by generating the intra-frame coded picture described above, the video coded stream can be cut out and connected. I had a problem that I couldn't.

かかる事情に鑑みてなされた本発明の目的は、映像符号化ストリームの任意の区間を部分編集でき、且つ部分編集による品質の劣化を低減することが可能な映像符号化ストリーム編集装置、及びプログラムを提供することにある。 An object of the present invention, which has been made in view of such circumstances, is to provide a coded video stream editing apparatus and a program capable of partially editing an arbitrary section of a coded video stream and reducing deterioration in quality due to partial editing. to provide.

上記課題を解決するため、本発明に係る映像符号化ストリーム編集装置は、フレーム間予測を用いて符号化された映像符号化ストリームに対して部分差替編集を行い、部分差替編集前の映像符号化ストリームである差替前ストリームから、部分差替編集後の映像符号化ストリームである差替後ストリームを生成する映像符号化ストリーム編集装置であって、前記差替前ストリームのうち差替区間を含むGOPを復号して差替前映像を生成するデコーダと、前記差替前映像の前記差替区間の映像を差替映像に入れ換えて差替後映像を生成する映像差替部と、前記差替後映像のうち、前記差替区間の始点フレームよりも表示順で前に位置するフレームであって、符号化時に前記始点フレーム以降のフレームを参照しないフレームを除外した切出映像を生成する映像切出部と、前記切出映像を符号化して、差替ストリームを生成するエンコーダと、前記差替前ストリームの前記切出映像に該当する区間を前記差替ストリームに差替えて、前記差替後ストリームを生成する部分差替部と、を備え、前記エンコーダは、前記差替ストリームの復号順で先頭のフレームをIピクチャとし、前記差替ストリームの表示順で最終のフレームをPピクチャ又はIピクチャとすることを特徴とする。
In order to solve the above-mentioned problems, a video encoded stream editing apparatus according to the present invention performs partial replacement editing on a video encoded stream encoded using inter-frame prediction, and performs video editing before partial replacement editing. An coded video stream editing device for generating a post-replacement stream, which is a video coded stream after partial substitution editing, from a pre-replacement stream, which is an encoded stream, wherein the pre-replacement stream includes a replacement section. a decoder that decodes a GOP containing the A clipped video is generated by excluding a frame that is located before the start frame of the replacement section in the display order from the video after replacement and that does not refer to frames subsequent to the start frame during encoding. a video clipping unit, an encoder that encodes the clipped video to generate a replacement stream, and a segment corresponding to the clipped video of the pre-replacement stream that is replaced with the replacement stream to generate the replacement stream. and a partial replacement unit that generates a subsequent stream, wherein the encoder sets the first frame in the decoding order of the replacement stream as an I picture, and the last frame in the display order of the replacement stream as a P picture or an I picture. It is characterized by being a picture .

さらに、本発明に係る映像符号化ストリーム編集装置において、前記映像切出部は、前記差替区間を含むGOPの、前記差替区間の前記始点フレームのピクチャタイプを識別し、該ピクチャタイプがIピクチャである場合には、前記差替後映像のうち、前記始点フレームから最終フレームまでを前記切出映像とし、該ピクチャタイプがIピクチャでない場合には、前記差替後映像のうち、表示順で前記始点フレームの前方の直近に位置するPピクチャ又はIピクチャの1枚後のフレームから最終フレームまでを前記切出映像とすることを特徴とする。 Further, in the coded video stream editing apparatus according to the present invention, the video clipping unit identifies a picture type of the start frame of the replacement section in a GOP including the replacement section, and the picture type is I. In the case of a picture, the clipped video is selected from the start frame to the final frame in the post-replacement video, and if the picture type is not an I-picture, the display order of the post-replacement video. , the frame from the frame one after the P-picture or I-picture located immediately ahead of the starting point frame to the last frame is used as the clipped video.

また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記映像符号化ストリーム編集装置として機能させることを特徴とする。 Further, in order to solve the above problems, a program according to the present invention is characterized by causing a computer to function as the video encoded stream editing device.

本発明によれば、映像符号化ストリームの任意のフレームを始点、終点とした区間を部分編集することができる。また、映像符号化ストリームを部分編集する際の品質劣化を低減することができる。 According to the present invention, it is possible to partially edit a section whose start point and end point are arbitrary frames of an encoded video stream. Also, it is possible to reduce quality deterioration when partially editing a video encoded stream.

本発明の一実施形態に係る映像符号化ストリーム編集装置の構成例を示すブロック図である。1 is a block diagram showing a configuration example of a video encoded stream editing device according to an embodiment of the present invention; FIG. 本発明の一実施形態に係る映像符号化ストリーム編集装置の動作例を示すフローチャートである。4 is a flowchart showing an operation example of the video encoded stream editing device according to one embodiment of the present invention; 本発明の一実施形態に係る映像符号化ストリーム編集装置の処理の具体例を説明する図である。FIG. 4 is a diagram illustrating a specific example of processing of the video encoded stream editing device according to one embodiment of the present invention; 編集後の符号化ストリームを正しく復号することができない例を説明する図である。FIG. 10 is a diagram illustrating an example in which an edited encoded stream cannot be decoded correctly; 編集後の符号化ストリームを正しく復号可能なものとする手法を説明する図である。FIG. 10 is a diagram illustrating a technique for making an edited encoded stream correctly decodable; 8Kスーパーハイビジョン映像を符号化した際における、ビットレートに対するPSNRを示すグラフである。FIG. 10 is a graph showing PSNR versus bit rate when encoding 8K Super Hi-Vision video; FIG.

以下、本発明の一実施形態について、図面を参照して詳細に説明する。 An embodiment of the present invention will be described in detail below with reference to the drawings.

図1に、本発明の一実施形態に係る映像符号化ストリーム編集装置1の構成例を示す。図1に示す映像符号化ストリーム編集装置1は、差替位置指定部11と、デコーダ12と、映像差替部13と、映像切出部14と、エンコーダ15と、部分差替部16と、を備える。 FIG. 1 shows a configuration example of a video encoded stream editing apparatus 1 according to one embodiment of the present invention. The video encoded stream editing device 1 shown in FIG. Prepare.

映像符号化ストリーム編集装置1は、フレーム間予測を用いて符号化された映像符号化ストリームの一部を別のストリームに差替える部分差替編集を行う装置である。以下の説明において、部分差替編集前の映像符号化ストリームを「差替前ストリーム」と称し、部分差替編集後の映像符号化ストリームを「差替後ストリーム」と称する。映像符号化ストリームはフレーム間予測を用いて符号化されているため、GOP構造はLong GOPとなる。ただし、本発明はClosed GOPを対象とし、Open GOPは対象外とする。 The video encoded stream editing device 1 is a device that performs partial replacement editing in which a part of a video encoded stream encoded using inter-frame prediction is replaced with another stream. In the following description, the coded video stream before partial replacement editing is referred to as "pre-replacement stream", and the video coded stream after partial replacement editing is referred to as "post-replacement stream". Since the video encoded stream is encoded using inter-frame prediction, the GOP structure is Long GOP. However, the present invention targets Closed GOP and excludes Open GOP.

送出サーバ20は、差替前ストリームを映像符号化ストリーム編集装置1のデコーダ12、部分差替部16、及び映像切出部14に送信する。また、送出サーバ20は、部分差替部16から、差替後ストリームを受信する。 The transmission server 20 transmits the pre-replacement stream to the decoder 12 , the partial replacement unit 16 and the video clipping unit 14 of the coded video stream editing device 1 . The transmission server 20 also receives the post-replacement stream from the partial replacement unit 16 .

差替位置指定部11は、映像符号化ストリーム編集装置1の操作者により部分差替編集の始点及び終点が指定されると、部分差替編集の始点及び終点を示す始点・終点情報を生成する。そして、差替位置指定部11は、始点・終点情報をデコーダ12、映像差替部13、映像切出部14、及び部分差替部16に出力する。始点及び終点の指定は、例えばストリーム内のタイムコードや、表示順のフレーム番号を用いて指定することができる。また、映像符号化ストリームの任意の2枚フレームをそれぞれ始点、終点として指定することができ、始点及び終点で設定される差替区間はGOP単位でなくてもよい。 When the operator of the video coded stream editing apparatus 1 designates the start point and end point of the partial replacement editing, the replacement position specifying unit 11 generates start point/end point information indicating the start point and end point of the partial replacement edit. . The replacement position specifying unit 11 then outputs the start point/end point information to the decoder 12 , the video replacement unit 13 , the video clipping unit 14 , and the partial replacement unit 16 . The start point and end point can be specified using, for example, the time code in the stream or the frame number in display order. Also, any two frames of the encoded video stream can be specified as the start point and the end point, respectively, and the replacement sections set at the start point and the end point need not be in units of GOPs.

デコーダ12は、差替位置指定部11から入力された始点・終点情報に基づいて、送出サーバ20から入力された差替前ストリームのうち、始点及び終点を含むGOP(すなわち、差替区間を含むGOPであり複数のGOPであってもよい)を復号して差替前映像を生成する。そして、デコーダ12は、生成した差替前映像を映像差替部13に出力する。 Based on the start point/end point information input from the replacement position specifying unit 11, the decoder 12 selects a GOP including the start point and the end point of the pre-replacement stream input from the transmission server 20 (that is, a GOP or a plurality of GOPs) is decoded to generate a video before replacement. The decoder 12 then outputs the generated video before replacement to the video replacement unit 13 .

映像差替部13は、映像符号化ストリーム編集装置1の周辺機器である編集機、録再機などから差替映像を取得する。また、映像差替部13は、デコーダ12から差替前映像を取得する。そして、映像差替部13は、差替位置指定部11から入力された始点・終点情報に基づいて、差替前映像の始点から終点(差替区間)の映像を差替映像に入れ換えて差替後映像を生成する。映像差替部13は、生成した差替後映像を映像切出部14に出力する。 The video replacement unit 13 acquires a replacement video from a peripheral device of the video encoded stream editing apparatus 1 such as an editing machine, a recording/reproducing device, or the like. Also, the video replacement unit 13 acquires the video before replacement from the decoder 12 . Then, based on the start point/end point information input from the replacement position specifying unit 11, the image replacement unit 13 replaces the image from the start point to the end point (replacement section) of the image before replacement with the replacement image. Generate a post-switch video. The video replacement unit 13 outputs the generated video after replacement to the video clipping unit 14 .

映像切出部14は、映像差替部13から入力された差替後映像のうち、差替区間の始点フレームよりも表示順で前に位置するフレームであって、符号化時に始点フレーム以降のフレームを参照しないフレームを除外した切出映像を生成する。そして、映像切出部14は、生成した切出映像をエンコーダ15に出力する。 The video clipping unit 14 extracts a frame that is located before the start frame of the replacement section in the display order in the video after replacement input from the video replacement unit 13, and that is after the start frame at the time of encoding. A clipped video is generated by excluding frames that do not refer to frames. Then, the video clipping unit 14 outputs the generated clipped video to the encoder 15 .

エンコーダ15は、映像切出部14から入力された切出映像を符号化して、差替ストリームを生成する。そして、エンコーダ15は、生成した差替ストリームを部分差替部16に出力する。差替ストリームの復号順で先頭のフレームは、Iピクチャとなる。 The encoder 15 encodes the clipped video input from the video clipping unit 14 to generate a replacement stream. The encoder 15 then outputs the generated replacement stream to the partial replacement unit 16 . The first frame in decoding order of the replacement stream is an I picture.

部分差替部16は、送出サーバ20から受信した差替前ストリームの切出映像に該当する区間を、エンコーダ15から入力された差替ストリームに差替えて差替後ストリームを生成する。そして、部分差替部16は、生成した差替後ストリームを送出サーバ20に送信する。 The partial replacement unit 16 replaces the section corresponding to the clipped video of the pre-replacement stream received from the transmission server 20 with the replacement stream input from the encoder 15 to generate the post-replacement stream. The partial replacement unit 16 then transmits the generated post-replacement stream to the transmission server 20 .

図2は、映像符号化ストリーム編集装置1の動作例を示すフローチャートである。図3は、映像符号化ストリーム編集装置1の処理の具体例を説明する図である。図2及び図3を参照して、映像符号化ストリーム編集装置1の動作について説明する。なお、図3において、フレームのカウントは表示順で行うものとする。すなわち、図3中のフレーム番号は表示順番号であるPOC(Picture Order Count)を意味するものとする。 FIG. 2 is a flow chart showing an operation example of the video encoded stream editing apparatus 1. As shown in FIG. FIG. 3 is a diagram for explaining a specific example of processing of the video encoded stream editing apparatus 1. As shown in FIG. The operation of the video encoded stream editing apparatus 1 will be described with reference to FIGS. 2 and 3. FIG. In FIG. 3, frames are counted in display order. That is, the frame number in FIG. 3 means a POC (Picture Order Count), which is a display order number.

映像符号化ストリーム編集装置1は、差替位置指定部11により、差替位置を指定する(ステップS101)。図3に示す例では、送出サーバ20から受信した差替前ストリームに対して、第nGOPの7フレーム目から10フレーム目の部分差替編集を行う。この場合、差替位置指定部11は、第nGOPの7フレーム目及び10フレーム目を示す情報を始点・終点情報として生成する。 The video encoded stream editing device 1 designates a replacement position using the replacement position designating unit 11 (step S101). In the example shown in FIG. 3, partial replacement editing of the 7th to 10th frames of the n-th GOP is performed on the pre-replacement stream received from the transmission server 20 . In this case, the replacement position specifying unit 11 generates information indicating the 7th and 10th frames of the n-th GOP as the start point/end point information.

次に、映像符号化ストリーム編集装置1は、デコーダ12により、差替前ストリームのうち、差替区間を含むGOPを復号して差替前映像を生成する(ステップS102)。図3に示す例では、デコーダ12は第nGOPを復号して差替前映像を生成する。 Next, the video encoded stream editing apparatus 1 decodes the GOP including the replacement section in the pre-replacement stream using the decoder 12 to generate the pre-replacement video (step S102). In the example shown in FIG. 3, the decoder 12 decodes the nth GOP to generate pre-substitution video.

次に、映像符号化ストリーム編集装置1は、映像差替部13により、差替映像を取得し、差替前映像の差替区間の映像を差替映像に入れ換えて、差替後映像を生成する(ステップS103)。図3に示す例では、映像差替部13は、差替映像として#1’,#2’,#3’,#4’を取得する。 Next, the video encoded stream editing device 1 acquires the replacement video by the video replacement unit 13, replaces the video in the replacement section of the video before replacement with the replacement video, and generates the video after replacement. (step S103). In the example shown in FIG. 3, the image replacement unit 13 acquires #1', #2', #3', and #4' as replacement images.

次に、映像符号化ストリーム編集装置1は、映像切出部14により、差替区間を含むGOPのGOP構造を確認し、差替区間の始点フレームのピクチャタイプを識別する。映像切出部14は、差替区間の始点フレームのピクチャタイプがIピクチャである場合には(ステップS104-Yes)、差替後映像のうち、始点フレームから最終フレームまでを切出映像とする(ステップS105)。 Next, the video coded stream editing apparatus 1 confirms the GOP structure of the GOP including the replacement section by the video clipping unit 14, and identifies the picture type of the starting frame of the replacement section. If the picture type of the start frame of the replacement section is an I picture (step S104-Yes), the video clipping unit 14 cuts out the video after replacement from the start frame to the final frame. (Step S105).

一方、映像切出部14は、差替区間の始点フレームのピクチャタイプがPピクチャ又はBピクチャである場合には(ステップS104-No)、差替後映像のうち、差替前ストリームの表示順(POC順)で始点フレームの前方の直近に位置するPピクチャ又はIピクチャの1枚後のフレーム位置(POC)を特定する。そして、差替後映像のうち、先に特定したフレーム位置(POC)に該当するフレームから最終フレームまでを切出映像とする(ステップS106)。 On the other hand, if the picture type of the start frame of the replacement section is a P picture or a B picture (step S104-No), the video clipping unit 14 determines the display order of the pre-replacement stream in the post-replacement video. A frame position (POC) after one P-picture or I-picture located immediately ahead of the starting frame (POC order) is specified. Then, of the post-replacement video, the frame corresponding to the frame position (POC) specified earlier to the final frame are taken as the clipped video (step S106).

図3に示す例では、差替区間の始点フレーム(B#7)のピクチャタイプがBピクチャであるため、映像切出部14は、始点フレーム(B#7)の前方の直近に位置するPピクチャ(P#5)の1枚後のフレーム位置(6フレーム目)を特定する。そして、差替後映像のうち、6フレーム目(#6)から最終フレーム(#12)までを切出映像とする。 In the example shown in FIG. 3, since the picture type of the start frame (B#7) of the replacement section is a B picture, the video clipping unit 14 selects the P picture located immediately before the start frame (B#7). Identify the frame position (sixth frame) one after the picture (P#5). Then, the sixth frame (#6) to the final frame (#12) of the post-replacement video are cut out.

次に、映像符号化ストリーム編集装置1は、エンコーダ15により、切出映像を符号化して差替ストリームを生成する(ステップS107)。その際、図3に示すように、差替ストリームの復号順で先頭のフレームをIピクチャとする。また、差替ストリームの表示順で最終のフレームをPピクチャ又はIピクチャとする。差替ストリームの他のピクチャタイプは任意であるが、Iピクチャが増えると符号化効率が低下するため、Bピクチャ又はPピクチャとするのが好適である。 Next, the video encoded stream editing apparatus 1 encodes the clipped video using the encoder 15 to generate a replacement stream (step S107). At this time, as shown in FIG. 3, the first frame in the decoding order of the replacement stream is the I picture. Also, the last frame in the display order of the replacement stream is the P-picture or the I-picture. Other picture types in the replacement stream are arbitrary, but B-pictures or P-pictures are preferred because the coding efficiency decreases as the number of I-pictures increases.

次に、映像符号化ストリーム編集装置1は、部分差替部16により、差替前ストリームの切出映像に該当する区間を差替ストリームに差替えて差替後ストリームを生成する(ステップS108)。図3に示す例では、差替後ストリームの第nGOPについて、最初の5フレーム(I#1,B#2,B#3,B#4,P#5)、及び最後の4フレーム(I#13,B#14,B#15,B#16)は差替前ストリームと同一である。よって、これらのフレームに関しては、再符号化による品質劣化が生じることはない。 Next, the video encoded stream editing apparatus 1 causes the partial replacement unit 16 to replace the section corresponding to the clipped video of the pre-replacement stream with the replacement stream to generate the post-replacement stream (step S108). In the example shown in FIG. 3, the first 5 frames (I#1, B#2, B#3, B#4, P#5) and the last 4 frames (I# 13, B#14, B#15, B#16) are the same as the pre-replacement stream. Therefore, quality degradation due to re-encoding does not occur for these frames.

以上、映像符号化ストリーム編集装置1について説明したが、映像符号化ストリーム編集装置1として機能させるためにコンピュータを用いることも可能である。そのようなコンピュータは、映像符号化ストリーム編集装置1の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。 Although the coded video stream editing device 1 has been described above, it is also possible to use a computer to function as the coded video stream editing device 1 . Such a computer stores a program describing the processing details for realizing each function of the video coded stream editing apparatus 1 in the memory of the computer, and the CPU of the computer reads and executes the program. can be realized by

また、このプログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、CD-ROMやDVD-ROMなどの記録媒体であってもよい。 Also, this program may be recorded on a computer-readable medium. It can be installed on a computer using a computer readable medium. Here, the computer-readable medium on which the program is recorded may be a non-transitory recording medium. The non-transitory recording medium is not particularly limited, but may be, for example, a recording medium such as CD-ROM or DVD-ROM.

上述したように、本発明においては、GOP構造がLong GOPである符号化ストリームに対して部分差替編集を施す際に、表示順で始点フレームより前に位置するフレームのうち、始点フレーム以降のフレームを参照しないフレームについては、元の編集前の映像符号化ストリームをそのまま利用する。よって、本発明によれば、映像符号化ストリームの部分編集を行っても、再符号化による画質劣化を低減することが可能となる。 As described above, in the present invention, when performing partial replacement editing on an encoded stream whose GOP structure is Long GOP, among the frames positioned before the starting frame in the display order, For frames that do not refer to frames, the original pre-edited video encoded stream is used as it is. Therefore, according to the present invention, it is possible to reduce deterioration in image quality due to re-encoding even if partial editing of a video encoded stream is performed.

上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。 Although the above embodiments have been described as representative examples, it will be apparent to those skilled in the art that many modifications and substitutions may be made within the spirit and scope of the invention. Therefore, the present invention should not be construed as limited by the embodiments described above, and various modifications and changes are possible without departing from the scope of the appended claims. For example, it is possible to combine a plurality of configuration blocks described in the configuration diagrams of the embodiments into one, or divide one configuration block.

1 映像符号化ストリーム編集装置
11 差替位置指定部
12 デコーダ
13 映像差替部
14 映像切出部
15 エンコーダ
16 部分差替部
20 送出サーバ
1 Video Encoded Stream Editing Apparatus 11 Substitution Position Designating Section 12 Decoder 13 Video Substitution Section 14 Video Clipping Section 15 Encoder 16 Partial Substitution Section 20 Sending Server

Claims (3)

フレーム間予測を用いて符号化された映像符号化ストリームに対して部分差替編集を行い、部分差替編集前の映像符号化ストリームである差替前ストリームから、部分差替編集後の映像符号化ストリームである差替後ストリームを生成する映像符号化ストリーム編集装置であって、
前記差替前ストリームのうち差替区間を含むGOPを復号して差替前映像を生成するデコーダと、
前記差替前映像の前記差替区間の映像を差替映像に入れ換えて差替後映像を生成する映像差替部と、
前記差替後映像のうち、前記差替区間の始点フレームよりも表示順で前に位置するフレームであって、符号化時に前記始点フレーム以降のフレームを参照しないフレームを除外した切出映像を生成する映像切出部と、
前記切出映像を符号化して、差替ストリームを生成するエンコーダと、
前記差替前ストリームの前記切出映像に該当する区間を前記差替ストリームに差替えて、前記差替後ストリームを生成する部分差替部と、
を備え
前記エンコーダは、前記差替ストリームの復号順で先頭のフレームをIピクチャとし、前記差替ストリームの表示順で最終のフレームをPピクチャ又はIピクチャとすることを特徴とする、映像符号化ストリーム編集装置。
Partial replacement editing is performed on a video coded stream encoded using inter-frame prediction, and a video code after partial replacement editing is obtained from a pre-replacement stream, which is a video coded stream before partial replacement editing. A coded video stream editing device that generates a post-replacement stream that is a coded stream,
a decoder that decodes a GOP including a replacement section in the pre-replacement stream to generate a pre-replacement video;
a video replacement unit that replaces the video in the replacement section of the pre-replacement video with a replacement video to generate a post-replacement video;
Generating a clipped video by excluding a frame, from the post-replacement video, which is located before the start frame of the replacement section in display order and which does not refer to frames subsequent to the start frame during encoding. a video clipping unit to
an encoder that encodes the clipped video to generate a replacement stream;
a partial replacement unit that replaces a section corresponding to the clipped video of the pre-replacement stream with the replacement stream to generate the post-replacement stream;
with
The encoded video stream, wherein the encoder sets the first frame in the decoding order of the replacement stream as an I picture, and the last frame in the display order of the replacement stream as a P picture or an I picture. editing device.
前記映像切出部は、前記差替区間を含むGOPの、前記差替区間の前記始点フレームのピクチャタイプを識別し、
該ピクチャタイプがIピクチャである場合には、前記差替後映像のうち、前記始点フレームから最終フレームまでを前記切出映像とし、
該ピクチャタイプがIピクチャでない場合には、前記差替後映像のうち、表示順で前記始点フレームの前方の直近に位置するPピクチャ又はIピクチャの1枚後のフレームから最終フレームまでを前記切出映像とする
ことを特徴とする、請求項1に記載の映像符号化ストリーム編集装置。
The video clipping unit identifies a picture type of the starting frame of the replacement section in a GOP including the replacement section,
if the picture type is an I-picture, of the post-replacement video, from the start point frame to the final frame are taken as the clipped video;
If the picture type is not an I-picture, the switching from the frame one after the P-picture or I-picture positioned immediately before the start-point frame in display order to the final frame in the post-replacement video. 2. The coded video stream editing apparatus according to claim 1, wherein the coded video stream is an output video.
コンピュータを、請求項1又は2に記載の映像符号化ストリーム編集装置として機能させるためのプログラム。 A program for causing a computer to function as the video encoded stream editing device according to claim 1 or 2.
JP2018245893A 2018-12-27 2018-12-27 VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM Active JP7273504B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018245893A JP7273504B2 (en) 2018-12-27 2018-12-27 VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018245893A JP7273504B2 (en) 2018-12-27 2018-12-27 VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM

Publications (2)

Publication Number Publication Date
JP2020108032A JP2020108032A (en) 2020-07-09
JP7273504B2 true JP7273504B2 (en) 2023-05-15

Family

ID=71449553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018245893A Active JP7273504B2 (en) 2018-12-27 2018-12-27 VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM

Country Status (1)

Country Link
JP (1) JP7273504B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113079406A (en) * 2021-03-19 2021-07-06 上海哔哩哔哩科技有限公司 Video processing method and device

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002058023A (en) 2000-08-09 2002-02-22 Mitsubishi Electric Corp Encoding picture signal transmitting system
JP2002300528A (en) 2001-03-30 2002-10-11 Toshiba Corp Method and device for editing video stream
JP2007104182A (en) 2005-10-03 2007-04-19 Nec Electronics Corp Image coding device, image coding method, and image editing device
JP2008066845A (en) 2006-09-05 2008-03-21 Sony Corp Information processing apparatus and method, recording medium, and program
JP2010154502A (en) 2008-11-28 2010-07-08 Sony Corp Device and method for editing image
US20160217827A1 (en) 2015-01-28 2016-07-28 Electronics And Telecommunications Research Institute Method and apparatus for processing video stream

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3493872B2 (en) * 1996-02-29 2004-02-03 ソニー株式会社 Image data processing method and apparatus

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002058023A (en) 2000-08-09 2002-02-22 Mitsubishi Electric Corp Encoding picture signal transmitting system
JP2002300528A (en) 2001-03-30 2002-10-11 Toshiba Corp Method and device for editing video stream
JP2007104182A (en) 2005-10-03 2007-04-19 Nec Electronics Corp Image coding device, image coding method, and image editing device
JP2008066845A (en) 2006-09-05 2008-03-21 Sony Corp Information processing apparatus and method, recording medium, and program
JP2010154502A (en) 2008-11-28 2010-07-08 Sony Corp Device and method for editing image
US20160217827A1 (en) 2015-01-28 2016-07-28 Electronics And Telecommunications Research Institute Method and apparatus for processing video stream

Also Published As

Publication number Publication date
JP2020108032A (en) 2020-07-09

Similar Documents

Publication Publication Date Title
US6674796B1 (en) Statistical multiplexed video encoding for diverse video formats
US9716896B2 (en) Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method
EP2839647B1 (en) Constraints and unit types to simplify video random access
JP3181037B2 (en) Method of embedding and extracting additional data in encoded data stream
TW545064B (en) Methods and apparatus for transcoding progressive I-slice refreshed MPEG data streams to enable trick play mode features on a television appliance
JP3840895B2 (en) Video encoded data conversion apparatus and method
JP7045800B2 (en) Converting from the Open Group of Pictures to the Closed Group of Pictures in interframe video compression
JP6367030B2 (en) Streaming distribution system
JP2010232720A (en) Image encoding method and image decoding method
JPH10145798A (en) System for processing digital coding signal
JP2008066847A (en) Information processor and information processing method, recording medium, and program
US10582208B2 (en) Video encoding apparatus, video decoding apparatus, video encoding method, and video decoding method
JP2009207163A (en) Decoding device and method, and recording medium
EP2642764B1 (en) Transcoding a video stream to facilitate accurate display
JP7273504B2 (en) VIDEO ENCODED STREAM EDITING DEVICE AND PROGRAM
US8594195B2 (en) Method and apparatus for encoding and decoding at least one image frame that is artificially inserted into image sequence
JP4833923B2 (en) Transcoding device, transcoder, decoder and transcoding method
JP4301237B2 (en) Encoding apparatus and method thereof, recording apparatus and method thereof, and recording medium
JP2021197643A (en) Video code stream editing device and program
JP4399744B2 (en) Program, information processing apparatus, information processing method, and recording medium
CN113784209B (en) Multimedia data stream processing method and device
JP2004007571A (en) Coding instrument and methodology, decoding instrument and method, compiling apparatus and method, record medium, as well as program
CN107005704B (en) Method and apparatus for processing encoded video data and method and apparatus for generating encoded video data
JP2008066845A (en) Information processing apparatus and method, recording medium, and program
JP2015065528A (en) Picture editing device, picture editing method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211126

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221223

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230428

R150 Certificate of patent or registration of utility model

Ref document number: 7273504

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150