KR20100010605A - A transfer device of encoded data of analog camera signals on networks and a method for composing images therefor - Google Patents
A transfer device of encoded data of analog camera signals on networks and a method for composing images therefor Download PDFInfo
- Publication number
- KR20100010605A KR20100010605A KR1020080071550A KR20080071550A KR20100010605A KR 20100010605 A KR20100010605 A KR 20100010605A KR 1020080071550 A KR1020080071550 A KR 1020080071550A KR 20080071550 A KR20080071550 A KR 20080071550A KR 20100010605 A KR20100010605 A KR 20100010605A
- Authority
- KR
- South Korea
- Prior art keywords
- frame
- analog
- signal
- network
- video
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/12—Systems in which the television signal is transmitted via one channel or a plurality of parallel channels, the bandwidth of each channel being less than the bandwidth of the television signal
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
이 발명은 아날로그 카메라로 찍은 영상신호를 디지털 데이터로 부호화하여 얻어지는 데이터를 네트워크 상에서 전송하는 장치 및 이 장치를 위한 영상 구성 방법에 대한 것이다. 특히 이 발명은 기존의 아날로그 카메라와 분리된 부호화된 아날로그 영상신호 데이터의 네트워크 전송 장치 및 I-Frame, P-Frame, P'-Frame 및 B-Frame을 이용한 영상 구성 방법에 대한 것이다.The present invention relates to an apparatus for transmitting data obtained by encoding an image signal taken by an analog camera into digital data on a network, and a method of constructing an image for the apparatus. In particular, the present invention relates to a network transmission apparatus of encoded analog video signal data separated from a conventional analog camera and a video composition method using I-Frame, P-Frame, P'-Frame and B-Frame.
종래 이 분야의 기술로는 디지털카메라에 의해 디지털 영상이 얻어지면 그것을 네트워크로 전송하는 장치에 대해 알려져 있었다. 그리고 그 이전에는 아날로그 카메라에 의해 아날로그 영상이 얻어지면 그것을 디지털 신호로 바꾸어서 네트워크로 전송하는 장치에 대해 알려져 있었다. 그러나 이러한 종래의 장치들은 처음부터 디지털 장치이거나, 아니면 아날로그 카메라와 디지털 신호 변환장치가 일체로 이루어져 있었기에 부피도 크고 고가였으며, 기존에 널리 보급된 아날로그 카메라를 소지한 사용자들은 자신이 찍은 아날로그 영상물을 네트워크를 통해 네트워크에 연 결된 디지털 출력장치 등으로 전송하는 것이 불가능하였다. 따라서 기존에 보급된 아날로그 카메라 소지자들이 자신이 보유하고 있는 아날로그 카메라를 폐기하지 않고 또 비싼 아날로그/디지털카메라 일체형 디지털 데이터 전송장치를 별도로 구입하지 않고도 디지털 출력장치로 전송할 수 있는 기술의 등장이 필요하였다.In the prior art, there is a known device for transmitting a digital image by a digital camera to a network. Previously, it was known about a device that converts an analog image into an digital signal when it is obtained by an analog camera and transmits it to a network. However, these conventional devices were bulky and expensive because they were digital devices from the beginning, or were composed of analog cameras and digital signal converters, and users with existing analog cameras could network their analog video footage. It was not possible to transmit to a digital output device connected to the network through the network. Therefore, there has been a need for the emergence of a technology that allows analog camera holders to transmit to digital output devices without discarding their own analog cameras and without purchasing expensive analog / digital camera integrated digital data transmission devices.
그리고 종래에는 영상 구성을 하는 방법에 있어서, I-Frame, P-Frame 및 B-Frame 만을 이용하여 대용량의 영상데이터를 외부 출력장치로 전송하는 데 시간이 많이 소요되었고 데이터 용량도 커지는 문제점이 있었다. 따라서 이러한 문제점들을 해결하기 위해 이들 프레임을 보다 효율적으로 생성할 수 있는 방법의 모색이 필요하였다.In the conventional method of configuring an image, a large amount of time is required to transmit a large amount of image data to an external output device using only I-Frame, P-Frame, and B-Frame. Therefore, in order to solve these problems, it was necessary to find a way to generate these frames more efficiently.
이 발명은 종래 아날로그 카메라를 이용하여 디지털 데이터 출력장치로 아날로그 카메라로 찍은 영상데이터를 네트워크로 전송할 수 있는 장치 및 이 장치를 위한 영상 구성 방법을 제공하는 것을 목적으로 한다.An object of the present invention is to provide an apparatus capable of transmitting image data taken by an analog camera to a network using a conventional analog camera and a method of constructing an image for the apparatus.
이 발명의 다른 목적과 장점은 하기된 발명의 상세한 설명을 읽고 첨부된 도면을 참조하면 보다 명백해질 것이다.Other objects and advantages of the present invention will become more apparent from the following detailed description of the invention and the accompanying drawings.
이 발명에 따른 부호화된 아날로그 영상신호 데이터의 네트워크 전송 장치는, 네트워크에 연결되며 외부의 아날로그 동영상 촬영수단으로부터 입력받은 아날로그 신호를 디지털신호로 바꾼 뒤 네트워크에 연결된 외부 디지털 출력장치로 TCP/IP, RTP, UDP를 포함한 공지의 통신방식을 통해 전송하는 장치로서,The network transmission apparatus of the encoded analog video signal data according to the present invention is connected to a network, and converts the analog signal received from an external analog video recording means into a digital signal, and then connects the TCP / IP, RTP to an external digital output device connected to the network. A device for transmitting through a known communication method including UDP,
아날로그 동영상 촬영수단으로부터 입력되는 아날로그 영상 신호를 디지털 신호로 바꿔주기 위한 아날로그/디지털 변환기;An analog / digital converter for converting an analog video signal input from the analog video photographing means into a digital signal;
위 아날로그/디지털 변환기에 의해 디지털로 변환된 아날로그 영상 신호를 부호화하기 위한 코덱(codec);A codec for encoding an analog image signal digitally converted by the analog / digital converter;
위 코덱에 의해 부호화된 영상 신호로부터 I-Frame, B-Frame, P-Frame, P'-Frame값을 계산하기 위한 DSP; A DSP for calculating I-Frame, B-Frame, P-Frame, and P'-Frame values from the video signal encoded by the above codec;
위 DSP에 의해 계산된 I-Frame, B-Frame, P-Frame, P'-Frame값으로부터 얻어지는 영상 신호를 저장하기 위한 저장수단; Storage means for storing an image signal obtained from I-Frame, B-Frame, P-Frame, and P'-Frame values calculated by the DSP;
위 저장수단에 저장된 부호화된 영상 신호를 네트워크에 연결된 외부 출력장치로 전송하기 위한 네트워크 인터페이스부; 및A network interface unit for transmitting the encoded video signal stored in the storage unit to an external output device connected to a network; And
위 각 구성요소를 전체적으로 제어하는 중앙처리장치를 포함하여 이루어지는 것을 특징으로 한다.It characterized in that it comprises a central processing unit for controlling the above components as a whole.
이 실시예에 있어서, 위 장치로 입력되는 아날로그 영상신호는 composite video in 신호, S-video in 신호 및 component video in 신호인 것이 바람직하다.In this embodiment, the analog video signal input to the above device is preferably a composite video in signal, S-video in signal and component video in signal.
이 실시예에 있어서, 위 네트워크에 연결된 외부 출력장치들은 위 전송 장치로부터 영상신호를 전송받기 위해서 소정의 영상신호 수신 프로그램을 설치하여야 하는 것을 특징으로 한다.In this embodiment, the external output devices connected to the network are required to install a predetermined video signal receiving program in order to receive the video signal from the transmission device.
이 실시예에 있어서, 위 영상신호 수신 프로그램은 네트워크 전송 장치가 제공하는 영상신호를 복호화 하기 위한 코덱인 것이 바람직하다.In this embodiment, the video signal receiving program is preferably a codec for decoding the video signal provided by the network transmission device.
이 실시예에 있어서, 위 네트워크에 연결된 외부 출력장치는 PC, 디지털 TV, 휴대폰, PMP를 포함하며 TCP/IP, RTP, UDP를 포함한 공지의 통신방식을 통해 데이터 송수신 기능을 구비한 모든 출력장치인 것이 바람직하다.In this embodiment, the external output devices connected to the network are all output devices including a PC, a digital TV, a mobile phone, a PMP, and having a data transmission / reception function through a known communication method including TCP / IP, RTP, and UDP. It is preferable.
이 실시예에 있어서, 위 코덱은 인디오(indeo), MPEG1, MPEG2, MPEG4, MOV, DivX, AVI, 및 H.264를 포함하는 것이 바람직하다.In this embodiment, the codec preferably includes indio, MPEG1, MPEG2, MPEG4, MOV, DivX, AVI, and H.264.
이 발명에 따른 I-Frame, P-Frame, B-Frame 및 P'-Frame을 사용한 영상 구성 방법은, 네트워크에 연결된 영상신호 데이터의 네트워크 전송 장치가 외부의 아날로그 동영상 촬영수단으로부터 입력받은 아날로그 신호를 디지털신호로 바꾼 뒤 네트워크에 연결된 외부 디지털 출력장치로 TCP/IP, RTP, UDP를 포함한 공지의 통신방식을 통해 영상신호 데이터를 전송하기 위한 영상 구성 방법으로서,Image construction method using I-Frame, P-Frame, B-Frame and P'-Frame according to the present invention, the network transmission device of the video signal data connected to the network receives the analog signal received from the external analog video recording means A video composition method for transmitting video signal data through a known communication method including TCP / IP, RTP, and UDP to an external digital output device connected to a network after converting it into a digital signal.
위 네트워크 전송 장치가 위 아날로그 동영상 촬영수단으로부터 입력받은 아날로그 신호를 디지털 신호로 바꾼 뒤 I-Frame을 생성하는 단계;Generating, by the network transmission device, an I-Frame after converting an analog signal received from the analog video photographing means into a digital signal;
위 I-Frame이 생성되면, 이동 벡터와 차 벡터를 계산하는 단계;Calculating the motion vector and the difference vector when the I-Frame is generated;
위에서 이동 벡터와 차 벡터가 구해지면, P-Frame을 생성하는 단계;Generating a P-Frame when the motion vector and the car vector are obtained from the above;
위에서 P-Frame이 생성되면 I-Frame과 P-Frame을 비교해서 이동위치를 표시하는 예측 이동 벡터와, I-Frame과 P-Frame을 비교하여 변화된 위치를 표시하는 예측 차 벡터를 계산하는 단계;Calculating a predicted motion vector indicating a moving position by comparing the I-Frame and the P-Frame when the P-Frame is generated, and calculating a predictive difference vector indicating the changed position by comparing the I-Frame and the P-Frame;
위에서 계산된 예측 이동 벡터와 예측 차 벡터값이 각각 3 이상인지 여부를 판단하는 단계;Determining whether each of the predicted motion vector and the predicted difference vector value calculated above is 3 or more;
위 판단 결과 계산된 예측 이동 벡터와 예측 차 벡터값이 각각 3 이상이면 P'-Frame을 생성하고, 그렇지 않으면 B-Frame을 생성하는 단계;Generating a P'-Frame if the predicted motion vector and the predicted difference vector value calculated as the above result are 3 or more, respectively, otherwise generating a B-Frame;
위에서 생성된 P'-Frame, B-Frame을 내부 저장수단에 저장하는 단계; 및Storing the generated P'-Frame and B-Frame in the internal storage means; And
TCP/IP 통신 기능을 구비한 외부 출력장치가 위 저장수단에 저장된 P'-Frame 및 B-Frame을 전송받아 출력하는 단계를 구비하여 이루어지며,And an external output device having a TCP / IP communication function receives and outputs the P'-Frame and the B-Frame stored in the storage means.
P-Frame의 기준은 항상 최근의 I-Frame이며, P'-Frame의 기준은 항상 최근의 P-Frame이며, B-Frame의 기준은 항상 최근의 I-Frame과 P-Frame인 것을 특징으로 한다.The criterion of P-Frame is always the latest I-Frame, the criterion of P'-Frame is always the latest P-Frame, and the criterion of B-Frame is always the latest I-Frame and P-Frame. .
이 실시예에 있어서, 이동 벡터 탐색을 정확히 하고 코덱으로 데이터를 부호화시 계산량을 줄이기 위해 매크로 블록(Macro Block) 크기를 32×32로 설정하여 P'-Frame을 생성하는 것이 바람직하다.In this embodiment, it is preferable to generate a P'-Frame by setting the size of the macro block to 32 x 32 so as to accurately search the motion vector and reduce the amount of computation when encoding data with the codec.
이 실시예에 있어서, Bit Rate 감소를 위해 P'-Frame과 B-Frame의 생성시간을 짧게 하고 P'-Frame과 B-Frame의 크기를 작게 하며 네트워크 속도에 따라 B-Frame으로 Bit Rate를 조절하는 것이 바람직하다.In this embodiment, to reduce the bit rate, shorten the generation time of P'-Frame and B-Frame, reduce the size of P'-Frame and B-Frame, and adjust the Bit Rate with B-Frame according to the network speed. It is desirable to.
이 실시예에 있어서, 위 I-Frame, P-Frame, B-Frame 및 P'-Frame의 계산은 DSP가 하는 것이 바람직하다.In this embodiment, the calculation of the above I-Frame, P-Frame, B-Frame and P'-Frame is preferably performed by the DSP.
이 발명의 실시로 인해 기존에 널리 보급된 아날로그 카메라를 이용하여 찍은 아날로그 영상데이터를 근래 새로이 보급되고 있는 디지털 데이터 출력장치로 네트워크를 통해 전송하여 사용자가 고가의 디지털카메라 일체형 셋 톱 박스(set- top box)를 구입하지 않고도 기존의 아날로그 카메라로 찍은 영상데이터를 볼 수 있어서 경제적이다. 즉 이 발명의 실시에 의해 경제성이 확보되고, 종래의 아날로그 카메라를 폐기하지 않고 사용할 수 있어서 막대한 자원 낭비를 예방할 수 있으므로 깨끗한 지구환경을 보존하는데에도 일조를 할 수 있다.Due to the implementation of the present invention, analog image data taken using existing analog cameras, which have been widely used, is transmitted to a newly distributed digital data output device through a network, thereby allowing a user to set up an expensive digital camera integrated set-top box. It is economical because you can view the image data taken by the existing analog camera without purchasing the box. In other words, by implementing the present invention, economical efficiency can be ensured, and the conventional analog camera can be used without disposal, which can prevent enormous resource waste, thus contributing to preservation of a clean global environment.
도 1을 참조하여 이 발명의 구성 및 동작원리에 대하여 설명한다. 도 1은 이 발명에 따른 아날로그 영상 데이터를 디지털 영상 데이터로 부호화하여 네트워크상으로 전송하기 위한 장치의 블록 구성도이다. 이 발명의 부호화된 아날로그 영상신호 데이터의 네트워크 전송 장치(A transfer device of encoded data of analog camera signals on networks)(100)의 구성은, 외부의 아날로그 카메라(60)로부터 이 장치로 입력되는 아날로그 영상 신호를 디지털 신호로 바꿔주기 위한 아날로그/디지털 변환기(10), 디지털로 변환된 신호를 부호화하기 위한 코덱(codec)(20), 위 코덱에 의해 부호화된 영상 신호로부터 I-Frame, B-Frame, P-Frame, P'-Frame값을 계산하기 위한 DSP(80), 위 DSP(80)에 의해 계산된 I-Frame, B-Frame, P-Frame, P'-Frame값으로부터 얻어지는 영상 신호를 저장하기 위한 저장수단(50), 위 저장수단에 저장된 부호화된 영상신호를 네트워크로 전송하기 위한 네트워크 인터페이스부(30), 및 위 각 구성 요소들(10)(20)(30)((50),(80)을 전체적으로 제어하는 중앙처리장치(40)를 포함하여 이루어진다. With reference to FIG. 1, the structure and operation principle of this invention are demonstrated. 1 is a block diagram of an apparatus for encoding analog image data into digital image data according to the present invention and transmitting it over a network. The configuration of the A transfer device of encoded data of analog camera signals on
이때 코덱으로서는 공지의 여러가지 코덱을 사용할 수 있다. 예를 들어서, 인텔이 제안하여 많이 사용되고 있는 인디오(indeo), 동영상 편집기에서 사용되는 마이크로소프트가 개발한 엠펙(MPEG1, MPEG2, MPEG4 버전 등), 애플사의 MOV, MPEG4를 발전시킨 DivX, AVI, H.264 등 여러 종류의 코덱이 사용가능하다. At this time, various well-known codecs can be used as a codec. For example, Intel suggests and uses the most popular indios, MPEG developed by Microsoft for use in video editors (MPEG1, MPEG2, MPEG4 versions, etc.), Apple's MOV, and MPEG4. Various codecs such as .264 can be used.
그리고 이 발명의 부호화된 아날로그 영상신호 데이터의 네트워크 전송 장치(100)에서 출력되는 부호화된 신호는 네트워크(예로서 인터넷망)로 전송되고, 네트워크에 연결된 디지털 출력장치들(70)(예로서, PC, 디지털 TV, 휴대폰, PMP 등.)을 통해 재생이 가능하다. 이때 네트워크로 부호화된 신호를 전송하는 방식은 공지의 TCP/IP, RTP, UDP 등의 공지의 IP접속 기술을 이용하여 이루어진다. 따라서 이 발명에서는 이들 공지의 기술에 대해서 별도의 설명을 하지는 않는다.The encoded signals output from the
즉 위 네트워크 전송장치(100) 내의 저장수단(50)에 부호화된 신호를 저장하고 있으면, 인터넷에 연결된 PC(70)는 통상의 IP접속을 통해 네트워크 인터페이스부(30)에 접속한 뒤 위 저장수단(50)에 저장된 부호화된 영상신호를 가져와서 PC(70) 안의 코덱으로 복호화하여 모니터로 출력하여 원래의 영상을 재생한다. 일반적인 TCP/IP 통신 인터페이스를 구비하고 있는 장치는 모두 이 발명의 네트워크 전송장치(100)를 이용할 수 있다. 같은 방식으로 핸드폰, PMP 및 디지털 TV에서도 아날로그 카메라(60)로 찍은 영상을 볼 수 있다.That is, if the encoded signal is stored in the storage means 50 in the
한편 이 발명에 따른 네트워크 전송장치(100)로 입력되는 아날로그 카메라(60)를 통해 촬영한 아날로그 영상신호에는 composite video in 신호(signal 10), S-video in 신호(signal 20) 및 component video in 신호(signal 30)가 포함 된다. 이들 세 가지 신호가 동시에 이 발명에 따른 네트워크 전송장치(100)로 입력된다. Meanwhile, the analog video signal captured by the
composite video in 신호(signal 10)는 비디오신호와 오디오신호가 혼합된 신호이며, S-video in 신호(signal 20)는 composite video in 신호(signal 10)와 코덱방식이 다르며, component video in 신호(signal 30)는 RGB 신호다.The composite video in signal (signal 10) is a signal mixed with a video signal and an audio signal, and the S-video in signal (signal 20) is different from the composite video in signal (signal 10) and a codec method, and the component video in signal (signal). 30 is an RGB signal.
도 4의 흐름도는 이 발명에 따른 도 1의 장치에 적합한 영상을 구성하기 위한 방법을 나타내고 있고, 도 5는 I-Frame, P-Frame 및 P'-Frame의 관계를 예시하고 있다. 그리고 도 6은 이 발명에 따른 아날로그 영상 데이터를 디지털 영상 데이터로 부호화하여 네트워크상으로 전송하기 위한 방법의 흐름을 나타내고 있다. 이제 이 방법을 설명하기에 앞서 몇 가지 용어에 대한 정의를 내리기로 한다.The flowchart of FIG. 4 shows a method for constructing an image suitable for the device of FIG. 1 according to the invention, and FIG. 5 illustrates the relationship of I-Frame, P-Frame and P'-Frame. 6 shows a flow of a method for encoding analog image data into digital image data according to the present invention and transmitting it over a network. Before we explain this method, let's define some terms.
1. 용어 정의1. Definition of terms
< 정의 1 > GOP(Group of Pictures)<Definition 1> GOP (Group of Pictures)
GOP는 인코딩시 가장 기본이 되는 것으로서, 키 프레임부터 다음 키 프레임까지의 프레임 모음을 뜻한다. 영상을 구성하는 프레임 타입에는 I-Frame(이하 간단히 I로 표시한다), P-Frame(이하 간단히 P로 표시한다), B-Frame(이하 간단히 B로 표시한다)의 세 가지가 있다. 이 프레임들의 순서는 I, B, B, P, B, B, P, B, B, P, B, B, I, B, B, P, ... 와 같은 방식으로 I-Frame들 사이에 P-Frame들이, I-Frame과 P-Frame 사이에 B 프레임이 들어가는 방식으로 구성된다. 그리고 I-Frame 부터 다음 I-Frame 전까지를 하나의 GOP로 묶고, GOP 크기는 그 프레임들의 갯수가 되므로 위와 같은 경우엔 GOP 크기는 12가 된다. 그리고 P-Frame의 갯수는 GOP 안에 들어가는 P-Frame의 갯수고, B 프레임의 갯수는 I/P 프레임 사이에 들어가는 B-Frame의 갯수이므로, 위의 경우 P-Frame의 갯수는 3, B-Frame의 갯수는 2가 된다. GOP is the most basic element in encoding. It is a collection of frames from a key frame to the next key frame. There are three frame types constituting an image: I-Frame (hereinafter simply referred to as I), P-Frame (hereinafter simply referred to as P), and B-Frame (hereinafter simply referred to as B). The order of these frames is between I-Frames in the same way as I, B, B, P, B, B, P, B, B, P, B, B, I, B, B, P, ... P-Frames are constructed in such a way that a B frame is inserted between an I-Frame and a P-Frame. And from I-Frame to the next I-Frame, one GOP is grouped and the GOP size is the number of frames, so the GOP size becomes 12 in the above case. Since the number of P-Frames is the number of P-Frames in the GOP, and the number of B frames is the number of B-Frames between I / P frames, the number of P-Frames is 3 and B-Frame. The number of will be two.
< 정의 2 > 프레임(Frame)<Definition 2> Frame
이 발명에서 프레임은 하나의 화면을 뜻한다. 프레임의 크기는 픽셀 단위로 지정할 수 있으며, 전체 화면에서 차지하는 비율을 % 단위로 지정할 수도 있다. In this invention, a frame means one screen. The size of the frame can be specified in pixels and the percentage of the entire screen can be specified in%.
< 정의 3 > 전체 화면(Full Frame)<Definition 3> Full Frame
전체 화면은 아날로그 텔레비젼의 전체 스크린(Full Screen)에서 가로(넓이)와 세로(높이)의 비율이 4:3인 영상비(Aspect Ratio: AR)를 갖는 경우의 화면을 말한다. 4:3 영상비는 1.33:1 영상비 또는 간단히 1.33 영상비라고도 표현한다. 이러한 영상비를 갖는 스크린을 전체 스크린이라고도 부른다. 따라서 이러한 영상비를 갖는 비디오 신호는 아날로그 텔레비젼의 전체 스크린을 꽉 채운다. 그리고 4:3 텔레비젼에서 와이드스크린 비디오(Widescreen Video)를 적절히 보기 위해서는 수직방향으로 압축시키야 하므로 스크린의 일부분만 영상을 위해 이용되는 셈이다.The full screen refers to a screen having an aspect ratio (AR) in which a ratio of width (width) to height (height) is 4: 3 in the full screen of an analog television. 4: 3 aspect ratio is also referred to as 1.33: 1 aspect ratio or simply 1.33 aspect ratio. Screens having such aspect ratios are also called full screens. Thus, a video signal with this aspect ratio fills the entire screen of an analog television. And in order to properly view widescreen video on a 4: 3 television, it must be compressed vertically, so only part of the screen is used for video.
< 정의 4 > I-프레임(Intra coded Frames)<Definition 4> In-coded Frames
I-Frame은 카메라로 찍은 영상 전체를 압축(coding)하여 얻어지는 모든 화 소(pixel)의 좌표정보를 나타내는 데이터로서 키 프레임이라고도 한다. 그래서 I-Frame은 다른 Frame들에 비해 화질은 가장 좋지만 용량은 가장 크다. I-Frame은 전체 화면(Full Frame) 정보를 가지고 있고, 영상이 적절히 재생되기 전 또는 재생된 뒤에는 그 화면으로부터 어떤 다른 정보도 필요로 하지 않는다. 즉 I-Frame은 독립적인 프레임이고, random access가 가능한 프레임이다. I-Frame은 가장 기본이 되는 프레임으로서 앞뒤 프레임에 상관없이 인코딩과 디코딩이 가능한 프레임이다. 즉, 현재 화상 내의 정보만으로 압축이 행해진다. 압축 특성상 I-Frame은 FF/REW를 위한 Random access나 고속 재생을 실현하기 위하여 종종 사용된다.I-Frame is data that represents the coordinate information of all pixels obtained by compressing the entire image taken by the camera and is also called a key frame. Therefore, I-Frame has the best image quality but the largest capacity compared to other frames. I-Frames have full frame information and do not need any other information from the screen before or after the video has been played properly. In other words, I-Frame is an independent frame and a random access frame. I-Frame is the most basic frame and can be encoded and decoded regardless of front and rear frame. In other words, compression is performed only with information in the current image. Due to the nature of compression, I-Frame is often used to realize random access or fast playback for FF / REW.
< 정의 5 > 내부 화면(Inline Frame)<Definition 5> Inline Frame
내부 화면은 하나의 화면 안에 만들어지는 또 하나의 작은 화면을 뜻하며, 내부화면을 생성한다는 것은 화면을 전체적으로 분할하는 것을 말한다. 하나의 화면 안에는 다수개의 내부 화면이 있을 수 있다. The internal screen is another small screen created in one screen, and creating an internal screen means dividing the screen as a whole. There may be a plurality of internal screens in one screen.
< 정의 6 > P-Frame(Predictive Frame)<Definition 6> P-Frame (Predictive Frame)
P-Frame은 이전에 코딩되었던 I-Frame 또는 P-Frame을 참조하여 공통점을 찾고, 공통되지 않는 부분에 대해서만 코딩하여 얻어지는 프레임이다. 즉 P-Frame은 이전에 나온 키 프레임의 정보를 바탕으로 구성되는 프레임이고, 화질과 용량이 I-Frame과 B-Frame의 중간급이다. 이처럼 P-Frame은 전체 화면에 대한 정보를 나타내는 것이 아니고, I-Frame을 추종하여 선행하는 I-Frame의 바뀐 정보만 나타낸다. 그리고 P-Frame을 델타 프레임(Delta Frame)이라고도 하며, P-Frame은 움직임 보상기법을 이용한다. P-Frame에서는 이전 프레임과 현재 프레임과의 오차를 계산하여 이전 프레임의 해당블록과의 오차가 임계치보다 크면 DCT를 수행하고, 오차가 임계치보다 작으면 유사한 블록의 방향 방향벡터 정보만을 압축하는 방법을 사용한다. P-Frame을 구하는 식은 다음과 같다:The P-Frame is a frame obtained by finding commonalities by referring to previously-coded I-Frames or P-Frames, and coding only for portions that are not common. In other words, P-Frame is a frame composed based on the information of the previous key frame, and the quality and capacity are intermediate between I-Frame and B-Frame. As such, the P-Frame does not represent information on the entire screen, but only changed information of the preceding I-Frame following the I-Frame. The P-Frame is also called a delta frame, and the P-Frame uses a motion compensation technique. The P-Frame calculates the error between the previous frame and the current frame and performs DCT when the error of the corresponding block of the previous frame is larger than the threshold, and compresses only the direction direction vector information of similar blocks when the error is smaller than the threshold. use. The equation for the P-Frame is:
P-Frame = 이전 프레임 - 현재 프레임 + MV(Motion Vector)P-Frame = Previous Frame-Current Frame + Motion Vector (MV)
P-Frame은 I-Frame으로부터의 이동벡터값만 전송하고 기준은 항상 최근의 I-Frame이 된다. 도 5의 예에서 한 점(20,21)에서 다른 점(18,25)으로 이동한 벡터(화살표 P로 표시됨)가 P-Frame이다. 이 발명에서는 특별히 P-Frame을 이전에 코딩되었던 I-Frame만을 참조하여 공통점을 찾고, 공통되지 않는 부분에 대해서만 코딩하여 얻어지는 프레임이다The P-Frame only transmits the motion vector value from the I-Frame, and the reference is always the latest I-Frame. In the example of FIG. 5, a vector (denoted by arrow P) moving from one
< 정의 7 > Motion Estimation<Definition 7> Motion Estimation
Motion Estimation은 인코딩시 현재 프레임의 Macro Block 단위인 16×16 또는 8×8 블록 단위를 기준으로 이전 프레임의 해당 블록 주위의 일정 영역을 탐색하여 유사한 블록을 찾아내는 과정이다. 이때 탐색영역을 Searching area라 하며, H/W 성능에 따라 적절히 제어될 수 있다. 도 2는 종래 기술에 따른 동영상 벡터 탐색방식의 개념도이고, 도 3은 이 발명에 따른 동영상 켁터 탐색방식의 개념을 보여주고 있다. 이 발명에서는 32×32인 매크로 블록 단위를 기준으로 한다. 그리고 각 블록간의 유사성을 찾아내는 방법은 여러 방법이 사용되지만 대부분의 상용 코덱에 서는 모든 계수 값의 절대차 평균값인 SAD (sum of absolute differences)를 구하여 일정 범위 내에 들어오게 되면 유사한 것으로 판단한다. 만약 계산된 SAD가 임계치보다 크면 유사 블록이 없는 것으로 인식하여 I-Frame과 마찬가지로 해당 블록을 인코딩 한다.Motion Estimation is a process of searching for a similar block by searching a predetermined area around a corresponding block of a previous frame on the basis of 16 × 16 or 8 × 8 block units, which are Macro Block units of the current frame, during encoding. In this case, the search area is referred to as a searching area and may be appropriately controlled according to H / W performance. 2 is a conceptual diagram of a video vector search method according to the prior art, and FIG. 3 illustrates a concept of a video vector search method according to the present invention. In the present invention, it is based on a macroblock unit of 32x32. And many methods are used to find similarity between each block, but in most commercial codecs, SAD (sum of absolute differences), which is the average value of absolute coefficients of all coefficients, is found to be similar when it comes within a certain range. If the calculated SAD is larger than the threshold, it is recognized that there is no similar block and the corresponding block is encoded like I-Frame.
< 정의 8 > P'-Frame<Definition 8> P'-Frame
P'-Frame은 최근의 P-Frame만을 참조하여 공통점을 찾고, 공통되지 않는 부분에 대해서만 코딩하여 얻어지는 프레임이다. 본질적으로는 P-Frame에 속한다. P-Frame으로부터의 이동벡터값만 전송하므로 기준은 항상 최근의 P-Frame이 된다. 도 5의 예에서 한 점(18,25)에서 다른 점(18,27)으로 이동한 벡터(화살표 P'로 표시됨)가 P'-Frame이다. The P'-Frame is a frame obtained by searching for the common point only by referring to the latest P-Frame and coding only the non-common part. It is essentially a P-Frame. Since only the movement vector value from the P-Frame is transmitted, the reference is always the latest P-Frame. In the example of FIG. 5, the vector (denoted by arrow P ′) moving from one point 18, 25 to another point 18, 27 is P′-Frame.
< 정의 9 > B-Frame(Bi-directionally Predictive Frame)<Definition 9> Bi-directionally Predictive Frame (B-Frame)
B-Frame은 전후의 I-Frame과 P-Frame의 정보를 바탕으로 구성된 프레임이다. 즉 B-Frame은 두 방향에서 예견되는 프레임으로서 앞 뒤의 I-Frame과 P-Frame을 참조하여 만들어진다. B-Frame은 이전의 I-Frame 또는 P-Frame 그리고 다음 I-Frame 또는 P-Frame을 조사하여 공통된 부분을 찾아서 중복되는 부분을 제외한 정보만을 갖는 프레임이다. 따라서 B-Frame은 많은 참조를 하므로 그만큼 중복되는 부분이 제외되고 변경 부분만 표시하므로 B-Frame이 많아지면 압축률이 좋아진다. 대신 압축할 때 참조 프레임의 예측 시간이 길어지기 때문에 시간이 오래 걸린다. B-Frame 은 I-Frame과 P-Frame에 비해 화질과 용량이 최하급이며, 전체 화면 정보를 나타내는 것이 아니고, 이전 화면들(previous frames)과 다음 화면들(next frames) 양측에 의해 예측되는 화면 정보를 나타낸다. B-Frame을 구하는 식은 다음과 같다:B-Frame is a frame composed based on the information of I-Frame before and after P-Frame. In other words, B-Frame is a frame predicted from two directions and is made by referring to I-Frame and P-Frame. A B-Frame is a frame having only information except for overlapping parts by searching for a common part by examining the previous I-Frame or P-Frame and the next I-Frame or P-Frame. Therefore, B-Frame refers to a lot of references, so the overlapping parts are excluded and only the changed parts are displayed. Therefore, when the B-Frame increases, the compression ratio is improved. Instead, the compression takes a long time because the prediction time of the reference frame is long. B-Frame has the lowest quality and capacity compared to I-Frame and P-Frame, and does not represent full screen information, but screen information predicted by both previous frames and next frames. Indicates. The equation for the B-Frame is:
B-Frame = 이전 프레임 - 다음 프레임 + Bidirectional MVB-Frame = Previous Frame-Next Frame + Bidirectional MV
B-Frame을 삭제해도 다른 프레임 생성의 기준이 되지 않으므로 네트워크의 속도 조절시 도움이 된다.Deleting a B-Frame does not become a standard for creating other frames, so it helps to adjust the speed of the network.
< 정의 10 > 벡터(Vector)<
벡터란 화면상의 한 점을 나타내며 동적 배열이라고 할 수 있다. 여기서 일반적인 배열을 사용하면 그 전에 얼마만큼의 화면 크기를 사용할 것인가를 미리 정하고 사용을 해야 하지만 벡터는 동적인 배열이기 때문에 일반 배열과는 달리 그때 그때의 상황에 따라서 화면이 삭제되거나, 크기가 감소하거나, 증가한다. A vector represents a point on the screen and can be called a dynamic array. If you use the general array, you have to decide how much screen size to use beforehand.However, since the vector is a dynamic array, unlike the general array, the screen is deleted or reduced in size depending on the situation. , Increase.
< 정의 11 > 이동 벡터(motion vector)<Definition 11> motion vector
이동 벡터란 화면상에서 한 점이 한 위치에서 다른 위치로 이동한 경우의 좌표값을 배열로 나타낸 것이다.The movement vector is an array of coordinate values when a point moves from one position to another on the screen.
< 정의 12 > 차 벡터(difference vector)<Definition 12> Difference vector
차 벡터는 화면상에서 한 점이 어떻게 변화되었는지를 나타내는 배열이다. The difference vector is an array that shows how a point has changed on the screen.
일반적으로 동영상이 재생되면 가장 먼저 I-Frame을 참조한다. 그리고 이 정보를 I-Frame에 제일 인접한 B-Frame과 P-Frame에 전달한다. 그러면 P-Frame은 이 정보를 참조해 새로운 정보를 만들고 이것들을 앞쪽의 B-Frame으로 보내준다. 그리고 이와 함께 P-Frame 다음에 올 또 다른 P-Frame과 B-Frame들에게 정보를 보내준다. 즉 P-Frame은 동영상이 재생되면서 제 2의 I-Frame처럼 된다.In general, when a video plays, I first reference the I-Frame. This information is then passed to the B-Frame and P-Frame closest to the I-Frame. The P-Frame then references this information, creates new information, and sends them to the front B-Frame. It also sends information to other P-Frames and B-Frames that come after the P-Frame. That is, the P-Frame becomes like a second I-Frame while a video is played.
이때 I-Frame에서 P-Frame으로 보내는 정보는 목적물(object)의 위치 백터이다. 즉, 목적물이 어디로 이동했다는 정보를 보내면 P-Frame에서는 그 목적물을 해당 위치에서 보여준다.At this time, the information sent from the I-Frame to the P-Frame is the position vector of the object. That is, when the object sends information that the object has moved, the P-Frame shows the object in the corresponding position.
2. 발명의 구성 및 동작 설명2. Description of the composition and operation of the invention
이제 위에서 정의된 용어들을 이용하여 이 발명에 따른 P-Frame과 B-Frame을 생성하는 방법에 대해 자세히 설명한다.Now, the method of generating a P-Frame and a B-Frame according to the present invention using the terms defined above will be described in detail.
이 방법의 실행시 제일 먼저 I-Frame을 생성한다(S20). I-Frame을 생성하는 방법은 공지의 기술이므로 여기서는 이에 대한 설명을 생략한다.When executing this method, I-Frame is first generated (S20). To generate an I-Frame Since the method is a known technique, a description thereof will be omitted here.
I-Frame이 만들어지고 나면, 이동 벡터와 차 벡터를 계산한다(S40). 이동 벡터와 차 벡터를 계산하는 방법도 공지의 기술이므로 이에 대한 설명을 생략한다.After the I-Frame is created, the motion vector and the difference vector are calculated (S40). Since a method of calculating the motion vector and the difference vector is also known, a description thereof will be omitted.
이동 벡터와 차 벡터가 구해지면, P-Frame을 생성한다(S60). P-Frame의 생성방법도 공지의 기술이므로 이에 대한 설명을 생략한다.When the motion vector and the car vector are obtained, a P-Frame is generated (S60). Since the method of generating the P-Frame is also known technology, a description thereof will be omitted.
P-Frame이 생성되면, 예측 이동 벡터와 예측 차 벡터를 계산한다(S80). 예측 이동 벡터는 I-Frame과 P-Frame을 비교해서 이동위치를 표시하고, 예측 차 벡터는 I-Frame과 P-Frame을 비교하여 변화된 위치를 표시한다.When the P-Frame is generated, the prediction motion vector and the prediction difference vector are calculated (S80). The predicted motion vector indicates the moving position by comparing the I-Frame and the P-Frame, and the predictive difference vector indicates the changed position by comparing the I-Frame and the P-Frame.
계산된 예측 이동 벡터와 예측 차 벡터값이 각각 3 이상인지 여부를 판단한다(S100). It is determined whether the calculated predicted motion vector and the predicted difference vector are 3 or more, respectively (S100).
위 판단 결과 계산된 예측 이동 벡터와 예측 차 벡터값이 각각 3 이상이면 P'-Frame을 생성하고(S120), 그렇지 않으면 B-Frame을 생성한 뒤 종료한다(S140). B-Frame을 생성하는 방법도 공지의 기술이다.As a result of the determination, if the predicted motion vector and the predicted difference vector value are each 3 or more, a P'-Frame is generated (S120), otherwise, the B-Frame is generated and terminated (S140). A method for generating a B-Frame is also a known technique.
이 발명에서는 매크로 블록(Macro Block)을 기존 16×16에서 32×32로 설정하여 이동 벡터 탐색을 정확히 하여 P'-Frame의 생성이 가능하다. 그리고 P-Frame은 I-Frame의 모든 화소의 이동 벡터를 추적해야 하므로 프레임 생성시간이 길지만, P'-Frame과 B-Frame은 생성시간도 짧다. 그 이유는 P'-Frame은 P-Frame을 기준으로 이동 벡터를 추적하기 때문이고, B-Frame은 실제로 이동 벡터를 계산하지 않고 예측 벡터를 적용하여 I-Frame 대비 P-Frame의 이동 벡터 적용값으로 계산하므로 그 양이 상황에 따라 70~95%까지 줄어드는 효과가 있기 때문이다. In the present invention, it is possible to generate a P'-Frame by precisely searching for a motion vector by setting a macro block from an existing 16 × 16 to 32 × 32. And since the P-Frame needs to track the motion vector of every pixel of the I-Frame The frame generation time is long, but the P'-Frame and B-Frame are also short. The reason is that the P'-Frame tracks the motion vector based on the P-Frame, and the B-Frame does not actually calculate the motion vector but applies the prediction vector to apply the motion vector of the P-Frame to the I-Frame. This is because the amount is reduced by 70-95% depending on the situation.
그리고 앞의 용어 정의 편에서 살펴 보았듯이 P'-Frame과 B-Frame의 크기도 I-Frame과 P-Frame에 비해 작아지며, Bit Rate 감소 효과가 크고, 네트워크 속도에 따라 B-Frame으로 Bit Rate를 조절하는 것도 가능하다.And as we saw in the previous terminology definition, the size of P'-Frame and B-Frame is also smaller than I-Frame and P-Frame, and the bit rate reduction effect is big. It is also possible to adjust.
이처럼 이 발명은 다양하게 변형될 수 있고 여러 가지 형태를 취할 수 있으며 위 발명의 상세한 설명에서는 그에 따른 특별한 실시예에 대해서만 기술하였다. 하지만 이 발명은 위 발명의 상세한 설명에서 언급된 특별한 형태로 한정되는 것이 아닌 것으로 이해되어야 하며, 오히려 첨부된 청구범위에 의해 정의되는 이 발명의 정신과 범위 내에 있는 모든 변형물과 균등물 및 대체물을 포함하는 것으로 이해되어야 한다.As such, the present invention may be variously modified and may take various forms, and only the specific embodiments thereof are described in the detailed description of the present invention. It is to be understood, however, that the invention is not limited to the particular forms mentioned in the detailed description of the invention, but rather includes all modifications, equivalents, and substitutions within the spirit and scope of the invention as defined by the appended claims. It should be understood to do.
기존 아날로그 카메라와 연결하면 아날로그 카메라로 촬영한 정지화상 또는 동영상을 이 발명의 장치에 의해 디지털 데이터로 부호화하여 네트워크를 통해 TCP/IP 인터페이스가 가능한 PC, 디지털 TV, 휴대폰, PMP 등과 같은 디지털 출력장치로 출력할 수 있으므로 산업상 이용가능성이 매우 높다.When connected to an existing analog camera, still images or videos taken by the analog camera are encoded into digital data by the device of the present invention, and can be connected to digital output devices such as PCs, digital TVs, mobile phones, and PMPs, which are capable of TCP / IP interface over a network. Industrial output is very high because it can be printed.
도 1은 이 발명에 따른 아날로그 영상 데이터를 디지털 영상 데이터로 부호화하여 네트워크상으로 전송하기 위한 장치의 블록 구성도.1 is a block diagram of an apparatus for encoding analog image data into digital image data according to the present invention and transmitting it over a network.
도 2는 종래 기술에 따른 동영상 벡터 탐색 방식을 보여주는 개념도.2 is a conceptual diagram illustrating a video vector search method according to the prior art.
도 3은 이 발명에 따른 동영상 벡터 탐색 방식을 보여주는 개념도.3 is a conceptual diagram illustrating a video vector search method according to the present invention;
도 4는 이 발명에 따른 동영상 구성 방법을 나타내는 흐름도.4 is a flowchart showing a video composition method according to the present invention;
도 5는 I-Frame, P-Frame 및 P'-Frame의 관계 예시도.5 is an exemplary diagram illustrating a relationship between an I-Frame, a P-Frame, and a P'-Frame.
도 6은 이 발명에 따른 아날로그 영상 데이터를 디지털 영상 데이터로 부호화하여 네트워크상으로 전송하기 위한 방법의 흐름도.6 is a flow chart of a method for encoding analog video data into digital video data and transmitting it over a network in accordance with the present invention.
< 도면의 주요 부분의 도면 참조 번호에 대한 설명 ><Description of drawing reference number of main part of drawing>
10: 아날로그/디지털 변환기(Analog/Digital converter)10: Analog / Digital converter
20: 코덱 엔진(codec engine)20: codec engine
30: 네트워크 인터페이스부30: network interface unit
40: CPU40: CPU
50: 저장수단50: storage means
60: 아날로그 카메라60: analog camera
70: 출력장치(PC, 핸드폰, PMP, 디지털 TV 등)70: output device (PC, mobile phone, PMP, digital TV, etc.)
80: DSP80: DSP
100: 아날로그 카메라용 EDNTD(Encoding Data Network Transfer Device from Analog Camera Signal)100: Encoding Data Network Transfer Device from Analog Camera Signal (EDNTD) for analog cameras
200: 매크로 블록200: macro block
210: 이전 프레임의 탐색 영역210: navigation area of previous frame
signal 10: Composite Video In Signalsignal 10: Composite Video In Signal
signal 20: S-Video In Signalsignal 20: S-Video In Signal
signal 30: Component Video In Signalsignal 30: Component Video In Signal
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080071550A KR20100010605A (en) | 2008-07-23 | 2008-07-23 | A transfer device of encoded data of analog camera signals on networks and a method for composing images therefor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080071550A KR20100010605A (en) | 2008-07-23 | 2008-07-23 | A transfer device of encoded data of analog camera signals on networks and a method for composing images therefor |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20100010605A true KR20100010605A (en) | 2010-02-02 |
Family
ID=42085213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080071550A KR20100010605A (en) | 2008-07-23 | 2008-07-23 | A transfer device of encoded data of analog camera signals on networks and a method for composing images therefor |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20100010605A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106681841A (en) * | 2017-01-07 | 2017-05-17 | 安徽声讯信息技术有限公司 | Method for solving UI pausing and audio loss caused by excessive CPU occupation |
-
2008
- 2008-07-23 KR KR1020080071550A patent/KR20100010605A/en not_active Application Discontinuation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106681841A (en) * | 2017-01-07 | 2017-05-17 | 安徽声讯信息技术有限公司 | Method for solving UI pausing and audio loss caused by excessive CPU occupation |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100950743B1 (en) | Image information coding device and method and image information decoding device and method | |
US20070291131A1 (en) | Apparatus and Method for Controlling Image Coding Mode | |
JP5090158B2 (en) | VIDEO INFORMATION RECORDING DEVICE, VIDEO INFORMATION RECORDING METHOD, VIDEO INFORMATION RECORDING PROGRAM, AND RECORDING MEDIUM CONTAINING VIDEO INFORMATION RECORDING PROGRAM | |
US9584832B2 (en) | High quality seamless playback for video decoder clients | |
JP4401336B2 (en) | Encoding method | |
JP2006279573A (en) | Encoder and encoding method, and decoder and decoding method | |
CN112073737A (en) | Re-encoding predicted image frames in live video streaming applications | |
JP2009267689A (en) | Moving image coding device, and moving image coding method | |
US20040081237A1 (en) | Transcoder system for compressed digital video bitstreams | |
KR100386583B1 (en) | Apparatus and method for transcoding video | |
CN113259671B (en) | Loop filtering method, device, equipment and storage medium in video coding and decoding | |
KR20090046812A (en) | Video encoding | |
KR100364748B1 (en) | Apparatus for transcoding video | |
Joy et al. | A comprehensive review of traditional video processing | |
JP2008141354A (en) | Image coding apparatus and imaging apparatus | |
US20160316220A1 (en) | Video encoder management strategies | |
JP5472094B2 (en) | Moving image conversion apparatus, moving image distribution system, moving image conversion method, and program | |
KR20100010605A (en) | A transfer device of encoded data of analog camera signals on networks and a method for composing images therefor | |
JP2009081622A (en) | Moving image compression encoder | |
JP3690259B2 (en) | High-speed moving image encoding apparatus and high-speed moving image encoding method | |
KR20060016947A (en) | Mpeg video encoding system and method for the same | |
JP4765961B2 (en) | Digital video recording device | |
JP2004120415A (en) | Device and method for converting moving picture data stream | |
JP2007036887A (en) | Coding method | |
JP5067492B2 (en) | Digital video recording device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |