WO2021033964A1

WO2021033964A1 - 컨텐츠전송방법 및 이를 이용한 컨텐츠 생성 단말

Info

Publication number: WO2021033964A1
Application number: PCT/KR2020/010356
Authority: WO
Inventors: 장준기; 김성호; 조성택; 안재철; 이택주
Original assignee: 네이버 주식회사
Priority date: 2019-08-19
Filing date: 2020-08-05
Publication date: 2021-02-25
Also published as: KR20210021630A; KR102248097B1

Abstract

본 출원은 컨텐츠전송방법 및 이를 이용한 컨텐츠 생성 단말에 관한 것으로서, 본 발명의 일 실시예에 의한 컨텐츠 생성단말의 컨텐츠 전송방법은, 상기 컨텐츠 생성단말이 원본 컨텐츠를 생성하는 단계; 상기 원본 컨텐츠를 인코딩(encoding)한 압축데이터와, 상기 원본 컨텐츠를 샘플링(sampling)한 참조데이터를 생성하는 단계; 및 상기 압축데이터 및 참조데이터를 배포서버로 전송하는 단계를 포함할 수 있다.

Description

컨텐츠전송방법 및 이를 이용한 컨텐츠 생성 단말

본 출원은 스트리밍을 통하여 제공받은 컨텐츠의 해상도 등 품질을 향상시킬 수 있는 컨텐츠전송방법 및 이를 이용한 컨텐츠 생성 단말에 관한 것이다.

스트리밍(streaming) 기술은 대용량의 비디오, 오디오 등과 같은 컨텐츠를 실시간으로 송신/수신하여 네트워크와 CPU 자원을 최적으로 사용하는 기술을 의미한다.

스트리밍 기술은 인터넷의 성장과 함께 더욱 더 중요해지고 있는데, 그 이유는 대부분의 사용자가 대용량 멀티미디어 파일들을 즉시 다운로드할 만큼 빠른 접속회선을 가지고 있지 못하기 때문이다.

일반적으로 컨텐츠 전체를 수신측에서 모두 다운로드 받은 후 컨텐츠 서비스(일례로, 비디오 컨텐츠의 재생 서비스)를 제공받는 방법은 사용자에게 긴 대기시간을 요구하지만, 스트리밍 기술을 이용하는 경우 컨텐츠 전체를 모두 다운로드 받기 전이라도 클라이언트 브라우저 또는 플러그인을 통해 현재의 재생 지점에 대한 데이터만을 다운로드 하여 컨텐츠 서비스를 실시간으로 제공할 수 있게 된다. 이와 같이, 스트리밍 서비스는 사용자가 컨텐츠를 선택하는 즉시 컨텐츠 서비스를 받을 수 있는 장점을 가진다.

본 출원은, 전송매체의 대역폭이나 전송속도 등에 의하여 제한되는 컨텐츠의 품질을 향상시킬 수 있는 컨텐츠전송방법 및 이를 이용한 컨텐츠 생성 단말을 제공하고자 한다.

본 출원은, 컨텐츠 생성단말이 인코딩된 압축데이터와 함께 참조데이터를 더 전송하도록 하여, 수신측에서의 컨텐츠 품질개선을 구현할 수 있는 컨텐츠전송방법 및 이를 이용한 컨텐츠 생성 단말을 제공하고자 한다.

본 출원은, 딥러닝 기반의 품질개선 모델을 이용하여 수신한 컨텐츠의 품질개선을 수행할 수 있는 컨텐츠전송방법 및 이를 이용한 컨텐츠 생성 단말을 제공하고자 한다.

본 발명의 일 실시예에 의한 컨텐츠 생성단말의 컨텐츠 전송방법은, 상기 컨텐츠 생성단말이 원본 컨텐츠를 생성하는 단계; 상기 원본 컨텐츠를 인코딩(encoding)한 압축데이터와, 상기 원본 컨텐츠를 샘플링(sampling)한 참조데이터를 생성하는 단계; 및 상기 압축데이터 및 참조데이터를 배포서버로 전송하는 단계를 포함할 수 있다.

본 발명의 일 실시예에 의한 배포 서버의 컨텐츠품질개선방법은, 컨텐츠 생성단말로부터, 원본 컨텐츠를 인코딩(encoding)한 압축데이터와 상기 원본 컨텐츠를 샘플링(sampling)한 참조데이터를 수신하는 단계; 상기 압축데이터를 디코딩(decoding)하여 복호데이터를 생성하는 단계; 및 상기 복호데이터 및 참조데이터를 품질개선모델에 적용하여, 상기 복호데이터의 품질을 개선한 출력데이터를 생성하는 단계를 포함할 수 있다.

본 발명의 일 실시예에 의한 컨텐츠 생성단말은, 원본 컨텐츠를 생성하는 컨텐츠 생성부; 상기 원본 컨텐츠를 인코딩(encoding)하여 압축 데이터를 생성하는 인코딩부; 상기 원본 컨텐츠를 샘플링(sampling)하여 참조데이터를 생성하는 참조데이터생성부; 및 상기 압축데이터 및 참조데이터를 배포서버로 전송하는 전송부를 포함할 수 있다.

본 발명의 일 실시예에 의한 배포서버는, 컨텐츠 생성단말로부터, 원본 컨텐츠를 인코딩(encoding)한 압축데이터와 상기 원본 컨텐츠를 샘플링(sampling)하여 추출한 참조데이터를 수신하는 수신부; 상기 압축데이터를 디코딩(decoding)하여 복호데이터를 생성하는 디코딩부; 및 상기 복호데이터 및 참조데이터를 품질개선모델에 적용하여, 상기 복호데이터의 품질을 개선한 출력데이터를 생성하는 품질개선부를 포함할 수 있다.

본 발명의 다른 실시예에 의한 클라이언트 단말에서의 컨텐츠품질개선방법은, 컨텐츠 서버로부터, 원본 컨텐츠를 인코딩(encoding)한 압축데이터와 상기 원본 컨텐츠를 샘플링(sampling)한 참조데이터를 수신하는 단계; 상기 압축데이터를 디코딩(decoding)하여 복호데이터를 생성하는 단계; 및 상기 복호데이터 및 참조데이터를 품질개선모델에 적용하여, 상기 복호데이터의 품질을 개선한 출력데이터를 생성하는 단계를 포함할 수 있다.

본 발명의 다른 실시예에 의한 컨텐츠 서버의 컨텐츠 전송방법은, 클라이언트 단말로부터 원본 컨텐츠에 대한 스트리밍(streaming)을 요청받는 단계; 상기 클라이언트 단말과 연결된 전송매체의 전송속도(bit rate)에 따라 인코딩 품질을 설정하고, 상기 인코딩 품질에 따라 상기 원본 컨텐츠를 인코딩하여 압축데이터를 생성하는 단계; 상기 원본 컨텐츠를 기 설정된 주기마다 샘플링하거나, 상기 원본 컨텐츠 내의 장면변화(scene change)가 발생할 때마다 샘플링하여, 상기 원본 컨텐츠에 대한 참조데이터를 생성하는 단계; 및 상기 압축데이터 및 참조데이터를 상기 전송매체를 통하여 상기 클라이언트 단말로 전송하는 단계를 포함할 수 있다.

덧붙여 상기한 과제의 해결수단은, 본 발명의 특징을 모두 열거한 것이 아니다. 본 발명의 다양한 특징과 그에 따른 장점과 효과는 아래의 구체적인 실시형태를 참조하여 보다 상세하게 이해될 수 있을 것이다.

본 발명의 일 실시예에 의한 컨텐츠전송방법 및 이를 이용한 컨텐츠 생성 단말에 의하면, 컨텐츠 생성단말로부터 제한된 품질의 컨텐츠를 수신하는 경우에도, 배포서버 측에서 품질개선을 수행할 수 있으므로, 고품질의 컨텐츠를 사용자에게 제공하는 것이 가능하다.

본 발명의 일 실시예에 의한 컨텐츠전송방법 및 이를 이용한 컨텐츠 생성 단말에 의하면, 전체 원본 컨텐츠 대신에 원본 컨텐츠를 샘플링한 참조데이터를 이용하여 품질개선을 구현하는 것이 가능하다.

다만, 본 발명의 실시예들에 따른 컨텐츠전송방법 및 이를 이용한 컨텐츠 생성 단말이 달성할 수 있는 효과는 이상에서 언급한 것들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

도1은 본 발명의 일 실시예에 의한 컨텐츠품질개선 시스템을 나타내는 개략도이다.

도2는 본 발명의 일 실시예에 의한 컨텐츠품질개선 시스템의 컨텐츠 생성단말 및 배포서버를 나타내는 블록도이다.

도3은 본 발명의 일 실시예에 의한 컨텐츠 생성단말의 컨텐츠전송방법을 나타내는 순서도이다.

도4는 본 발명의 일 실시예에 의한 배포서버의 컨텐츠품질개선방법을 나타내는 순서도이다.

도5는 본 발명의 다른 실시예에 의한 컨텐츠품질개선 시스템을 나타내는 개략도이다.

도6은 본 발명의 다른 실시예에 의한 컨텐츠품질개선 시스템의 클라이언트 단말 및 컨텐츠 서버를 나타내는 블록도이다.

도7은 본 발명의 다른 실시예에 의한 클라이언트 단말의 컨텐츠품질개선방법을 나타내는 순서도이다.

도8은 본 발명의 다른 실시예에 의한 컨텐츠 서버의 컨텐츠전송방법을 나타내는 순서도이다.

이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 즉, 본 발명에서 사용되는 '부'라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, '부'는 어떤 역할들을 수행한다. 그렇지만 '부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '부'들로 결합되거나 추가적인 구성요소들과 '부'들로 더 분리될 수 있다.

또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

도1은 본 발명의 일 실시예에 의한 컨텐츠품질개선시스템을 나타내는 개략도이다.

도1을 참조하면 본 발명의 일 실시예에 의한 컨텐츠품질개선시스템은, 컨텐츠 생성단말(100), 배포서버(200) 및 컨텐츠 수신단말(300)를 포함할 수 있다.

이하 도1을 참조하여 본 발명의 일 실시예에 의한 컨텐츠품질개선시스템을 설명한다.

컨텐츠 생성단말(100)은 사용자의 조작에 따라 원본 컨텐츠를 생성할 수 있으며, 생성한 원본 컨텐츠들은 배포서버(200)를 통하여 복수의 컨텐츠 수신단말(300)들로 배포할 수 있다.

예를들어, 사용자는 컨텐츠 생성단말(100)에 구비된 카메라 및 마이크를 이용하여 직접 동영상, 이미지를 촬영하거나, 음향 등을 녹음하여 원본 컨텐츠를 생성할 수 있으며, 실시예에 따라서는 별도의 캠코더나 카메라, 녹음기 등을 활용하여 원본 컨텐츠들을 생성한 후, 컨텐츠 생성단말(100) 내에 저장하는 것도 가능하다. 이후 컨텐츠 생성단말(100)은 생성한 원본 컨텐츠에 대한 편집이나 수정 등을 지원할 수 있다.

컨텐츠 생성단말(100)은 생성한 원본 컨텐츠를 통신 네트워크를 통하여 배포서버(200)로 공급할 수 있으며, 이때 컨텐츠 생성단말(100)은 원본 컨텐츠에 대응하는 비디오 신호, 오디오 신호 등의 멀티미디어 신호를 인코딩하여 멀티미디어 스트림으로 변환시킬 수 있다.

여기서, 인코딩된 멀티미디어 스트림은 표준 영상 전송 프로토콜인 실시간 스트리밍 프로토콜(Real Time Streaming Protocol: RTSP, RFC 2326에 규약됨), 실시간 전송 프로토콜(Realtime Transport Protocol: RTP), 리얼 타임 메시징 프로토콜(Real Time Messaging Protocol: RTMP) 등을 통하여 배포 서버(200)로 전송될 수 있다.

컨텐츠 생성단말(100)은 생성한 원본 컨텐츠들을 시각적으로 표시하기 위한 디스플레이부를 포함할 수 있으며, 사용자의 입력을 인가받는 입력부, 배포 서버(200)와의 유/무선 통신을 위한 통신부, 적어도 하나의 프로그램이 저장되는 메모리 및 프로세서를 포함할 수 있다.

또한, 컨텐츠 생성단말(100)은 휴대폰, 스마트 폰(Smart phone), 노트북 컴퓨터(laptop computer), 데스크탑 컴퓨터(desktop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기(smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등일 수 있다.

컨텐츠 생성단말(100)은 배포서버(200)와 통신 네트워크를 통하여 연결될 수 있으며, 여기서 통신 네트워크는 유선 네트워크와 무선 네트워크를 포함할 수 있다. 구체적으로, 근거리 네트워크(LAN: Local Area Network), 도시권 네트워크(MAN: Metropolitan Area Network), 광역 네트워크(WAN: Wide Area Network) 등 다양한 네트워크를 포함할 수 있으며, 공지의 월드와이드웹(WWW: World Wide Web)을 포함할 수도 있다. 다만, 본 발명에 따른 통신 네트워크는 상기 열거된 네트워크에 국한되지 않으며, 공지의 무선 데이터 네트워크, 공지의 전화 네트워크, 공지의 유선 또는 무선 텔레비전 네트워크 등을 포함할 수 있다.

컨텐츠 수신단말(300)은 배포서버(200) 등으로부터 제공받은 컨텐츠를 시각이나 청각 등으로 표시하여 사용자에게 제공할 수 있다. 컨텐츠 수신단말(300)은 컨텐츠들을 시각적으로 표시하기 위한 디스플레이부를 포함할 수 있으며, 사용자의 입력을 인가받는 입력부, 컨텐츠 서버(200)와의 유/무선 통신을 위한 통신부, 적어도 하나의 프로그램이 저장되는 메모리 및 프로세서를 포함할 수 있다. 예를들어, 컨텐츠 수신단말(300)은 스마트 폰이나 태블릿 PC 등일 수 있으며, 상술한 컨텐츠 생성단말(100)과 같은 종류의 휴대용 기기 또는 고정형 기기일 수 있다. 또한, 컨텐츠 수신단말(300)은 배포서버(200)와 통신 네트워크를 통하여 연결될 수 있으며, 여기서 통신 네트워크는 유선 네트워크와 무선 네트워크를 포함할 수 있다.

배포서버(200)는 컨텐츠 생성단말(100)로부터 컨텐츠를 수신할 수 있으며, 수신한 컨텐츠를 복수의 컨텐츠 수신단말(300)들에게 배포할 수 있다. 여기서, 배포서버(200)는 컨텐츠 생성단말(100)로부터 수신한 컨텐츠에 대한 품질개선을 수행한 후 배포할 수 있다.

구체적으로, 컨텐츠 생성단말(100)이 원본 컨텐츠를 배포서버(200)로 전송하는 경우, 통신 네트워크 내의 광케이블이나 동축케이블 등 전송매체를 거칠 수 있다. 이때, 전송매체의 대역폭(bandwith)이나 전송속도(bit rate) 등에 의하여, 컨텐츠 생성단말(100)이 배포서버(200)로 전송하는 원본 컨텐츠들의 해상도나 음질 등이 제한될 수 있다. 즉, 컨텐츠 생성단말(100)은 원본 컨텐츠를 인코딩할 때, 전송매체의 전송속도 등에 따라 품질을 조절하여 인코딩할 수 있으며, 이에 따라 배포서버(200)는 각각 다른 품질로 인코딩된 압축데이터를 제공받을 수 있다. 따라서, 배포서버(200)는 컨텐츠 생성단말(100)로부터 낮은 품질의 압축데이터를 수신할 수 있으며, 이를 디코딩하여 복호데이터를 생성할 수 있다. 이 경우 원본컨텐츠와 비교하여 상대적으로 해상도가 떨어지거나 음원의 음질이 열화된 컨텐츠를 제공받을 수 있다.

다만, 배포서버(200)는 각각의 컨텐츠 수신단말(300)들에게 고품질의 컨텐츠를 제공할 필요가 있으므로, 컨텐츠 생성단말(100)로부터 수신한 컨텐츠의 품질을 향상시킬 필요가 있다. 여기서, 본 발명의 일 실시예에 의한 컨텐츠품질개선시스템에 의하면, 컨텐츠 생성단말(100)이 압축데이터와 함께 고품질의 참조데이터를 추가로 배포 서버(200)로 제공함으로써 열화된 컨텐츠의 품질을 개선하도록 하는 것이 가능하다.

이하 본 발명의 일 실시예에 의한 컨텐츠 생성단말(100) 및 배포 서버(200)에 대해 구체적으로 설명한다.

도2는 본 발명의 일 실시예에 의한 컨텐츠품질개선 시스템의 컨텐츠 생성 단말 및 배포 서버를 나타내는 블록도이다.

도2를 참조하면, 본 발명의 일 실시예에 의한 컨텐츠 생성단말(100)은 컨텐츠생성부(110), 인코딩부(120), 참조데이터생성부(130) 및 전송부(140)를 포함할 수 있다.

컨텐츠 생성부(110)는 원본 컨텐츠를 생성할 수 있다. 즉, 컨텐츠 생성부(110)는 컨텐츠 생성단말(100) 내에 포함된 카메라, 마이크 등을 이용하여 동영상이나 이미지를 촬영하거나, 음향 등을 녹음하여 원본 컨텐츠를 생성할 수 있다. 예를들어, 연예인 등 유명인이 자신의 스마트 폰 등을 이용하여 자신의 일상을 동영상으로 촬영하는 등의 방식으로 원본 컨텐츠를 생성할 수 있다.

인코딩부(120)는 원본 컨텐츠를 인코딩하여 압축데이터를 생성할 수 있다. 여기서, 인코딩부(120)는 배포서버(200)와 연결된 전송매체의 전송속도(bit rate)에 따라 인코딩 품질을 설정할 수 있으며, 인코딩 품질에 따라 원본 컨텐츠를 인코딩할 수 있다. 여기서, 인코딩부(120)는 MPEG, Indeo, DivX, Xvid, H.264, WMV, RM, Cinepak, MOV, ASF, RA, XDM, RLE 등의 동영상 코덱(codec)이나, MP3, AC3, AAC, OGG, WMA, FLAC. DTS 등의 오디오 코덱 등을 활용할 수 있다.

참조데이터생성부(130)는 원본 컨텐츠를 샘플링하여 참조데이터를 생성할 수 있다. 인코딩부(120)는 전송매체의 전송속도에 따라 인코딩시 품질을 제한하여 압축데이터를 생성하므로, 배포서버(200)는 전송매체의 전송속도에 따라 제한된 품질의 압축데이터를 수신할 수 있다. 이 경우, 수신한 압축데이터만을 복호화하여 컨텐츠를 재생하면 컨텐츠의 해상도 등 품질이 상대적으로 낮아지는 등의 문제가 발생할 수 있다.

이를 해결하기 위하여, 참조데이터생성부(130)는 압축데이터 이외에 참조데이터를 추가로 생성할 수 있다. 즉, 원본 컨텐츠의 정보를 포함하는 메타데이터인 참조데이터를 배포서버(200)로 더 제공할 수 있으며, 이후 참조데이터를 활용하여 품질개선을 수행하도록 할 수 있다.

구체적으로, 참조데이터는 원본 컨텐츠를 캡쳐한 고화질의 이미지이거나, 원본 컨텐츠를 음성인식하여 생성한 텍스트정보일 수 있다. 먼저, 원본 컨텐츠가 동영상인 경우에는, 원본 컨텐츠를 캡처하여 생성한 고화질의 이미지를 참조데이터로 활용할 수 있다. 즉, 참조데이터에는 원본 컨텐츠에 포함된 특정 프레임에 대응하는 고화질 이미지 정보가 포함되므로, 이를 활용하여 특 프레임의 전후 프레임들의 품질을 개선하는 것이 가능하다.

또한, 원본 컨텐츠가 음원 등인 경우에는 해당 음원에 음성인식을 통해 추출한 텍스트정보를 참조데이터로 활용할 수 있다. 즉, 음원의 압축데이터에서 음성이 부정확하게 등 음질에 문제가 있는 경우에는, 텍스트 정보를 이용하여 해당 음성이 텍스트 정보에 대응하는 소리를 내도록 하는 등 품질개선을 위해 활용할 수 있다.

한편, 참조데이터생성부(130)는 원본 컨텐츠를 설정주기마다 샘플링하여 참조데이터를 생성할 수 있으며, 실시예에 따라서는 원본 컨텐츠 내의 장면변화(scene change)가 발생할 때마다 생성하는 것도 가능하다.

예를들어, 원본 컨텐츠가 동영상인 경우, 동영상을 N 초마다 한번씩 캡쳐하여 참조데이터를 생성하도록 할 수 있다. 즉, 원본 컨텐츠 전체가 아니라 원본 컨텐츠를 샘플링한 참조데이터를 품질개선에 활용하도록 할 수 있다. 여기서, 참조데이터는 고화질의 이미지이므로 상대적으로 용량이 클 수 있다. 따라서, 참조데이터를 N초마다 한번씩 포함하도록 하여, 전송하는 용량은 줄이면서도 품질개선이 가능하도록 구현할 수 있다. 실시예에 따라서는, 640X360의 풀프레임 동영상에 대해, 10초에 1장씩 1920X1080 해상도의 이미지를 참조데이터로 생성할 수 있다.

또한, 동영상인 원본 컨텐츠의 경우, 동영상 내의 유사한 장면이 일정시간 동안 유지된 후 장면이 전환되는 경우가 다수 존재할 수 있다. 여기서, 장면전환시 급격한 변화가 발생하므로, 이때 참조데이터를 생성하여 전환된 장면에 대응한 품질개선이 가능하도록 할 수 있다.

추가적으로, 참조데이터생성부(130)는 각각의 참조데이터를 생성한 시점의 타임스탬프(time stamp)를 더 포함하여 참조데이터를 생성할 수 있다.

전송부(140)는 압축데이터 및 참조데이터를 배포서버(200)로 전송할 수 있다. 여기서, 전송부(140)는 미리 설정된 네트워크 프로토콜에 따라 압축데이터 및 참조데이터를 전송할 수 있다. 예를들어, RTMP(Real Time Messaging Protocol), HTTP(Hypertext Transfer Protocol) 등을 활용할 수 있다.

한편, 도2를 참조하면, 본 발명의 일 실시예에 의한 배포서버(200)는 수신부(210), 디코딩부(220) 및 품질개선부(230)를 포함할 수 있다.

수신부(210)는 컨텐츠 생성단말(100)로부터 원본 컨텐츠를 인코딩한 압축데이터와, 원본 컨텐츠를 샘플링하여 추출한 참조데이터를 수신할 수 있다. 즉, 컨텐츠 생성단말(100)은 자신의 원본 컨텐츠를 배포하기 위하여, 배포서버(200)로 컨텐츠 배포를 요청할 수 있으며, 이 경우 배포서버(200)는 수신부(210)를 통하여 컨텐츠 생성단말(100)이 전송하는 압축데이터 및 참조데이터를 수신할 수 있다. 실시예에 따라서는 컨텐츠 생성단말(100)이 배포서버(200)로 라이브 방송을 요청할 수 있으며, 배포서버(200)는 컨텐츠 생성단말(100)이 전송하는 압축데이터 및 참조데이터를 이용하여 실시간 라이브 스트리밍을 수행할 수 있다.

디코딩부(220)는 압축데이터를 디코딩하여 복호데이터를 생성할 수 있다. 디코딩부(220)는 압축데이터의 인코딩시 활용한 코덱을 이용하여 압축데이터를 디코딩할 수 있다. 여기서 디코팅부(220)는 MPEG, Indeo, DivX, Xvid, H.264, WMV, RM, Cinepak, MOV, ASF, RA, XDM, RLE 등의 동영상 코덱(codec)이나, MP3, AC3, AAC, OGG, WMA, FLAC. DTS 등의 오디오 코덱 등을 활용할 수 있다.

품질개선부(230)는 복호데이터 및 참조데이터를 품질개선모델에 적용하여, 복호데이터의 품질을 개선한 출력데이터를 생성할 수 있다. 여기서 품질개선모델은 딥러닝(deep learning)을 기반으로 미리 학습된 것일 수 있으며, 품질개선모델을 이용하면 복호데이터와 참조데이터로부터 각각의 복호데이터에 대응하는 원본 컨텐츠의 추정하는 것이 가능하다.

즉, 전체 원본 컨텐츠를 대신하여, 원본 컨텐츠에서 샘플링한 참조데이터를 활용할 수 있으며, 품질개선모델은 참조데이터와 복호데이터를 비교하여 원본 컨텐츠에 대응하는 품질을 가지는 출력데이터를 생성하도록 학습되어 있을 수 있다.

여기서, 품질개선부(230)는 원본 컨텐츠가 동영상인 경우 복호데이터와 참조데이터를 이용하여 원본 컨텐츠의 해상도를 복원한 출력데이터를 생성할 수 있으며, 원본 컨텐츠가 오디오인 경우에는 음질을 복원한 출력데이터를 생성할 수 있다.

실시예에 따라서는, 품질개선모델로 해상도 복원을 위한 초해상도 영상복원 모델(super resolution model), 동영상의 동작범위(dynamic range) 확장을 위한 SDR-HDR(Standard Dynamic Range-High Dynamic Range) 영상 변환 모델을 활용할 수 있으며, 이외에도, 영상개선(Image enhancement) 모델, 음질개선모델 등을 다양한 모델들을 활용할 수 있다.

도3은 본 발명의 일 실시예에 의한 컨텐츠 생성 단말에서의 컨텐츠전송방법을 나타내는 순서도이다.

도3을 참조하면, 컨텐츠 생성단말은 원본 컨텐츠를 생성할 수 있다(S110). 즉, 컨텐츠 생성단말 내에 포함된 카메라, 마이크 등을 이용하여 동영상이나 이미지를 촬영하거나, 음향 등을 녹음하여 원본 컨텐츠를 생성할 수 있다.

이후, 컨텐츠 생성단말은 원본 컨텐츠를 인코딩하여 압축데이터를 생성하고, 원본 컨텐츠를 샘플링하여 참조데이터를 생성할 수 있다(S120). 즉, 컨텐츠 생성단말은 배포서버로 원본 컨텐츠를 전송하기 위하여, 원본 컨텐츠에 대응하는 압축데이터와 참조데이터를 생성할 수 있다.

여기서, 컨텐츠 생성단말은 배포서버와 연결된 전송매체의 전송속도에 따라 인코딩 품질을 설정할 수 있으며, 인코딩 품질에 따라 원본 컨텐츠를 인코딩하여 압축데이터를 생성할 수 있다. 여기서, 컨텐츠 생성단말은 MPEG, Indeo, DivX, Xvid, H.264, WMV, RM, Cinepak, MOV, ASF, RA, XDM, RLE 등의 동영상 코덱(codec)이나, MP3, AC3, AAC, OGG, WMA, FLAC. DTS 등의 오디오 코덱 등을 활용할 수 있다.

또한, 컨텐츠 생성단말은 원본 컨텐츠를 설정주기마다 샘플링하거나, 원본 컨텐츠 내의 장면변화가 발생할 때마다 샘플링하여, 원본 컨텐츠에 대한 참조데이터를 생성할 수 있다. 즉, 배포서버에서 품질개선을 수행할 수 있도록, 원본 컨텐츠에 대한 정보를 포함하는 참조데이터를 추가로 생성할 수 있다.

구체적으로, 참조데이터는 원본 컨텐츠를 캡쳐한 고화질의 이미지이거나, 원본 컨텐츠를 음성인식하여 생성한 텍스트정보일 수 있다. 여기서, 원본 컨텐츠가 동영상인 경우에는 원본 컨텐츠를 캡처한 고화질의 이미지를 참조데이터로 활용하고, 원본 컨텐츠가 음원 등인 경우에는 해당 음원에 음성인식을 통해 추출한 텍스트정보를 참조데이터로 활용할 수 있다. 이때, 참조데이터는 각각의 참조데이터를 생성한 시점의 타임스탬프를 더 포함할 수 있다.

한편, 원본 컨텐츠가 동영상인 경우, 컨텐츠 서버는 동영상을 N 초마다 한번씩 캡쳐하여 참조데이터를 생성할 수 있다. 이때 참조데이터는 고화질의 이미지에 해당하므로 상대적으로 용량이 많을 수 있다. 따라서, 컨텐츠 서버는 참조데이터를 N초마다 한번씩 생성하여, 필요한 용량은 줄이면서도 품질개선을 구현하도록 할 수 있다. 예를들어, 원본 컨텐츠가 640X360의 풀프레임 동영상인 경우, 컨텐츠 서버는 10초에 1장씩 1920X1080 해상도의 이미지를 참조데이터로 생성하도록 할 수 있다.

또한, 동영상 내에는 유사한 장면이 일정시간 동안 유지된 후, 장면이 전환되는 등의 경우가 다수 존재할 수 있다. 여기서, 장면전환시 급격한 변화가 발생하므로, 컨텐츠 서버는 이때 참조데이터를 생성하여 전환된 장면에 대응한 품질개선이 가능하도록 할 수 있다.

이후, 컨텐츠 생성단말은 생성한 압축데이터 및 참조데이터를 배포서버로 전송할 수 있다(S130). 여기서, 컨텐츠 생성단말은 미리 설정된 네트워크 프로토콜에 따라 압축데이터 및 참조데이터를 전송할 수 있으며, 예를들어, RTMP(Real Time Messaging Protocol), HTTP(Hypertext Transfer Protocol) 등을 활용할 수 있다.

도4는 본 발명의 일 실시예에 의한 배포서버에서의 컨텐츠품질개선방법을 나타내는 순서도이다.

도4를 참조하면, 배포서버는 컨텐츠 생성단말로부터 원본 컨텐츠를 인코딩한 압축데이터와 원본 컨텐츠를 샘플링한 참조데이터를 수신할 수 있다(S210). 컨텐츠 생성단말은 배포서버로 원본 컨텐츠의 배포를 요청할 수 있으며, 배포하고자 하는 압축데이터와 참조데이터를 배포서버로 전송할 수 있다. 여기서, 참조데이터는 원본 컨텐츠의 정보를 포함하므로, 이후 이를 활용하여 품질개선을 수행하는 것이 가능하다.

구체적으로, 참조데이터는 원본 컨텐츠를 캡쳐한 고화질의 이미지이거나, 원본 컨텐츠를 음성인식하여 생성한 텍스트정보일 수 있다. 원본 컨텐츠가 동영상인 경우에는, 원본 컨텐츠의 캡처한 고화질의 이미지를 참조데이터로 활용할 수 있다. 또한, 원본 컨텐츠가 음원 등인 경우에는 해당 음원에 음성인식을 통해 추출한 텍스트정보를 참조데이터로 활용할 수 있다.

한편, 참조데이터는 원본 컨텐츠를 설정주기마다 샘플링하여 생성한 것일 수 있으며, 실시예에 따라서는 원본 컨텐츠 내의 장면변화(scene change)가 발생할 때마다 생성하는 것도 가능하다.

이후, 배포서버는 압축데이터를 디코딩(decoding)하여 복호데이터를 생성할 수 있다(S220). 배포서버는 컨텐츠 생성단말이 압축데이터를 인코딩할 때 활용한 코덱을 이용하여, 압축데이터를 디코딩할 수 있다. 여기서 배포서버는 MPEG, Indeo, DivX, Xvid, H.264, WMV, RM, Cinepak, MOV, ASF, RA, XDM, RLE 등의 동영상 코덱이나, MP3, AC3, AAC, OGG, WMA, FLAC. DTS 등의 오디오 코덱 등을 활용할 수 있다.

디코딩이 완료되면, 배포서버는 복호데이터 및 참조데이터를 품질개선모델에 적용하여, 복호데이터의 품질을 개선한 출력데이터를 생성할 수 있다(S230). 여기서 품질개선모델은 딥러닝(deep learning)을 기반으로 미리 학습된 것으로, 품질개선모델을 이용하면, 복호데이터와 참조데이터로부터 각각의 복호데이터에 대응하는 원본 컨텐츠의 추정하는 것이 가능하다. 즉, 전체 원본 컨텐츠가 아니라 원본 컨텐츠에서 샘플링한 일부 참조데이터를 이용하여, 복호데이터로부터 원본 컨텐츠에 대응하는 품질을 가지는 출력데이터를 생성할 수 있다.

실시예에 따라서는, 품질개선모델로 해상도 복원을 위한 초해상도 영상복원 모델(super resolution model), 동영상의 동작범위(dynamic range) 확장을 위한 SDR-HDR(Standard Dynamic Range-High Dynamic Range) 영상 변환 모델 등을 활용할 수 있으며, 이외에도 영상개선(Image enhancement) 모델, 음질개선모델 등을 활용할 수 있다.

도5는 본 발명의 다른 실시예에 의한 컨텐츠품질개선시스템을 나타내는 개략도이다.

도5를 참조하면 본 발명의 다른 실시예에 의한 컨텐츠품질개선시스템은, 클라이언트 단말(600) 및 컨텐츠서버(700)를 포함할 수 있다.

이하 도5를 참조하여 본 발명의 일 실시예에 의한 컨텐츠품질개선시스템을 설명한다.

클라이언트 단말(600)은 컨텐츠 서버(700) 등으로부터 제공받은 컨텐츠를 시각이나 청각 등으로 표시하여 사용자에게 제공할 수 있다. 여기서, 컨텐츠 서버(700)로부터 제공받는 컨텐츠는 동영상이나 오디오, 이미지 등일 수 있으며, 실시예에 따라서는 컨텐츠 서버(700)가 제공하는 VOD(Video On-demand)나 라이브 방송 등을 스트리밍(streaming) 방식으로 출력할 수 있다.

클라이언트 단말(600)은 컨텐츠들을 시각적으로 표시하기 위한 디스플레이부를 포함할 수 있으며, 사용자의 입력을 인가받는 입력부, 컨텐츠 서버(700)와의 유/무선 통신을 위한 통신부, 적어도 하나의 프로그램이 저장되는 메모리 및 프로세서를 포함할 수 있다.

여기서, 클라이언트 단말(600)은 휴대폰, 스마트 폰(Smart phone), 노트북 컴퓨터(laptop computer), 데스크탑 컴퓨터(desktop computer), 디지털방송용 단말기, PDA(personal digital assistants), PMP(portable multimedia player), 슬레이트 PC(slate PC), 태블릿 PC(tablet PC), 울트라북(ultrabook), 웨어러블 디바이스(wearable device, 예를 들어, 워치형 단말기(smartwatch), 글래스형 단말기 (smart glass), HMD(head mounted display)) 등일 수 있다.

클라이언트 단말(600)은 컨텐츠 서버(700)와 통신 네트워크를 통하여 연결될 수 있으며, 여기서 통신 네트워크는 유선 네트워크와 무선 네트워크를 포함할 수 있다. 구체적으로, 근거리 네트워크(LAN: Local Area Network), 도시권 네트워크(MAN: Metropolitan Area Network), 광역 네트워크(WAN: Wide Area Network) 등 다양한 네트워크를 포함할 수 있으며, 공지의 월드와이드웹(WWW: World Wide Web)을 포함할 수도 있다. 다만, 본 발명에 따른 통신 네트워크는 상기 열거된 네트워크에 국한되지 않으며, 공지의 무선 데이터 네트워크, 공지의 전화 네트워크, 공지의 유선 또는 무선 텔레비전 네트워크 등을 포함할 수 있다.

컨텐츠서버(700)는 클라이언트 단말(100)이 요청하는 컨텐츠를 제공할 수 있으며, 실시예에 따라서는 스트리밍(streaming) 등을 이용하여 컨텐츠를 실시간으로 제공할 수 있다.

컨텐츠 서버(700)는, 클라이언트 단말(600)로부터 특정한 컨텐츠에 대한 요청이 입력되면, 해당하는 컨텐츠를 컨텐츠 서버(700) 또는 원본 컨텐츠 데이터베이스(D)에서 검색할 수 있으며, 검색된 컨텐츠를 통신 네트워크를 통하여 클라이언트 단말(600)에 제공할 수 있다. 여기서, 컨텐츠 서버(700)가 다양한 방송기관이나 개인 등이 운영하는 채널에서 제공하는 라이브 방송 등의 컨텐츠를 제공하는 것도 가능하다.

원본 컨텐츠 데이터베이스(D)에는 다양한 종류의 VOD 등 동영상이 저장되어 있을 수 있으며, 동영상 이외에 음원이나 이미지, 게임 등 다양한 종류의 컨텐츠들도 포함할 수 있다.

컨텐츠서버(700)가 원본 컨텐츠를 클라이언트 단말(600)로 전송하는 경우, 통신 네트워크의 광케이블이나 동축케이블 등의 전송매체를 거칠 수 있다. 이때, 전송매체의 대역폭(bandwith)이나 전송속도(bit rate) 등에 의하여 클라이언트 단말(600)로 전송되는 컨텐츠들의 해상도 등 품질은 낮아질 수 있다. 예를들어, 컨텐츠서버(700)가 동영상을 스트리밍하여 클라이언트 단말(600)로 전송하는 경우, 컨텐츠서버(700)는 원본 컨텐츠를 인코딩하여 압축데이터 형태로 생성할 수 있다. 이때, 컨텐츠서버(700)는 전송매체의 전송속도에 따라 동영상의 품질을 조절하여 인코딩하므로, 클라이언트 단말(600)은 전송매체의 전송속도 등에 따라 각각 다른 품질로 인코딩된 압축데이터를 제공받을 수 있다.

즉, 클라이언트 단말(600)은 낮은 품질의 압축데이터를 수신한 후, 이를 디코딩하여 복호데이터를 생성할 수 있으며, 이 경우 원본컨텐츠와 비교하여 상대적으로 해상도가 떨어지거나 음원의 음질이 열화된 컨텐츠를 재생할 수 있다.

여기서, 클라이언트 단말(600)에서 실행하는 컨텐츠의 품질을 향상하기 위한 다양한 방안들이 제시되고 있으며, 본 발명의 일 실시예에 의한 컨텐츠품질개선시스템에 의하면, 컨텐츠서버(700)가 압축데이터와 함께 참조데이터를 추가로 클라이언트 단말(600)에게 제공함으로써 열화된 컨텐츠의 품질을 개선하도록 할 수 있다. 이하, 본 발명의 일 실시예에 의한 클라이언트 단말(600) 및 컨텐츠 서버(700)를 각각 설명한다.

도6은 본 발명의 일 실시예에 의한 컨텐츠품질개선 시스템의 클라이언트 단말 및 컨텐츠 서버를 나타내는 블록도이다.

도6을 참조하면, 본 발명의 일 실시예에 의한 클라이언트 단말(600)은 수신부(610), 디코딩부(620) 및 품질개선부(630)를 포함할 수 있다.

클라이언트 단말(600)은 컨텐츠 서버(700)로 원본 컨텐츠에 대한 제공을 요청할 수 있으며, 이 경우 수신부(610)는 컨텐츠 서버(700)로부터 원본 컨텐츠를 인코딩(encoding)한 압축데이터와, 원본 컨텐츠로부터 추출한 참조데이터를 수신할 수 있다.

여기서, 컨텐츠 서버(700)는 전송매체의 전송속도(bit rate)에 따라 원본 컨텐츠에 대한 인코딩시 품질을 제한하여 압축데이터를 생성할 수 있으며, 수신부(610)는 전송매체의 전송속도에 따라 제한된 품질의 압축데이터를 수신할 수 있다. 이 경우, 수신한 압축데이터만을 복호화하여 컨텐츠를 재생하면 컨텐츠의 해상도 등 품질이 상대적으로 낮아지는 등의 문제가 발생할 수 있다.

이를 해결하기 위하여, 수신부(610)는 압축데이터 이외에 참조데이터를 추가로 수신할 수 있다. 즉, 원본 컨텐츠의 정보를 포함하는 메타데이터에 해당하는 참조데이터를 컨텐츠서버(700)로부터 더 제공받을 수 있으며, 이후 참조데이터를 활용하여 품질개선을 수행할 수 있다.

구체적으로, 참조데이터는 원본 컨텐츠를 캡쳐한 고화질의 이미지이거나, 원본 컨텐츠를 음성인식하여 생성한 텍스트정보일 수 있다. 먼저, 원본 컨텐츠가 동영상인 경우에는, 원본 컨텐츠를 캡처하여 생성한 고화질의 이미지를 참조데이터로 활용할 수 있다. 즉, 참조데이터에는 원본 컨텐츠에 포함된 특정 프레임에 대응하는 고화질 이미지 정보가 포함되므로, 이를 활용하여 특 프레임의 전후 프레임들의 품질을 개선하도록 할 수 있다.

한편, 참조데이터는 원본 컨텐츠를 기 설정된 주기마다 샘플링하여 생성한 것일 수 있으며, 실시예에 따라서는 원본 컨텐츠 내의 장면변화(scene change)가 발생할 때마다 생성하는 것도 가능하다.

예를들어, 원본 컨텐츠가 동영상인 경우, 동영상을 N 초마다 한번씩 캡쳐하여 참조데이터를 생성하도록 할 수 있다. 즉, 원본 컨텐츠 전체가 아니라 원본 컨텐츠를 샘플링하여 참조데이터를 생성할 수 있다. 여기서, 참조데이터는 고화질의 이미지이므로 상대적으로 용량이 클 수 있다. 따라서, 참조데이터를 N초마다 한번씩 포함하여 필요한 용량은 줄이면서도 품질개선을 구현하도록 할 수 있다. 실시예에 따라서는, 640X360의 풀프레임 동영상에 대해, 10초에 1장씩 1920X1080 해상도의 이미지를 참조데이터로 생성하도록 할 수 있다.

추가적으로, 참조데이터에는 고화질의 이미지 등과 함께, 각각의 참조데이터를 생성한 시점의 타임스탬프(time stamp)가 더 포함될 수 있다.

디코딩부(620)는 압축데이터를 디코딩(decoding)하여 복호데이터를 생성할 수 있다. 디코딩부(620)는 압축데이터의 인코딩시 활용한 코덱을 이용하여 압축데이터를 디코딩할 수 있다. 여기서 디코팅부(620)는 MPEG, Indeo, DivX, Xvid, H.264, WMV, RM, Cinepak, MOV, ASF, RA, XDM, RLE 등의 동영상 코덱(codec)이나, MP3, AC3, AAC, OGG, WMA, FLAC. DTS 등의 오디오 코덱 등을 활용할 수 있다.

품질개선부(630)는 복호데이터 및 참조데이터를 품질개선모델에 적용할 수 있으며, 품질개선모델로부터 복호데이터의 품질을 개선한 출력데이터를 생성할 수 있다. 여기서 품질개선모델은 딥러닝(deep learning)을 기반으로 미리 학습된 것일 수 있으며, 품질개선모델을 이용하면 복호데이터와 참조데이터로부터 각각의 복호데이터에 대응하는 원본 컨텐츠의 추정하는 것이 가능하다.

즉, 전체 원본 컨텐츠를 대신하여, 원본 컨텐츠에서 샘플링한 참조데이터를 활용할 수 있으며, 품질개선모델이 참조데이터와 복호데이터를 비교하여 원본 컨텐츠에 대응하는 품질을 가지는 출력데이터를 생성하도록 학습시킬 수 있다.

여기서, 품질개선부(630)는 원본 컨텐츠가 동영상인 경우 복호데이터와 참조데이터를 이용하여 원본 컨텐츠의 해상도를 복원한 출력데이터를 생성할 수 있으며, 원본 컨텐츠가 오디오인 경우에는 음질을 복원한 출력데이터를 생성할 수 있다.

한편, 도6을 참조하면, 본 발명의 일 실시예에 의한 컨텐츠 서버(700)는 인코딩부(710), 참조데이터생성부(720) 및 전송부(730)를 포함할 수 있다.

컨텐츠 서버(700)는 클라이언트 단말(600)로부터 원본 컨텐츠에 대한 스트리밍(streaming)을 요청받을 수 있으며, 이 경우 인코딩부(710)는 스트리밍 요청에 대응하여 원본 콘텐츠를 인코딩할 수 있다.

구체적으로, 인코딩부(710)는 클라이언트 단말(600)과 연결된 전송매체의 전송속도(bit rate)에 따라 인코딩 품질을 설정할 수 있으며, 인코딩 품질에 따라 원본 컨텐츠를 인코딩하여 압축데이터를 생성할 수 있다. 여기서, 인코딩부(710)는 MPEG, Indeo, DivX, Xvid, H.264, WMV, RM, Cinepak, MOV, ASF, RA, XDM, RLE 등의 동영상 코덱(codec)이나, MP3, AC3, AAC, OGG, WMA, FLAC. DTS 등의 오디오 코덱 등을 활용할 수 있다.

또한, 참조데이터생성부(720)는 원본 컨텐츠를 기 설정된 주기마다 샘플링하거나, 원본 컨텐츠 내의 장면변화(scene change)가 발생할 때마다 샘플링하여, 원본 컨텐츠에 대한 참조데이터를 생성할 수 있다.

구체적으로, 참조데이터는 원본 컨텐츠를 캡쳐한 고화질의 이미지이거나, 원본 컨텐츠를 음성인식하여 생성한 텍스트정보일 수 있다. 여기서, 원본 컨텐츠가 동영상인 경우에는 원본 컨텐츠의 캡처한 고화질의 이미지를 참조데이터로 활용하고, 원본 컨텐츠가 음원 등인 경우에는 해당 음원에 음성인식을 통해 추출한 텍스트정보를 참조데이터로 활용할 수 있다. 또한, 참조데이터는 샘플링을 통해 획득한 고화질의 이미지 등과 함께, 각각의 참조데이터를 생성한 시점의 타임스탬프를 더 포함할 수 있다.

한편, 원본 컨텐츠가 동영상인 경우, 참조데이터생성부(720)는 동영상을 N 초마다 한번씩 캡쳐하여 참조데이터를 생성할 수 있다. 예를들어, 원본 컨텐츠가 640X360의 풀프레임 동영상인 경우, 참조데이터생성부(720)는 10초에 1장씩 1920X1080 해상도의 이미지를 참조데이터로 생성하도록 할 수 있다.

또한, 동영상 내에는 유사한 장면이 일정시간 동안 유지된 후, 장면이 전환되는 등의 경우가 다수 존재할 수 있다. 여기서, 장면전환시 급격한 변화가 발생하므로, 참조데이터생성부(720)는 장면전환시마다 참조데이터를 생성하여 전환된 장면에 대응한 품질개선이 가능하도록 할 수 있다.

전송부(730)는 압축데이터 및 참조데이터를 전송매체를 통하여 클라이언트 단말(600)로 전송할 수 있다. 여기서, 전송부(730)는 미리 설정된 네트워크 프로토콜에 따라 압축데이터 및 참조데이터를 전송할 수 있다. 예를들어, RTMP(Real Time Messaging Protocol), HTTP(Hypertext Transfer Protocol) 등을 활용할 수 있다.

도7은 본 발명의 일 실시예에 의한 클라이언트 단말에서의 컨텐츠품질개선방법을 나타내는 순서도이다.

도7을 참조하면, 클라이언트 단말은 컨텐츠 서버로부터 원본 컨텐츠를 인코딩(encoding)한 압축데이터와, 원본 컨텐츠로부터 추출한 참조데이터를 수신할 수 있다(S710). 클라이언트 단말은 컨텐츠 서버로 원본 컨텐츠에 대한 제공을 요청할 수 있으며, 이 경우 압축데이터와 참조데이터를 컨텐츠 서버로부터 수신할 수 있다. 여기서, 참조데이터는 원본 컨텐츠의 정보를 포함하므로, 이후 이를 활용하여 품질개선을 수행하는 것이 가능하다.

이후, 클라이언트 단말은 압축데이터를 디코딩(decoding)하여 복호데이터를 생성할 수 있다(S720). 클라이언트 단말은 컨텐츠 서버가 압축데이터를 인코딩할 때 활용한 코덱을 이용하여, 압축데이터를 디코딩할 수 있다. 여기서 클라이언트 단말은 MPEG, Indeo, DivX, Xvid, H.264, WMV, RM, Cinepak, MOV, ASF, RA, XDM, RLE 등의 동영상 코덱이나, MP3, AC3, AAC, OGG, WMA, FLAC. DTS 등의 오디오 코덱 등을 활용할 수 있다.

디코딩이 완료되면, 클라이언트 단말은 복호데이터 및 참조데이터를 품질개선모델에 적용하여, 복호데이터의 품질을 개선한 출력데이터를 생성할 수 있다(S730). 여기서 품질개선모델은 딥러닝(deep learning)을 기반으로 미리 학습된 것으로, 품질개선모델을 이용하면, 복호데이터와 참조데이터로부터 각각의 복호데이터에 대응하는 원본 컨텐츠의 추정하는 것이 가능하다. 즉, 전체 원본 컨텐츠가 아니라 원본 컨텐츠에서 샘플링한 참조데이터를 이용하여, 복호데이터로부터 원본 컨텐츠에 대응하는 품질을 가지는 출력데이터를 생성할 수 있다.

도8은 본 발명의 일 실시예에 의한 컨텐츠서버에서의 컨텐츠전송방법을 나타내는 순서도이다.

도8을 참조하면, 컨텐츠 서버는 클라이언트 단말로부터 원본 컨텐츠에 대한 스트리밍(streaming)을 요청받을 수 있다(S810). 이 경우 컨텐츠 서버는 원본 컨텐츠를 컨텐츠 서버 또는 원본 컨텐츠 데이터베이스에서 검색할 수 있다.

이후, 요청받은 원본 컨텐츠가 검색되면, 컨텐츠 서버는 클라이언트 단말과 연결된 전송매체의 전송속도(bit rate)에 따라 인코딩 품질을 설정하고, 인코딩 품질에 따라 원본 컨텐츠를 인코딩하여 압축데이터를 생성할 수 있다(S820). 구체적으로, 클라이언트 단말과 연결된 전송매체의 전송속도에 따라 인코딩 품질을 설정할 수 있으며, 인코딩 품질에 따라 원본 컨텐츠를 인코딩하여 압축데이터를 생성할 수 있다. 여기서, 컨텐츠서버는 MPEG, Indeo, DivX, Xvid, H.264, WMV, RM, Cinepak, MOV, ASF, RA, XDM, RLE 등의 동영상 코덱(codec)이나, MP3, AC3, AAC, OGG, WMA, FLAC. DTS 등의 오디오 코덱 등을 활용할 수 있다.

또한, 컨텐츠 서버는, 원본 컨텐츠를 기 설정된 주기마다 샘플링하거나, 원본 컨텐츠 내의 장면변화(scene change)가 발생할 때마다 샘플링하여, 원본 컨텐츠에 대한 참조데이터를 생성할 수 있다(S830). 즉, 클라이언트 단말에서 품질개선을 수행할 수 있도록, 컨텐츠 서버는 원본 컨텐츠에 대한 정보를 포함하는 참조데이터를 추가로 생성할 수 있다.

구체적으로, 참조데이터는 원본 컨텐츠를 캡쳐한 고화질의 이미지이거나, 원본 컨텐츠를 음성인식하여 생성한 텍스트정보일 수 있다. 여기서, 원본 컨텐츠가 동영상인 경우에는 원본 컨텐츠의 캡처한 고화질의 이미지를 참조데이터로 활용하고, 원본 컨텐츠가 음원 등인 경우에는 해당 음원에 음성인식을 통해 추출한 텍스트정보를 참조데이터로 활용할 수 있다. 이때, 참조데이터는 샘플링을 통해 획득한 고화질의 이미지 등과 함께, 각각의 참조데이터를 생성한 시점의 타임스탬프를 더 포함할 수 있다.

이후, 컨텐츠 서버는 생성한 압축데이터 및 참조데이터를 전송매체를 통하여 클라이언트 단말로 전송할 수 있다(S840). 여기서, 컨텐츠 서버는 미리 설정된 네트워크 프로토콜에 따라 압축데이터 및 참조데이터를 전송할 수 있으며, 예를들어, RTMP(Real Time Messaging Protocol), HTTP(Hypertext Transfer Protocol) 등을 활용할 수 있다.

전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.

본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 본 발명에 따른 구성요소를 치환, 변형 및 변경할 수 있다는 것이 명백할 것이다.

Claims

컨텐츠 생성단말의 컨텐츠 전송방법에 있어서,

상기 컨텐츠 생성단말이 원본 컨텐츠를 생성하는 단계;

상기 원본 컨텐츠를 인코딩(encoding)한 압축데이터와, 상기 원본 컨텐츠를 샘플링(sampling)한 참조데이터를 생성하는 단계; 및

상기 압축데이터 및 참조데이터를 배포서버로 전송하는 단계를 포함하는 컨텐츠전송방법.
제1항에 있어서, 상기 원본 컨텐츠는

상기 컨텐츠 생성단말이 실시간으로 생성하는 라이브 방송 컨텐츠 또는 상기 컨텐츠 생성단말 내에 저장된 녹화 방송 컨텐츠를 포함하는 것을 특징으로 하는 컨텐츠전송방법.
제1항에 있어서, 상기 생성하는 단계는

상기 컨텐츠 생성단말과 상기 배포서버 사이의 전송매체의 전송속도(bit rate)에 따라, 제한된 품질의 압축데이터를 생성하는 것을 특징으로 하는 컨텐츠전송방법.
제1항에 있어서, 상기 참조데이터는

상기 원본 컨텐츠를 캡쳐(capture)하여 생성한 원본 해상도의 참조 이미지 또는 상기 원본 컨텐츠를 음성인식하여 생성한 참조 텍스트인 것을 특징으로 하는 컨텐츠전송방법.
제1항에 있어서, 상기 참조데이터는

상기 원본 컨텐츠를 설정주기마다 샘플링하여 생성하거나, 상기 원본 컨텐츠 내의 장면변화(scene change)가 발생할 때마다 생성하는 것을 특징으로 하는 컨텐츠전송방법.
배포 서버의 컨텐츠품질개선방법에 있어서,

컨텐츠 생성단말로부터, 원본 컨텐츠를 인코딩(encoding)한 압축데이터와 상기 원본 컨텐츠를 샘플링(sampling)한 참조데이터를 수신하는 단계;

상기 압축데이터를 디코딩(decoding)하여 복호데이터를 생성하는 단계; 및

상기 복호데이터 및 참조데이터를 품질개선모델에 적용하여, 상기 복호데이터의 품질을 개선한 출력데이터를 생성하는 단계를 포함하는 컨텐츠품질개선방법.
제6항에 있어서, 상기 품질개선모델은

딥러닝(deep learning)을 기반으로 학습된 것으로, 상기 참조데이터를 이용하여 상기 복호데이터를 상기 원본 컨텐츠의 해상도 또는 음질을 가지는 출력데이터로 복원하는 것을 특징으로 하는 컨텐츠품질개선방법.
제6항에 있어서, 상기 품질개선모델은

초해상도 영상복원 모델(super resolution model), SDR-HDR(Standard Dynamic Range-High Dynamic Range) 영상 변환 모델, 영상개선(Image enhancement) 모델 및 음질개선모델 중 어느 하나인 것을 특징으로 하는 컨텐츠품질개선방법.
원본 컨텐츠를 생성하는 컨텐츠 생성부;

상기 원본 컨텐츠를 인코딩(encoding)하여 압축 데이터를 생성하는 인코딩부;

상기 원본 컨텐츠를 샘플링(sampling)하여 참조데이터를 생성하는 참조데이터생성부; 및

상기 압축데이터 및 참조데이터를 배포서버로 전송하는 전송부를 포함하는 컨텐츠 생성단말.
컨텐츠 생성단말로부터, 원본 컨텐츠를 인코딩(encoding)한 압축데이터와 상기 원본 컨텐츠를 샘플링(sampling)하여 추출한 참조데이터를 수신하는 수신부;

상기 압축데이터를 디코딩(decoding)하여 복호데이터를 생성하는 디코딩부; 및

상기 복호데이터 및 참조데이터를 품질개선모델에 적용하여, 상기 복호데이터의 품질을 개선한 출력데이터를 생성하는 품질개선부를 포함하는 배포서버.
클라이언트 단말에서의 컨텐츠품질개선방법에 있어서,

컨텐츠 서버로부터, 원본 컨텐츠를 인코딩(encoding)한 압축데이터와 상기 원본 컨텐츠를 샘플링(sampling)한 참조데이터를 수신하는 단계;

상기 압축데이터를 디코딩(decoding)하여 복호데이터를 생성하는 단계; 및

상기 복호데이터 및 참조데이터를 품질개선모델에 적용하여, 상기 복호데이터의 품질을 개선한 출력데이터를 생성하는 단계를 포함하는 컨텐츠품질개선방법.
컨텐츠 서버의 컨텐츠 전송방법에 있어서,

클라이언트 단말로부터 원본 컨텐츠에 대한 스트리밍(streaming)을 요청받는 단계;

상기 클라이언트 단말과 연결된 전송매체의 전송속도(bit rate)에 따라 인코딩 품질을 설정하고, 상기 인코딩 품질에 따라 상기 원본 컨텐츠를 인코딩하여 압축데이터를 생성하는 단계;

상기 원본 컨텐츠를 기 설정된 주기마다 샘플링하거나, 상기 원본 컨텐츠 내의 장면변화(scene change)가 발생할 때마다 샘플링하여, 상기 원본 컨텐츠에 대한 참조데이터를 생성하는 단계; 및

상기 압축데이터 및 참조데이터를 상기 전송매체를 통하여 상기 클라이언트 단말로 전송하는 단계를 포함하는 컨텐츠 서버의 컨텐츠전송방법.