JP2020109897A - 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置 - Google Patents

画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置 Download PDF

Info

Publication number
JP2020109897A
JP2020109897A JP2018248974A JP2018248974A JP2020109897A JP 2020109897 A JP2020109897 A JP 2020109897A JP 2018248974 A JP2018248974 A JP 2018248974A JP 2018248974 A JP2018248974 A JP 2018248974A JP 2020109897 A JP2020109897 A JP 2020109897A
Authority
JP
Japan
Prior art keywords
image
data
bit rate
low bit
rate encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018248974A
Other languages
English (en)
Other versions
JP6900359B2 (ja
Inventor
尚 小嶋
Takashi Kojima
尚 小嶋
一彦 草野
Kazuhiko Kusano
一彦 草野
肇 加藤
Hajime Kato
肇 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dwango Co Ltd
Original Assignee
Dwango Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dwango Co Ltd filed Critical Dwango Co Ltd
Priority to JP2018248974A priority Critical patent/JP6900359B2/ja
Priority to PCT/JP2019/037580 priority patent/WO2020137050A1/ja
Priority to US17/418,233 priority patent/US11800185B2/en
Priority to CN201980077647.5A priority patent/CN113491134A/zh
Publication of JP2020109897A publication Critical patent/JP2020109897A/ja
Priority to JP2020203735A priority patent/JP7336427B2/ja
Application granted granted Critical
Publication of JP6900359B2 publication Critical patent/JP6900359B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440263Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the spatial resolution, e.g. for displaying on a connected PDA
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234363Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4318Generation of visual interfaces for content selection or interaction; Content or additional data rendering by altering the content in the rendering process, e.g. blanking, blurring or masking an image region
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
    • H04N21/4666Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms using neural networks, e.g. processing the feedback provided by the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/654Transmission by server directed to the client
    • H04N21/6547Transmission by server directed to the client comprising parameters, e.g. for client setup
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level

Abstract

【課題】 動画像コンテンツをサーバ2−2から視聴者端末11へ配信するシステム1において、配信容量を小さくして伝送路への負荷を削減するとともに、視聴する画像品質を向上させた構成を提供する。【解決手段】 低ビットレートへエンコードした画像に基づくコンテンツデータ31と、低ビットレートエンコード済み画像から原画像30に近づいた画像を得るためのモデルデータ32である、ニューラルネットワークにおける変換行列のデータとを、動画像コンテンツ配信サーバ2−2が視聴者端末11へ配信し、視聴者端末11ではこれらを用いて、改良された動画像コンテンツ33を得ることができる。【選択図】図3

Description

本開示は、画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置に関し、特に動画像コンテンツを配信サーバから、視聴者用のクライアント端末へ配信する、動画像配信システムに好適な構成に関する。
動画像または静止画像と、必要に応じて音声と組み合わせた画像コンテンツ(「画像番組」、「番組」、「コンテンツ」とも言い、以下ではこれらも用いる)を、配信用のサーバから、視聴者が用いるクライアント端末へ送信し、クライアント端末の表示画面に表示された画像コンテンツを視聴者が鑑賞する画像配信システムが用いられている。
例えば、下記の特許文献1には、その図1および0012乃至0016段落、および、0032段落乃至0035段落などに、映像データを配信するストリーミングサーバ300にネットワーク500を介して接続する複数の端末装置400が、ユーザの選択操作に応じて複数の映像データの中から所望の映像データを選択し、配信を受けることが可能なシステムの構成が開示されている。
特に動画像コンテンツは送信すべきデータの容量が大きく、配送元のコンテンツ配信用サーバから配送先の視聴用端末へインターネット通信網を含む広域ネットワークなど通信路経由で動画像コンテンツを配信する場合、通信路への負荷が大きくなり、さらに配信先の端末の数が増えたり、あるいはある時間中に配信が集中した場合には、データの輻輳、配信の中断を招きかねない。
これに対し、下記の特許文献2が開示するビデオエンコーディングシステムは、その0024〜0025段落などに記載があるように、限られた帯域幅のみを有するインターネット通信網を介してビデオを見るためにビデオストリーミングの送受を行うシステムにおいては、ビデオデータ圧縮の目的でデジタルビデオ信号のデータ比率が実質的に低減され得る効率的なデジタルビデオエンコーディングを用いることが必要となる、としている。そして特許文献2開示システムが備えるエンコーダは、ビデオストリームをまず複数のシーンに分割し、それぞれのシーンについてシーンタイプとして、例えば、「高速動き」、「静止」、「トーキングヘッド」、「文字」、「スクロールクレジット」、「ほとんど黒色の画像」、「5つ以下の画像フレームの短いシーン」などのいずれかを決定して、各シーンタイプのためのあらかじめ規定されたビデオエンコーディングパラメータ(画像符号化パラメータ)を用いてエンコーディングされたビデオストリームを出力する、としている。
一方、より高効率に動画像コンテンツの帯域圧縮を行うための一つの選択肢として、動画像コンテンツデータを送信する送信レート(ビットレート)を小さくして、少ないデータ量として送信する方法がある。ところが、この方法では、動画像コンテンツデータに含まれるデータ量が減少し、画像品位の劣る、すなわちディテール情報が欠落したり、ブロックノイズやモスキートノイズを含んだ画像表示がなされがちとなるので、視聴者(ユーザ)の不満が生じてしまう。
一方、動画像コンテンツの配信システムでの適用を意図した構成ではないものの、このような、ディテールが欠落した画像データを改変して、解像感が向上して、原画像に近づいた画像を生成するために、ディープラーニングを含めた機械学習技術を利用するものを含め、提案がいくつかなされている。
例えば、下記の特許文献3には、低画質の画像から高画質の画像を復元する技術(「超解像技術」と呼ぶ)において、まず全体のプロセスが、復元に用いる辞書データベースを作成する過程である学習過程と、この辞書データベースを用いて低画質画像から高画質画像を復元する復元過程とに分かれている(0043段落)。そして学習過程では同じ学習画像の同じ局所領域に由来する微小サイズの高解像度画像、及びこの高解像度画像を画質劣化させて作られた劣化画像の対が作成され、復元過程においては、復元対象となる低画質の画像からパッチ画像が切り出され、当該パッチ画像に類似する辞書データベースにある学習済みの微小サイズの劣化画像が特定され、当該劣化画像と対になっている微小サイズの高解像度画像を集成することで、画像が高画質に復元される学習型超解像技術を用いるとしている。
また、同様にディープラーニングを用いて高解像度画像を復元しようとする下記の特許文献4には、複数種類の撮影対象物が出現する可能性のある場面において、より正確に監視を行うことができる監視システムを提供するために(0004段落)、0015段落、0029乃至0041段落にあるように、対象物の種類に対応する辞書データ64を用いて超解像処理を行う構成であって、超解像処理した画像を取得するために、畳み込み演算を実行するときに必要な係数を含んだ辞書データ64は、例えば多数の正解データである高解像度データと低解像度データの組み合わせをディープラーニング等の手法で学習することで生成されるもので、後段画像処理部54は、この学習により生成された辞書データ64を用いて、実際に取得した画像に対して畳み込み演算を実行し、高解像度画像(拡大画像)を取得する、としている。
さらに、同様にディープラーニングを用いて高解像度画像を復元しようとする下記の特許文献5には、アナログ記録媒体(ビデオテープ、フィルム等)に記録された劣化した映像の高画質化システムが開示されている。
しかしながら、上記に示したこれら各特許文献が開示する構成においては、先に示したような、動画像コンテンツのような大容量の画像データを配信元から配信先へ配信する場合において、通信路などの負荷を軽減し、かつ、画像品位が妥当である動画像コンテンツ配信を行うための構成は何ら開示をしていないし、示唆すらしていない。
本願発明は、以上のように、それぞれの従来技術がいまだ解決できていない課題である、限られた帯域幅のみを有するインターネット通信網など伝送路を介して動画像コンテンツを見るためにビデオストリーミングの送受を行うシステムにおいて、効率的な伝送帯域の圧縮と、原画像に近い解像感を有する画像復元とを、操作者の負担を軽減して効率的に実施が可能な、画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置を提供することを、目的とする。
特許 第5956761号公報 特許出願公開 特開2017−123649号公報 特許出願公開 特開2017−49686号公報 特許出願公開 特開2017−158067号公報 特許出願公開 特開2015−201819号公報
課題を解決するための手段
本発明は、上記の課題を解決するために、以下の各項に記載の画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置を提供する。
1)
単数または複数備えられた送信装置の少なくともいずれかが、原画像を低ビットレートへエンコードした低ビットレートエンコード済み画像から、より原画像に近づけた改良画像を生成するためのモデルデータを、機械学習により生成する機械学習部を備え、
単数または複数備えられた送信装置の少なくともいずれかが、 低ビットレートエンコード済み画像と、モデルデータとを当該装置の外部へ送信する送信部を備え、
受信装置が、受信した低ビットレートエンコード済み画像およびモデルデータから、当該低ビットレートエンコード画像の改良画像を生成する改良画像生成部を有することを特徴とする、画像送受信システム。
2)
機械学習に用いるデータが、さらに、低ビットレートエンコード済み画像のメタ情報を含むことを特徴とする、1)に記載の画像送受信システム。
3)
低ビットレートエンコード済み画像のメタ情報が、画像符号化技術における符号化ブロック量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、2)に記載の画像送受信システム。
4)
単数または複数備えられた送信装置の少なくともいずれかが、さらに、送信部から送信されるいずれかの低ビットレートエンコード済み画像に関する情報に基づき、低ビットレートエンコード済み画像と共に送信されるモデルデータを、複数の中から選択するモデルデータ選択部を有することを特徴とする、1)乃至3)のいずれか1項に記載の画像送受信システム。
5)
単数または複数備えられた送信装置の少なくともいずれかが、原データを低ビットレートへエンコードした低ビットレートエンコード済みデータから、より原データに近づけた改良データを生成するためのモデルデータを、機械学習により生成する機械学習部を備え、
単数または複数備えられた送信装置の少なくともいずれかが、低ビットレートエンコード済みデータと、モデルデータとを当該装置の外部へ送信する送信部を備え、
受信装置が、受信した低ビットレートエンコード済みデータおよびモデルデータから、当該低ビットレートエンコードデータの改良データを生成する改良データ生成部を有することを特徴とする、データ送受信システム。
6)
画像の送受信方法であって、
単数または複数備えられた送信装置の少なくともいずれかが有する機械学習部が、原画像を低ビットレートへエンコードした低ビットレートエンコード済み画像から、より原画像に近づけた改良画像を生成するためのモデルデータを、機械学習により生成するステップと、
単数または複数備えられた送信装置の少なくともいずれかが有する送信部が、低ビットレートエンコード済み画像と、モデルデータとを当該装置の外部へ送信するステップと、
受信装置の改良画像生成部が、受信した低ビットレートエンコード済み画像およびモデルデータから、当該低ビットレートエンコード済み画像の改良画像を生成するステップと、を有することを特徴とする、送受信方法。
7)
機械学習に用いるデータが、さらに、低ビットレートエンコード済み画像のメタ情報を含むことを特徴とする、6)に記載の送受信方法。
8)
低ビットレートエンコード済み画像のメタ情報が、画像符号化技術における符号化ブロック量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、7)に記載の送受信方法。
9)
単数または複数備えられた送信装置の少なくともいずれかが、さらに、送信部から送信される前記低ビットレートエンコード済み画像に関する情報に基づき、前記低ビットレートエンコード済み画像と共に送信される前記モデルデータを、複数の中から選択するモデルデータ選択部を有することを特徴とする、請求項6乃至8のいずれか1項に記載の送受信方法。
10)
単数または複数備えられた送信装置の少なくともいずれかが有する機械学習部が、原データを低ビットレートへエンコードした低ビットレートエンコード済みデータから、より原データに近づけた改良データを生成するためのモデルデータを、機械学習により生成するステップと、
単数または複数備えられた送信装置の少なくともいずれかが有する送信部が、低ビットレートエンコード済みデータと、モデルデータとを当該装置の外部へ送信するステップと、
受信装置の改良データ生成部が、受信した低ビットレートエンコード済みデータおよびモデルデータから、当該低ビットレートエンコードデータの改良データを生成するステップと、を有することを特徴とする、送受信方法。
11)
6)乃至10)のいずれか1項に記載された送受信方法を実行するためのコンピュータ・プログラム。
12)
単数または複数備えられた送信装置の少なくともいずれかに設けられた、原画像を低ビットレートへエンコードした低ビットレートエンコード済み画像から、より原画像に近づけた改良画像を生成するためのモデルデータを、機械学習により生成する機械学習部と、
単数または複数備えられた送信装置の少なくともいずれかに設けられた、低ビットレートエンコード済み画像と、モデルデータとを当該システムの外部へ送信する送信部と、を備えたことを特徴とする、画像送信システム。
13)
機械学習に用いるためのデータが、低ビットレートエンコード済み画像のメタ情報であることを特徴とする、12)に記載の画像送信システム。
14)
低ビットレート変換画像のメタ情報が、画像符号化技術における符号化ブロック量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、13)に記載の画像送信システム。
15)
さらに、送信部から送信される低ビットレートエンコード済み画像に関する情報に基づき、低ビットレートエンコード済み画像と共に送信されるモデルデータを、複数の中から選択するモデルデータ選択部を有することを特徴とする、12)乃至14)のいずれか1項に記載の画像送信システム。
16)
単数または複数設けられた送信装置の少なくともいずれかに設けられた、原データを低ビットレートへエンコードした低ビットレートエンコード済みデータを、より原データに近づけた改良データを生成するためのモデルデータを、機械学習により生成する機械学習部と、
単数または複数設けられた送信装置の少なくともいずれかに設けられた、低ビットレートエンコード済みデータと、モデルデータとを当該装置の外部へ送信する送信部を備えたことを特徴とする送信システム。
17)
原画像を低ビットレートへエンコードした低ビットレートエンコード済み画像から、より原画像に近づけた改良画像を生成するためのモデルデータであって、機械学習により生成されたモデルデータと、低ビットレートエンコード済み画像とを画像送信システムから受信する受信部と、
受信した低ビットレートエンコード済み画像およびモデルデータから、当該低ビットレートエンコード画像の改良画像を生成する改良画像生成部と、を有することを特徴とする画像受信装置。
18)
機械学習に用いるためのデータが、低ビットレートエンコード済み画像のメタ情報であることを特徴とする、17)に記載の画像受信装置。
19)
低ビットレートエンコード済み画像のメタ情報が、画像符号化技術における符号化ブロック量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、18)に記載の画像受信装置。
20)
受信部が受信するモデルデータは、共に受信する低ビットレートエンコード済み画像に関する情報に基づき、複数の中から選択されたことを特徴とする、17)に記載の画像受信装置。
21)
原データを低ビットレートへエンコードした低ビットレートエンコード済みデータから、より原データに近づけた改良データを生成するためのモデルデータであって、機械学習により生成されたモデルデータと、低ビットレートエンコード済みデータとを送信システムから受信する受信部と、
受信した前記低ビットレートエンコード済みデータおよびモデルデータから、当該低ビットレートエンコード済みデータの改良データを生成する改良データ生成部と、を有することを特徴とする受信装置。
発明の効果
上記のような構成を有することにより、本発明は、限られた帯域幅のみを有するインターネット通信網など伝送路を介して動画像コンテンツを見るためにビデオストリーミングの送受を行うシステムなどにおいて、効率的な伝送帯域の圧縮と、原画像に近い解像感を有する画像復元とを、操作者の負担を軽減して効率的に実施が可能な、画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置を提供することができる。
本発明各実施形態に共通な、高画質化処理の概念図である。 本発明にかかる動画像コンテンツ配信システムの全体構成図である。 本発明の第1の実施形態における配信信号の流れを示す概念図である。 本発明の第1の実施形態が用いるニューラルネットワークの概念図である。 本発明の各実施形態に共通な、モデルデータ作成サーバおよび動画像コンテンツ配信サーバの構成を示す図である。 本発明の各実施形態に共通な、第1の視聴者端末の構成を示す図である。 本発明の各実施形態に共通な、第1の視聴者端末の外観模式図である。 本発明の各実施形態に共通な、動画像配信サイトの画面遷移模式図である。 本発明の第1の実施形態における高画質化処理のシークエンス・チャートである。 本発明・第1の実施形態 第1の視聴者端末が実行する、画像の高画質化処理フロー図である。
〔本発明の各実施形態に共通な構成〕
本発明の各実施形態においては、動画像コンテンツ配信サーバ2−2から配信されるコンテンツ(番組)、特に動画像コンテンツに含まれる各画像は、図1(A)に示すような原画像(猫の画像で例示している)が、伝送容量を削減する目的で、図1(B)図示のような低ビットレートへのエンコード済み画像(同じく、猫の低ビットレートへのエンコード済み画像で例示した)が生成されて、各低ビットレート画像よりなる伝送用動画像コンテンツが、視聴者端末11、12、13へ配信される。
配信を受けた視聴者用の各端末11,12,13では、以下の各実施形態で説明をするそれぞれの構成、方法によって、図1(C)のような、視覚的に原画像に近づいた(「高画質化した」などともいう)画像(同じく、猫の高画質化した画像で例示した)を生成して、それら高画質化した各画像を集成して、高画質化した動画像コンテンツを生成し、視聴者の視聴に供するものである。
そのために、本発明の各実施形態に共通な構成として、図2に図示するとおり、動画像コンテンツ配信システム1は、サーバ用コンピュータなどで実現されるモデルデータ作成サーバ2−1、同じくサーバ用コンピュータなどで実現される動画像コンテンツ配信サーバ2−2と、このサーバ2−1、2−2との間で、インターネット通信網などで例示される伝送路3を介して信号接続する、パーソナルコンピュータ、スマートフォンあるいは携帯情報端末などで実現される第1の視聴者11、第2の視聴者端末12、及び第3の視聴者端末13などを備えている。実施に際して視聴者端末の数は上の例示に限定されない。また、以下の各説明では、視聴者端末の代表として第1の視聴者端末11について説明を行うが、他の視聴者端末においても、構成や動作は同様である。
ここで、本発明が実行しようとする「高画質化」、あるいは原画像により視覚的に近づけた画像の生成について定性的な説明を行うと、従来技術においては単に画素数を増やしたり、あるいはアナログノイズを取り除いたりするのみの構成であるところ、本発明実施構成では、低ビットレートの動画から、高ビットレートの動画を復号した画像のようだと人間が感じる画像に変換する点が特徴である。更に、本発明における高画質化とは、単なる静止画における空間方向の高画質化処理だけではなく、動画における時間方向の高画質化処理をも含むようにしてもよい。
〔第1の実施の形態・概要〕
以下、図1乃至図10の各図面を援用し、本発明にかかる第1の実施の形態である、動画像コンテンツ配信システム1を説明する。なお、本実施形態に限らず本願明細書記載の各実施例は本発明実施の一例示にすぎず、種々の変形、他の技術との組み合わせによる実施が可能であり、それらもまた本発明に含まれる。
本実施形態のシステム1は、先に説明をした図2の構成を踏まえ、さらに、図3に示すように、モデルデータ作成サーバ2−1は、第1の視聴者端末11が配信(送信)を望んでいる動画像コンテンツに対応した、機械学習用の入力データである低ビットレート化画像と、その低ビットレート化前の原画像とを用いて、機械学習済みモデルデータである、後に説明をする変換行列Q,Rを記憶している。
第1の視聴者端末11から、ユーザが配信を希望する動画像コンテンツの配信要求を動画像コンテンツ配信サーバ2−2が受けると(図9 ステップS1)、動画像コンテンツ配信サーバ2−2は、まず、原画像30を含んでいる、配信が要求された原動画像コンテンツの各原画像について低ビットレートへのエンコード処理を行い、処理により生成された各低ビットレートエンコード済み画像31を集成して低ビットレート動画像コンテンツを生成する。あるいは、コンテンツの配信要求を受ける前に、これらコンテンツについての低ビットレートエンコード済みコンテンツを作成しておいてもよい。
次に動画像コンテンツ配信サーバ2−2は、配信が要求された動画像コンテンツの機械学習による高画質化に適した、機械学習におけるモデルデータである、例えばニューラルネットワーク技術における変換行列Q,Rの配信をモデルデータ作成サーバ2−1に対して要求し(図9 ステップS2)、要求に応じて得られた機械学習済みモデルデータである変換行列Q,R32とともに、配信が要求された動画像コンテンツを低ビットレート化した動画像コンテンツ31を、伝送路3を経由して、第1の視聴者端末11へ送信する(図9 ステップS3,S4)。
配信を受けた第1の視聴者端末11は、各低ビットレートエンコード済み画像31について以下に説明を行う動作及び方法により、機械学習済みモデルデータ32を用いて、視覚的に原画像により近づいた画像33を生成し、それら高画質化した各画像を集成して解像感が向上した動画像コンテンツを生成して、視聴者の視聴に供する。
〔機械学習を用いたモデルデータの取得〕
本実施形態では、機械学習の中で、ニューラルネットワークを用いた、多次元の入力から多次元の出力を得る際に、教師データを用いて最適なモデルを得る手法を用いている。
なお、これらニューラルネットワークを用いた機械学習の適用は一例にすぎず、他の機械学習の手法を用いて高画質化処理を行うことも可能であり、そのような構成もまた本発明に含まれる。
本発明・第1の実施形態が用いる、ニューラルネットワークを用いた高画質化のための機械学習の概念図である図4に示すように、ニューラルネットワーク技術における入力データとして、低ビットレートエンコード済み画像についての、例えば対象となるフレーム画像について、複数のサンプル画素における画素の値(輝度、色調)である複数(m個)のパラメータである、入力データ・パラメータ1、入力データ・パラメータ2、・・・、入力データ・パラメータmを、それぞれ具体的な数値として有しており、一方、ニューラルネットワーク技術における教師データ(出力データ)として、同様に、原画像についての、例えば対象となるフレーム画像について、複数のサンプル画素における画素の値(輝度、色調)である複数(d個)のパラメータである、教師データ・パラメータ1、教師データ・パラメータ2、・・・、教師データ・パラメータdを、具体的な数値として有している。これら入力データ、教師データ(出力データ)それぞれのパラメータの組みを、以下では「パラメータベクトル」という場合もある。また、入力データの各パラメータと、出力データ(教師データ)の各パラメータとは、一部あるいは全部が重複してもよい。
先に説明を行った、低ビットレート画像に関する入力データ・パラメータベクトルw(式(1))が入力層(m次元)41をなし、同じく、先に説明をした、原画像に関する教師データ・パラメータベクトルβと同じくd次元である出力データ・パラメータベクトルx(式(2))が出力層43をなしている。
k次元のベクトルy(式(3)。中間データともいう)が入力層41と出力層43との間にある中間層42をなしている。
入力層41のデータは、変換行列Qによる線形変換により中間層42に変換され、その中間層42のデータは、別な変換行列Rによる線形変換がなされて出力層43のデータとして出力される。それぞれの層の内部については各データ間には接続関係がなく独立している。
先に説明したように、入力データ・パラメータベクトルwから出力データ・パラメータベクトルxに直接変換するのではなく、式(4)に示すように2段階の変換を行う。
式(4)において、QおよびRは先に説明をした線形変換を表す行列である。そして、それぞれの線形変換Q,Rを行ったあと、それぞれの変数に対して非線形の関数により変換を行う。その関数は活性化関数と呼ばれるもので、本実施形態では式(5)に示す、ロジスティックシグモイド関数σ(a)を用いている。
このロジスティックシグモイド関数σ(a)を用いると、上に説明をした各データの変換は、式(6)のように4段階であらわされる。
学習に際しては、出力変数の目標となるデータである、原画像が有する画素値である教師データt(式(7))をあらかじめ与える。そして、ニューラルネットワークの各パラメータは、出力の値が教師データtに近くなるように、以下のような「推定」を行うことで決定される。
さて、入力データ・パラメータベクトルwを、中間層42を表す変数ベクトルyに変換するk行m列の行列を、Q=[qhj](qhjはh行j列の要素)で表すと、y=Qwとなり、要素で表すと式(8)の通りとなる。
さらに、式(8)に従って変換された変数ベクトルyを、先に説明したロジスティックシグモイド関数σ(a)によって、式(9)のように非線形的に変換する。
同様に、中間層42からの変数ベクトルαを、出力層の変数ベクトルxに、d行k列の行列R=[rih](rihはi行h列の要素)を用いて、x=Rαと変換する。要素で表すと式(10)のようになる。
中間層42における変換と同様にして、この変換された変数ベクトルxを、さらにロジスティックシグモイド関数σ(a)によって、式(11)のように変換する。
次に、学習の過程である、2つの行列Q,Rの推定を行うプロセスに移る。この推定のために、本実施形態では、以下に説明する誤差逆伝搬法と呼ばれる方法を用いている。
すなわち、はじめに、原画像におけるパラメータである教師データtと出力βとの誤差を計算し、その誤差を用いて中間層42と出力層43の変換行列を変化させる量を求める。次に、入力層41と中間層42の変換行列を変化させる量を求める。各変換行列の要素パラメータの推定にあたっては、誤差の2乗和を最小にする推定を行うが、非線形の変換が途中に含まれているため、確率的勾配降下法を用いる。これは、学習用データの1サンプルごとに誤差の2乗和を減少させるよう、誤差の勾配に比例した量だけ行列の要素パラメータを変化させる方法である。
以上の各プロセスに従い、変換行列Q、Rの各要素が推定できたので、学習の過程が終了し、変換の対象である低ビットレート画像が与えられたときに、その低ビットレート画像の各パラメータ(各画素の輝度や色調を表す画素値や、画像符号化技術における各パラメータであってもよいし、他のパラメータでもよい)を、式(6)に従って変換をして、出力データベクトルxを得ることによって、高画質化した画像を描画するためのパラメータを得ることができる。
〔モデルデータ作成サーバ2−1、動画像コンテンツ配信サーバ2−2の構成〕
図5(1)に構成図を示すように、本実施形態のシステム1が備えるモデルデータ作成サーバ2−1は、サーバ用コンピュータなどで実現されるものであって、サーバ内外間のデータ接続を行う入出力インターフェース2−1a、サーバ2−1の各種統制を行うCPU(セントラル・プロセッシング・ユニット)である制御部2−1b、サーバ2−1が実行する実行プログラムを読み出し可能に記憶するプログラム記憶部2−1f、先に説明をした、ニューラルネットワークに基づく機械学習に用いるための、入力データ、教師データを、例えば各種カテゴリ別の動画像コンテンツデータの低ビットレート化画像、および原画像として、あるいは他の態様にて記録している、機械学習用コンテンツ記録部2−1g、先に説明をしたニューラルネットワークに基づく機械学習である、変換行列Q,Rの推定を行う機械学習部2−1h、サーバ2−1内各構成間をデータ接続するバス2−1iなどを備えている。
また、図5(2)に示すように、動画像コンテンツ配信サーバ2−2はサーバ用コンピュータなどで実現されるものであって、サーバ2−2外との間で情報通信の入出力を司る入出力インターフェース2−2a、サーバ2−2全体の統制制御を行う制御部2−2b、配信を行う動画像コンテンツを記録保管するコンテンツ記録部2−2cを備えている。なおサーバ2−2が取り扱うコンテンツは動画像コンテンツに限らず静止画コンテンツ、音声コンテンツなど他の仕様のコンテンツ、あるいはこれら各種コンテンツの組み合わせであってもよい。
また、コンテンツ記録部2−2cは、それぞれのコンテンツに対して視聴者が投稿したテキストデータである「コメント」を、投稿を行った再生時間(コンテンツの先頭から計測した時間の情報)とともに記録している。
さらにサーバ2−2は、動画像コンテンツを、外部からの要求通信を受信して、当該要求に応じて、要求をした視聴者端末11などへ送出するコンテンツ配信部2−2d、サーバ2−2が実行すべきコンピュータ・プログラムを記憶するプログラム記憶部2−2f、コンテンツ配信を要求してきた視聴者端末が、例えば動画配信サイトの会員であるかなど、視聴者あるいは視聴者端末に関する情報を記録し管理するユーザ管理部2−2g、サーバ2−2内の各構成間を通信接続するバス2−2iを備えている。
以上のように、動画像コンテンツ配信サーバ2−2が動画像コンテンツの配信を行う一方、別なサーバであるモデルデータ作成サーバ2−1がモデルデータを生成するための機械学習を行うようにした構成は一例にすぎず、この構成に限定する必要はない。すなわち、本発明の実施に当たっては、単数または複数のサーバすなわち送信装置2−1、2−2がシステム1に設けられており、これらサーバのいずれかが、動画像コンテンツの配信を行う構成を有し、同じくこれらサーバのいずれかがモデルデータを生成するための機械学習を行う構成を有するようにすることが可能である。また、機械学習を行う構成や、動画像コンテンツの配信を行う構成に限らず、本発明のシステム1において、サーバ側に設けられた構成は、単数または複数設けられたサーバ、すなわち送信装置の少なくともいずれかに設けられるようにしてもよいし、同様に、視聴者端末側に設けられた各構成を複数の視聴者端末に分散して設けてもよい。すなわち、単数または複数のサーバ、すなわち送信装置は、送信システムを構成しているし、同様に単数または複数設けられた視聴者端末すなわち受信装置は、受信システムを構成しているともいうことができる。これらの構成は、本発明の他の実施形態においても同様である。
〔第1の視聴者端末11の構成〕
以下、第1の視聴者端末11の構成を説明するが、第2の視聴者端末12、第3の視聴者端末13もまた同様の構成を有している。
図6に構成を示すように、第1の視聴者端末11はパーソナルコンピュータ、スマートフォン、携帯情報端末その他で実現される、視聴者が用いる端末装置であって、端末内外の入出力インターフェースを司る入出力インターフェース11a、端末全体の統制制御を行う制御部11b、低ビットレートへのエンコード済み画像を、機械学習済みモデルを用いて高画質化した画像に復元する画像復元部11c、動画像コンテンツの内容を表示したり、動画像サイトの操作画面その他を表示する、液晶画面とその制御部などで実現される表示部11f、キーボードやマウスなどで実現され、視聴者がこの視聴者端末11を操作するために用いる操作部11g、この端末11で走らせるコンピュータ・プログラムを記憶するプログラム記憶部11h、サーバ2−2から受信した低ビットレート画像による動画像コンテンツ、あるいは画像復元部が復元した解像度が向上した画像による動画像コンテンツなどを記録するデータ記録部11i、あとで説明するように、動画像コンテンツ配信サーバ2−2に対してコメントを投稿するためのコメント投稿部11k、端末11内部の各構成間を通信接続するバス11mをそれぞれ備えている。
図7は、第1の視聴者端末11の外観を模式的に示したもので、端末11には表示パネル11−1、表示パネル11−1内に表示されるマウスカーソル11−2、マウス11−3、キーボード11−4が備えられている。
図7は、ある動画像コンテンツを再生表示している状況を示しており、表示パネル11−1には、動画像表示画面11−1aが表示され、動画像コンテンツの内容として、人物11−1b、樹木11−1n、家屋11−1oが表示されている。
また表示パネル11−1には、コメント「良い天気」11−1r、「走るの速いwww」11−1rが表示されていて、このコメント11−1rは動画像コンテンツを作成して動画像コンテンツ配信サーバ2−2に投稿した投稿者(あるいは便宜的に「配信者」ともいう)が作成したものではなく、このコンテンツを見た、第1の視聴者端末11を使う視聴者あるいは他の視聴者が、再生中の任意の時間に動画像コンテンツ配信サーバ2−2に対して投稿した文字の情報であり、オリジナルのコンテンツとは異なることが視聴者に明瞭に理解ができるようにするために、動画像表示画面11−1aの外側に一部がはみ出して表示されるようにしている。
同じく、表示パネル11−1上には、動画像コンテンツ配信サーバ2−2に通信接続して表示される動画配信サイトの画面表示として、動画配信サイトのポータル画面(入口の画面)に表示を切り替えるためのホームボタン11−1e、動画再生を終了するための停止ボタン11−1f、動画再生をいったんポーズさせるポーズボタン11−1g、ポーズ中のコンテンツを再生スタートさせる再生ボタン11−1h、コメントを投稿するためのコメント投稿ボタン11−1i、再生時間を始点から終点までの相対位置で表示するシークバー11−1kおよびシークボタン11−1mがそれぞれ表示されている。
動画像コンテンツ配信サーバ2−2が提供する動画配信サイトは、動画像コンテンツに対して各視聴者がコメント11−1rを投稿可能であることを説明したが、投稿されたコメントは、コンテンツ再生時間におけるコメントの投稿時間(例えば、3分間のコンテンツの中で開始から1分で投稿を行った場合に1分)と同じ再生時間で、他の視聴者がこのコンテンツを再生した場合に表示がなされる。そのために、コメント投稿に際しては、コメントの中身である文字情報とともに、コメントを投稿した投稿時間の情報が、視聴者端末からサーバ2−2へ送信されてサーバ2−2が記録保管する。そして、同じコンテンツを他の視聴者が再生しようとしてサーバ2−2へ再生送信依頼信号を出すと、サーバ2−2は番組コンテンツとともに、投稿時間情報付きのコメント情報を視聴者端末へ送信するので、各視聴者端末は、投稿者が投稿した同じ再生時間に、同じ画面をバックとしてコメントを読むことが可能である。
図8は、動画像コンテンツ配信サーバ2−2が提供する動画像配信サイトの画面の遷移を説明することにより、後に説明を行う、コンテンツの検索用項目である「タグ」の本来の用途を説明しようとする模式図である。タグはコンテンツ配信サイト画面のユーザインターフェースとも関連するので、画面表示に関連させて説明を行う。
動画像配信サイトに最初に接続して表示されるポータル画面(図8(A))には、まず、サイトの名称80が「ネコネコ動画」と表示されており、タブ81には「ホーム」(ポータル画面のこと)と、先に説明したカテゴリ(カテゴリタグ)として、「エンタメ」、「生活」、「アニメ」が表示されている。ポータル画面の下側にはおススメの動画として、複数のサムネイル画像82が表示され、視聴者はマウスでこれらから所望のサムネイル画像82をクリック選択すれば、その番組コンテンツの再生が開始される。
図8(B)は、図8(A)に表示された「生活」カテゴリを視聴者がクリック選択した場合の表示画面であって、カテゴリ「生活」に属する複数のタグ83(「牛鍋」、「ハイボール」、「魚釣り」、「猫」、「料理動画」、「キャンピング」、「懐かCM」)が画面表示され、視聴者が選択することが可能になっている。
図8(C)は、図8(B)においてタグ「料理動画」を選択した場合に表示される画面を示す図であって、画面上部には選択されたタグ名「料理動画」が表示され、画面下部には、タグ「料理動画」が付与された複数の動画コンテンツのサムネイル画像85と、それらコンテンツのキャプション(説明文)86が表示されている。視聴者は気に入ったコンテンツのサムネイル85をクリック選択することでそのコンテンツを再生することができるので、視聴者の選択をガイドするタグは極めて有用である。その他、図示はしないものの、別なキーワード選択画面で、所望の言葉に該当するタグ名を検索して一覧表示させることもできる。
〔機械学習済みのモデルを用いた、高画質化した画像を生成するプロセス〕
図9のシークエンス・チャート、図10のフローチャートを用いて、先に説明をした機械学習済みモデルデータ32である変換行列Q,Rなどを用いて、低ビットレートへエンコードした画像から高画質化した画像を得るプロセスをあらためて説明する。なお、先に説明した第1の視聴者端末11を、視聴者端末11と表記する場合もある。
まず動画像コンテンツ配信サーバ2−2には、原画像よりなる動画像コンテンツ、あるいは原画像を低ビットレートにエンコードした動画像コンテンツが複数保管されており、視聴者は先に説明をしたコンテンツ配信サイトの諸画像その他の情報から自分が視聴をしたいコンテンツを決め、視聴者端末11の表示画面上に表示された、コンテンツのサムネイルボタン表示をクリックするなどすると、該当するコンテンツの配信要求信号が視聴者端末11から動画像コンテンツ配信サーバ2−2へ送信され、サーバ2−2が受信する(図9 ステップS1)。
一方、モデルデータ作成サーバ2−1には、動画像コンテンツ配信サーバ2−2に対して配信指示されたコンテンツに対応した機械学習済みモデルデータ32である、先に説明をした変換行列Q,Rがそれぞれ記録保管されている。
各コンテンツに対応をしたモデルデータとは、例えば「猫」に関する動画像コンテンツであれば、「動物」という動画像コンテンツのカテゴリがあらかじめ用意され、この動物カテゴリに属する原画像を教師データとして、その原画像を低ビットレートエンコーディングした画像を入力画像として、機械学習により変換行列Q,Rを推定して求めてもよい。そして、モデルデータ作成サーバ2−1、あるいは動画像コンテンツ配信サーバ2−2は、ユーザが視聴者端末11を用いて配信を要望してきた動画像コンテンツを知り、このコンテンツの画像改良に適した、機械学習済みのモデルデータを、複数用意されたモデルデータから選択し、動画像コンテンツ配信サーバ2−2を経由して視聴者端末11へ配信するように構成してもよい(図9 ステップS2、S3)。
あるいは、直接、配信を行なおうとする動画像コンテンツ中の画像を用いて機械学習を行い、モデルデータを得る方法もある。すなわち、ニューラルネットワークを用いた機械学習を行う際に、視聴者端末11へ送信をすべき動画像コンテンツ中の、低ビットレートエンコード済み画像とその原画像にそれぞれ含まれる画素の値(輝度、色調)を入力データ、および教師データとして用いるようにしてもよい。このように構成することにより、モデルデータ32が送信予定のコンテンツに近いデータ内容となり、機械学習済みモデルデータ32を用いた高画質化画像の品質も高いものとすることができるが、一方、視聴者端末11へ配信する可能性があるすべてのコンテンツについて、それぞれ機械学習を実施してモデルデータを準備しておく必要がある。
そこで、上記の点を踏まえて、配信しようとするコンテンツではなく、コンテンツが含まれるカテゴリや関連する分野に属する画像を用いて機械学習によりモデルデータを作成する方法が、先に説明をした、例えば「猫」の動画像コンテンツについては、「動物」カテゴリのコンテンツに含まれる画像を用いて機械学習を行い、モデルデータを生成してもよい。そのように構成することで、機械学習を行わねばならない頻度が少なくなり、配信用コンテンツ・タイトルの増設も自由に迅速に行うことができる。
ところで、先に説明をしたような、「猫」に関する動画像コンテンツに対して、「動物」カテゴリに属する画像を用いた機械学習で得られたモデルデータを用いる方法もあるが、「猫」に関する動画像コンテンツが、「動物」カテゴリに属するかどうかの判断は操作を行う人間により行われねばならない可能性もある。さらに、配信が行われるコンテンツにより近い、すなわち高画質化の処理を行った場合に原画像により近い画像が得られるようにするために、配信を行うコンテンツの種類、撮影されている内容、タイトル、撮影者、ジャンル、などでモデルデータを分けて、それぞれ適応した種類のモデルデータを、コンテンツとともに配信するようにしてもよいし、これらの「配信を行うコンテンツの種類、撮影されている内容、タイトル、撮影者、ジャンル」など、あるいは他の項目を複数組み合わせて、適切なモデルデータを選択するようにしてもよい。
そこで、例えば以下のような各項目は、各コンテンツの内容と密接に関連しており、コンテンツに含まれる画像の特性を適切に分類することが可能であるので、これらの項目に従ってモデルデータを自動的に分類して準備し、配信が要求された動画像コンテンツの低ビットレートエンコード済みコンテンツとともに配信することも有効である。
そのために、先に説明をした、モデルデータ作成サーバ2−1、または動画像コンテンツ配信サーバ2−2は、配信が要求された動画像コンテンツの高画質化のために、最適なモデルデータを、複数用意されたモデルデータの中から選択するための構成を有するようにしてもよい。選択を行う動作は、例えば以下のような項目が、配信する動画像コンテンツに含まれている場合に、これら項目から自動的に、高画質化処理に適したモデルデータが選択されるにようにしてもよい。
・コンテンツを視聴した視聴者から投稿されたコメント情報
・コンテンツを説明する説明文情報
・コンテンツの作者に関する情報
・コンテンツの名称あるいはシリーズ名称の情報
・コンテンツを配信する配信者に関する情報
このように、動画像コンテンツの内容に密接に関連した項目として、ほかに「タグ」情報があげられる。
ここで、「タグ」とは、各動画像コンテンツに付された、動画の内容を指し示す検索用キーワードであり、一つのコンテンツに対して例えば10個まで登録することができる。タグにより、視聴者が所望する動画や、ある動画と似たような動画を容易に探せるような仕組みになっている。
タグは、動画像コンテンツをサーバ2に投稿する動画投稿者だけではなく、これらコンテンツの視聴者(閲覧者ともいう)も自由に登録することができる。本来は検索機能として用いられるタグだが、動画の内容に絡めたタグ付けや動画像配信サイト特有のタグ付けも多く見られる。利用の実態としては、検索のための分類というより、その動画の見所を視聴者に教える役割を果たすこともあり、タグを用いて視聴者同士のコミュニケーションに使われることもある。同じ素材(例えば「歌ってみた」「アイドルマスター」などの人気ジャンルに属する無数のサブジャンル)を扱った動画や同じ投稿者による動画に対して閲覧者の間で自発的にタグが発明され、より深い検索のニーズに応えている側面もある。(一部、ウイキペディア「ニコニコ動画」https://ja.wikipedia.org/wiki/%E3%83%8B%E3%82%B3%E3%83%8B%E3%82%B3%E5%8B%95%E7%94%BBより引用をしている。)
本出願人は、動画像配信サイト「ニコニコ動画」
https://www.nicovideo.jp/video_top?ref=nicotop_videoを運営している。
この「ニコニコ動画」サイトで実際に用いられているタグとして、以下の例がある。
タグの上位分類である「カテゴリ」(「カテゴリタグ」ともいう)の分類において、「エンタメ・音楽」には、「VOICEROID劇場」、「オリジナル曲」、「バーチャルYouTuber」、「アイドル部」、「にじさんじ」、「アニソンfull」、「作業用BGM」、「Fate/MMD」、「MMD刀剣乱舞」、「ニコスロ」、「SCP解説」、「パチスロ」、「SCP」、「ボカロカラオケDB」、「ゆっくり解説」、「声優ライブ」、「R.A.B」、「パチンコ」、「アニメ色のない作業用BGM」、「歌うボイスロイド」、「VOCALOID」、「伝説入り」、「コスプレで踊ってみた」、「ニコパチ」、「VOCALOID殿堂入り」、「うちいくTV」、「マイクラ肝試し」、「ゆっくり怪談」、「ハロプロ」、「洋楽名曲集」、「小説家になろう」、「探してたあの曲」、「洋楽」が例えば用いられている。
同様に、「生活一般・スポーツ」というカテゴリでは、「日米野球」、「ノリッチ」、「RTA(リアル登山アタック)」、「ゆっくり解説」、「VOICEROID車載」、「WWE」、「コツメカワウソ」、「フィギュアスケート」、「世界の交通事情」、「バイク」、「ドライブレコーダー」、「異種仲良し動画リンク」、「しくじり企業」、「ゆっくり雑談」、「VOICEROID解説」、「プロ野球」、「殺人毛玉」、「失われた野生」、「ボイ酒ロイド」、「ハイボールの人」、「世界の奇人・変人・偉人紹介」、「ゆっくり解説動画」、「球界OBの現役時代のプレー集」、「柴犬」、「バーベキュー」、「戦闘民族」、「F1」、「ニコニコ海外旅行」、「ぬこぬこ動画」、「野生解放」、「野外料理」、「ラーメン」、「軍事」、「ホームラン集」、「ロードレース」、「懐かCM」、「犬」、「アザラシ」、「トースト」、「ゆっくり車載」、「野球」、「横浜DeNAベイスターズ」、「猫」、「絶叫するビーバー」、「犬と猫」などが例えば用いられている。
同じく、「科学技術」というカテゴリでは、「粉瘤」、「航空事故」、「銃」、「ドキュメンタリー」、「リボルバー」、「軍事」、「宇宙ヤバイ」、「ろくろを回すシリーズ」、「水素の音」、「拳銃」、「フィギュア」、「珍兵器」、「迷飛行機で行こうシリーズ」、「迷列車派生シリーズ」、「ナポリの男たち」、「プラモデル」、「日本刀」、「宇宙」、「衝撃映像」、「軍事訓練NG集」、「円周率」、「レトロPC」、「ミニ四駆」、「ニコニコ兵器開発局」、「JAXA」、「スバル」、「ニコニコ空想科学部」、「大きさ比較シリーズ」、「ブラックホール」、「車両接近通報装置シリーズ」、「F−22」、「世界の交通事情」、「羽ばたき機」、「理系ホイホイ」、「数学」などが例えば用いられる。
この結果、次のような格別な効果がある。
まず、タグは投稿者あるいはコンテンツの視聴者が付与するので、システム1の操作者や管理者が付与を行う工数がいらず、またコンテンツの中身を熟知している投稿者や視聴者が付与するので、付与が正確である。
また、上記のようにタグは、単なるカテゴリとは異なり細分化されているうえに、既存のタグを知った投稿者や視聴者が同じタグを付与することから、同じタグに属する動画像コンテンツは極めて近い内容であることが期待できるので、機械学習における学習過程が精度よく実行できる。
以上のように、モデルデータ32である変換行列Q,Rは、このコンテンツに含まれている画像について、その低ビットレートエンコード済み画像を入力とし、対応する原画像を出力である教師データとして、先に説明したニューラルネットワークを用いた機械学習に基づく推定によって、得ている。
動画像コンテンツ配信サーバ2−2は、コンテンツにふさわしいモデルデータ32と、配信要求があったコンテンツデータである、低ビットレートエンコード済み画像よりなるコンテンツデータとを、視聴者端末11へ送信する(ステップS4)。
視聴者端末11は、上のモデルデータ32と、低ビットレートエンコード済みコンテンツデータとを受信して(ステップS11)、以後、コンテンツデータをなしている各低ビットレートエンコード済み画像のフレームごとに、先に説明をした式(6)に従って、ニューラルネットワークにおける出力データとして各画素値、それに基づく、高画質化した画像フレームを得る(ステップS12)。そして、得られた、高画質化した画像フレームを時間軸で集成することにより、高画質化したコンテンツデータを得る(ステップS13)。
〔第2の実施形態〕
機械学習に用いるデータとして、先に説明をした低ビットレートエンコード済み画像フレーム、および原画像の画素の値(輝度、色調)とは別に、あるいはそれに加えて、次のような、画像符号化技術における項目の少なくともいずれかであって、次のような、高画質化をしたい低ビットレートエンコード済み動画像コンテンツのメタ情報が含まれているようにしてもよく、その他の構成は先に説明をした本発明第1の実施形態に準ずるように構成した第2の実施形態とすることが可能である。
・符号化ブロック量子化パラメータ
・予測誤差係数
・予測モード情報
・動きベクトル情報
このように構成することで、機械学習における推定の精度がより向上することが期待できる。
〔第3の実施形態 〜 様々なデータ形式に対する適用〕
以上の各実施形態では、動画像コンテンツ配信を中心に本発明の実施を説明したが、動画像コンテンツに限ることなく、静止画、音声データなど様々なデータ種別について本発明を実施することができる。本実施形態の構成は、先に説明をした第1および第2実施形態の構成を準用して、単数または複数備えられた送信装置の少なくともいずれかが、 原データを低ビットレートへエンコードした低ビットレートエンコード済みデータから、より原データに近づけた改良データを生成するためのモデルデータを、機械学習により生成する機械学習部を備え、同じく、単数または複数備えられた送信装置の少なくともいずれかが、低ビットレートエンコード済みデータと、モデルデータとを当該装置の外部へ送信する送信部を備え、受信装置が、受信した低ビットレートエンコード済みデータおよびモデルデータから、当該低ビットレートエンコードデータの改良データを生成する改良データ生成部を有することを特徴とする、データ送受信システム、である。また、先に説明をした動画像コンテンツ配信システム1の各実施形態に含まれる各構成を、動画像コンテンツ対象に代えて、他のデータ形式あるいは汎用のデータ形式に適応するようにした構成を含むようにしてもよい。
これら各種データの送信に際しては、伝送路への負荷を削減することが要求され、また受信端末における再生に際しては、再生品質が高いことが求められている点は、先に説明をした動画像配信システムにおける課題と同様であって、本発明を実施することにより得られる効果も、先に各実施例で説明をした効果と同様である。
〔第4の実施形態 〜 モデルデータのクライアント端末への直接配信〕
次に、以上説明をした各実施形態において細部を異なる構成とした、第4の実施形態を説明する。なお、この第4の実施形態に特徴的な下記の構成を、先に説明をした各実施形態の構成と組み合わせて実施することが可能であり、これら各構成もまた本発明が包含するものである。
先に説明をした本発明の各実施形態においては、ある動画像コンテンツ、またはデータの配信要求がクライアント端末(第1の視聴者端末11が相当)からサーバ(動画像コンテンツ配信サーバ2−2が相当)へなされると、この動画像コンテンツあるいはデータの改良にふさわしい、機械学習済みのモデルデータが選択されて他のサーバ(モデルデータ作成サーバ2−1が相当)からサーバ(動画像コンテンツ配信サーバ2−2が相当)に送られ、サーバ(動画像コンテンツ配信サーバ2−2が相当)は、配信が要求されたコンテンツあるいはデータの低ビットレートエンコーダ済みデータと、選択された機械学習済みのモデルデータとを、クライアント端末(第1の視聴者端末11が相当)へ配信し、この結果、クライアント端末では、受信をしたモデルデータと低ビットレートエンコード済みデータとから、改良されたデータである高画質化した動画像コンテンツなどを得ることができることを説明した。
ここで、本発明の実施に当たり、機械学習済みモデルデータを他のサーバ(モデルデータ作成サーバ2−1が相当)から、まずサーバ(動画像コンテンツ配信サーバ2−2が相当)に送り、サーバ(動画像コンテンツ配信サーバ2−2が相当)からクライアント端末(第1の視聴者端末11が相当)に配信を行う点は本質的ではないし、必須でもない。そうではなくて、他のサーバ(モデルデータ作成サーバ2−1が相当)から、クライアント端末(第1の視聴者端末11が相当)へ、機械学習済みのモデルデータを直接配信するようにしてもよい。
このような構成にて実施する場合、モデルデータ作成サーバ2−1に相当するサーバは、第1の視聴者端末11が相当するクライアント端末から動画像コンテンツ配信サーバ2−2に相当するサーバへ配信要求がなされた動画像コンテンツあるいはデータについての情報を得て、このコンテンツあるいはデータの改良のために適切な機械学習済みモデルデータを選択し、動画像コンテンツ配信サーバ2−2が相当するサーバが配信をする、低ビットレートエンコード済みデータ(動画像コンテンツで例示)の配信タイミングに合わせて、あるいはその前後の時刻に、第1の視聴者端末11が相当するクライアント端末へ、機械学習済みモデルデータを直接配信することとなる。
すなわち、この第4の実施形態の構成を動画像コンテンツ配信の分野で実現した場合には、単数または複数の送信装置すなわちサーバが備えられた送信システムが、低ビットレートエンコード済みの動画像コンテンツを送信する構成部分と、この低ビットレートエンコード済みの動画像コンテンツを、高画質化した動画像コンテンツに改良するのに適した、機械学習済みモデルデータを送信する構成部分とを有し、一方、受信端末が、受信した低ビットレートエンコード済みの動画像コンテンツと、同じく受信した機械学習済みのモデルデータとから、高画質化した動画像コンテンツを生成する構成部分を有する。
また、この第4の実施形態の構成を、動画像コンテンツ配信の分野に限らない、一般的なデータ配信分野で実現をした場合には、単数または複数の送信装置であるサーバが備えられた送信システムが、低ビットレートエンコード済みのデータを送信する構成部分と、この低ビットレートエンコード済みのデータを、原データに近づけたデータへ改良するのに適した、機械学習済みモデルデータを送信する構成部分とを有し、一方、受信端末が、受信した低ビットレートエンコード済みのデータと、同じく受信した機械学習済みのモデルデータとから、原データに近づけるよう改良したデータを生成する構成部分を有する。
(発明の効果の説明)
本発明は、限られた帯域幅のみを有するインターネット通信網など伝送路を介して動画像コンテンツを見るためにビデオストリーミングの送受を行うシステムにおいて、効率的な伝送帯域の圧縮と、原画像に近い解像感を有する画像復元とを、操作者の負担を軽減して効率的に実施が可能な、画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置を提供することができる。
動画像コンテンツ配信システム 1
モデルデータ作成サーバ 2−1
動画像コンテンツ配信サーバ 2−2
第1の視聴者端末 11
原画像 30
低ビットレートエンコード済み画像 31
機械学習済みモデルデータ 32
高画質化した画像 33
本発明は、上記の課題を解決するために、以下の各項に記載の画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置を提供する。
1)
単数または複数備えられた送信装置の少なくともいずれかが、原画像を低ビットレートへエンコードした低ビットレートエンコード済み画像から、より原画像に近づけた改良画像を生成するためのモデルデータを、機械学習により生成する機械学習部を備え、
単数または複数備えられた送信装置の少なくともいずれかが、低ビットレートエンコード済み画像と、機械学習により生成された機械学習済みモデルデータとを当該送信装置の外部の受信装置へ送信する送信部を備え、
受信装置が、受信した低ビットレートエンコード済み画像および機械学習済みモデルデータから、当該低ビットレートエンコード済み画像の改良画像を生成する改良画像生成部を有することを特徴とする、画像送受信システム。
2)
機械学習に用いるデータが、さらに、低ビットレートエンコード済み画像のメタ情報を含むことを特徴とする、1)に記載の画像送受信システム。
3)
低ビットレートエンコード済み画像のメタ情報が、画像符号化技術における符号化ブロック量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、2)に記載の画像送受信システム。
4)
単数または複数備えられた送信装置の少なくともいずれかが、さらに、送信部から送信されるいずれかの低ビットレートエンコード済み画像に関する情報に基づき、低ビットレートエンコード済み画像と共に送信される機械学習済みモデルデータを、複数の中から選択するモデルデータ選択部を有することを特徴とする、1)乃至3)のいずれか1項に記載の画像送受信システム。
5)
単数または複数備えられた送信装置の少なくともいずれかが、原データを低ビットレートヘエンコードした低ビットレートエンコード済みデータから、より原データに近づけた改良データを生成するためのモデルデータを、機械学習により生成する機械学習部を備え、
単数または複数備えられた送信装置の少なくともいずれかが、低ビットレートエンコード済みデータと、機械学習により生成された機械学習済みモデルデータとを当該送信装置の外部の受信装置へ送信する送信部を備え、
受信装置が、受信した低ビットレートエンコード済みデータおよび機械学習済みモデルデータから、当該低ビットレートエンコード済みデータの改良データを生成する改良データ生成部を有することを特徴とする、データ送受信システム。
6)
画像の送受信方法であって、
単数または複数備えられた送信装置の少なくともいずれかが有する機械学習部が、原画像を低ビットレートヘエンコードした低ビットレートエンコード済み画像から、より原画像に近づけた改良画像を生成するためのモデルデータを、機械学習により生成するステップと、
単数または複数備えられた送信装置の少なくともいずれかが有する送信部が、低ビットレートエンコード済み画像と、機械学習により生成された機械学習済みモデルデータとを当該送信装置の外部の受信装置へ送信するステップと、
受信装置の改良画像生成部が、受信した低ビットレートエンコード済み画像および機械学習済みモデルデータから、当該低ビットレートエンコード済み画像の改良画像を生成するステップと、を有することを特徴とする、送受信方法。
7)
機械学習に用いるデータが、さらに、低ビットレートエンコード済み画像のメタ情報を含むことを特徴とする、6)に記載の送受信方法。
8)
低ビットレートエンコード済み画像のメタ情報が、画像符号化技術における符号化プロツク量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、7)に記載の送受信方法。
9)
単数または複数備えられた送信装置の少なくともいずれかが、さらに、送信部から送信される低ビットレートエンコード済み画像に関する情報に基づき、低ビットレートエンコード済み画像と共に送信される機械学習済みモデルデータを、複数の中から選択するモデルデータ選択部を有することを特徴とする、6)乃至8)のいずれか1項に記載の送受信方法。
10)
単数または複数備えられた送信装置の少なくともいずれかが有する機械学習部が、原データを低ビットレートヘエンコードした低ビットレートエンコード済みデータから、より原データに近づけた改良データを生成するためのモデルデータを、機械学習により生成するステップと、
単数または複数備えられた送信装置の少なくともいずれかが有する送信部が、低ビットレートエンコード済みデータと、機械学習により生成された機械学習済みモデルデータとを当該送信装置の外部の受信装置へ送信するステップと、
受信装置の改良データ生成部が、受信した低ビットレートエンコード済みデータおよび機械学習済みモデルデータから、当該低ビットレートエンコード済みデータの改良データを生成するステップと、を有することを特徴とする、送受信方法。
11)
6)乃至10)のいずれか1項に記載された送受信方法を実行するためのコンピュータ・プログラム。
12)
単数または複数備えられた送信装置の少なくともいずれかに設けられた、原画像を低ビットレートヘエンコードした低ビットレートエンコード済み画像から、より原画像に近づけた改良画像を生成するためのモデルデータを、機械学習により生成する機械学習部と、
単数または複数備えられた送信装置の少なくともいずれかに設けられた、低ビットレートエンコード済み画像と、機械学習により生成された機械学習済みモデルデータとを当該送信装置の外部の受信装置へ送信する送信部と、を備えたことを特徴とする、画像送信システム。
13)
機械学習に用いるためのデータが、低ビットレートエンコード済み画像のメタ情報であることを特徴とする、12)に記載の画像送信システム。
14)
低ビットレートエンコード済み画像のメタ情報が、画像符号化技術における符号化ブロック量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、13)に記載の画像送信システム。
15)
さらに、送信部から送信される低ビットレートエンコード済み画像に関する情報に基づき、低ビットレートエンコード済み画像と共に送信される機械学習済みモデルデータを、複数の中から選択するモデルデータ選択部を有することを特徴とする、12)乃至14)のいずれか1項に記載の画像送信システム。
16)
単数または複数設けられた送信装置の少なくともいずれかに設けられた、原データを低ビットレートヘエンコードした低ビットレートエンコード済みデータを、より原データに近づけた改良データを生成するためのモデルデータを、機械学習により生成する機械学習部と、
単数または複数設けられた送信装置の少なくともいずれかに設けられた、低ビットレートエンコード済みデータと、機械学習により生成された機械学習済みモデルデータとを当該送信装置の外部の受信装置へ送信する送信部を備えたことを特徴とする送信システム。
17)
原画像を低ビットレートヘエンコードした低ビットレートエンコード済み画像から、より原画像に近づけた改良画像を生成するためのモデルデータであって、機械学習により生成された機械学習済みモデルデータと、低ビットレートエンコード済み画像とを画像送信システムから受信する受信部と、
受信した低ビットレートエンコード済み画像および機械学習済みモデルデータから、当該低ビットレートエンコード済み画像の改良画像を生成する改良画像生成部と、を有することを特徴とする画像受信装置。
18)
機械学習に用いるためのデータが、低ビットレートエンコード済み画像のメタ情報であることを特徴とする、17)に記載の画像受信装置。
19)
低ビットレートエンコード済み画像のメタ情報が、画像符号化技術における符号化プロツク量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、18)に記載の画像受信装置。
20)
受信部が受信する機械学習済みモデルデータは、共に受信する低ビットレートエンコード済み画像に関する情報に基づき、複数の中から選択されたことを特徴とする、17)に記載の画像受信装置。
21)
原データを低ビットレートヘエンコードした低ビットレートエンコード済みデータから、より原データに近づけた改良データを生成するためのモデルデータであって、機械学習により生成された機械学習済みモデルデータと、低ビットレートエンコード済みデータとを送信システムから受信する受信部と、
受信した低ビットレートエンコード済みデータおよび機械学習済みモデルデータから、当該低ビットレートエンコード済みデータの改良データを生成する改良データ生成部と、を有することを特徴とする受信装置。

Claims (21)

  1. 単数または複数備えられた送信装置の少なくともいずれかが、原画像を低ビットレートへエンコードした低ビットレートエンコード済み画像から、より前記原画像に近づけた改良画像を生成するためのモデルデータを、機械学習により生成する機械学習部を備え、
    前記単数または複数備えられた送信装置の少なくともいずれかが、 前記低ビットレートエンコード済み画像と、前記モデルデータとを当該装置の外部へ送信する送信部を備え、
    受信装置が、受信した前記低ビットレートエンコード済み画像および前記モデルデータから、当該低ビットレートエンコード画像の前記改良画像を生成する改良画像生成部を有することを特徴とする、画像送受信システム。
  2. 前記機械学習に用いるデータが、さらに、前記低ビットレートエンコード済み画像のメタ情報を含むことを特徴とする、請求項1に記載の画像送受信システム。
  3. 前記低ビットレートエンコード済み画像のメタ情報が、画像符号化技術における符号化ブロック量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、請求項2に記載の画像送受信システム。
  4. 前記単数または複数備えられた送信装置の少なくともいずれかが、さらに、前記送信部から送信される前記いずれかの低ビットレートエンコード済み画像に関する情報に基づき前記低ビットレートエンコード済み画像と共に送信される前記モデルデータを、複数の中から選択するモデルデータ選択部を有することを特徴とする、請求項1乃至3のいずれか1項に記載の画像送受信システム。
  5. 単数または複数備えられた送信装置の少なくともいずれかが、原データを低ビットレートへエンコードした低ビットレートエンコード済みデータから、より前記原データに近づけた改良データを生成するためのモデルデータを、機械学習により生成する機械学習部を備え、
    前記単数または複数備えられた送信装置の少なくともいずれかが、前記低ビットレートエンコード済みデータと、前記モデルデータとを当該装置の外部へ送信する送信部を備え、
    受信装置が、受信した前記低ビットレートエンコード済みデータおよび前記モデルデータから、当該低ビットレートエンコードデータの前記改良データを生成する改良データ生成部を有することを特徴とする、データ送受信システム。
  6. 画像の送受信方法であって、
    単数または複数備えられた送信装置の少なくともいずれかが有する機械学習部が、原画像を低ビットレートへエンコードした低ビットレートエンコード済み画像から、より前記原画像に近づけた改良画像を生成するためのモデルデータを、機械学習により生成するステップと、
    前記単数または複数備えられた送信装置の少なくともいずれかが有する送信部が、前記低ビットレートエンコード済み画像と、前記モデルデータとを当該装置の外部へ送信するステップと、
    受信装置の改良画像生成部が、受信した前記低ビットレートエンコード済み画像および前記モデルデータから、当該低ビットレートエンコード済み画像の前記改良画像を生成するステップと、を有することを特徴とする、送受信方法。
  7. 前記機械学習に用いるデータが、さらに、前記低ビットレートエンコード済み画像のメタ情報を含むことを特徴とする、請求項6に記載の送受信方法。
  8. 前記低ビットレートエンコード済み画像のメタ情報が、画像符号化技術における符号化ブロック量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、請求項7に記載の送受信方法。
  9. 前記単数または複数備えられた送信装置の少なくともいずれかが、さらに、前記送信部から送信される前記低ビットレートエンコード済み画像に関する情報に基づき、前記低ビットレートエンコード済み画像と共に送信される前記モデルデータを、複数の中から選択するモデルデータ選択部を有することを特徴とする、請求項6乃至8のいずれか1項に記載の送受信方法。
  10. 単数または複数備えられた送信装置の少なくともいずれかが有する機械学習部が、原データを低ビットレートへエンコードした低ビットレートエンコード済みデータから、より前記原データに近づけた改良データを生成するためのモデルデータを、機械学習により生成するステップと、
    前記単数または複数備えられた送信装置の少なくともいずれかが有する送信部が、前記低ビットレートエンコード済みデータと、前記モデルデータとを当該装置の外部へ送信するステップと、
    受信装置の改良データ生成部が、受信した前記低ビットレートエンコード済みデータおよび前記モデルデータから、当該低ビットレートエンコードデータの前記改良データを生成するステップと、を有することを特徴とする、送受信方法。
  11. 請求項6乃至10のいずれか1項に記載された送受信方法を実行するためのコンピュータ・プログラム。
  12. 単数または複数備えられた送信装置の少なくともいずれかに設けられた、原画像を低ビットレートへエンコードした低ビットレートエンコード済み画像から、より前記原画像に近づけた改良画像を生成するためのモデルデータを、機械学習により生成する機械学習部と、
    前記単数または複数備えられた送信装置の少なくともいずれかに設けられた、前記低ビットレートエンコード済み画像と、前記モデルデータとを当該システムの外部へ送信する送信部と、を備えたことを特徴とする、画像送信システム。
  13. 前記機械学習に用いるためのデータが、前記低ビットレートエンコード済み画像のメタ情報であることを特徴とする、請求項12に記載の画像送信システム。
  14. 前記低ビットレート変換画像のメタ情報が、画像符号化技術における符号化ブロック量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、請求項13に記載の画像送信システム。
  15. さらに、前記送信部から送信される前記低ビットレートエンコード済み画像に関する情報に基づき、前記低ビットレートエンコード済み画像と共に送信される前記モデルデータを、複数の中から選択するモデルデータ選択部を有することを特徴とする、請求項12乃至14のいずれか1項に記載の画像送信システム。
  16. 単数または複数設けられた送信装置の少なくともいずれかに設けられた、原データを低ビットレートへエンコードした低ビットレートエンコード済みデータを、より前記原データに近づけた改良データを生成するためのモデルデータを、機械学習により生成する機械学習部と、
    前記単数または複数設けられた送信装置の少なくともいずれかに設けられた、前記低ビットレートエンコード済みデータと、前記モデルデータとを当該装置の外部へ送信する送信部を備えたことを特徴とする送信システム。
  17. 原画像を低ビットレートへエンコードした低ビットレートエンコード済み画像から、より前記原画像に近づけた改良画像を生成するためのモデルデータであって、機械学習により生成されたモデルデータと、前記低ビットレートエンコード済み画像とを画像送信システムから受信する受信部と、
    前記受信した前記低ビットレートエンコード済み画像および前記モデルデータから、当該低ビットレートエンコード画像の前記改良画像を生成する改良画像生成部と、を有することを特徴とする画像受信装置。
  18. 前記機械学習に用いるためのデータが、前記低ビットレートエンコード済み画像のメタ情報であることを特徴とする、請求項17に記載の画像受信装置。
  19. 前記低ビットレートエンコード済み画像のメタ情報が、画像符号化技術における符号化ブロック量子化パラメータ(QP)、予測誤差係数、予測モード情報、動きベクトル情報のうちの少なくともいずれかであることを特徴とする、請求項18に記載の画像受信装置。
  20. 前記受信部が受信する前記モデルデータは、共に受信する前記低ビットレートエンコード済み画像に関する情報に基づき、複数の中から選択されたことを特徴とする、請求項17に記載の画像受信装置。
  21. 原データを低ビットレートへエンコードした低ビットレートエンコード済みデータから、より前記原データに近づけた改良データを生成するためのモデルデータであって、機械学習により生成されたモデルデータと、前記低ビットレートエンコード済みデータとを送信システムから受信する受信部と、
    前記受信した前記低ビットレートエンコード済みデータおよび前記モデルデータから、当該低ビットレートエンコード済みデータの前記改良データを生成する改良データ生成部と、を有することを特徴とする受信装置。
JP2018248974A 2018-12-28 2018-12-28 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置 Active JP6900359B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2018248974A JP6900359B2 (ja) 2018-12-28 2018-12-28 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置
PCT/JP2019/037580 WO2020137050A1 (ja) 2018-12-28 2019-09-25 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置
US17/418,233 US11800185B2 (en) 2018-12-28 2019-09-25 Image transmission and reception system, data transmission and reception system, transmission and reception method, computer program, image transmission system, image reception device, transmission system, reception device
CN201980077647.5A CN113491134A (zh) 2018-12-28 2019-09-25 图像收发系统、数据收发系统、收发方法、计算机程序、图像发送系统、图像接收装置、发送系统、接收装置
JP2020203735A JP7336427B2 (ja) 2018-12-28 2020-12-08 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018248974A JP6900359B2 (ja) 2018-12-28 2018-12-28 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2020203735A Division JP7336427B2 (ja) 2018-12-28 2020-12-08 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置

Publications (2)

Publication Number Publication Date
JP2020109897A true JP2020109897A (ja) 2020-07-16
JP6900359B2 JP6900359B2 (ja) 2021-07-07

Family

ID=71129325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018248974A Active JP6900359B2 (ja) 2018-12-28 2018-12-28 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置

Country Status (4)

Country Link
US (1) US11800185B2 (ja)
JP (1) JP6900359B2 (ja)
CN (1) CN113491134A (ja)
WO (1) WO2020137050A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6900359B2 (ja) 2018-12-28 2021-07-07 株式会社ドワンゴ 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置
US20220046237A1 (en) * 2020-08-07 2022-02-10 Tencent America LLC Methods of parameter set selection in cloud gaming system

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04302272A (ja) * 1991-03-29 1992-10-26 Canon Inc 画像処理方法
JPH05191796A (ja) * 1992-01-10 1993-07-30 Sharp Corp ブロック歪補正器
JP2016534654A (ja) * 2013-09-05 2016-11-04 マイクロソフト テクノロジー ライセンシング,エルエルシー ユニバーサルスクリーンコンテンツコーデック
WO2017164297A1 (ja) * 2016-03-25 2017-09-28 パナソニックIpマネジメント株式会社 信号依存型適応量子化を用いて動画像を符号化及び復号するための方法及び装置
JP2018120217A (ja) * 2017-01-20 2018-08-02 株式会社半導体エネルギー研究所 表示システム及び電子機器
WO2018163011A1 (ja) * 2017-03-09 2018-09-13 株式会社半導体エネルギー研究所 半導体装置および放送システム
US20180288440A1 (en) * 2015-09-30 2018-10-04 Piksel, Inc. Improved video stream delivery via adaptive quality enhancement using error correction models
WO2018193333A1 (ja) * 2017-04-21 2018-10-25 株式会社半導体エネルギー研究所 画像処理方法および受像装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9338477B2 (en) * 2010-09-10 2016-05-10 Thomson Licensing Recovering a pruned version of a picture in a video sequence for example-based data pruning using intra-frame patch similarity
WO2012103332A2 (en) 2011-01-28 2012-08-02 Eye IO, LLC Encoding of video stream based on scene type
JP5956761B2 (ja) 2012-02-03 2016-07-27 株式会社ドワンゴ 配信システム、配信方法及びコンピュータプログラム
JP6396066B2 (ja) 2014-04-10 2018-09-26 株式会社東芝 画質改善システム、画質改善方法及びプログラム
GB2548749B (en) 2015-02-19 2017-12-13 Magic Pony Tech Limited Online training of hierarchical algorithms
GB201603144D0 (en) * 2016-02-23 2016-04-06 Magic Pony Technology Ltd Training end-to-end video processes
JP6645076B2 (ja) 2015-08-31 2020-02-12 ノーリツプレシジョン株式会社 画像処理装置
JP6636828B2 (ja) 2016-03-02 2020-01-29 株式会社東芝 監視システム、監視方法、および監視プログラム
JP6689656B2 (ja) 2016-04-18 2020-04-28 ルネサスエレクトロニクス株式会社 画像処理システム、画像処理方法及び画像送信装置
CN107945108A (zh) * 2016-10-13 2018-04-20 华为技术有限公司 视频处理方法及装置
CN106791927A (zh) * 2016-12-23 2017-05-31 福建帝视信息科技有限公司 一种基于深度学习的视频增强与传输方法
JP6630377B2 (ja) 2018-01-22 2020-01-15 西日本電信電話株式会社 高精細動画生成装置、高精細動画生成方法、およびプログラム
US11368758B2 (en) 2018-05-21 2022-06-21 Gdflab Co., Ltd. VOD service system based on AI video learning platform
JP6900359B2 (ja) 2018-12-28 2021-07-07 株式会社ドワンゴ 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置
JP6908756B1 (ja) 2020-04-30 2021-07-28 株式会社ドワンゴ 配信者端末、コンテンツ配信システム、コンテンツ生成方法、コンテンツ生成プログラム、および、記録媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04302272A (ja) * 1991-03-29 1992-10-26 Canon Inc 画像処理方法
JPH05191796A (ja) * 1992-01-10 1993-07-30 Sharp Corp ブロック歪補正器
JP2016534654A (ja) * 2013-09-05 2016-11-04 マイクロソフト テクノロジー ライセンシング,エルエルシー ユニバーサルスクリーンコンテンツコーデック
US20180288440A1 (en) * 2015-09-30 2018-10-04 Piksel, Inc. Improved video stream delivery via adaptive quality enhancement using error correction models
WO2017164297A1 (ja) * 2016-03-25 2017-09-28 パナソニックIpマネジメント株式会社 信号依存型適応量子化を用いて動画像を符号化及び復号するための方法及び装置
JP2018120217A (ja) * 2017-01-20 2018-08-02 株式会社半導体エネルギー研究所 表示システム及び電子機器
WO2018163011A1 (ja) * 2017-03-09 2018-09-13 株式会社半導体エネルギー研究所 半導体装置および放送システム
WO2018193333A1 (ja) * 2017-04-21 2018-10-25 株式会社半導体エネルギー研究所 画像処理方法および受像装置

Also Published As

Publication number Publication date
WO2020137050A1 (ja) 2020-07-02
CN113491134A (zh) 2021-10-08
US20220070527A1 (en) 2022-03-03
US11800185B2 (en) 2023-10-24
JP6900359B2 (ja) 2021-07-07

Similar Documents

Publication Publication Date Title
US11211096B2 (en) Video manipulation with face replacement
US10491935B2 (en) Movie advertising placement optimization based on behavior and content analysis
Li et al. Fundamentals of multimedia
CN107534796B (zh) 视频处理系统和数字视频分发系统
US20140219635A1 (en) System and method for distributed and parallel video editing, tagging and indexing
US8270815B2 (en) Online video and audio editing
US8307273B2 (en) Methods and apparatus for interactive network sharing of digital video content
WO2011126134A1 (ja) リアルタイム動画像収集・認識・分類・処理・配信サーバシステム
WO2020137050A1 (ja) 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置
US11399156B2 (en) System and method for improved content creation by means of combining content from multiple individual content capture devices
US11677796B2 (en) System and method for video encoding optimization and broadcasting
US20230142432A1 (en) Content Generating Device, Content Distribution System, Content Generating Method, And Content Generating Program
JP2015142207A (ja) 視聴ログ記録システム及び動画配信システム
JP7336427B2 (ja) 画像送受信システム、データ送受信システム、送受信方法、コンピュータ・プログラム、画像送信システム、画像受信装置、送信システム、受信装置
WO2013018913A1 (ja) 映像処理システム、視聴者の嗜好判定方法、映像処理装置およびその制御方法と制御プログラム
US20130055325A1 (en) Online advertising relating to feature film and television delivery over the internet
JP4210186B2 (ja) 要約映像作成サーバ、プログラム及び記録媒体
KR20210096868A (ko) 동영상의 프로그램화를 통한 동영상 제작 방법 및 시스템
CN116484031A (zh) 一种多媒体交互方法、装置、存储介质及设备
KR20140075902A (ko) 소셜 네트워크 서비스 아카이브를 이용한 동영상 생성방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191220

A603 Late request for extension of time limit during examination

Free format text: JAPANESE INTERMEDIATE CODE: A603

Effective date: 20200325

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20200325

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200331

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201208

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20201208

C876 Explanation why request for accelerated appeal examination is justified

Free format text: JAPANESE INTERMEDIATE CODE: C876

Effective date: 20201208

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20201216

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20201222

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20210122

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20210126

C305 Report on accelerated appeal examination

Free format text: JAPANESE INTERMEDIATE CODE: C305

Effective date: 20210129

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20210202

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20210224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210423

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20210511

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20210608

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20210608

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210616

R150 Certificate of patent or registration of utility model

Ref document number: 6900359

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150