WO2009157340A1 - 高品質コンテンツ生成システムと、その方法及びプログラム - Google Patents

高品質コンテンツ生成システムと、その方法及びプログラム Download PDF

Info

Publication number
WO2009157340A1
WO2009157340A1 PCT/JP2009/060909 JP2009060909W WO2009157340A1 WO 2009157340 A1 WO2009157340 A1 WO 2009157340A1 JP 2009060909 W JP2009060909 W JP 2009060909W WO 2009157340 A1 WO2009157340 A1 WO 2009157340A1
Authority
WO
WIPO (PCT)
Prior art keywords
content
quality
contents
derived
same
Prior art date
Application number
PCT/JP2009/060909
Other languages
English (en)
French (fr)
Inventor
亮磨 大網
岩元 浩太
貴美 佐藤
康史 平川
裕三 仙田
木本 崇博
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2010517913A priority Critical patent/JP5648800B2/ja
Priority to CN200980124217.0A priority patent/CN102077582B/zh
Priority to EP09770050A priority patent/EP2306718A4/en
Priority to US13/001,378 priority patent/US8879004B2/en
Publication of WO2009157340A1 publication Critical patent/WO2009157340A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/462Content or additional data management, e.g. creating a master electronic program guide from data received from the Internet and a Head-end, controlling the complexity of a video stream by scaling the resolution or bit-rate based on the client capabilities
    • H04N21/4622Retrieving content or additional data from different sources, e.g. from a broadcast channel and the Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6125Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via Internet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8456Structuring of content, e.g. decomposing content into time segments by decomposing the content in the time domain, e.g. in time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/173Analogue secrecy systems; Analogue subscription systems with two-way working, e.g. subscriber sending a programme selection signal
    • H04N7/17309Transmission or handling of upstream communications
    • H04N7/17318Direct or substantially direct transmission and handling of requests
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2508Magnetic discs
    • G11B2220/2516Hard disks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/7921Processing of colour television signals in connection with recording for more than one processing mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Abstract

本発明は、複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出手段と、特徴量抽出手段で抽出した複数コンテンツの特徴量間で照合を行い、複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツをグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化手段と、同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成手段とを有する高品質コンテンツ生成システムである。

Description

高品質コンテンツ生成システムと、その方法及びプログラム
 本発明は高品質コンテンツ生成システムと、その方法及びプログラムに関する。
 近年、多くの動画投稿サイトが立ち上がってきており、インターネットを通じて様々な動画像を視聴できる環境が整いつつある。この際、プロモーション用の動画像などの積極的に流通させたいコンテンツや、話題性のあるコンテンツは同じものが様々な動画投稿サイトに繰り返し投稿されることがある。通常、どの動画サイトも、自サイト内でのコンテンツの検索機能は提供するが、近年、複数のサイト間を跨って検索可能な検索エンジンも登場してきている。この検索エンジンを用いて、複数の動画像投稿サイトを横断的に検索した場合、同じコンテンツが複数見つかる場合がある。
 この際、みつかったもののどれか1つを見れば十分であるが、高画質でコンテンツを視聴したいというユーザにとっては、以下のように問題があった。
 第1の問題点は、高画質なコンテンツを見ることが困難であるということである。
 その理由は、検索で見つかった複数のコンテンツの1つを適当に選択して視聴すると、低画質のコンテンツにあたる可能性が高いためである。動画投稿サイトの場合、大量のコンテンツを扱うため、個々のコンテンツは高圧縮率で符号化されることが多い。このため、元来画質が低いコンテンツが多く、画質が低いコンテンツにあたる可能性が高い。この結果、高画質でコンテンツを見たいユーザの場合、複数見つかった同じコンテンツを逐一視聴して高画質なものを探すか、あるいは、たまたま見たコンテンツの画質が悪かった場合は、高画質のコンテンツを見たいにも関わらず、時間的な制約等により、低画質のコンテンツの視聴に甘んじなければならなかった。
 第2の問題点は、ユーザは全ての区間において高画質なコンテンツを視聴することは困難であるということである。
 その理由は、検索で複数の同一コンテンツが見つかったとしても、ユーザが視聴するのはそのうちの1つのみであるためである。ある一つのコンテンツが初めから終わりまで常に画質がよいとは限らない。例えば、低レートでVBR符号化する場合には、バッファリングの量が多くなり、制御が困難になる。このため、必ずしも全部の区間で高品質を保てるとは限らない。このような場合、途中で品質が劣化する箇所があっても、ユーザが視聴するコンテンツを他の同一コンテンツに切り替えることは、手間がかかる、視聴が途切れるといった理由から通常は行わない。このため、途中で品質が劣化してもユーザはその品質劣化に甘んじるより他なかった。
 そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、同じコンテンツ、あるいはそれから派生してできたコンテンツが複数存在する場合には、それらを用いてより高品質なコンテンツを生成することができる高品質コンテンツ生成システム、方法およびプログラムを提供することにある。
 上記課題を解決する本発明は、複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出手段と、前記特徴量抽出手段で抽出した複数コンテンツの特徴量間で照合を行い、前記複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツをグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化手段と、前記同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成手段とを有する高品質コンテンツ生成システムである。
 上記課題を解決する本発明は、複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出ステップと、前記抽出した複数コンテンツの特徴量間で照合を行い、前記複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツをグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化ステップと、前記同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成ステップとを有する高品質コンテンツ生成方法である。
 上記課題を解決する本発明は、複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出処理と、前記抽出した複数コンテンツの特徴量間で照合を行い、前記複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツをグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化処理と、前記同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成処理とを情報処理装置に実行させる高品質コンテンツ生成プログラムである。
 本発明によれば、同じコンテンツ、あるいはそれから派生してできたコンテンツが複数存在する場合、それらを用いてより高品質なコンテンツを生成することができる。
図1は第1の実施の形態における高品質コンテンツ生成システムのブロック図である。 図2は時間軸をもつコンテンツ間のグループ化の一例を表す図である。 図3は第1の実施の形態の高品質コンテンツ生成システムの処理全体の流れを表すフローチャートである。 図4は高品質コンテンツ生成手段102の第1の形態の処理の流れを表すフローチャートである。 図5は高品質コンテンツ生成手段102の第2の形態の処理の流れを表すフローチャートである。 図6は高品質コンテンツ生成手段102の第3の形態の処理の流れを表すフローチャートである。 図7は高品質コンテンツ生成手段102の第4の形態の動作の処理の流れを表すフローチャートである。 図8はコンテンツ間でフレームレートが異なる場合の高品質コンテンツ生成の方法を示す図である。 図9はコンテンツ間でフレームレートが異なる場合の高品質コンテンツ生成の方法を示す図である。 図10は図7のコンテンツ間フレーム/フィールド対応付けステップS463の一実施の形態の動作を示す流れ図である。 図11は図7のコンテンツ間フレーム/フィールド対応付けステップS463一実施の形態の動作を示す流れ図である。 図12は時空間スライス画像を説明する図である。 図13は高品質コンテンツ生成手段102の第5の形態の処理の流れを表すフローチャートである。 図14は第2の実施の形態における高品質コンテンツ生成システムのブロック図である。
 本発明の実施の形態の高品質コンテンツ生成システムは、複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出手段(図1の100)と、特徴量抽出手段で抽出した複数コンテンツの特徴量間で照合を行い、複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツを求めてグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化手段(図1の101)と、同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成手段(図1の102)とを有することを特徴とする。このような構成を採用し、複数コンテンツ間で同一/派生コンテンツをグループ化し、これらを用いて高品質コンテンツを生成し、ユーザに提供することにより、本発明の目的を達成することができる。
 次に、本発明の実施の形態について図面を参照して詳細に説明する。
 図1は第1の実施の形態における高品質コンテンツ生成システムのブロック図である。
 図1を参照すると、第1の実施の形態の高品質コンテンツ生成システムは、特徴量抽出手段100、同一/派生コンテンツグループ化手段101、高品質コンテンツ生成手段102、コンテンツ蓄積手段105とからなる。
 コンテンツ蓄積手段105は複数のコンテンツを蓄積しており、特徴量抽出手段100と高品質コンテンツ生成手段102へ接続される。特徴量抽出手段100は、コンテンツ蓄積手段105からコンテンツが入力され、コンテンツに対する特徴量を求めて特徴量を同一/派生コンテンツグループ化手段101へ出力する。同一/派生コンテンツグループ化手段101へは、特徴量抽出手段100から出力されるコンテンツの特徴量が入力され、特徴量間のリンク関係を表すコンテンツリンク情報を求め、グループ化情報として高品質コンテンツ生成手段102へ出力する。高品質コンテンツ生成手段102は、同一/派生コンテンツグループ化手段101からグループ化情報が入力され、コンテンツ蓄積手段105からコンテンツが入力され、高品質コンテンツを生成して出力する。
 次に、本実施の形態の高品質コンテンツ生成システムの動作について説明する。
 コンテンツはコンテンツ蓄積手段105に蓄えられている。ここで、コンテンツとは、デジタル化されたマルチメディアコンテンツのことを指し、たとえば、デジタル化された写真、映像、音楽、あるいはそれらを組み合わせてできるコンテンツなどが該当する。なお、コンテンツは放送番組のように、プロが制作したコンテンツのみではなく、コンシューマが制作したコンテンツである、いわゆるCGM(Consumer Generated Media)であってもよい。以下では、基本的に動画像コンテンツに特化して説明するが、音楽や写真などであっても同様に当てはまる。
 また、コンテンツ蓄積手段105は、便宜上、一箇所にコンテンツが蓄えられているように書いてあるが、複数のストレージに分散してコンテンツが蓄積されていてもよい。たとえば、インターネット上の複数の動画像投稿サイトで、サイトごとに動画像コンテンツが蓄積されていてもよい。また、各サイトでも、複数のストレージに分けてコンテンツが蓄積されていてもよい。コンテンツ蓄積手段105に蓄積されたコンテンツは特徴量抽出手段100へ入力される。
 特徴量抽出手段100では、入力される各コンテンツに対して特徴量抽出を行う。特徴量は、写真の場合は、色や模様、形などの視覚的特徴量であり、たとえば、ISO/IEC 15938-3で規格化されている特徴量を用いることができる。音楽の場合は、音のパワーや周波数成分などの音響特徴量であり、たとえば、ISO/IEC 15938-4で規格化されている特徴量を用いることができる。映像の場合には、上述の視覚特徴量に加え、さらに動きを表現する視覚特徴量も用いることができ、たとえば、ISO/IEC 15938-3で規格化されている特徴量を用いることができる。また、上述の音響特徴量を用いてもよいし、音響特徴量と視覚特徴量の両方を用いてもよい。抽出された各コンテンツの特徴量は、同一/派生コンテンツグループ化手段101へ出力される。
 同一/派生コンテンツグループ化手段101では、入力される各コンテンツの特徴量間で照合を行い、特徴量間の類似度が十分大きい場合には、内容が同一のコンテンツであると見做し、グループ化する。具体的には、ある2つのコンテンツの特徴量間で類似度(あるいは距離)を算出し、それが閾値以上(距離の場合は閾値以下)の場合には、その2つのコンテンツをグループ化する。
 類似度の算出においては、写真コンテンツの場合には、写真全体で特徴量同士を比較して、類似度算出を行うことによって、同一の写真をグループ化できる。また、写真の一部の領域同士で照合を行って類似度を算出してもよい。この場合には、ある写真を使ってできる別の画像(たとえば、写真に枠を付けたり、別の写真に貼り込んだりしてできる画像)、すなわち、派生コンテンツもグループ化することが可能になる。一方、映像や音楽のように、時間軸を有するコンテンツの場合には、各時間区間(区間長は任意)に対してコンテンツのグループ化を行う。たとえば、コンテンツA、B、C、D間で図2のような照合がなされたとすると、斜め縞線で示した時間区間同士、縦縞線で示した時間区間同士をグループ化する。このようにして求まったグループ化情報は、高品質コンテンツ生成手段102へ出力される。
 高品質コンテンツ生成手段102では、入力されるグループ化情報と対応するコンテンツとから、高品質なコンテンツを生成する。たとえば、図2の例の場合には、コンテンツA、B、C、Dを用いて高品質なコンテンツを生成する。この生成の詳細については、後述する。
 次に、フローチャートを用いて、本実施の形態の高品質コンテンツ生成システムの動作を説明する。
 図3は第1の実施の形態の高品質コンテンツ生成システムの処理全体の流れを表すフローチャートである。
 まず、ステップS300において、コンテンツ毎の特徴量抽出を行う。抽出の詳細は特徴量抽出手段100で述べたとおりである。次に、ステップS301において、抽出された特徴量の照合をコンテンツ間で行い、コンテンツのグループ化を行い、グループ化情報を求める。グループ化の詳細は同一/派生コンテンツグループ化手段101で述べたとおりである。そして、ステップS302において、グループ化情報と、コンテンツとから高品質コンテンツを生成する。
 次に、高品質コンテンツ生成手段102の第1の形態の動作について図を参照しながら詳細に説明する。
 図4は、高品質コンテンツ生成手段102の第1の形態の処理の流れを表すフローチャートである。
 まず、高品質コンテンツの生成対象となるコンテンツの時間区間のインデックスをi=0、1、…、N-1で表すことにする。すなわち、生成対象となるコンテンツはN個(Nは任意の自然数)の時間区間に分割され、区間ごとに高品質コンテンツを生成することとする。
 フローチャートでは、まず、ステップS400において、区間のインデックスであるiを0に設定する。
 次に、ステップS401で、区間iに関するグループ化情報を読み込む。例えば、図2の例の場合は、区間iが斜線で示す部分に属する場合には、コンテンツA、B、Cが対応付けられてグループ化されており、コンテンツAとBは時間方向のオフセットは存在しないが、コンテンツCは、時間方向にt1のオフセットがあるといった対応関係の情報がグループ化情報から得られる。
 次に、ステップS402では、対応するコンテンツが存在するかどうかを調べる。もし、対応するコンテンツが他に存在しない区間の場合には、そのコンテンツのみから出力となる高品質コンテンツを生成する必要があるため、ステップS405へジャンプする。一方、図2の例のように対応するコンテンツが存在する場合には、次のステップS403へ進む。
 ステップS403では、対応付けられているコンテンツ毎に区間iに対応する時間区間での品質評価値を算出する。ここで、品質評価値の算出方法には複数存在するが、この詳細については後述する。
 次のステップS404では、ステップS403で求まった品質評価値をコンテンツ間で比較し、品質が最大となるコンテンツを選択する。
 ステップS405では、選択されたコンテンツの区間iに対応する部分を出力用にバッファにコピーする。そして、適切な出力フォーマットで符号化する。なお、出力フォーマットへの符号化は、高品質コンテンツが複数区間分生成されてから、まとめて出力フォーマットへ符号化してもよい。
 次に、ステップS406では、区間iが最後の区間かどうかを調べ、最後の区間でない場合には、区間のインデックスiを1つ増やしてステップS401へ戻る。もし、最後の区間である場合には、処理を終了する。
 このようにして、高品質なコンテンツを生成することができる。なお、今までは、コンテンツの時間区間ごとに品質が最大となるものを選び、高品質コンテンツを生成する場合について述べた。この区間は、フレームを1枚含む場合でもよい。すなわち、フレームごとに品質を評価して高品質を生成するようにしてもよい。あるいは、各フレームを複数の領域に分割し、この領域ごとに品質を判定して品質が最大となるコンテンツを領域ごとに変えてもよい。例えば、フレームを複数のブロックに分割し、ブロック単位で品質を評価するようにしてもよい。これにより、より緻密な高品質コンテンツの生成が可能になる。ただし、選択されるコンテンツが切り替わる時空間の境界では、不自然なコンテンツ品質のギャップが生じる場合があるため、境界近傍で両者がスムーズに変わるようにトランジション処理を行ってもよい。
 次に、ステップS403での品質評価値の算出法の詳細について述べる。
 まず、区間iに割り当てられているビット量と符号化方式とから品質評価値を算出する場合について述べる。この場合、はじめに対応する各コンテンツの区間iに対応づけられている時間区間での発生符号量を調べる。一般的に発生符号量が多いほど、高画質であるといえるため、発生符号量が大きいものほど大きくなる値を品質評価値として定義する。ただし、区間iに対応付けられる各コンテンツの符号化の構造が異なる場合(例えばIピクチャ、Pピクチャの数などが異なる場合)はその分を品質評価値として考慮するようにする。また、符号化方式が異なる場合は、同じ品質であっても発生符号量は異なる。例えば、H.264で符号化されている場合は、MPEG-1で符号化されているものと比べると、同じ発生符号量であっても一般的にはH.264のほうがよい。品質評価値は、このような符号化方式の違いによる特性を反映するようになっていてもよい。なお、符号化の違いや符号化構造の違いによって品質評価値をどのように制御すべきかについては、例えば、同じコンテンツを複数の様々な方式で符号化し、画質との関係を調べることによって決定できる。もちろん、この過程で機械学習の枠組みを用いてもよい。
 次に、符号化歪みの大きさを評価して品質評価値を算出する場合について述べる。この場合、対応する各コンテンツの区間iに対応づけられている時間区間を復号してできる画像の画質をチェックする。例えば、文献1(特開2005-159419号公報 「画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体」)の方法を用いることにより、符号化歪みを定量化できる。
 勿論、符号化歪みを測定する方法はこれに限らず、原画像を用いなくても復号画像のみを用いて画質を判定できる方法であれば、何でもよい。この際には、符号化歪みが大きいほど小さくなる品質評価値を定義し、用いるようにすればよい。
 あるいは、量子化のパラメータを用いて画質を評価してもよい。粗い量子化を行うと一般的に画質は低下するため、量子化に関する符号化パラメータをコンテンツから抽出することによって、品質を評価できる。この際には、量子化パラメータが大きいほど小さくなる品質評価値を定義し、用いるようにすればよい。
 もし、対応付けられているコンテンツ間で解像度が異なる場合には、解像度を用いて品質を評価してもよい。一般に、解像度が高いほど高画質といえるため、解像度が大きいほど大きくなる品質評価値を定義し、用いるようにしてもよい。
 また、対応付けられているコンテンツ間でフレームレートが異なる場合には、フレームレートを用いて品質を評価してもよい。フレームレートが高いほど、動きが滑らかになり、映像の品質が向上するため、フレームレートが高いほど大きくなる品質評価値を定義し、用いるようにしてもよい。
 以上個々のファクタに基づいて品質評価値を求める方法について述べたが、これらのファクタを複数取り入れた品質評価値を定義し、用いるようにしてもよい。
 以上が図4に示すフローチャートに基づく高品質コンテンツ生成手段102の動作である。
 次に、高品質コンテンツ生成手段102の第2の形態の動作について図を参照しながら詳細に説明する。
 図5は、高品質コンテンツ生成手段102の第2の形態の処理の流れを表すフローチャートである。基本的には、図4のステップS403、ステップS404のかわりに、ステップS423が含まれている。それ以外は図4のフローチャートと同じであるため、以下ではステップS423について述べる。
 ステップS423では、対応づけられたコンテンツの対応するフレーム間で画素値の統計処理を行って出力するフレームを生成する。例えば、対応づけられた複数コンテンツのフレーム間で同じ画素位置に存在する画素の値を平均することで出力フレームのその画素位置における画素値を算出する。このように平均することにより、個々のコンテンツに含まれているノイズ成分を相殺することができ、出力フレームの品質を高めることができる。
 あるいは、単純な平均ではなく、M推定のようにoutlier を排除して画素値を求めるようになっていてもよい。例えば、大幅に画素値が異なるコンテンツが存在する場合には、そのコンテンツの画素値は除いて平均をとって出力フレームの画素値を求めるようにしてもよい。この場合、例えば、テロップが重畳されている派生コンテンツが対応付けられている場合であっても、そのテロップの影響を受けずに出力フレームを算出できるようになる。
 あるいは、図3のフローチャートでステップS403の説明で述べた品質評価値をコンテンツ毎に算出し、ある一定の基準を満たしたもののみを用いて統計処理を行うようになっていてもよい。これにより、品質が極端に低いコンテンツの影響を排除することができる。
 もし、解像度が異なるコンテンツが含まれる場合には、出力フレームの解像度に合うように内挿補間を行ってから統計処理を行うようにすればよい。
 以上が図5に示すフローチャートに基づく高品質コンテンツ生成手段102の動作である。
 次に、高品質コンテンツ生成手段102の第3の形態の動作について図を参照しながら詳細に説明する。
 図6は、高品質コンテンツ生成手段102の第3の形態の処理の流れを表すフローチャートである。基本的には、図4のステップS403、ステップS404のかわりに、ステップS443が含まれている。それ以外は図4のフローチャートと同じであるため、以下ではステップS443について述べる。
 ステップS443では、対応づけられたコンテンツの対応するフレーム間で超解像処理を行って出力するフレームを生成する。具体的には、フレーム間で画素の位置あわせを行ったのち、Blind deconvolution等の処理を行い、フレームを鮮鋭化し、出力フレームを生成する。
 以上が図6に示すフローチャートに基づく高品質コンテンツ生成手段102の動作である。
 次に、高品質コンテンツ生成手段102の第4の形態の動作について図を参照しながら詳細に説明する。
 図7は、高品質コンテンツ生成手段102の第4の形態の動作の処理の流れを表すフローチャートである。基本的には、図4のステップS403、ステップS404のかわりに、ステップS463、ステップS464が含まれている。それ以外は図4のフローチャートと同じであるため、以下ではステップS463、ステップS464について述べる。
 ステップS463では、コンテンツ間でのフレーム/フィールドの対応づけを行う。フレームレートが異なるコンテンツの場合、完全には一致しないため、同一/派生コンテンツグループ化手段101での照合で求まったフレーム間の対応関係は若干ずれている可能性がある。このため、対応関係の微調整を行い、照合の精度を高める。この詳細は後述する。
 次に、ステップS464で区間iにおいて出力フレームを生成する。図8は、コンテンツEとコンテンツFがグループ化されており、これらから出力コンテンツを生成する場合を図示している。フレームレートが異なるコンテンツの場合には、この図からもわかるように、フレームの時間位置によって、対応するコンテンツの数が変化する。よって、複数のコンテンツのフレームが対応づけられている時刻での出力フレームについては、これらの複数のフレームを用いて出力フレームを生成する。この生成方法としては、上述の様々な方法を用いることができる。一方、一つのフレームしか対応しない時刻位置においては、そのフレームを出力フレームとする。一方、図9のように、フレーム/フィールドがコンテンツ間で全く重ならない場合もある。この場合は、図9に示すようにそれぞれぞれの時刻位置でのフレーム/フィールドをそのまま用い、出力フレームとする。このようにして高品質コンテンツのフレームを生成する。
 次に、ステップS463におけるフレーム/フィールド対応付けの処理の詳細についてフローチャートを用いて説明する。
 図10は、ステップS463の処理の流れを表すフローチャートである。
 まず、ステップS600では、フレーム内挿処理により、コンテンツ間のフレームレートを合わせる。具体的には、コンテンツ間のフレームレートの最小公倍数(例えば、10fpsと15fpsならば30fps)にフレームレートを上げる。この際のフレーム内挿方法としては、前後のフレームから時間的距離に応じて線形内挿する方式や、物体の動きを補償して前後のフレームから内挿フレームを生成する。この際、動物体によって覆われる背景の部分と新たに表れる背景の部分が存在する。覆われる領域は時間的に前のフレームとしか対応がつかず、逆に新たに現れる領域は時間的に後のフレームとしか対応づけることができない。この場合には、対応付けられる一方の領域の画素値をそのまま用いる。なお、もともとインターレース構造のコンテンツの場合には、上記内挿処理は、フィールド構造で行う。
 次に、ステップS601において、各フレーム/フィールドの特徴量を抽出する。この際に抽出する特徴量としては、特徴量抽出手段100で用いたものと同じでもよいし、違っていてもよい。時間軸方向の細かな位置あわせを行う必要があるため、時間軸方向のずれに敏感な特徴量であることが望ましい。
 次に、ステップS602において、コンテンツ間で特徴量の照合を行い、フレーム/フィールドの対応付けを確定させる。もともと、この処理がなくても、コンテンツ間で時間方向の位置はほぼ対応づいているため、その位置を前後に少し動かしてもっとも照合スコアがよいものを選ぶようにすればよい。このようにして、フレームレートが異なるコンテンツ間であっても、フレーム/フィールドの対応づけができる。
 次に、ステップS463におけるフレーム/フィールド対応付けの処理の別の方法についてフローチャートを用いて説明する。
 図11は、ステップS463の処理の流れを表すフローチャートである。
 まず、ステップS620では、各コンテンツの時空間スライス画像を生成する。時空間スライス画像とは、図12に示すように、映像コンテンツを水平・垂直・時間の3次元データとみなしたときに、水平方向の座標値一定の平面、あるいは、垂直方向の座標値一定の平面で切ったときにできる平面である。便宜上、水平方向の座標値一定の平面、または、垂直方向の座標値一定の平面で切った場合について考えるが、原理的には、時間軸に平行な面であれば、どのような面で切った画像を用いてもよい。図12は、水平方向の座標値一定で切った平面を表している。次に、ステップS621では、時空間スライス画像の内挿処理を行う。ステップS600の場合と同様、コンテンツ間のフレームレートの最小公倍数(例えば、10fpsと15fpsならば30fps)によって、時間方向の内挿を行う。
 次に、ステップS622では、内挿処理後の時空間スライス画像に対して、コンテンツ間で時間方向の平行移動のみによるグローバル動き推定を行う。この際には、通常のブロックマッチングベースの方法を用いてもよいし、Hough変換的な方法を用いてもよい。これにより、時空間画像の時間方向の変位量が求まる。この値に従って、コンテンツ間のフレーム/フィールド対応付けを行えばよい。
 以上が図7に示すフローチャートに基づく高品質コンテンツ生成手段102の動作である。
 次に、高品質コンテンツ生成手段102の第5の形態の動作について図を参照しながら詳細に説明する。
 図13は、高品質コンテンツ生成手段102の第5の形態の処理の流れを表すフローチャートである。基本的には、図4のステップS403、ステップS404のかわりに、ステップS483、ステップS484が含まれている。それ以外は図4のフローチャートと同じであるため、以下ではステップS483、ステップS484について述べる。
 ステップS483では、ステップS620と同様にして各コンテンツの時空間スライス画像を生成する。そして、この時空間画像に対して超解像処理を行って、高品質時空間スライス画像を生成する。
 次にステップS484では、高品質時空間スライス画像を出力フレームの時刻位置でサンプリングすることによって、出力フレームを生成する。一つの高品質時空間スライス画像からは、切り口にあたるある一直線上でしか出力フレームの画素値が求まらない。このため、この直線に平行な任意の直線に対応する高品質時空間スライス画像を生成し、出力フレームの画素値を算出する。これにより、高品質画像の出力フレームが生成される。
 以上が図13に示すフローチャートに基づく高品質コンテンツ生成手段102の動作である。
 以上、高品質コンテンツ生成手段102の動作について述べてきたが、上述の方法を組み合わせて用いてもよいことは言うまでもない。例えば、上述の複数の方法によって作成した高品質コンテンツの画質を比較して、もっともよいものを選ぶようにしてもよい。あるいは、区間ごと、領域ごとに用いる方式を変えてもよい。
 次に、本実施の形態の効果について説明する。
 本実施の形態では、複数の同一コンテンツを自動的にグループ化し、高品質なコンテンツを生成する構成になっているため、ユーザが自ら高品質コンテンツを探さなくても高品質なコンテンツを視聴できる。また、時間軸を有するコンテンツの場合には、同一と判定されたコンテンツの品質を区間ごとに判定し、もっとも品質がよいものを選ぶ、あるいは、高品質なものを生成する構成になっているため、ユーザは逐一高品質なコンテンツに切り替えながら見るといった手間をかけなくても、コンテンツ全体に対して高品質なコンテンツの視聴が可能になる。
 次に、第2の実施の形態について図面を参照して詳細に説明する。
 図14を参照すると、第2の実施の形態の高品質コンテンツ生成システムは、特徴量抽出手段100、同一/派生コンテンツグループ化手段101、高品質コンテンツ生成手段102、対応関係修正手段150、コンテンツ蓄積手段105とからなる。コンテンツ蓄積手段105は複数のコンテンツを蓄積しており、特徴量抽出手段100と高品質コンテンツ生成手段102へ接続される。
 特徴量抽出手段100は、コンテンツ蓄積手段105からコンテンツが入力され、コンテンツに対する特徴量を求めて特徴量を同一/派生コンテンツグループ化手段101へ出力する。
 同一/派生コンテンツグループ化手段101へは、特徴量抽出手段100から出力されるコンテンツの特徴量が入力され、特徴量間のリンク関係を表すコンテンツリンク情報を求め、グループ化情報として対応関係調整手段150へ出力する。
 対応関係修正手段150は、コンテンツ蓄積手段105からコンテンツが入力され、同一/派生コンテンツグループ化手段101からグループ化情報が入力され、グループ化情報に含まれるコンテンツリンク情報を修正して、修正後のグループ化情報を高品質コンテンツ生成手段102へ出力する。
 高品質コンテンツ生成手段102は、同一/派生コンテンツグループ化手段101からグループ化情報が入力され、コンテンツ蓄積手段105からコンテンツが入力され、高品質コンテンツを生成して出力する。
 次に、第2の実施の形態の高品質コンテンツ生成システムの動作を説明する。
 対応関係修正手段150以外の動作は図1に示す第1の実施の形態と同様である。ただし、高品質コンテンツ生成手段102は、同一/派生コンテンツグループ化手段101ではなく、対応関係修正手段150から出力されるグループ化情報を用いて処理を行う点のみ異なる。
 対応関係修正手段150では、同一/派生コンテンツグループ化手段101から出力されるコンテンツ間の対応関係を修正する。これは、特徴量間の照合で求まったリンク関係は、正しい対応関係から若干(数フレーム程度)ずれる場合があるためである。具体的には、同一/派生コンテンツグループ化手段101から出力されるコンテンツ間の対応関係をベースとして、コンテンツ間で再度照合を行い、このずれを補正する。この方法としては、図7のフローチャートのステップS463の説明で述べた方法を用いることができる。修正された対応関係を含むグループ化情報は、対応関係修正手段150へ出力される。
 第2の実施の形態では、特徴量間の照合で若干の誤差が生じている場合でも、対応関係を補正することにより、確実に高品質コンテンツを生成できるようになる。
 尚、上述した実施の形態では、高品質コンテンツ生成システムの各部をハードウェアで構成したが、プログラムで動作する情報処理装置で構成することもできる。この場合、プログラムは、上述した各部の動作を情報処理装置に実行させる。
 本実施の形態によれば、複数のコンテンツが投稿されている場合には、ユーザが自ら探さなくても高品質化なコンテンツを視聴できる。その理由は、投稿された複数の同一コンテンツを用いて高品質なコンテンツを生成し、提供するためである。このため、ユーザは苦労することなく高画質なコンテンツを見ることができるようになる。
 また、本実施の形態によれば、ユーザはコンテンツの初めから終わりまで高品質なコンテンツを視聴することができる。その理由は、コンテンツの品質を区間ごとに判定し、もっとも高品質なものを選ぶ、あるいは、複数の同一コンテンツから高品質なものを作り出すことにより、コンテンツ全体で高品質化を行い、ユーザに提供するためである。このため、ユーザは逐一高品質なコンテンツに切り替えながら見るといった手間をかけなくても、コンテンツ全体に対して高品質なコンテンツの視聴が可能になる。
 本発明の実施の形態を説明したが、本発明の第1の態様は、複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出手段と、前記特徴量抽出手段で抽出した複数コンテンツの特徴量間で照合を行い、前記複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツをグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化手段と、前記同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成手段とを有する高品質コンテンツ生成システムである。
 本発明の第2の態様は、上記態様において、前記コンテンツが時間軸を有するコンテンツであり、前記コンテンツグループ化手段は、前記照合によって時間区間ごとに同一/派生コンテンツのグループ化を行い、前記同一/派生コンテンツグループ化情報を算出し、前記高品質コンテンツ生成手段は、前記選択されたコンテンツを用いて、時間区間ごとに品質がよりよいコンテンツを生成する。
 本発明の第3の態様は、上記態様において、前記コンテンツが、音楽または映像である。
 本発明の第4の態様は、上記態様において、前記コンテンツの特徴量が、視覚特徴量、又は音響特徴量の少なくとも1つを含む。
 本発明の第5の態様は、上記態様において、前記高品質コンテンツ生成手段は、前記選択されたコンテンツの品質を時間区間ごとに評価し、前記選択されたコンテンツ同士の同一区間に対応する時間区間の間で品質を比較し、高品質なコンテンツの時間区間を選んでつなぎ合わせていくことによって品質がよりよいコンテンツを生成する。
 本発明の第6の態様は、上記態様において、前記高品質コンテンツ生成手段は、時間区間ごとの品質の評価を、その時間区間に割り当てられている符号化ビット量と符号化方式とによって判定する。
 本発明の第7の態様は、上記態様において、前記高品質コンテンツ生成手段は、時間区間ごとの品質の評価を、符号化歪みの大きさを評価する評価指標によって判定する。
 本発明の第8の態様は、上記態様において、前記高品質コンテンツ生成手段は、前記選択されたコンテンツの品質を時間区間ごとおよびフレーム内領域ごとに評価し、前記選択されたコンテンツ同士の同一区間に対応する時間区間の間で品質を比較し、高品質なコンテンツの時間区間およびフレーム内領域を選んでつなぎ合わせていくことによって品質がよりよいコンテンツを生成する。
 本発明の第9の態様は、上記態様において、前記高品質コンテンツ生成手段は、フレーム内領域ごとの品質の評価を、そのフレーム内領域に割り当てられている符号化ビット量と符号化方式とによって判定する。
 本発明の第10の態様は、上記態様において、前記高品質コンテンツ生成手段は、フレーム内領域ごとの品質の評価を、符号化歪みの大きさを評価する評価指標によって判定する。
 本発明の第11の態様は、上記態様において、前記符号化歪みの大きさを評価する評価指標が、量子化の粗さを規定する符号化パラメータである。
 本発明の第12の態様は、上記態様において、前記高品質コンテンツ生成手段は、前記選択されたコンテンツの解像度が異なる場合に、最も高い解像度のコンテンツを用いることによって品質がよりよいコンテンツを生成する。
 本発明の第13の態様は、上記態様において、前記高品質コンテンツ生成手段は、対応するフレーム間で画素値の統計処理を行って高品質なフレームを生成することによって品質がよりよいコンテンツを生成する。
 本発明の第14の態様は、上記態様において、前記高品質コンテンツ生成手段は、前記選択されたコンテンツの解像度が異なる場合に、対応するフレーム間で超解像技術を用いることによって高品質なフレームを生成することによって品質がよりよいコンテンツを生成する。
 本発明の第15の態様は、上記態様において、前記高品質コンテンツ生成手段は、前記選択されたコンテンツのフレームレートが異なる場合に、最も高いフレームレートのコンテンツを用いることによって品質がよりよいコンテンツを生成する。
 本発明の第16の態様は、上記態様において、前記高品質コンテンツ生成手段は、前記選択されたコンテンツのフレームレートが異なる場合、前記選択されたコンテンツ間で対応するフレームまたはフィールドが複数存在する場合にはその中でもっとも品質がよいフレームまたはフィールドを選択するか、あるいは前記対応するフレームまたはフィールドに対して統計処理を行うことによってフレームまたはフィールドを生成し、対応するフレームまたはフィールドが複数存在しない場合には、そのフレームまたはフィールドを選択することにより、品質がよりよいコンテンツを生成する。
 本発明の第17の態様は、上記態様において、前記高品質コンテンツ生成手段は、フレームまたはフィールドごとの品質の評価を、符号化歪みの大きさを評価する評価指標によって判定する。
 本発明の第18の態様は、上記態様において、前記高品質コンテンツ生成手段は、前記選択されたコンテンツのフレームレートが異なる場合、前記選択されたコンテンツごとに時空間スライス画像を生成し、前記選択されたコンテンツ間で対応する時空間スライス画像間で時間軸方向に平行な動き成分を推定することによって、前記コンテンツ間のフレームまたはフィールド間の対応付けを調整してから前記品質がよりよいコンテンツを生成する。
 本発明の第19の態様は、上記態様において、前記高品質コンテンツ生成手段は、前記選択されたコンテンツのフレームレートが異なる場合、前記選択されたコンテンツごとに時空間スライス画像を生成し、前記選択されたコンテンツ間で対応する時空間スライス画像間で超解像技術を用いることによって高品質な時空間スライス画像を生成し、前記高品質な時空間スライス画像をサンプリングしなおすことによってフレームレートが高いコンテンツを生成する。
 本発明の第20の態様は、上記態様において、前記コンテンツグループ化手段から出力される同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、前記同一/派生コンテンツグループ化情報に基づいて前記選択されたコンテンツ間で区間の対応関係の修正を行って、修正された同一/派生コンテンツグループ化情報を出力する対応関係修正手段を有し、前記高品質コンテンツ生成手段は、前記同一/派生コンテンツグループ化情報の代わりに前記修正された同一/派生コンテンツグループ化情報を入力とする。
 本発明の第21の態様は、複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出ステップと、前記抽出した複数コンテンツの特徴量間で照合を行い、前記複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツをグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化ステップと、前記同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成ステップとを有する高品質コンテンツ生成方法である。
 本発明の第22の態様は、上記態様において、前記コンテンツが時間軸を有するコンテンツであり、前記コンテンツグループ化ステップは、前記照合によって時間区間ごとに同一/派生コンテンツのグループ化を行い、前記同一/派生コンテンツグループ化情報を算出し、前記高品質コンテンツ生成ステップは、前記選択されたコンテンツを用いて、時間区間ごとに品質がよりよいコンテンツを生成する。
 本発明の第23の態様は、上記態様において、前記コンテンツグループ化ステップで算出される同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、前記同一/派生コンテンツグループ化情報に基づいて前記選択されたコンテンツ間で区間の対応関係の修正を行って、修正された同一/派生コンテンツグループ化情報を算出する対応関係修正ステップを有し、前記高品質コンテンツ生成ステップは、前記同一/派生コンテンツグループ化情報の代わりに前記修正された同一/派生コンテンツグループ化情報を用いる。
 本発明の第24の態様は、複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出処理と、前記抽出した複数コンテンツの特徴量間で照合を行い、前記複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツを求めてグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化処理と、前記同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成処理とを情報処理装置に実行させる高品質コンテンツ生成プログラムである。
 本発明の第25の態様は、上記態様において、前記コンテンツが時間軸を有するコンテンツであり、前記コンテンツグループ化処理は、前記照合によって時間区間ごとに同一/派生コンテンツのグループ化を行い、前記同一/派生コンテンツグループ化情報を算出し、前記高品質コンテンツ生成処理は、前記選択されたコンテンツを用いて、時間区間ごとに品質がよりよいコンテンツを生成する。
 本発明の第26の態様は、上記態様において、前記コンテンツグループ化処理で算出される同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、前記同一/派生コンテンツグループ化情報に基づいて前記選択されたコンテンツ間で区間の対応関係の修正を行って、修正された同一/派生コンテンツグループ化情報を算出する対応関係修正処理を情報処理装置に実行させ、前記高品質コンテンツ生成処理は、前記同一/派生コンテンツグループ化情報の代わりに前記修正された同一/派生コンテンツグループ化情報を用いる。
 以上好ましい実施の形態及び態様をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び実施例に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。
 本出願は、2008年6月26日に出願された日本出願特願2008-167345号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 本発明によれば、ネットワークからアクセス可能なコンテンツを用いてより高品質なコンテンツを生成してユーザに提供するシステムやプログラムといった用途に適用できる。また、上記の用途はネットワークに限らず、同じハードディスクレコーダ内に蓄積されたコンテンツであっても、同一あるいは派生コンテンツが存在する場合には、同様に適用可能である。
 100  特徴量抽出手段
 101  同一/派生コンテンツグループ化手段
 102  高品質コンテンツ生成手段
 105  コンテンツ蓄積手段
 150  対応関係修正手段
 
 

Claims (26)

  1.  複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出手段と、
     前記特徴量抽出手段で抽出した複数コンテンツの特徴量間で照合を行い、前記複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツをグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化手段と、
     前記同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成手段と
    を有する高品質コンテンツ生成システム。
  2.  前記コンテンツが時間軸を有するコンテンツであり、
     前記コンテンツグループ化手段は、前記照合によって時間区間ごとに同一/派生コンテンツのグループ化を行い、前記同一/派生コンテンツグループ化情報を算出し、
     前記高品質コンテンツ生成手段は、前記選択されたコンテンツを用いて、時間区間ごとに品質がよりよいコンテンツを生成する
    請求項1に記載の高品質コンテンツ生成システム。
  3.  前記コンテンツが、音楽または映像である請求項2に記載の高品質コンテンツ生成システム。
  4.  前記コンテンツの特徴量が、視覚特徴量、又は音響特徴量の少なくとも1つを含む請求項3に記載の高品質コンテンツ生成システム。
  5.  前記高品質コンテンツ生成手段は、前記選択されたコンテンツの品質を時間区間ごとに評価し、前記選択されたコンテンツ同士の同一区間に対応する時間区間の間で品質を比較し、高品質なコンテンツの時間区間を選んでつなぎ合わせていくことによって品質がよりよいコンテンツを生成する請求項2から請求項4のいずれかに記載の高品質コンテンツ生成システム。
  6.  前記高品質コンテンツ生成手段は、時間区間ごとの品質の評価を、その時間区間に割り当てられている符号化ビット量と符号化方式とによって判定する請求項5に記載の高品質コンテンツ生成システム。
  7.  前記高品質コンテンツ生成手段は、時間区間ごとの品質の評価を、符号化歪みの大きさを評価する評価指標によって判定する請求項5に記載の高品質コンテンツ生成システム。
  8.  前記高品質コンテンツ生成手段は、前記選択されたコンテンツの品質を時間区間ごとおよびフレーム内領域ごとに評価し、前記選択されたコンテンツ同士の同一区間に対応する時間区間の間で品質を比較し、高品質なコンテンツの時間区間およびフレーム内領域を選んでつなぎ合わせていくことによって品質がよりよいコンテンツを生成する請求項2から4に記載の高品質コンテンツ生成システム。
  9.  前記高品質コンテンツ生成手段は、フレーム内領域ごとの品質の評価を、そのフレーム内領域に割り当てられている符号化ビット量と符号化方式とによって判定する請求項8に記載の高品質コンテンツ生成システム。
  10.  前記高品質コンテンツ生成手段は、フレーム内領域ごとの品質の評価を、符号化歪みの大きさを評価する評価指標によって判定する請求項8に記載の高品質コンテンツ生成システム。
  11.  前記符号化歪みの大きさを評価する評価指標が、量子化の粗さを規定する符号化パラメータである請求項7または請求項10に記載の高品質コンテンツ生成システム。
  12.  前記高品質コンテンツ生成手段は、前記選択されたコンテンツの解像度が異なる場合に、最も高い解像度のコンテンツを用いることによって品質がよりよいコンテンツを生成する請求項2から請求項4のいずれかに記載の高品質コンテンツ生成システム。
  13.  前記高品質コンテンツ生成手段は、対応するフレーム間で画素値の統計処理を行って高品質なフレームを生成することによって品質がよりよいコンテンツを生成する請求項2から請求項4のいずれかに記載の高品質コンテンツ生成システム。
  14.  前記高品質コンテンツ生成手段は、前記選択されたコンテンツの解像度が異なる場合に、対応するフレーム間で超解像技術を用いることによって高品質なフレームを生成することによって品質がよりよいコンテンツを生成する請求項2から請求項4のいずれかに記載の高品質コンテンツ生成システム。
  15.  前記高品質コンテンツ生成手段は、前記選択されたコンテンツのフレームレートが異なる場合に、最も高いフレームレートのコンテンツを用いることによって品質がよりよいコンテンツを生成する請求項2から請求項4のいずれかに記載の高品質コンテンツ生成システム。
  16.  前記高品質コンテンツ生成手段は、前記選択されたコンテンツのフレームレートが異なる場合、前記選択されたコンテンツ間で対応するフレームまたはフィールドが複数存在する場合にはその中でもっとも品質がよいフレームまたはフィールドを選択するか、あるいは前記対応するフレームまたはフィールドに対して統計処理を行うことによってフレームまたはフィールドを生成し、対応するフレームまたはフィールドが複数存在しない場合には、そのフレームまたはフィールドを選択することにより、品質がよりよいコンテンツを生成する請求項2から請求項4のいずれかに高品質コンテンツ生成システム。
  17.  前記高品質コンテンツ生成手段は、フレームまたはフィールドごとの品質の評価を、符号化歪みの大きさを評価する評価指標によって判定する請求項16に記載の高品質コンテンツ生成システム。
  18.  前記高品質コンテンツ生成手段は、前記選択されたコンテンツのフレームレートが異なる場合、前記選択されたコンテンツごとに時空間スライス画像を生成し、前記選択されたコンテンツ間で対応する時空間スライス画像間で時間軸方向に平行な動き成分を推定することによって、前記コンテンツ間のフレームまたはフィールド間の対応付けを調整してから前記品質がよりよいコンテンツを生成する請求項16に記載の高品質コンテンツ生成システム。
  19.  前記高品質コンテンツ生成手段は、前記選択されたコンテンツのフレームレートが異なる場合、前記選択されたコンテンツごとに時空間スライス画像を生成し、前記選択されたコンテンツ間で対応する時空間スライス画像間で超解像技術を用いることによって高品質な時空間スライス画像を生成し、前記高品質な時空間スライス画像をサンプリングしなおすことによってフレームレートが高いコンテンツを生成する請求項2から請求項4のいずれかに記載の高品質コンテンツ生成システム。
  20.  前記コンテンツグループ化手段から出力される同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、前記同一/派生コンテンツグループ化情報に基づいて前記選択されたコンテンツ間で区間の対応関係の修正を行って、修正された同一/派生コンテンツグループ化情報を出力する対応関係修正手段を有し、
     前記高品質コンテンツ生成手段は、前記同一/派生コンテンツグループ化情報の代わりに前記修正された同一/派生コンテンツグループ化情報を入力とする
    請求項2から請求項19に記載の高品質コンテンツ生成システム。
  21.  複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出ステップと、
     前記抽出した複数コンテンツの特徴量間で照合を行い、前記複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツをグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化ステップと、
     前記同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成ステップと
    を有する高品質コンテンツ生成方法。
  22.  前記コンテンツが時間軸を有するコンテンツであり、
     前記コンテンツグループ化ステップは、前記照合によって時間区間ごとに同一/派生コンテンツのグループ化を行い、前記同一/派生コンテンツグループ化情報を算出し、
     前記高品質コンテンツ生成ステップは、前記選択されたコンテンツを用いて、時間区間ごとに品質がよりよいコンテンツを生成する
    請求項21に記載の高品質コンテンツ生成方法。
  23.  前記コンテンツグループ化ステップで算出される同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、前記同一/派生コンテンツグループ化情報に基づいて前記選択されたコンテンツ間で区間の対応関係の修正を行って、修正された同一/派生コンテンツグループ化情報を算出する対応関係修正ステップを有し、
     前記高品質コンテンツ生成ステップは、前記同一/派生コンテンツグループ化情報の代わりに前記修正された同一/派生コンテンツグループ化情報を用いる
    請求項21又は請求項22に記載の高品質コンテンツ生成方法。
  24.  複数のコンテンツからコンテンツの特徴量を抽出する特徴量抽出処理と、
     前記抽出した複数コンテンツの特徴量間で照合を行い、前記複数コンテンツ中に含まれる同一コンテンツおよびそのコンテンツを使って制作された派生コンテンツを求めてグループ化し、同一/派生コンテンツグループ化情報を算出するコンテンツグループ化処理と、
     前記同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、選択されたコンテンツを用いて品質がよりよいコンテンツを生成する高品質コンテンツ生成処理と
    を情報処理装置に実行させる高品質コンテンツ生成プログラム。
  25.  前記コンテンツが時間軸を有するコンテンツであり、
     前記コンテンツグループ化処理は、前記照合によって時間区間ごとに同一/派生コンテンツのグループ化を行い、前記同一/派生コンテンツグループ化情報を算出し、
     前記高品質コンテンツ生成処理は、前記選択されたコンテンツを用いて、時間区間ごとに品質がよりよいコンテンツを生成する
    請求項24に記載の高品質コンテンツ生成プログラム。
  26.  前記コンテンツグループ化処理で算出される同一/派生コンテンツグループ化情報でグループ化されるコンテンツを前記複数のコンテンツの中から選択し、前記同一/派生コンテンツグループ化情報に基づいて前記選択されたコンテンツ間で区間の対応関係の修正を行って、修正された同一/派生コンテンツグループ化情報を算出する対応関係修正処理を情報処理装置に実行させ、
     前記高品質コンテンツ生成処理は、前記同一/派生コンテンツグループ化情報の代わりに前記修正された同一/派生コンテンツグループ化情報を用いる
    請求項24又は請求項25に記載の高品質コンテンツ生成プログラム。
PCT/JP2009/060909 2008-06-26 2009-06-16 高品質コンテンツ生成システムと、その方法及びプログラム WO2009157340A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2010517913A JP5648800B2 (ja) 2008-06-26 2009-06-16 高品質コンテンツ生成システムと、その方法及びプログラム
CN200980124217.0A CN102077582B (zh) 2008-06-26 2009-06-16 高品质内容生成系统及其方法和程序
EP09770050A EP2306718A4 (en) 2008-06-26 2009-06-16 METHOD FOR PRODUCING QUALITY CONTENTS, METHOD THEREFOR AND PROGRAM
US13/001,378 US8879004B2 (en) 2008-06-26 2009-06-16 High-quality content generation system, method therefor, and program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008-167345 2008-06-26
JP2008167345 2008-06-26

Publications (1)

Publication Number Publication Date
WO2009157340A1 true WO2009157340A1 (ja) 2009-12-30

Family

ID=41444408

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/060909 WO2009157340A1 (ja) 2008-06-26 2009-06-16 高品質コンテンツ生成システムと、その方法及びプログラム

Country Status (5)

Country Link
US (1) US8879004B2 (ja)
EP (1) EP2306718A4 (ja)
JP (2) JP5648800B2 (ja)
CN (1) CN102077582B (ja)
WO (1) WO2009157340A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013157268A1 (ja) * 2012-04-20 2013-10-24 パナソニック株式会社 コンテンツ管理装置、コンテンツ管理方法、プログラム、およびコンテンツの表示方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101969583B1 (ko) * 2012-01-10 2019-08-20 삼성전자주식회사 컨텐츠 관리 방법과 장치 및 기록 매체
US10078888B2 (en) * 2016-01-15 2018-09-18 Fluke Corporation Through-focus image combination
JP6559870B1 (ja) * 2018-11-30 2019-08-14 株式会社ドワンゴ 動画合成装置、動画合成方法及び動画合成プログラム
KR102126514B1 (ko) * 2019-04-10 2020-06-24 삼성전자주식회사 컨텐츠 관리 방법과 장치 및 기록 매체

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259832A (ja) * 1999-01-06 2000-09-22 Nec Corp 画像特徴量生成装置、画像検索装置、並びにその生成方法及び検索方法
JP2000339474A (ja) * 1999-05-27 2000-12-08 Nec Corp 動画像類似度算出装置および方法
JP2003333484A (ja) * 2002-05-15 2003-11-21 Nec Corp 番組録画再生システム、番組録画再生方法および番組録画再生プログラム
JP2005159419A (ja) 2003-11-20 2005-06-16 Canon Inc 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2006115264A (ja) * 2004-10-15 2006-04-27 Xanavi Informatics Corp デジタル放送の送出装置、受信装置およびデジタル放送システム
JP2008167345A (ja) 2007-01-04 2008-07-17 Nec Saitama Ltd 音声信号の出力方法、スピーカシステム、携帯機器及びコンピュータプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657402A (en) * 1991-11-01 1997-08-12 Massachusetts Institute Of Technology Method of creating a high resolution still image using a plurality of images and apparatus for practice of the method
US5724453A (en) * 1995-07-10 1998-03-03 Wisconsin Alumni Research Foundation Image compression system and method having optimized quantization tables
US5953506A (en) * 1996-12-17 1999-09-14 Adaptive Media Technologies Method and apparatus that provides a scalable media delivery system
WO1999063760A1 (en) * 1998-05-30 1999-12-09 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Sequence adaptive bit allocation for pictures encoding
US6167084A (en) * 1998-08-27 2000-12-26 Motorola, Inc. Dynamic bit allocation for statistical multiplexing of compressed and uncompressed digital video signals
US6744922B1 (en) * 1999-01-29 2004-06-01 Sony Corporation Signal processing method and video/voice processing device
JP4157340B2 (ja) * 2002-08-27 2008-10-01 松下電器産業株式会社 送信装置、受信装置を含む放送システム、受信装置、及びプログラム。
US8201194B2 (en) 2003-01-06 2012-06-12 Wijnands Rudi J M Real-time recording agent for streaming data from an internet
EP1513353A3 (en) * 2003-09-05 2008-10-08 Matsushita Electric Industrial Co., Ltd. Video stream processing apparatus and video stream processing method
JP4600209B2 (ja) * 2005-08-18 2010-12-15 ソニー株式会社 画像処理方法、画像処理装置、プログラムおよび記録媒体
WO2007100004A1 (ja) * 2006-03-01 2007-09-07 Pioneer Corporation 情報再生装置、情報再生方法、情報再生プログラムおよび記録媒体
CA2604139C (en) * 2006-05-09 2014-02-18 Nippon Telegraph And Telephone Corporation Video quality estimation apparatus, method, and program
CN101021857A (zh) * 2006-10-20 2007-08-22 鲍东山 基于内容分析的视频搜索系统
US20090320081A1 (en) * 2008-06-24 2009-12-24 Chui Charles K Providing and Displaying Video at Multiple Resolution and Quality Levels

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000259832A (ja) * 1999-01-06 2000-09-22 Nec Corp 画像特徴量生成装置、画像検索装置、並びにその生成方法及び検索方法
JP2000339474A (ja) * 1999-05-27 2000-12-08 Nec Corp 動画像類似度算出装置および方法
JP2003333484A (ja) * 2002-05-15 2003-11-21 Nec Corp 番組録画再生システム、番組録画再生方法および番組録画再生プログラム
JP2005159419A (ja) 2003-11-20 2005-06-16 Canon Inc 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2006115264A (ja) * 2004-10-15 2006-04-27 Xanavi Informatics Corp デジタル放送の送出装置、受信装置およびデジタル放送システム
JP2008167345A (ja) 2007-01-04 2008-07-17 Nec Saitama Ltd 音声信号の出力方法、スピーカシステム、携帯機器及びコンピュータプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2306718A4 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013157268A1 (ja) * 2012-04-20 2013-10-24 パナソニック株式会社 コンテンツ管理装置、コンテンツ管理方法、プログラム、およびコンテンツの表示方法
JPWO2013157268A1 (ja) * 2012-04-20 2015-12-21 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America コンテンツ管理装置、コンテンツ管理方法、プログラム、およびコンテンツの表示方法

Also Published As

Publication number Publication date
EP2306718A1 (en) 2011-04-06
US20110149169A1 (en) 2011-06-23
CN102077582B (zh) 2014-04-16
JP5928747B2 (ja) 2016-06-01
EP2306718A4 (en) 2012-08-08
CN102077582A (zh) 2011-05-25
JPWO2009157340A1 (ja) 2011-12-08
JP5648800B2 (ja) 2015-01-07
JP2014220836A (ja) 2014-11-20
US8879004B2 (en) 2014-11-04

Similar Documents

Publication Publication Date Title
JP5928747B2 (ja) 高品質コンテンツ生成システムと、その方法及びプログラム
CN102326391B (zh) 多视点图像编码装置及方法、多视点图像译码装置及方法
US10003768B2 (en) Apparatus and methods for frame interpolation based on spatial considerations
US9049420B1 (en) Relative quality score for video transcoding
CN110546953B (zh) 复杂度自适应单程转码与双程转码
EP3176749A2 (en) Efficient image processing on content-adaptive pq signal domain
JP5144545B2 (ja) 動画像コーデック装置及びその方法
US10354394B2 (en) Dynamic adjustment of frame rate conversion settings
US20040091171A1 (en) Mosaic construction from a video sequence
JP2006174415A (ja) 画像復号装置、画像復号プログラム、画像復号方法、画像符号化装置、画像符号化プログラム及び画像符号化方法
US7421129B2 (en) Image compression and synthesis for video effects
JP2014174834A (ja) 情報処理装置、クラウドプラットフォーム、情報処理方法およびそのプログラム
JP2003018603A (ja) 動画像符号化方法及び装置
CN102265607A (zh) 图像缩放曲线生成
JP4490374B2 (ja) 映像品質評価装置および方法
US20030202780A1 (en) Method and system for enhancing the playback of video frames
JP5313326B2 (ja) 画像復号装置、方法およびプログラム、並びに、画像符号化装置、方法およびプログラム
EP3329678B1 (en) Method and apparatus for compressing video data
CN113748683A (zh) 用于在压缩视频文件中保存带内元数据的系统和方法
US9736490B2 (en) Apparatus and method of compressing and restoring image using filter information
US20210274231A1 (en) Real-time latency measurement of video streams
US9398314B2 (en) Entropy coding efficiency enhancement utilizing energy distribution remapping
US20030081679A1 (en) Image interpolation
EP2320663A1 (en) Image display device, image recording and reproduction device, and image processing method
JP6078431B2 (ja) 映像品質推定装置、映像品質推定方法及びプログラム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200980124217.0

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09770050

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2010517913

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2009770050

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 13001378

Country of ref document: US