JP2024010692A - 映像コンテンツ処理装置、映像コンテンツ処理方法および映像コンテンツ処理プログラム - Google Patents

映像コンテンツ処理装置、映像コンテンツ処理方法および映像コンテンツ処理プログラム Download PDF

Info

Publication number
JP2024010692A
JP2024010692A JP2022112116A JP2022112116A JP2024010692A JP 2024010692 A JP2024010692 A JP 2024010692A JP 2022112116 A JP2022112116 A JP 2022112116A JP 2022112116 A JP2022112116 A JP 2022112116A JP 2024010692 A JP2024010692 A JP 2024010692A
Authority
JP
Japan
Prior art keywords
video content
unit
classification
selection
acquisition unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022112116A
Other languages
English (en)
Inventor
竜彦 田中
Tatsuhiko Tanaka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP2022112116A priority Critical patent/JP2024010692A/ja
Publication of JP2024010692A publication Critical patent/JP2024010692A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】映像コンテンツの録画再生における利便性を向上する。【解決手段】映像コンテンツ処理装置は、映像コンテンツにおいて出現する視聴対象を分類した分類結果を取得する分類結果取得部と、前記分類結果取得部により取得された前記分類結果に対する選択結果を取得する選択結果取得部と、前記選択結果取得部により取得された前記選択結果が示す前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記映像コンテンツの区切り位置を設定する設定部とを備える。【選択図】図5

Description

本開示は、映像コンテンツ処理装置、映像コンテンツ処理方法および映像コンテンツ処理プログラムに関する。
従来、映像コンテンツの区切り位置であるチャプタを設定するための技術が知られている。
たとえば、特許文献1(特開2007-74040号公報)には、以下のような放送番組記録装置が開示されている。すなわち、放送番組記録装置は、ランダムアクセス可能な記録媒体を有する蓄積部に放送番組を予約して記録する放送番組記録装置であって、少なくとも毎日における概同時刻又は1週間のうちの所定の曜日における概同時刻に放送される番組である帯番組を一度の予約録画設定で繰り返し予約録画を実行するパターン予約録画に対して録画済みの前記帯番組のタイトルである参考タイトルのチャプタ情報よりチャプタ作成情報を作成する録画管理手段と、受信した放送番組を録画データストリームに変換して前記蓄積部へ出力する変換手段と、前記変換手段による録画中に前記録画データストリームに含まれているCMの検出を行いCM検出結果を出力するCM検出手段とを備え、前記変換手段は、前記録画管理手段からの前記チャプタ作成情報と前記CM検出手段からの前記CM検出結果とに基づいて前記パターン予約録画実行時に前記蓄積部に保存される前記録画データストリームの所定位置へ挿入すべきチャプタの作成を行うよう構成されている。
また、たとえば、非特許文献1(”時短で見る”、[online]、[令和4年6月29日検索]、インターネット〈URL:https://www.regza.com/bd-dvd/lineup/dbr-m4010-m3010/features/recording.html〉)には、録画している番組に自動的にチャプタを作成することが記載されている。
また、たとえば、非特許文献2(”有料サービス ディモーラ”、[online]、[令和4年6月29日検索]、インターネット〈URL:https://panasonic.jp/diga/apps/premium.html〉)には、録画番組を再生する際、ユーザにより選択されたシーンから再生することが記載されている。
また、たとえば、非特許文献3(”隠れた実力「おまかせチャプター」”、[online]、[令和4年6月29日検索]、インターネット〈URL:https://www.sony.jp/products/Consumer/dvdrecorder/tour/omakase/index.html〉)には、音の切り替わりおよび映像の切り替わりを自動的に検出し、チャプタを作成することが記載されている。
特開2007-74040号公報
"時短で見る"、[online]、[令和4年6月29日検索]、インターネット〈URL:https://www.regza.com/bd-dvd/lineup/dbr-m4010-m3010/features/recording.html〉 "有料サービス ディモーラ"、[online]、[令和4年6月29日検索]、インターネット〈URL:https://panasonic.jp/diga/apps/premium.html〉 "隠れた実力「おまかせチャプター」"、[online]、[令和4年6月29日検索]、インターネット〈URL:https://www.sony.jp/products/Consumer/dvdrecorder/tour/omakase/index.html〉
特許文献1および非特許文献1から3に記載の技術を超えて、映像コンテンツの録画再生における利便性を向上することが可能な技術が望まれる。
本開示は、上述の課題を解決するためになされたもので、その目的は、映像コンテンツの録画再生における利便性を向上することが可能な映像コンテンツ処理装置、映像コンテンツ処理方法および映像コンテンツ処理プログラムを提供することである。
本開示の映像コンテンツ処理装置は、映像コンテンツにおいて出現する視聴対象を分類した分類結果を取得する分類結果取得部と、前記分類結果取得部により取得された前記分類結果に対する選択結果を取得する選択結果取得部と、前記選択結果取得部により取得された前記選択結果が示す前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記映像コンテンツの区切り位置を設定する設定部とを備える。
本開示の一態様は、このような特徴的な処理部を備える映像コンテンツ処理装置として実現され得るだけでなく、映像コンテンツ処理装置の一部または全部を実現する半導体集積回路として実現され得たり、映像コンテンツ処理装置を含むシステムとして実現され得る。
本開示によれば、映像コンテンツの録画再生における利便性を向上することができる。
図1は、本開示の第1の実施の形態に係るコンテンツ配信システムの構成を示す図である。 図2は、本開示の第1の実施の形態に係るコンテンツ視聴装置の構成の概要を示す図である。 図3は、本開示の第1の実施の形態に係るコンテンツ視聴装置の詳細な構成を示す図である。 図4は、本開示の第1の実施の形態に係るコンテンツ視聴装置におけるチャプタ生成部により生成されるチャプタ情報の一例を示す図である。 図5は、本開示の第1の実施の形態に係るコンテンツ視聴装置におけるチャプタ生成部の構成を示す図である。 図6は、本開示の第1の実施の形態に係るコンテンツ視聴装置のチャプタ生成部における検出部による人間の顔の検出結果の一例を示す図である。 図7は、本開示の第1の実施の形態に係るコンテンツ視聴装置のチャプタ生成部における分類部による人間の顔の分類結果の一例を示す図である。 図8は、本開示の第1の実施の形態に係るコンテンツ視聴装置のチャプタ生成部における表示処理部により表示装置に表示される選択画面の一例を示す図である。 図9は、本開示の第1の実施の形態に係るコンテンツ視聴装置における録画再生部により表示装置に表示されるチャプタ操作画面の一例を示す図である。 図10は、本開示の実施の形態に係るコンテンツ視聴装置がチャプタ情報の生成を行う際の動作手順の一例を定めたフローチャートである。 図11は、本開示の第1の実施の形態の変形例1に係るコンテンツ視聴装置におけるチャプタ生成部の構成を示す図である。 図12は、本開示の第1の実施の形態の変形例2に係るコンテンツ視聴装置におけるチャプタ生成部の構成を示す図である。 図13は、本開示の第1の実施の形態の変形例2に係るコンテンツ視聴装置における録画再生部により表示装置に表示されるチャプタ操作画面の一例を示す図である。 図14は、本開示の第2の実施の形態に係るコンテンツ配信システムの構成を示す図である。 図15は、本開示の第2の実施の形態に係るサーバの構成の概要を示す図である。 図16は、本開示の第2の実施の形態に係るサーバにおけるチャプタ生成部の構成を示す図である。
最初に、本開示の実施形態の内容を列記して説明する。
(1)本開示の実施の形態に係る映像コンテンツ処理装置は、映像コンテンツにおいて出現する視聴対象を分類した分類結果を取得する分類結果取得部と、前記分類結果取得部により取得された前記分類結果に対する選択結果を取得する選択結果取得部と、前記選択結果取得部により取得された前記選択結果が示す前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記映像コンテンツの区切り位置を設定する設定部とを備える。
このように、映像コンテンツにおいて出現する視聴対象を分類した分類結果に対する選択結果を取得し、取得した選択結果が示す視聴対象の時間的な出現位置に基づいて区切り位置を設定する構成により、選択された視聴対象の分類に基づいて区切り位置を設定することができるので、映像コンテンツにおける当該視聴対象の複数の出現位置に基づいて効率的に区切り位置を設定することができるとともに、早送り機能等を用いることなく、たとえばユーザが着目する視聴対象が出現するシーンから再生することができる。したがって、映像コンテンツの録画再生における利便性を向上することができる。
(2)上記(1)において、前記選択結果取得部は、前記分類結果に基づいて、前記視聴対象を選択してもよく、前記設定部は、前記選択結果取得部により選択された前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記区切り位置を設定してもよい。
このような構成により、たとえば分類結果に対するユーザの選択結果を取得することなく、映像コンテンツ処理装置において、分類結果に基づいて自動的に視聴対象を選択して区切り位置を設定することができるので、ユーザの利便性をより向上することができる。
(3)上記(1)または(2)において、前記映像コンテンツ処理装置は、さらに、前記分類結果に基づく前記視聴対象を表示する処理を行う表示処理部を備えてもよく、前記選択結果取得部は、前記表示処理部により表示された前記視聴対象の前記選択結果を受け付けてもよい。
このような構成により、映像コンテンツにおいて出現する視聴対象のうちの、ユーザにより選択された視聴対象の出現位置に基づいて区切り位置を設定することができる。
(4)上記(3)において、前記表示処理部は、前記映像コンテンツにおける出現頻度の順に従って前記視聴対象を並べて表示する処理を行ってもよい。
このような構成により、ユーザにおいて、出現頻度を考慮して、区切り位置の設定に用いられる視聴対象を選択することができる。
(5)上記(1)から(4)のいずれかにおいて、前記映像コンテンツ処理装置は、さらに、映像コンテンツ配信装置から、前記映像コンテンツを含むストリームを受信する受信部と、前記受信部により受信された前記ストリームに含まれる前記映像コンテンツにおいて出現する前記視聴対象を検出する検出部とを備えてもよく、前記分類結果取得部は、前記検出部により検出された前記視聴対象を分類してもよい。
このような構成により、たとえばユーザ宅に設けられた映像コンテンツ処理装置において、分類結果を当該ユーザに提示することにより、当該ユーザの選択結果を簡単に取得することができる。
(6)上記(1)から(4)のいずれかにおいて、前記映像コンテンツ処理装置は、さらに、映像コンテンツ配信装置から、前記映像コンテンツを含むストリームを受信する受信部を備えてもよく、前記分類結果取得部は、前記映像コンテンツ配信装置から前記分類結果を取得してもよい。
このような構成により、映像コンテンツ処理装置における処理負荷を軽減することができる。
(7)上記(1)または(2)において、前記映像コンテンツ処理装置は、さらに、前記映像コンテンツが蓄積された記憶部と、前記記憶部に蓄積された前記映像コンテンツを映像コンテンツ再生装置へ配信する送信部と、前記記憶部に蓄積された前記映像コンテンツにおいて出現する前記視聴対象を検出する検出部とを備えてもよく、前記分類結果取得部は、前記検出部により検出された前記視聴対象を分類してもよい。
このような構成により、たとえば視聴対象の分類結果を映像コンテンツ処理装置へ送信することにより、映像コンテンツ処理装置における処理負荷を軽減することができる。
(8)本開示の実施の形態に係る映像コンテンツ処理方法は、映像コンテンツ処理装置における映像コンテンツ処理方法であって、映像コンテンツにおいて出現する視聴対象を分類した分類結果を取得するステップと、取得した前記分類結果に対する選択結果を取得するステップと、取得した前記選択結果が示す前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記映像コンテンツの区切り位置を設定するステップとを含む。
このように、映像コンテンツにおいて出現する視聴対象を分類した分類結果に対する選択結果を取得し、取得した選択結果が示す視聴対象の時間的な出現位置に基づいて区切り位置を設定する方法により、選択された視聴対象の分類に基づいて区切り位置を設定することができるので、映像コンテンツにおける当該視聴対象の複数の出現位置に基づいて効率的に区切り位置を設定することができるとともに、早送り機能等を用いることなく、たとえばユーザが着目する視聴対象が出現するシーンから再生することができる。したがって、映像コンテンツの録画再生における利便性を向上することができる。
(9)本開示の実施の形態に係る映像コンテンツ処理プログラムは、映像コンテンツ処理装置において用いられる映像コンテンツ処理プログラムであって、コンピュータを、映像コンテンツにおいて出現する視聴対象を分類した分類結果を取得する分類結果取得部と、前記分類結果取得部により取得された前記分類結果に対する選択結果を取得する選択結果取得部と、前記選択結果取得部により取得された前記選択結果が示す前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記映像コンテンツの区切り位置を設定する設定部、として機能させるためのプログラムである。
このように、映像コンテンツにおいて出現する視聴対象を分類した分類結果に対する選択結果を取得し、取得した選択結果が示す視聴対象の時間的な出現位置に基づいて区切り位置を設定する構成により、選択された視聴対象の分類に基づいて区切り位置を設定することができるので、映像コンテンツにおける当該視聴対象の複数の出現位置に基づいて効率的に区切り位置を設定することができるとともに、早送り機能等を用いることなく、たとえばユーザが着目する視聴対象が出現するシーンから再生することができる。したがって、映像コンテンツの録画再生における利便性を向上することができる。
以下、本開示の実施の形態について図面を用いて説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。また、以下に記載する実施の形態の少なくとも一部を任意に組み合わせてもよい。
<第1の実施の形態>
[構成および基本動作]
図1は、本開示の第1の実施の形態に係るコンテンツ配信システムの構成を示す図である。図1を参照して、コンテンツ配信システム401は、コンテンツ視聴装置101と、サーバ201と、表示装置301とを備える。コンテンツ視聴装置101は、映像コンテンツ再生装置の一例である。サーバ201は、映像コンテンツ配信装置の一例である。コンテンツ配信システム401は、複数のコンテンツ視聴装置101を備える構成であってもよい。
コンテンツ視聴装置101および表示装置301は、ユーザ宅に設けられる。表示装置301は、ユーザ宅において、たとえばHDMI(登録商標)ケーブルを介してコンテンツ視聴装置101に接続される。
サーバ201は、映像コンテンツをコンテンツ視聴装置101へ配信する装置である。サーバ201は、配信可能な複数の映像コンテンツのうちの、ユーザにより選択された映像コンテンツをコンテンツ視聴装置101へ配信する。たとえば、サーバ201は、VOD(Video On Demand)の映像コンテンツをコンテンツ視聴装置101へ配信する。また、たとえば、サーバ201は、地上デジタル放送、BS(Broadcast Satelite)放送、CS(Communication Satellite)放送、および自主放送等の映像コンテンツをコンテンツ視聴装置101へ配信する。
コンテンツ視聴装置101は、たとえばSTB(Set Top Box)である。コンテンツ視聴装置101は、サーバ201から配信される映像コンテンツを受信する。コンテンツ視聴装置101は、受信した映像コンテンツの録画および再生を行うことが可能である。コンテンツ視聴装置101は、たとえば、映像コンテンツが複数の放送パケットに分割されたストリームをインターネット等のネットワーク351経由で受信し、コンテンツ視聴装置101に接続される表示装置301において映像コンテンツを再生する。
ストリームは、たとえば音声情報、映像情報、EPG(Electronic Program Guide)情報、字幕情報およびSI(Service Information)等を含む。
ストリームを構成する各放送パケットのペイロードには、たとえばPES(Packetized Elementary Stream)の一部または全部が含まれる。
コンテンツ視聴装置101において処理されるPESには、たとえば、画像を格納する画像PESおよび音声を格納する音声PES等がある。画像PESおよび音声PESのペイロードには、符号化された、画像および音声がそれぞれ含まれる。PESのヘッダには、当該PESの識別子であるストリームID、および当該PESのペイロードに含まれる画像または音声を出力すべきタイミングを示すPTS(Presentation Time Stamp)等が含まれる。
表示装置301は、たとえばテレビジョン装置である。表示装置301は、コンテンツ視聴装置101により再生された映像コンテンツを画面に表示する。
(コンテンツ視聴装置)
図2は、本開示の第1の実施の形態に係るコンテンツ視聴装置の構成の概要を示す図である。図2を参照して、コンテンツ視聴装置101は、受信部11と、処理部12と、記憶部13とを備える。受信部11および処理部12の一部または全部は、たとえば、1または複数のプロセッサを含む処理回路(Circuitry)により実現される。記憶部13は、たとえば上記処理回路に含まれる不揮発性メモリである。
受信部11は、サーバ201から映像コンテンツを含むストリームを受信する。より詳細には、受信部11は、ストリームを構成する放送パケットをネットワーク351経由でサーバ201から受信し、受信した放送パケットを処理部12へ出力する。
処理部12は、受信部11から受けた放送パケットを記憶部13に保存する。また、処理部12は、映像コンテンツを出力する処理を行う。より詳細には、処理部12は、記憶部13に保存した情報等を用いて映像コンテンツを再生する処理を行い、得られた映像情報および音声情報等を表示装置301へ送信する。
図3は、本開示の第1の実施の形態に係るコンテンツ視聴装置の詳細な構成を示す図である。図3を参照して、コンテンツ視聴装置101は、リモコン信号受信部111と、放送受信部112と、消去部121と、録画部122と、録画予約部123と、放送視聴部124と、録画再生部125と、チャプタ生成部126と、録画DB131と、番組情報DB132と、予約管理DB133とを備える。また、コンテンツ視聴装置101は、記憶媒体の一例であるHDD(Hard Disk Drive)14と接続される。
リモコン信号受信部111および放送受信部112は、図2に示す受信部11に含まれる。消去部121、録画部122、録画予約部123、放送視聴部124、録画再生部1125およびチャプタ生成部126は、図2に示す処理部12に含まれる。録画DB131、番組情報DB132および予約管理DB133は、記憶部13に保存されている。
録画DB131は、録画された映像コンテンツすなわち録画番組のデータベースである。録画DB131には、各映像コンテンツの、コンテンツファイル名、タイトル、ジャンル、開始時間、終了時間、およびコンテンツ長等が登録される。
番組情報DB132は、放送される映像コンテンツすなわち放送番組のデータベースである。番組情報DB132には、番組情報として、放送受信部112によってストリームから取得されたイベント情報テーブル(EIT)、およびEITなどを用いて作成されるEPGに基づく番組表が登録される。放送受信部112によってEITが定期的に取得されることにより、番組情報DB132は定期的に更新される。
予約管理DB133は、録画予約された映像コンテンツすなわち予約番組のデータベースである。予約管理DB133には、各映像コンテンツの、タイトル、番組開始時間および番組終了時間等が登録される。
リモコン信号受信部111は、リモコン15におけるリモコン操作部151からリモコン信号を受信し、受信したリモコン信号に含まれる、ユーザの操作を示す操作情報を消去部121、録画部122、録画予約部123、放送視聴部124、録画再生部125およびチャプタ生成部126へ出力する。
放送受信部112は、ネットワーク351経由でストリームを構成する放送パケットを受信する。放送パケットは、たとえば、TCP(Transmission Control Protocol)パケットまたはUDP(User Datagram Protocol)パケットを含むIPパケットである。
放送視聴部124は、放送番組を再生する。より詳細には、放送視聴部124は、リモコン信号受信部111から受けた操作情報に従って放送受信部112を制御することにより、操作情報の示す映像コンテンツに対応する放送パケットを取得し、取得した放送パケットに含まれる情報等を用いて映像コンテンツである放送番組を再生する処理を行い、得られた映像情報および音声情報等を表示装置301へ送信する。
録画予約部123は、リモコン信号受信部111から受けた操作情報に従い、番組情報DB132に登録されている番組表を参照し、操作情報の示す映像コンテンツに関する情報を予約管理DB133に登録する。録画予約部123は、予約管理DB133を参照し、当該映像コンテンツの開始時間に従って録画部122へ録画指示を出力する。
録画部122は、リモコン信号受信部111から受けた操作情報に従い、操作情報の示す映像コンテンツを録画する。また、録画部122は、録画予約部123から受けた録画指示に従い、録画指示の示す映像コンテンツを録画する。より詳細には、録画部122は、操作情報または録画指示に従って放送受信部112を制御することにより、操作情報または録画指示の示す映像コンテンツに対応する放送パケットを取得し、コンテンツファイルとしてHDD14に保存するとともに、当該映像コンテンツに関する録画情報を録画DB131に登録する。
録画部122は、放送パケットのHDD14への保存を開始すると、当該放送パケットに対応する映像コンテンツである録画番組に関する録画情報をチャプタ生成部126へ出力する。
チャプタ生成部126は、録画部122から受けた録画情報が示す録画番組に対応するチャプタ情報を生成し、生成したチャプタ情報を当該録画番組に対応付けてHDD14に保存する。
図4は、本開示の第1の実施の形態に係るコンテンツ視聴装置におけるチャプタ生成部により生成されるチャプタ情報の一例を示す図である。
図4を参照して、チャプタ情報は、録画番組における章立て位置すなわちインデックスであるチャプタポイントのチャプタIDおよび再生位置Pc、ならびにチャプタ情報の生成の際に用いた後述する検出画像を含む。チャプタ情報における再生位置Pcは、対応の映像コンテンツの冒頭からの経過時間で表される。図4に示す例では、「CH-1」のチャプタポイントの再生位置Pcは、14分20秒であり、「CH-3」のチャプタポイントの再生位置Pcは、1時間10分20秒である。再生位置Pcは、区切り位置の一例である。
再び図3を参照して、録画再生部125は、HDD14に保存された録画番組を再生する。より詳細には、録画再生部125は、リモコン信号受信部111から受けた操作情報に従い、操作情報の示す録画番組に対応する放送パケットをHDD14から取得する。そして、録画再生部125は、取得した放送パケットに含まれる情報等を用いて映像コンテンツである録画番組を再生する処理を行い、得られた映像情報および音声情報等を表示装置301へ送信する。
録画再生部125は、操作情報の示す録画番組に対応するチャプタ情報がHDD14に保存されている場合、当該チャプタ情報を取得する。そして、録画再生部125は、録画番組の再生中に、チャプタポイントの指定を含む操作情報をリモコン信号受信部111から受けると、チャプタ情報に基づいて、受けた操作情報において指定されたチャプタポイントの再生位置Pcから録画番組の再生を行う。
消去部121は、リモコン信号受信部111から受けた操作情報に従い、操作情報の示す録画番組に対応する放送パケットをHDD14から消去するとともに、当該録画番組に関する録画情報を録画DB131から消去する。
(チャプタ生成部)
図5は、本開示の第1の実施の形態に係るコンテンツ視聴装置におけるチャプタ生成部の構成を示す図である。図5を参照して、チャプタ生成部126は、抽出部51と、検出部52と、分類部53と、表示処理部54と、受付部55と、設定部56とを含む。分類部53は、分類結果取得部の一例である。受付部55は、選択結果取得部の一例である。
(抽出部)
抽出部51は、映像コンテンツを含むストリームを構成する放送パケットをHDD14から取得する。より詳細には、抽出部51は、録画部122から録画情報を受けて、受けた録画情報が示す録画番組である対象番組RPに対応する放送パケットをHDD14から取得する。
抽出部51は、取得した放送パケットを用いて対象番組RPを再生したときに所定間隔で表示される複数の画像を取得する。より詳細には、抽出部51は、取得した放送パケットに含まれるPESのヘッダにおけるストリームIDおよびPTSを参照することにより、対象番組RPを再生したときにたとえば0.5秒間隔で表示される複数のI(Intra)フレームIFを取得する。なお、IフレームIFは、Iピクチャとも称される。IフレームIFは、PフレームおよびBフレームと比べて、簡易な処理で取得することができる。
抽出部51は、取得した複数のIフレームIFおよび各IフレームIFの再生位置Pfを含む抽出画像情報を検出部52へ出力する。
(検出部)
検出部52は、抽出部51から抽出画像情報を受けて、受けた抽出画像情報に基づいて、受信部11により受信されたストリームに含まれる映像コンテンツにおいて出現する人間の顔を検出する。人間の顔は、視聴対象の一例である。
図6は、本開示の第1の実施の形態に係るコンテンツ視聴装置のチャプタ生成部における検出部による人間の顔の検出結果の一例を示す図である。
図6を参照して、検出部52は、たとえばMTCNN(Multi-Task Convolutional Neural Network)に従って作成された学習モデルを用いて、抽出画像情報に含まれるIフレームIFのうちの人間の顔が含まれるIフレームIFを抽出し、抽出したIフレームIFにおいて人間の顔が含まれる領域である対象領域Rtを検出する。たとえば、検出部52は、1つのIフレームIFに複数の人間の顔が含まれる場合、当該IフレームIFにおいて、当該複数の人間の顔にそれぞれ対応する複数の対象領域Rtを検出する。
検出部52は、抽出したIフレームIF、当該IフレームIFの再生位置Pf、および当該IFフレームにおける対象領域Rtの検出結果を含む検出情報を分類部53へ出力する。たとえば、検出情報は、対象領域RtのサイズおよびIフレームIFにおける対象領域Rtの位置を含む。
(分類部)
分類部53は、映像コンテンツにおいて出現する人間の顔を分類した分類結果を取得する。たとえば、分類部53は、検出部52により検出された人間の顔を分類する。より詳細には、分類部53は、検出部52から検出情報を受けて、検出情報に含まれる対象領域Rtの検出結果に基づいて、検出情報に含まれるIフレームIFから、対象領域Rtの画像である対象画像Gtを抽出する。
図7は、本開示の第1の実施の形態に係るコンテンツ視聴装置のチャプタ生成部における分類部による人間の顔の分類結果の一例を示す図である。
図7を参照して、分類部53は、たとえば、顔認証API(Application Programming Interface)であるOpenFaceを用いて、抽出した対象画像Gtに含まれる人間の顔を分類することにより、複数の対象画像Gtを、同一人物の顔を含む対象画像Gtからなる1または複数のグループGrに分類する。分類部53は、各対象画像Gtの再生位置Pfおよび対象画像Gtの分類結果を、表示処理部54および設定部56へ出力する。
(表示処理部)
図8は、本開示の第1の実施の形態に係るコンテンツ視聴装置のチャプタ生成部における表示処理部により表示装置に表示される選択画面の一例を示す図である。
図8を参照して、表示処理部54は、分類部53による分類結果に基づく人間の顔を表示装置301に表示する処理を行う。より詳細には、表示処理部54は、分類部53から受けた分類結果に基づいて、各グループGrからたとえばサイズが最も大きい対象画像Gtを取得し、取得した対象画像Gtを含む選択画面Sc1を生成する。表示処理部54は、生成した選択画面Sc1を表示装置301に表示する処理を行う。なお、表示処理部54は、各グループGrから、サイズが最も大きい対象画像Gtを取得する代わりに、対象番組RPを再生したときに最初に表示される対象画像Gtを取得してもよい。
たとえば、表示処理部54は、映像コンテンツにおける出現頻度の順に従って、人間の顔を含む対象画像Gtを並べて表示する処理を行う。より詳細には、表示処理部54は、各グループGrから取得した対象画像Gtが、対応のグループGrに属する対象画像Gtの数の大きさの順に従って並べられた選択画面Sc1を生成する。
一例として、表示処理部54は、録画再生部125により対象番組RPが初めて再生されるタイミングにおいて、選択画面Sc1を表示する処理を行う。より詳細には、対象番組RPを再生すべき旨を示す操作情報をリモコン信号受信部111から受けて、選択画面Sc1を表示する処理を行う。
(受付部)
受付部55は、分類部53による分類結果に対する選択結果を取得する。たとえば、受付部55は、表示処理部54により表示された人間の顔の選択結果を受け付ける。
より詳細には、コンテンツ視聴装置101のユーザは、表示装置301に表示された選択画面Sc1を参照しながら、リモコン15を用いて、選択画面Sc1に含まれるサムネイル画像である対象画像Gtのうちの、たとえば好みの人間の顔が含まれる対象画像Gtを選択する操作を行う。
受付部55は、ユーザにより選択された対象画像Gtを示す操作情報をリモコン信号受信部111から受けて、受けた操作情報を設定部56へ出力する。
(設定部)
設定部56は、受付部55により取得された選択結果が示す人間の顔の、映像コンテンツにおける時間的な出現位置に基づいて、当該映像コンテンツの再生位置Pcを設定する。
より詳細には、設定部56は、分類部53から受けた分類結果に基づいて、受付部55から受けた操作情報が示す対象画像Gtが属するグループGrを特定する。設定部56は、分類部53から受けた各対象画像Gtの再生位置Pfのうちの、特定したグループGrに属する対象画像Gtの再生位置Pfを抽出し、抽出した再生位置Pfに基づいて、チャプタポイントの再生位置Pcを設定する。
たとえば、設定部56は、抽出した再生位置Pfの3秒前をチャプタポイントの再生位置Pcとして設定する。そして、設定部56は、設定した再生位置Pc、再生位置Pcに対応する再生位置Pfにおける検出画像であるIフレームIF、およびチャプタIDを含むチャプタ情報を生成する。設定部56は、生成したチャプタ情報を、対象番組RPに対応付けてHDD14に保存する。
図9は、本開示の第1の実施の形態に係るコンテンツ視聴装置における録画再生部により表示装置に表示されるチャプタ操作画面の一例を示す図である。
図9を参照して、録画再生部125は、HDD14からチャプタ情報を取得し、取得したチャプタ情報からIフレームIFを取得し、取得したIフレームIFを含むチャプタ操作画面Sc2を生成する。録画再生部125は、生成したチャプタ操作画面Sc2を表示装置301に表示する処理を行う。
たとえば、コンテンツ視聴装置101のユーザは、表示装置301に表示されたチャプタ操作画面Sc2を参照しながら、リモコン15を用いて、同一人物が登場する複数のシーンのうちの視聴したいシーンを示すIフレームIFを選択する操作を行う。
録画再生部125は、ユーザにより選択されたIフレームIFを示す操作情報をリモコン信号受信部111から受けて、受けた操作情報が示すIフレームIFに対応するチャプタポイントの再生位置Pcから対象番組RPの再生を開始する。
[動作の流れ]
図10は、本開示の実施の形態に係るコンテンツ視聴装置がチャプタ情報の生成を行う際の動作手順の一例を定めたフローチャートである。
図10を参照して、まず、コンテンツ視聴装置101は、録画すべき映像コンテンツである対象番組RPを含むストリームを受信する(ステップS11)。
次に、コンテンツ視聴装置101は、受信したストリームからIフレームIFを取得する(ステップS12)。
次に、コンテンツ視聴装置101は、受信したストリームに含まれる映像コンテンツにおいて出現する人間の顔を検出する。より詳細には、コンテンツ視聴装置101は、取得したIフレームIFのうちの人間の顔が含まれるIフレームIFを抽出し、抽出したIフレームIFにおいて人間の顔が含まれる領域である対象領域Rtを検出する(ステップS13)。
次に、コンテンツ視聴装置101は、検出した人間の顔を分類する。より詳細には、コンテンツ視聴装置101は、IフレームIFから対象画像Gtを抽出し、抽出した対象画像Gtに含まれる人間の顔を分類することにより、複数の対象画像Gtを、同一人物の顔を含む対象画像Gtからなる1または複数のグループGrに分類する(ステップS14)。
次に、コンテンツ視聴装置101は、分類結果に基づく人間の顔を表示装置301に表示する処理を行う。より詳細には、コンテンツ視聴装置101は、選択画面Sc1を表示装置301に表示する処理を行う(ステップS15)。
次に、コンテンツ視聴装置101は、ユーザによる対象画像Gtの選択結果を取得する(ステップS16)。
次に、コンテンツ視聴装置101は、取得した選択結果が示す対象画像Gtが属するグループGrを特定し、特定したグループGrに属する対象画像Gtの再生位置Pfを抽出し、抽出した再生位置Pfに基づいて再生位置Pcを設定する(ステップS17)。
次に、コンテンツ視聴装置101は、再生位置Pc、再生位置Pcに対応する再生位置PfにおけるIフレームIF、およびチャプタIDを含むチャプタ情報を生成し、生成したチャプタ情報を対象番組RPに対応付けてHDD14に保存する(ステップS18)。
次に、コンテンツ視聴装置101は、生成したチャプタ情報からIフレームIFを取得し、取得したIフレームIFを含むチャプタ操作画面Sc2を表示装置301に表示する処理を行う(ステップS19)。
次に、コンテンツ視聴装置101は、ユーザにより選択されたIフレームIFに対応するチャプタポイントの再生位置Pcから対象番組RPの再生を開始する(ステップS20)。
なお、本開示の第1の実施の形態に係るコンテンツ視聴装置101では、チャプタ生成部126における表示処理部54は、各グループGrから取得した対象画像Gtが、対応のグループGrに属する対象画像Gtの数の大きさの順に従って並べられた選択画面Sc1を表示する処理を行う構成であるとしたが、これに限定するものではない。表示処理部54は、グループGrに属する対象画像Gtの数に関わらず、各グループGrから取得した対象画像Gtが対象番組RPにおける出現順に並べられた選択画面Sc1を表示する処理を行う構成であってもよいし、各グループGrから取得した対象画像Gtが任意の順に並べられた選択画面Sc1を表示する処理を行う構成であってもよい。
また、本開示の第1の実施の形態に係るコンテンツ視聴装置101では、チャプタ生成部126における表示処理部54は、録画再生部125により対象番組RPが初めて再生されるタイミングにおいて、選択画面Sc1を表示する処理を行う構成であるとしたが、これに限定するものではない。表示処理部54は、選択画面Sc1を表示すべき旨を示す操作情報をリモコン信号受信部111から受けて、選択画面Sc1を表示する処理を行う構成であってもよい。具体的には、リモコン15は、シーン検索ボタンを含む。ユーザは、選択画面Sc1を表示させるために、シーン検索ボタンを押下する操作を行う。表示処理部54は、ユーザによりシーン検索ボタンが押下されたことを示す操作情報をリモコン信号受信部111から受けて、選択画面Sc1を表示する処理を行う。
また、本開示の第1の実施の形態に係るコンテンツ視聴装置101では、チャプタ生成部126における表示処理部54は、対象画像Gtを含む選択画面Sc1を表示する処理を行う構成であるとしたが、これに限定するものではない。表示処理部54は、対象画像Gtの代わりに、当該対象画像Gtに含まれる人間の上半身をさらに含む画像、または当該対象画像Gtに含まれる人間の背景をさらに含む画像、を含む選択画面Sc1を表示する処理を行う構成であってもよい。すなわち、表示処理部54は、当該対象画像Gtの抽出元のIフレームIFの画像の一部または全部を含む選択画面Sc1を表示する処理を行う構成であってもよい。
また、本開示の第1の実施の形態に係るコンテンツ視聴装置101では、チャプタ生成部126における検出部52は、映像コンテンツにおいて出現する人間の顔を検出する構成であるとしたが、これに限定するものではない。検出部52は、自動車、およびアニメのキャラクタの顔等の、人間の顔以外の視聴対象を検出する構成であってもよい。この場合、分類部53は、検出部52により検出された、人間の顔以外の視聴対象を分類する。表示処理部54は、分類部53による分類結果に基づく当該視聴対象を表示装置301に表示する処理を行う。受付部55は、表示処理部54により表示された当該視聴対象の選択結果を受け付ける。設定部56は、受付部55により取得された選択結果が示す当該視聴対象の、映像コンテンツにおける時間的な出現位置に基づいて、当該映像コンテンツの再生位置Pcを設定する。
また、本開示の第1の実施の形態に係るコンテンツ視聴装置101では、チャプタ生成部126における抽出部51は、録画部122から録画情報を受けて、放送パケットをHDD14から取得し、IフレームIFを取得する構成であるとしたが、これに限定するものではない。抽出部51は、録画部122から録画情報を受けて、たとえば夜中等のコンテンツ視聴装置101の処理負荷が比較的小さい時間帯が到来するまで待機し、当該時間帯において放送パケットをHDD14から取得し、IフレームIFを取得する構成であってもよい。
<変形例1>
図11は、本開示の第1の実施の形態の変形例1に係るコンテンツ視聴装置におけるチャプタ生成部の構成を示す図である。図11を参照して、チャプタ生成部126Aは、チャプタ生成部126と比べて、抽出部51、検出部52および分類部53の代わりに、取得部57を含む。取得部57は、分類結果取得部の一例である。コンテンツ視聴装置101は、チャプタ生成部126の代わりに、チャプタ生成部126Aを備える構成であってもよい。
たとえば、サーバ201は、ユーザにより選択された映像コンテンツに加えて、当該映像コンテンツにおけるIフレームIF、当該IフレームIFの再生位置Pf、当該IFフレームから抽出した対象画像Gt、および対象画像Gtの分類結果を含む分類情報をコンテンツ視聴装置101へ配信する。
チャプタ生成部126Aにおける取得部57は、サーバ201から分類結果を取得する。
より詳細には、受信部11は、分類情報をネットワーク351経由でサーバ201から受信し、受信した分類情報をチャプタ生成部126Aへ出力する。
取得部57は、受信部11から分類情報を受けて、受けた分類情報を表示処理部54および設定部56へ出力する。
表示処理部54は、取得部57から受けた分類情報に含まれる分類結果に基づく人間の顔を、表示装置301に表示する処理を行う。より詳細には、表示処理部54は、取得部57から受けた分類情報に基づいて選択画面Sc1を生成し、生成した選択画面Sc1を表示装置301に表示する処理を行う。
<変形例2>
図12は、本開示の第1の実施の形態の変形例2に係るコンテンツ視聴装置におけるチャプタ生成部の構成を示す図である。図12を参照して、チャプタ生成部126Bは、チャプタ生成部126と比べて、表示処理部54、受付部55および設定部56の代わりに、選択部58および設定部59を含む。選択部58は、選択結果取得部の一例である。コンテンツ視聴装置101は、チャプタ生成部126の代わりに、チャプタ生成部126Bを備える構成であってもよい。
分類部53は、各対象画像Gtの再生位置Pfおよび対象画像Gtの分類結果を、選択部58および設定部56へ出力する。
選択部58は、分類部53による分類結果に基づいて、人間の顔を含む対象画像Gtを選択する。たとえば、選択部58は、複数の対象画像Gtのうちの、対象番組RPにおける出現頻度が所定値以上である人間の顔を含む対象画像Gtを選択する。対象番組RPは、たとえば、ニュース番組等の番組構成が予め概ね確定している番組である。
より詳細には、選択部58は、複数のグループGrのうちの、属する対象画像Gtの数が所定値以上であるグループGrを抽出し、抽出したグループGrに属する対象画像Gtを選択する。たとえば、選択部58は、属する対象画像Gtの数が所定値以上であるグループGrとしてグループGr1,Gr2,Gr3を抽出し、対象画像Gtとして、グループGr1,Gr2,Gr3にそれぞれ属する対象画像Gt1,Gt2,Gt3を選択する。選択部58は、選択した対象画像Gtを示す選択情報を設定部59へ出力する。
設定部59は、選択部58により選択された対象画像Gtの、映像コンテンツにおける時間的な出現位置に基づいて、当該映像コンテンツの再生位置Pcを設定する。
より詳細には、設定部59は、分類部53から受けた各対象画像Gtの再生位置Pfのうちの、選択部58から受けた選択情報が示す対象画像Gtの再生位置Pfを抽出し、抽出した再生位置Pfに基づいて、チャプタポイントの再生位置Pcを設定する。設定部59は、設定した再生位置Pc、再生位置Pcに対応する再生位置PfにおけるIフレームIF、およびチャプタIDを含むチャプタ情報を生成し、生成したチャプタ情報を、対象番組RPに対応付けてHDD14に保存する。
図13は、本開示の第1の実施の形態の変形例2に係るコンテンツ視聴装置における録画再生部により表示装置に表示されるチャプタ操作画面の一例を示す図である。
図13を参照して、録画再生部125は、HDD14からチャプタ情報を取得し、取得したチャプタ情報からIフレームIFを取得し、取得したIフレームIFを含むチャプタ操作画面Sc3を生成する。録画再生部125は、生成したチャプタ操作画面Sc3を表示装置301に表示する処理を行う。
たとえば、コンテンツ視聴装置101のユーザは、表示装置301に表示されたチャプタ操作画面Sc3を参照しながら、リモコン15を用いて、視聴したいシーンを示すIフレームIFを選択する操作を行う。
録画再生部125は、ユーザにより選択されたIフレームIFを示す操作情報をリモコン信号受信部111から受けて、受けた操作情報が示すIフレームIFに対応するチャプタポイントの再生位置Pcから対象番組RPの再生を開始する。
ところで、映像コンテンツの録画再生における利便性を向上することが可能な技術が望まれる。たとえば、特定の人間が出現するシーンを簡単に視聴することが可能な技術が望まれる。非特許文献3に記載の技術のように音の切り替わりおよび映像の切り替わりを自動的に検出してチャプタを作成する方法、字幕情報に基づいてチャプタポイントの再生位置を設定する方法、ならびに所定間隔のチャプタポイントの再生位置を設定する方法では、特定の人間が出演するシーンに基づいてチャプタポイントの再生位置を設定することは困難である。また、特定の人間が出演するシーンに基づいて、手動でチャプタポイントの再生位置を設定することは、作業性の観点から現実的ではない。
これに対して、本開示の第1の実施の形態に係るコンテンツ視聴装置101では、分類部53は、映像コンテンツにおいて出現する人間の顔を分類した分類結果を取得する。受付部55は、分類部53により取得された分類結果に対する選択結果を取得する。設定部56は、受付部55により取得された選択結果が示す人間の顔の、映像コンテンツにおける時間的な出現位置に基づいて、当該映像コンテンツの再生位置Pcを設定する。
このように、映像コンテンツにおいて出現する人間の顔を分類した分類結果に対する選択結果を取得し、取得した選択結果が示す人間の顔の時間的な出現位置に基づいて再生位置Pcを設定する構成により、選択された人間の顔の分類に基づいて再生位置Pcを設定することができるので、映像コンテンツにおける当該人間の顔の複数の出現位置に基づいて効率的に再生位置Pcを設定することができるとともに、早送り機能等を用いることなく、たとえばユーザが着目する特定の人間が出現するシーンから再生することができる。したがって、映像コンテンツの録画再生における利便性を向上することができる。
次に、本開示の他の実施の形態について図面を用いて説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。
<第2の実施の形態>
本実施の形態は、第1の実施の形態に係るコンテンツ配信システム401と比べて、サーバ202がチャプタ情報を生成するコンテンツ配信システム402に関する。以下で説明する内容以外は第1の実施の形態に係るコンテンツ配信システム401と同様である。
図14は、本開示の第2の実施の形態に係るコンテンツ配信システムの構成を示す図である。図14を参照して、コンテンツ配信システム402は、コンテンツ配信システム401と比べて、コンテンツ視聴装置101の代わりにコンテンツ視聴装置102を備え、サーバ201の代わりにサーバ202を備える。たとえば、サーバ202は、VODの映像コンテンツをコンテンツ視聴装置102へ配信する。
図15は、本開示の第2の実施の形態に係るサーバの構成の概要を示す図である。図15を参照して、サーバ202は、チャプタ生成部21と、送信部22と、受信部23と、記憶部24とを備える。チャプタ生成部21、送信部22および受信部23の一部または全部は、たとえば、1または複数のプロセッサを含む処理回路(Circuitry)により実現される。記憶部24は、たとえば上記処理回路に含まれる不揮発性メモリである。
記憶部24には、サーバ202により配信可能な映像コンテンツが蓄積されている。より詳細には、記憶部24には、VODの映像コンテンツが蓄積されている。
送信部22は、記憶部24に蓄積された映像コンテンツをコンテンツ視聴装置102へ配信する。より詳細には、送信部22は、ユーザにより選択された映像コンテンツを記憶部24から取得し、取得した映像コンテンツが複数の放送パケットに分割されたストリームをネットワーク351経由でコンテンツ視聴装置102へ送信する。
図16は、本開示の第2の実施の形態に係るサーバにおけるチャプタ生成部の構成を示す図である。図16を参照して、チャプタ生成部21は、抽出部61と、検出部62と、分類部63と、選択部68と、設定部69とを含む。分類部63は、分類結果取得部の一例である。選択部68は、選択結果取得部の一例である。
(抽出部)
抽出部61は、記憶部24から映像コンテンツを取得し、取得した映像コンテンツである対象番組RPを再生したときに所定間隔で表示される複数の画像を取得する。より詳細には、抽出部61は、対象番組RPを再生したときにたとえば0.5秒間隔で表示される複数のI(Intra)フレームIFを取得する。抽出部61は、取得した複数のIフレームIFおよび各IフレームIFの再生位置Pfを含む抽出画像情報を検出部62へ出力する。
(検出部)
検出部62は、抽出部61から抽出画像情報を受けて、受けた抽出画像情報に基づいて、映像コンテンツにおいて出現する人間の顔を検出する。
より詳細には、検出部62は、たとえばMTCNNに従って作成された学習モデルを用いて、抽出画像情報に含まれるIフレームIFのうちの人間の顔が含まれるIフレームIFを抽出し、抽出したIフレームIFにおいて人間の顔が含まれる領域である対象領域Rtを検出する。たとえば、検出部62は、1つのIフレームIFに複数の人間の顔が含まれる場合、当該IフレームIFにおいて、当該複数の人間の顔にそれぞれ対応する複数の対象領域Rtを検出する。
検出部62は、抽出したIフレームIF、当該IフレームIFの再生位置Pf、および当該IFフレームにおける対象領域Rtの検出結果を含む検出情報を分類部63へ出力する。
(分類部)
分類部53は、映像コンテンツにおいて出現する人間の顔を分類した分類結果を生成する。たとえば、分類部63は、検出部62により検出された人間の顔を分類する。より詳細には、分類部63は、検出部62から検出情報を受けて、検出情報に含まれる対象領域Rtの検出結果に基づいて、検出情報に含まれるIフレームIFから、対象領域Rtの画像である対象画像Gtを抽出する。分類部63は、たとえばOpenFaceを用いて、抽出した対象画像Gtに含まれる人間の顔を分類することにより、複数の対象画像Gtを、同一人物の顔を含む対象画像Gtからなる1または複数のグループGrに分類する。分類部63は、各対象画像Gtの再生位置Pfおよび対象画像Gtの分類結果を、選択部68および設定部69へ出力する。
(選択部)
選択部68は、分類部63により取得された分類結果に対する選択結果を取得する。選択部68は、分類部63による分類結果に基づいて、人間の顔を含む対象画像Gtを選択する。たとえば、選択部68は、分類部63から受けた分類結果が示す複数の対象画像Gtのうちの、対象番組RPにおける出現頻度が所定値以上である人間の顔を含む対象画像Gtを選択する。対象番組RPは、たとえば、ニュース番組等の番組構成が予め概ね確定している番組である。
より詳細には、選択部68は、複数のグループGrのうちの、属する対象画像Gtの数が所定値以上であるグループGrを抽出し、抽出したグループGrに属する対象画像Gtを選択する。選択部68は、選択した対象画像Gtを示す選択情報を設定部69へ出力する。
(設定部)
設定部69は、選択部68により選択された対象画像Gtの、映像コンテンツにおける時間的な出現位置に基づいて、当該映像コンテンツの再生位置Pcを設定する。
より詳細には、設定部69は、分類部63から受けた各対象画像Gtの再生位置Pfのうちの、選択部68から受けた選択情報が示す対象画像Gtの再生位置Pfを抽出し、抽出した再生位置Pfに基づいて、チャプタポイントの再生位置Pcを設定する。設定部69は、設定した再生位置Pc、再生位置Pcに対応する再生位置Pfにおける検出画像であるIフレームIF、およびチャプタIDを含むチャプタ情報を生成する。設定部69は、生成したチャプタ情報を映像コンテンツに対応付けて記憶部24に保存する。
送信部22は、ユーザにより選択された映像コンテンツに対応するチャプタ情報が記憶部24に保存されている場合、当該映像コンテンツが複数の放送パケットに分割されたストリームに加えて、当該チャプタ情報をネットワーク351経由でコンテンツ視聴装置102へ送信する。なお、送信部22は、チャプタ情報を、ストリームを構成する1または複数の放送パケットに含めてネットワーク351経由でコンテンツ視聴装置102へ送信する構成であってもよい。
コンテンツ視聴装置102は、ネットワーク351経由でサーバ202からストリームおよびチャプタ情報を受信する。コンテンツ視聴装置102は、ストリームに含まれる映像コンテンツを再生する場合、チャプタ情報に基づいてチャプタ操作画面Sc3を生成し、生成したチャプタ操作画面Sc3を表示装置301に表示する処理を行う。そして、コンテンツ視聴装置102は、チャプタ操作画面Sc3に含まれるIフレームIFのうちのユーザにより選択されたIフレームIF、に対応するチャプタポイントの再生位置Pcから映像コンテンツの再生を開始する。
たとえば、コンテンツ視聴装置102は、定期的または不定期に、ユーザによるチャプタポイントの選択結果を示すチャプタ使用情報をネットワーク351経由でサーバ202へ送信する。
サーバ202における受信部23は、ネットワーク351経由で複数のコンテンツ視聴装置102からチャプタ使用情報を受信し、受信したチャプタ使用情報をチャプタ生成部21へ出力する。
チャプタ生成部21は、受信部23から受けたチャプタ使用情報が示すチャプタポイントの選択結果に基づいて、ユーザからの人気が高い人物を推定する。そして、チャプタ生成部21は、推定結果に基づいてチャプタ情報を生成する。より詳細には、チャプタ生成部21における選択部68は、分類部63から受けた分類結果が示す複数の対象画像Gtのうちの、ユーザからの人気が高い人物の顔を含む対象画像Gtを優先的に選択する。
なお、本開示の第2の実施の形態に係るサーバ202では、チャプタ生成部126は、選択部68および設定部69を含む構成であるとしたが、これに限定するものではない。チャプタ生成部126は、選択部68および設定部69を含まない構成であってもよい。この場合、分類部63は、分類結果を示す分類情報を映像コンテンツに対応付けて記憶部24に保存する。送信部22は、ユーザにより選択された映像コンテンツに対応する分類情報が記憶部24に保存されている場合、当該映像コンテンツが複数の放送パケットに分割されたストリームに加えて、当該分類情報をネットワーク351経由でコンテンツ視聴装置102へ送信する。
以上のように、本開示の第2の実施の形態に係るサーバ202では、分類部63は、映像コンテンツにおいて出現する人間の顔を分類した分類結果を取得する。選択部68は、分類部63により取得された分類結果に対する選択結果を取得する。設定部69は、選択部68により取得された選択結果が示す人間の顔の、映像コンテンツにおける時間的な出現位置に基づいて、当該映像コンテンツの再生位置Pcを設定する。
このように、映像コンテンツにおいて出現する人間の顔を分類した分類結果に対する選択結果を取得し、取得した選択結果が示す人間の顔の時間的な出現位置に基づいて再生位置Pcを設定する構成により、選択された人間の顔の分類に基づいて再生位置Pcを設定することができるので、映像コンテンツにおける当該人間の顔の複数の出現位置に基づいて効率的に再生位置Pcを設定することができるとともに、早送り機能等を用いることなく、たとえばユーザが着目する特定の人間が出現するシーンから再生することができる。したがって、映像コンテンツの録画再生における利便性を向上することができる。また、サーバ202において分類結果の生成および対象画像Gtの選択等を行う構成により、ユーザ宅に設けられることが多いコンテンツ視聴装置102においてこれらの処理を行う構成と比べて、コンテンツ配信システム402全体における処理負荷を低減することができる。また、サーバ202において、ユーザによるチャプタポイントの選択結果を収集することにより、ユーザからの人気が高い人物を推定し、推定結果に基づいてチャプタ情報を生成することができるので、ユーザの利便性をより向上することができる。
上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記説明ではなく特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
上述の実施形態の各処理(各機能)は、1または複数のプロセッサを含む処理回路(Circuitry)により実現される。上記処理回路は、上記1または複数のプロセッサに加え、1または複数のメモリ、各種アナログ回路、各種デジタル回路が組み合わされた集積回路等で構成されてもよい。上記1または複数のメモリは、上記各処理を上記1または複数のプロセッサに実行させるプログラム(命令)を格納する。上記1または複数のプロセッサは、上記1または複数のメモリから読み出した上記プログラムに従い上記各処理を実行してもよいし、予め上記各処理を実行するように設計された論理回路に従って上記各処理を実行してもよい。上記プロセッサは、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)、およびASIC(Application Specific Integrated Circuit)等、コンピュータの制御に適合する種々のプロセッサであってよい。なお、物理的に分離した上記複数のプロセッサが互いに協働して上記各処理を実行してもよい。たとえば、物理的に分離した複数のコンピュータのそれぞれに搭載された上記プロセッサがLAN(Local Area Network)、WAN (Wide Area Network)、およびインターネット等のネットワークを介して互いに協働して上記各処理を実行してもよい。上記プログラムは、外部のサーバ装置等から上記ネットワークを介して上記メモリにインストールされても構わないし、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、および半導体メモリ等の記録媒体に格納された状態で流通し、上記記録媒体から上記メモリにインストールされても構わない。
以上の説明は、以下に付記する特徴を含む。
[付記1]
映像コンテンツにおいて出現する視聴対象を分類した分類結果を取得する分類結果取得部と、
前記分類結果取得部により取得された前記分類結果に対する選択結果を取得する選択結果取得部と、
前記選択結果取得部により取得された前記選択結果が示す前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記映像コンテンツの区切り位置を設定する設定部とを備え、
さらに、
前記映像コンテンツにおいて出現する前記視聴対象を検出する検出部を備え、
前記検出部は、MTCNNに従って作成された学習モデルを用いて、前記視聴対象を検出し、
前記分類結果取得部は、OpenFaceを用いて、前記視聴対象を分類する、映像コンテンツ処理装置。
[付記2]
処理回路を備え、
前記処理回路は、
映像コンテンツにおいて出現する視聴対象を分類した分類結果を取得し、
取得した前記分類結果に対する選択結果を取得し、
取得した前記選択結果が示す前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記映像コンテンツの区切り位置を設定する、映像コンテンツ処理装置。
11 受信部
12 処理部
13 記憶部
14 HDD
15 リモコン
21 チャプタ生成部
22 送信部
23 受信部
24 記憶部
51,61 抽出部
52,62 検出部
53,63 分類部
54 表示処理部
55 受付部
56,59,59 設定部
57 取得部
58,68 選択部
101,102 コンテンツ視聴装置
111 リモコン信号受信部
112 放送受信部
121 消去部
122 録画部
123 録画予約部
124 放送視聴部
125 録画再生部
126,126A,126B チャプタ生成部
131 録画DB
132 番組情報DB
133 予約管理DB
151 リモコン操作部
201,202 サーバ
351 ネットワーク
301 表示装置
401,402 コンテンツ配信システム
IF Iフレーム
Rt 対象領域
Gt 対象画像
Gr グループ
Sc1 選択画面
Sc2,Sc3 チャプタ操作画面

Claims (9)

  1. 映像コンテンツにおいて出現する視聴対象を分類した分類結果を取得する分類結果取得部と、
    前記分類結果取得部により取得された前記分類結果に対する選択結果を取得する選択結果取得部と、
    前記選択結果取得部により取得された前記選択結果が示す前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記映像コンテンツの区切り位置を設定する設定部とを備える、映像コンテンツ処理装置。
  2. 前記選択結果取得部は、前記分類結果に基づいて、前記視聴対象を選択し、
    前記設定部は、前記選択結果取得部により選択された前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記区切り位置を設定する、請求項1に記載の映像コンテンツ処理装置。
  3. 前記映像コンテンツ処理装置は、さらに、
    前記分類結果に基づく前記視聴対象を表示する処理を行う表示処理部を備え、
    前記選択結果取得部は、前記表示処理部により表示された前記視聴対象の前記選択結果を受け付ける、請求項1または請求項2に記載の映像コンテンツ処理装置。
  4. 前記表示処理部は、前記映像コンテンツにおける出現頻度の順に従って前記視聴対象を並べて表示する処理を行う、請求項3に記載の映像コンテンツ処理装置。
  5. 前記映像コンテンツ処理装置は、さらに、
    映像コンテンツ配信装置から、前記映像コンテンツを含むストリームを受信する受信部と、
    前記受信部により受信された前記ストリームに含まれる前記映像コンテンツにおいて出現する前記視聴対象を検出する検出部とを備え、
    前記分類結果取得部は、前記検出部により検出された前記視聴対象を分類する、請求項1または請求項2に記載の映像コンテンツ処理装置。
  6. 前記映像コンテンツ処理装置は、さらに、
    映像コンテンツ配信装置から、前記映像コンテンツを含むストリームを受信する受信部を備え、
    前記分類結果取得部は、前記映像コンテンツ配信装置から前記分類結果を取得する、請求項1または請求項2に記載の映像コンテンツ処理装置。
  7. 前記映像コンテンツ処理装置は、さらに、
    前記映像コンテンツが蓄積された記憶部と、
    前記記憶部に蓄積された前記映像コンテンツを映像コンテンツ再生装置へ配信する送信部と、
    前記記憶部に蓄積された前記映像コンテンツにおいて出現する前記視聴対象を検出する検出部とを備え、
    前記分類結果取得部は、前記検出部により検出された前記視聴対象を分類する、請求項1または請求項2に記載の映像コンテンツ処理装置。
  8. 映像コンテンツ処理装置における映像コンテンツ処理方法であって、
    映像コンテンツにおいて出現する視聴対象を分類した分類結果を取得するステップと、
    取得した前記分類結果に対する選択結果を取得するステップと、
    取得した前記選択結果が示す前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記映像コンテンツの区切り位置を設定するステップとを含む、映像コンテンツ処理方法。
  9. 映像コンテンツ処理装置において用いられる映像コンテンツ処理プログラムであって、
    コンピュータを、
    映像コンテンツにおいて出現する視聴対象を分類した分類結果を取得する分類結果取得部と、
    前記分類結果取得部により取得された前記分類結果に対する選択結果を取得する選択結果取得部と、
    前記選択結果取得部により取得された前記選択結果が示す前記視聴対象の、前記映像コンテンツにおける時間的な出現位置に基づいて、前記映像コンテンツの区切り位置を設定する設定部、
    として機能させるための、映像コンテンツ処理プログラム。

JP2022112116A 2022-07-13 2022-07-13 映像コンテンツ処理装置、映像コンテンツ処理方法および映像コンテンツ処理プログラム Pending JP2024010692A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022112116A JP2024010692A (ja) 2022-07-13 2022-07-13 映像コンテンツ処理装置、映像コンテンツ処理方法および映像コンテンツ処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022112116A JP2024010692A (ja) 2022-07-13 2022-07-13 映像コンテンツ処理装置、映像コンテンツ処理方法および映像コンテンツ処理プログラム

Publications (1)

Publication Number Publication Date
JP2024010692A true JP2024010692A (ja) 2024-01-25

Family

ID=89621542

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022112116A Pending JP2024010692A (ja) 2022-07-13 2022-07-13 映像コンテンツ処理装置、映像コンテンツ処理方法および映像コンテンツ処理プログラム

Country Status (1)

Country Link
JP (1) JP2024010692A (ja)

Similar Documents

Publication Publication Date Title
US11081143B2 (en) Providing enhanced content
JP3838035B2 (ja) 放送方法及び放送受信装置
US8521009B2 (en) Systems and methods to modify playout or playback
US9098172B2 (en) Apparatus, systems and methods for a thumbnail-sized scene index of media content
US20030095790A1 (en) Methods and apparatus for generating navigation information on the fly
CN101755453A (zh) 用于在插播商业广告的间歇期间控制系统的系统和方法
JP2001119671A (ja) デジタルtv放送記録再生装置
JP2024010692A (ja) 映像コンテンツ処理装置、映像コンテンツ処理方法および映像コンテンツ処理プログラム
JP2006180306A (ja) 動画記録再生装置
JP5378304B2 (ja) 受信および再生方法
JP5583747B2 (ja) 受信装置および情報処理方法
JP4363364B2 (ja) 受信装置及び受信方法
US20160064037A1 (en) Video apparatus and control method of video apparatus
JP6052684B2 (ja) 受信装置および情報処理方法
TW200803515A (en) Systems and methods for playing video
JP5764642B2 (ja) 受信装置および情報処理方法
JP5136580B2 (ja) 受信装置、及び受信および再生方法
JP2004193708A (ja) 映像ダイジェスト生成方法、映像データベース生成方法、映像ダイジェスト生成装置、及び、映像データベース生成装置
KR20050101768A (ko) 광고 저장영역을 구비한 방송 수신 장치 및 동작 방법
US20110299834A1 (en) Program review on alternate display devices
JP2003224790A (ja) 番組記録再生装置、および番組記録再生方法
JP2006054631A (ja) 番組の編集再生方法、番組の編集再生システム、及び番組の編集再生プログラム
JP2006279996A (ja) 再生方法及び再生装置
JP2011101393A (ja) 動画記録再生装置
JP2009055637A (ja) 情報処理装置及び再生シーン決定方法