JP2024008646A - 受信装置およびメタデータ生成システム - Google Patents
受信装置およびメタデータ生成システム Download PDFInfo
- Publication number
- JP2024008646A JP2024008646A JP2022110677A JP2022110677A JP2024008646A JP 2024008646 A JP2024008646 A JP 2024008646A JP 2022110677 A JP2022110677 A JP 2022110677A JP 2022110677 A JP2022110677 A JP 2022110677A JP 2024008646 A JP2024008646 A JP 2024008646A
- Authority
- JP
- Japan
- Prior art keywords
- data
- advertisement
- metadata
- broadcast
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 claims abstract description 111
- 238000006243 chemical reaction Methods 0.000 claims abstract description 43
- 238000003780 insertion Methods 0.000 claims description 24
- 230000037431 insertion Effects 0.000 claims description 24
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 abstract description 26
- 238000010586 diagram Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 12
- 230000001815 facial effect Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 7
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/28—Arrangements for simultaneous broadcast of plural pieces of information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H40/00—Arrangements specially adapted for receiving broadcast information
- H04H40/18—Arrangements characterised by circuits or components specially adapted for receiving
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/68—Systems specially adapted for using specific information, e.g. geographical or meteorological information
- H04H60/73—Systems specially adapted for using specific information, e.g. geographical or meteorological information using meta-information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/437—Interfacing the upstream path of the transmission network, e.g. for transmitting client requests to a VOD server
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Computer Graphics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
Description
本発明の実施形態は、受信装置およびメタデータ生成システムに関する。
様々なコンテンツの効率的な視聴を実現するために、シーン情報を始めとするコンテンツに関するメタデータの有用性が注目されている。テレビジョンの放送番組では、これまで人手によるメタデータの作成が主流であったが、近年、人工知能(AI:Artificial Intelligence)を用いたメタデータの自動生成の試みが始まっている。
しかしながら、メタデータの自動生成には膨大な処理を要するため、限られたシステムリソースで、例えばフレームごとに抽出した放送番組の情報の処理を如何に行うかが課題となる。
本発明が解決しようとする課題は、フレームごとに抽出した放送番組の情報の処理を限られたシステムリソースで効率的に行うことができる受信装置およびメタデータ生成システムを提供することにある。
実施形態の受信装置は、放送番組を受信してライブ視聴可能に提供する受信装置であって、前記放送番組のライブ視聴を提供中に、前記放送番組の放送信号から、前記放送番組の内容を表すメタデータの生成が可能な変換データを生成するデータ処理部と、前記変換データを前記メタデータの生成を行うサーバ装置へと送信する第1の送受信部と、を備える。
(メタデータ生成システムの構成)
図1は、実施形態にかかるメタデータ生成システム1の構成の一例を示す図である。図1に示すように、メタデータ生成システム1は、サーバ装置10及び複数のテレビジョン装置20(20a,20b,20c・・・20n:ただしnは任意の整数)を備え、サーバ装置10とテレビジョン装置20との協業によって、放送番組の内容を表すメタデータを生成することが可能に構成されている。
図1は、実施形態にかかるメタデータ生成システム1の構成の一例を示す図である。図1に示すように、メタデータ生成システム1は、サーバ装置10及び複数のテレビジョン装置20(20a,20b,20c・・・20n:ただしnは任意の整数)を備え、サーバ装置10とテレビジョン装置20との協業によって、放送番組の内容を表すメタデータを生成することが可能に構成されている。
サーバ装置10及び複数のテレビジョン装置20は、例えばインターネット等のネットワーク30を介して、無線または有線にて相互に接続されている。ネットワーク30は、例えばDLNA(Digital Living Network Alliance)(登録商標)に基づくホームネットワーク、または家庭内LAN(Local Area Network)等であってもよい。
受信装置としてのテレビジョン装置20は、例えば放送局からの放送信号を受信して各種の放送番組を受信することができる。また、テレビジョン装置20は、受信した放送番組をライブ視聴にてユーザに提供したり、録画したり、録画した放送番組を再生したりすることができるよう構成されている。
テレビジョン装置20は、また、受信した放送番組をユーザに提供中、その放送番組の放送信号から、放送番組のシーン情報等を含むメタデータの生成が可能な変換データを生成することが可能に構成されている。
サーバ装置10は、例えばクラウド上に置かれたクラウドサーバ等として構成されている。サーバ装置10が、CPU(Central Processing Unit)、ROM(Read Only Memory)、及びRAM(Random Access Memory)等の物理的な構成を備える1つ以上のコンピュータとして構成されていてもよい。
サーバ装置10は、個々のテレビジョン装置20が変換した変換データを、これらのテレビジョン装置20から受信してメタデータを生成する。サーバ装置10は、生成したメタデータを個々のテレビジョン装置20に提供する。
(サーバ装置の構成例)
次に、図2及び図3を用いて、実施形態のサーバ装置10の構成例について説明する。
次に、図2及び図3を用いて、実施形態のサーバ装置10の構成例について説明する。
図2は、実施形態にかかるサーバ装置10のハードウェア構成の一例を示すブロック図である。図2に示すように、サーバ装置10は、CPU101、ROM102、RAM103、通信I/F(インターフェース)104、入出力I/F105、入力装置151、表示装置152、及び記憶装置106を備えている。
CPU101は、サーバ装置10の全体を制御する。ROM102は、サーバ装置10における保存領域として機能する。ROM102に記憶された情報は、サーバ装置10の電源が切られても保持される。RAM103は、一次記憶装置として機能し、CPU101の作業領域となる。
CPU101が、例えばROM102に格納される制御プログラム等をRAM103に展開して実行することで、複数のテレビジョン装置20から収集した変換データに基づいてメタデータを生成するサーバ装置10の機能が得られる。
なお、上記の制御プログラムは、フレキシブルディスク、CD-R、DVD(Digital Versatile Disk)、ブルーレイディスク(登録商標)、半導体メモリ等の、コンピュータで読み取り可能な各種の記録媒体に記録されて提供されることができる。
また、制御プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、制御プログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
通信I/F104は、例えばインターネット等のネットワーク30に接続可能に構成される。通信I/F104により、サーバ装置10と複数のテレビジョン装置20との間で各種情報の授受が可能となる。
入出力I/F105には、キーボード、マウス等の入力装置151、及びモニタ等の表示装置152が接続されていてもよい。これにより、例えばサーバ装置10の管理者等がサーバ装置10に対して各種操作を行うことができる。
記憶装置106は、HDD(Hard Disk Drive)、SSD(Solid State Drive)等であり、CPU101の補助記憶装置として機能する。
図3は、実施形態にかかるサーバ装置10の機能構成の一例を示すブロック図である。図3に示すように、サーバ装置10は、送受信部11、統合部12、広告判定部13、メタデータ生成部14、及び記憶部15を備える。
サーバ装置10の上記の機能構成は、例えば制御プログラムを実行中のCPU101、またはCPU101の制御下で動作するサーバ装置10の図2に示す各部のハードウェア構成によって実現される。
第2の送受信部としての送受信部11は、複数のテレビジョン装置20とサーバ装置10との間でデータの授受が可能に構成される。送受信部11は、例えば複数のテレビジョン装置20から、テレビジョン装置20が放送番組の放送信号から生成した変換データを受信する。また、送受信部11は、サーバ装置10が生成したメタデータを複数のテレビジョン装置20へと送信する。
統合部12は、複数のテレビジョン装置20がフレームごとに生成した変換データを時系列に配列した時系列データに統合する。このとき、統合部12は、複数ある放送局が所定の時間帯に放送している放送番組の全てについて時系列データが得られるよう、複数のテレビジョン装置20から収集した変換データを取捨選択する。
例えば、或る1つのテレビジョン装置20のユーザが一貫して1つの放送局の放送番組を視聴しているような場合、統合部12が、その1つのテレビジョン装置20から収集した変換データのみを用いて1つの放送番組の時系列データを生成してもよい。
あるいは、或る1つのテレビジョン装置20のユーザが、選局を繰り返しつつ複数の放送番組を視聴しているような場合は、そのような状況下にある複数のテレビジョン装置20から収集した変換データを用いて1つの放送番組の時系列データを生成してもよい。
広告判定部13は、時系列データに基づいて広告の挿入位置を判定する。テレビジョン装置20からの変換データには、テレビジョン装置20が推定した広告の挿入位置についての情報が含まれている。広告判定部13は、このテレビジョン装置20による推定情報を参照しつつ、広告の挿入位置を特定する。
メタデータ生成部14は、広告の挿入位置を除く変換データ、つまり、放送番組の本編部分から生成された変換データに基づいて、シーン情報等、その放送番組の内容を表すメタデータを生成する。
記憶部15には、サーバ装置10の動作に必要な各種パラメータ及び制御プログラム等が格納されている。また、記憶部15には、複数のテレビジョン装置20から収集した変換データ、変換データから生成した時系列データ、特定した広告の挿入位置の情報、及び変換データに基づいて生成したメタデータ等が格納されていてもよい。
(テレビジョン装置の構成例)
次に、図4及び図5を用いて、実施形態のテレビジョン装置20の構成例について説明する。
次に、図4及び図5を用いて、実施形態のテレビジョン装置20の構成例について説明する。
図4は、実施形態にかかるテレビジョン装置20のハードウェア構成の一例を示す図である。
図4に示すように、テレビジョン装置20は、アンテナ201、入力端子202a~202c、チューナ203、デモジュレータ204、デマルチプレクサ205、A/D(アナログ/デジタル)変換器206、セレクタ207、信号処理部208、スピーカ209、表示パネル210、操作部211、受光部212、IP通信部213、CPU214、メモリ215、及びストレージ216を備える。
アンテナ201は、デジタル放送の放送信号を受信し、受信した放送信号を、入力端子202aを介してチューナ203に供給する。
チューナ203は、アンテナ201から供給された放送信号から所望のチャンネルの放送信号を選局し、選局した放送信号をデモジュレータ204に供給する。
デモジュレータ204は、チューナ203から供給された放送信号を復調し、復調した放送信号をデマルチプレクサ205に供給する。
デマルチプレクサ205は、デモジュレータ204から供給された放送信号を分離して映像信号および音声信号を生成し、生成した映像信号および音声信号をセレクタ207に供給する。
セレクタ207は、デマルチプレクサ205、A/D変換器206、及び入力端子202cから供給される複数の信号から1つを選択し、選択した1つの信号を信号処理部208に供給する。
信号処理部208は、セレクタ207から供給された映像信号に所定の信号処理を施し、処理後の映像信号を表示パネル210に供給する。また、信号処理部208は、セレクタ207から供給された音声信号に所定の信号処理を施し、処理後の音声信号をスピーカ209に供給する。
スピーカ209は、信号処理部208から供給された音声信号に基づいて音声、または各種の音を出力する。また、スピーカ209は、CPU214による制御に基づいて、出力する音声または各種の音の音量を変更する。
表示パネル210は、信号処理部208から供給された映像信号またはCPU214による制御に基づいて、静止画および動画などの映像、その他の画像、並びに文字情報等を表示する。
入力端子202bは、外部から入力される映像信号および音声信号等のアナログ信号を受け付ける。また、入力端子202cは、外部から入力される映像信号および音声信号等のデジタル信号を受け付ける。例えば、入力端子202cは、BD(Blu-ray Disc)(登録商標)などの録画再生用の記録媒体を駆動して録画および再生するドライブ装置を搭載したレコーダ等から、デジタル信号の入力が可能である。
A/D変換器206は、入力端子202bから供給されたアナログ信号にA/D変換を施すことにより生成したデジタル信号をセレクタ207に供給する。
操作部211は、ユーザの操作入力を受け付ける。
受光部212は、リモートコントローラ219からの赤外線を受光する。
IP通信部213は、ネットワーク30を介したIP(インターネットプロトコル)通信を行うための通信インターフェースである。ただし、テレビジョン装置20が、LAN等のインターネットとは異なるネットワークに接続可能であってもよく、このようなネットワークを介して、各種情報の授受が可能に上述のサーバ装置10に接続されていてもよい。
CPU214は、テレビジョン装置20全体を制御する。
メモリ215は、CPU214が実行する各種コンピュータプログラムを格納するROM、及びCPU214に作業エリアを提供するRAM等である。例えば、ROMには、テレビジョン装置20の各種機能を実現するための制御プログラム及びアプリケーションプログラム等が格納されている。
ストレージ216は、HDD(Hard Disk Drive)またはSSD(Solid State Drive)等である。ストレージ216は、例えば、セレクタ207により選択された信号を録画データとして記録する。
図5は、実施形態にかかるテレビジョン装置20の機能構成の一例を示すブロック図である。図5に示すように、テレビジョン装置20は、送受信部21、タスク振り分け部22、データ処理部23、放送受信部24、操作受け付け部25、ライブ視聴処理部26、録画処理部27、再生処理部28、及び記憶部29を備える。
テレビジョン装置20の上記の機能構成は、例えば制御プログラムを実行中のCPU214、またはCPU214の制御下で動作するテレビジョン装置20の図4に示す各部のハードウェア構成によって実現される。
放送受信部24は、放送局から送られてくる放送番組の放送信号を受信する。放送信号には、映像情報および音声情報が含まれるとともに、番組選択の利便性等を考慮して、その放送番組の内容を示す番組配列情報(SI:Service Information)が多重されている。番組配列情報の一例としては、例えば新聞のテレビ欄に相当する情報を含む電子番組ガイド(EPG:Electronic Program Guide)に関する情報がある。
上記のような映像情報,音声情報,及びそれらに付随する 伝送制御情報等は、MPEG2形式に圧縮され、かつ多重されたトランスポートストリーム(TS:Transport Stream)を構成している。
放送受信部24は、放送信号に多重される映像情報、音声情報、及び番組配列情報等を受信可能である。
操作受け付け部25は、ユーザからのライブ視聴操作、録画操作、録画予約操作、及び再生操作等の各種操作を受け付ける。
ライブ視聴処理部26は、放送番組のライブ視聴の処理を行う。ライブ視聴とは、例えば、その時点で放送中の放送番組をリアルタイムで表示することである。
録画処理部27は、ユーザからの録画操作および録画予約操作にしたがい、放送番組の録画の処理を行う。録画処理部27は、録画番組を記憶部29に格納する。
再生処理部28は、ユーザからの再生操作にしたがい、記憶部29から録画番組を読み出して再生処理を行う。
データ処理部23は、例えばテレビジョン装置20がそのときライブ視聴を提供中の放送番組の放送信号から、上述のサーバ装置10がメタデータを生成することが可能な形式に変換する。より具体的には、データ処理部23は、ライブ視聴を提供中の放送番組の放送信号に基づくデータをフレームごとに多次元配列に変換し、さらに多次元配列から放送番組の内容を推論した推論結果を含めて変換データを生成する。
番組内容の推論結果としては、例えば本編と広告とを区分けするための広告の推定開始位置および推定終了位置、放送番組中の出演者を特定した情報等がある。
タスク振り分け部22は、データ処理部23がデータ変換処理を行う際に、それらの処理内容を示すタスクを振り分ける。データ処理部23がデータ変換処理を行う際、放送番組の内容またはフレームごとに、データ変換に必要なタスクが異なる場合がある。タスク振り分け部22は、例えば放送信号に含まれる番組配列情報等を参照しつつ、適宜、必要なタスクを特定し、データ処理部23に振り分ける。
第1の送受信部としての送受信部21は、テレビジョン装置20とサーバ装置10との間でデータの授受が可能に構成される。送受信部21は、テレビジョン装置20が放送番組の放送信号から生成した変換データをサーバ装置10へと送信する。また、送受信部21は、サーバ装置10が生成したメタデータを受信する。
記憶部29には、テレビジョン装置20の動作に必要な各種パラメータ及び制御プログラム等が格納されている。また、記憶部29には、録画番組、データ処理部23が生成した変換データ、及びサーバ装置10から受信したメタデータ等が格納されていてもよい。
なお、テレビジョン装置20のリソースをサーバ装置10におけるメタデータの生成処理に活用することについては、テレビジョン装置20のユーザに許諾を受けているものとする。
(メタデータの生成例)
次に、図6を用いて、実施形態のサーバ装置10及びテレビジョン装置20によるメタデータの生成例について説明する。
次に、図6を用いて、実施形態のサーバ装置10及びテレビジョン装置20によるメタデータの生成例について説明する。
図6は、実施形態にかかるメタデータ生成システム1がメタデータを生成する様子の一例を示す模式図である。なお、図6においては、紙面左から右へ向かって時間が経過していくものとする。
図6に示すように、テレビジョン装置20がライブ視聴を提供中の放送番組について、データ処理部23は、例えばフレームごとの視聴画面をキャプチャし、キャプチャした視聴画面IMから多次元配列を得る。より具体的には、データ処理部23は、放送番組のトランスポートストリームを浮動小数点値または整数値による多次元配列に変換する。多次元配列とは、行列の概念を用いて複数の変数が格納された複数列の配列である。
多次元配列を用いることにより、膨大なデータを取り扱うことが可能となる。例えば、データ処理部23によりキャプチャされた視聴画面IMを例にとり、以下、具体例を挙げる。元の視聴画面IMに対し、タスク振り分け部22により広告の開始推定位置および終了推定位置がタスクとして選定された場合を想定すると、地上デジタル放送の場合、(3×1440×1080)画素の画素数を有する。これを多次元配列に変換することで、一例として、出力を(1×576)画素または(1×5)画素とすることができる。ただし、これらの入出力に関する具体的な数値はあくまで一例である。いずれにしても、多次元配列を用いることで、元の視聴画面IMに対する配列要素数を大幅に縮小することができる。
このため、ディープニューラルネットワーク(DNN:Deep Neural Network)等への入出力データとして多次元配列を用いることで、DNNによる画像認識および音声認識等が容易となる。また、後述するように、多次元配列へと変換される個とで、サーバ装置10における取り扱いデータの容量も縮小することができ、より多くのコンテンツの情報を収集して処理することが可能となる。
データ処理部23は、例えば上記のDNN技術等を用いて、放送番組の本編と広告との区別、放送番組中の出演者、その他のシーン情報を推論した推論結果を含めて変換データを生成する。
テレビジョン装置20の送受信部21は、ネットワーク30を介して、生成されたフレームごとの変換データを、受信した放送信号に多重される番組配列情報とともにサーバ装置10へと送信する。テレビジョン装置20からサーバ装置10への変換データのアップロードは、例えば5分ごとなど定期で行われる。
サーバ装置10の統合部12は、複数のテレビジョン装置20から収集したフレームごとの変換データを取捨選択して、例えば同時に放送される複数の放送番組の全てについて時系列データを生成する。時系列データの生成処理も、複数のテレビジョン装置20からのデータアップロードのタイミングに合わせて、例えば5分ごとなど定期で行われる。
広告判定部13は、上述したとおり、時系列データに基づいて広告の挿入位置を特定する。また、メタデータ生成部14は、変換データに付加された番組配列情報を参照しつつ、放送番組の本編部分について番組内容を表すメタデータを生成する。
メタデータ生成部14が生成するメタデータとしては、例えば放送番組の本編と広告との区別を示すメタデータがある。
例えば、メタデータ生成部14は、広告判定部13によって特定された広告の挿入位置に対応する時系列データに紐づけて広告部分であることを示すメタデータ、あるいは、広告の挿入位置を除く部分に対応する時系列データに紐づけて本編部分であることを示すメタデータを時系列データの対応するタイミングに紐づけて生成する。
または、メタデータ生成部14は、番組配列情報から、NHKのように広告が挿入されない放送番組である場合には、上記処理を省略することもできる。
また例えば、メタデータの生成対象の放送番組が音楽番組であれば、メタデータ生成部14は、番組配列情報を参照しつつ、例えば歌手A、歌手B、歌手C・・・のそれぞれの歌唱タイミング等を特定し、これらの歌手名等を含むメタデータを時系列データの対応するタイミングに紐づけて生成する。
また例えば、メタデータの生成対象の放送番組がバラエティであれば、メタデータ生成部14は、番組配列情報を参照しつつ、例えばタレントA、タレントB、タレントC・・・のそれぞれの出演タイミング等を特定し、これらのタレント名等を含むメタデータを時系列データの対応するタイミングに紐づけて生成する。
また例えば、メタデータの生成対象の放送番組がアニメまたはドラマであれば、メタデータ生成部14は、番組配列情報を参照しつつ、例えばオープニングまたはエンディングの主題歌が流れるタイミングを特定し、主題歌部分であることを示すメタデータを時系列データの対応するタイミングに紐づけて生成する。
また例えば、メタデータの生成対象の放送番組がニュース番組であれば、メタデータ生成部14は、番組配列情報を参照しつつ、例えばスタジオからの放送タイミング、中継が入るタイミング等を特定し、スタジオからの放送部分、または中継部分であることを示すメタデータを時系列データの対応するタイミングに紐づけて生成する。
サーバ装置10の送受信部11は、上記のように生成したメタデータを複数のテレビジョン装置20へと送信する。このとき、メタデータは、サーバ装置10に接続される全てのテレビジョン装置20に配信されてもよく、あるいは、複数のテレビジョン装置20のうちリクエストがあったテレビジョン装置20に対して送信されてもよい。
個々のテレビジョン装置20では、録画番組が再生される際などに、ユーザの操作にしたがい、対応するメタデータを表示させる。これにより、ユーザは、メタデータを参考にして効率的に録画番組の視聴ができる。
なお、録画番組の再生には、番組終了後の任意のタイミングで録画番組が再生する場合のほか、番組放送中に、録画の終了を待たずにライブ視聴の途中で過去に遡って録画内容を再生する場合も含む。このような再生手法をタイムシフト再生などとも呼ぶ。
(広告挿入位置の特定例)
次に、図7を用いて、メタデータ生成システム1における広告の挿入位置の特定例について説明する。
次に、図7を用いて、メタデータ生成システム1における広告の挿入位置の特定例について説明する。
図7は、実施形態にかかるメタデータ生成システム1が広告の挿入位置を特定する様子の一例を示す模式図である。なお、図7においても、紙面左から右へ向かって時間が経過していくものとする。
図7に示すように、テレビジョン装置20のデータ処理部23は、例えば放送番組の放送信号に基づくデータを変換した多次元配列に基づき、例えばDNN技術等を用いて広告の推定開始位置と推定終了位置との情報を付す。推定開始位置および推定終了位置の情報には、これらの推定の確度も含まれていてよい。
これらの情報を含む変換データを受け取ったサーバ装置10では、広告判定部13が、時系列データにおける広告の挿入位置を特定する。
図7の例では、例えば時系列データ冒頭には、広告の推定開始位置(確度:80%)の情報が含まれる(図7の(1))。しかし、時系列データには、その後、所定期間を超えて、広告の推定終了位置の情報が含まれていなかったものとする。この場合、広告判定部13は、時系列データ冒頭の広告の推定開始位置の推論結果は誤りであり、このタイミングで広告は開始されていないものと判定する。
なお、広告の放送時間は通常、15秒単位で最長1分などと規格化されていることが多い。したがって、広告判定部13が判定に用いる所定期間を例えば1分などと設定することができる。
また、図7の例では、その後の時系列データに、広告の推定開始位置の情報が2つ(確度:90%、確度:85%)含まれている(図7の(2)(3))。これに対して、この推定開始位置に対応すると思われる広告の推定終了位置の情報は1つ(確度:80%)のみである(図7の(4))。この場合、広告判定部13は、2つの推定開始位置のそれぞれと1つの推定終了位置との組み合わせのうち、その広告の挿入時間が、広告の最短放送期間の倍数に近い組み合わせとなるほうを採用する。
すなわち、上述のように、広告の放送時間は15秒単位で増加するよう規格化されている。図7の例において、2つの推定開始位置のうち早いほうの推定開始位置(図7の(2))と、その後の推定終了位置とを組み合わせると、広告の挿入時間は67秒となる。一方、2つの推定開始位置のうち遅いほうの推定開始位置(図7の(3))と、その後の推定終了位置とを組み合わせると、広告の挿入時間は60秒となる。
このように、遅いほうの推定開始位置と、その後の推定終了位置との組み合わせでは、広告の放送時間が、より15秒の倍数に近い。このため、広告判定部13は、2つの推定開始位置のうち遅いほうの推定開始位置を広告の開始位置として採用する。
なお、本例では、2つの推定開始位置のうち、結果的に確度の低いほうが採用されている。しかし、広告判定部13が、広告の最短放送期間の倍数に近いか否かに加えて、確度の高低も判定基準に加えてもよい。
(タスクの振り分け例)
次に、図8を用いて、実施形態のテレビジョン装置20におけるタスクの振り分け例について説明する。
次に、図8を用いて、実施形態のテレビジョン装置20におけるタスクの振り分け例について説明する。
図8は、実施形態にかかるテレビジョン装置20でタスクの振り分けが行われる様子の一例を示す模式図である。なお、図8においては、紙面上から下へ向かって時間が経過していくものとする。
上述のように、データ処理部23が所定の放送番組についてデータ変換を行う際、放送番組の内容またはフレームごとに、データ変換に必要なタスクが異なる場合がある。
例えば、歌番組またはドラマ等においては、上述のように、出演歌手および出演者の顔認証等を行って、個々の出演者の出演タイミングを特定する処理が行われる場合がある。一方、ニュース番組等であれば、このような処理は通常不要である。
また例えば、民放番組であれば、広告の推定開始位置と推定終了位置とを特定する処理が行われる場合がある。一方で、NHKの放送番組であれば、このような処理は不要である。
また例えば、ハイビジョン放送等であれば、キャプチャした視聴画面の容量をリサイズする処理等が行われる場合もある。
図8の例では、タスク1~タスク7が、放送番組の内容またはフレームごとに異なり得るタスクを表しているものとする。また、これらのタスク1~タスク7のうち、タスク1~タスク3の処理は、比較的少ないリソースで実行可能なタスクであるものとする。一方、これらのタスク1~タスク7のうち、タスク4~タスク7の処理は、比較的多くのリソースを要するタスクであるものとする。
例えば図8の最上段のタイミングでは、データ処理部23が所定の視聴画面IMをキャプチャ中であるとする(図8の(1))。タスク振り分け部22は、このタイミングにおける番組配列情報を参照し、データ処理部23がキャプチャした視聴画面IMに基づいて変換データを生成するために必要なタスクを特定する。より具体的には、タスク振り分け部22は、複数のタスク1~タスク3の候補の中から、例えばタスク1を選択し、データ処理部23に振り分ける。
上述のように、タスク1を含むタスク1~タスク3の処理は、いずれも比較的少ないリソースで実行可能である。この場合、タスク振り分け部22は、データ処理部23には余剰のリソースが存在すると判定する。
また、例えば図8の中段のタイミングでは、データ処理部23がまた別の視聴画面IMをキャプチャ中であるとする(図8の(2))。タスク振り分け部22は、このタイミングにおける番組配列情報を参照し、データ処理部23がキャプチャした視聴画面IMに基づいて変換データを生成するために必要なタスクを特定する。図8の例では、タスク振り分け部22は、複数のタスク1~タスク3の候補の中から、例えばタスク1及びタスク2を選択し、データ処理部23に振り分けている。
この場合、1つ1つのタスク1、タスク2、タスク3の処理は、比較的少ないリソースで実行可能であるものの、データ処理部23は、タスク1及びタスク2の2つの処理を抱えている。この場合、タスク振り分け部22は、データ処理部23は余剰のリソースを有しておらず、これ以上、他のタスクの処理は不可能であると判定する。
また、例えば図8の最下段のタイミングでは、データ処理部23が更に別の視聴画面IMをキャプチャ中であるとする(図8の(3))。タスク振り分け部22は、このタイミングにおける番組配列情報を参照し、データ処理部23がキャプチャした視聴画面IMに基づいて変換データを生成するために必要なタスクを特定する。
図8の例では、タスク振り分け部22は、複数のタスク1~タスク3の候補の中から、例えばタスク1を選択し、データ処理部23に振り分けている。また、タスク振り分け部22は、複数のタスク4~タスク7の候補の中から、例えばタスク5を選択し、データ処理部23に振り分けている。
このとき、データ処理部23に振り分けられたタスク1及びタスク5のうち、タスク5は視聴画面IMをリサイズして視聴画面imとする処理であったとする。このような処理には、比較的多くのリソースが必要となる。
この場合においても、タスク振り分け部22は、データ処理部23は余剰のリソースを有しておらず、これ以上、他のタスクの処理は不可能であると判定する。
なお、これらのタスクを経て推論結果を含むフレームごとの変換データは、サーバ装置10にアップロードされる。
(余剰リソースの使用例)
次に、図9及び図10を用いて、実施形態のテレビジョン装置20における余剰リソースの使用例について説明する。
次に、図9及び図10を用いて、実施形態のテレビジョン装置20における余剰リソースの使用例について説明する。
図9及び図10は、実施形態にかかるテレビジョン装置20で余剰リソースがデータ変換の前処理のタスクを振り分ける場合の一例を示す模式図である。図9及び図10の例では、データ変換の前処理として、所定のドラマの出演者の特徴量を予め抽出しておく処理を行うこととする。
上述の図6のように、テレビジョン装置20のデータ処理部23が、例えばバラエティまたはドラマ等の放送番組について解析を行う場合、これらの放送番組における所定の出演者の出演タイミング等を検出する処理を行う場合がある。その際、例えばDNN技術を用いた顔認証等を行って個々の出演者を判別し、それらの出演者が視聴画面に登場するタイミングを特定する。
したがって、例えば所定の出演者の顔の特徴量を予め抽出しておくことで、データ変換処理時には、抽出した特徴量に基づいて迅速に個々の出演者の顔認証を行うことが可能となる。
図9(a)に示すように、テレビジョン装置20のタスク振り分け部22は、所定のタイミングでデータ処理部23に余剰のリソースが生じた場合には、例えば所定のドラマの出演者の顔の特徴量を抽出するタスクをデータ処理部23に振り分ける。顔の特徴量を抽出するための個々の出演者の顔写真等は、例えばサーバ装置10にプールされていてよい。
この場合、サーバ装置10の管理者等が、予め、ドラマの出演者の使用許諾を受けた顔写真データをサーバ装置10の記憶部15に格納しておくことができる。あるいは、テレビジョン装置20が自律的に、番組配列情報等に含まれる出演者の顔写真を取得し、記憶部29に格納しておいてもよい。この場合も、テレビジョン装置20を含むメタデータ生成システム1における番組配列情報の利用について、予め包括的な許諾を受けておくことができる。
図9(b)に示すように、テレビジョン装置20のデータ処理部23は、与えられた出演者の顔写真から、個々の出演者の顔の特徴量を抽出し、例えば記憶部29に格納しておく。その後、それらの出演者が出演するドラマについて変換データを生成する際には、記憶部29に格納した特徴量を参照して個々の出演者を特定することができる。その様子を図10に示す。
図10(a)に示すように、出演者の顔の特徴量を抽出済みのドラマについて、データ処理部23は、フレームごとにキャプチャした視聴画面に含まれる情報を多次元配列に変換する。
図10(b)に示すように、データ処理部23は、生成した多次元配列に基づいて解析を行って、視聴画面に含まれる出演者の顔の特徴量を抽出する。
図10(c)に示すように、データ処理部23は、記憶部29に格納した個々の出演者の顔の特徴量のデータを読み出し、視聴画面に含まれる出演者の顔の特徴量と照合することで、視聴画面に含まれる出演者を特定する。
なお、テレビジョン装置20は、生成した出演者の顔の特徴量をサーバ装置10に送信してもよい。また、サーバ装置10は、所定のテレビジョン装置20で生成された特徴量を他のテレビジョン装置20に配信し、個々のテレビジョン装置20でデータ変換を行う際、1つのテレビジョン装置20で生成した特徴量を、これらのテレビジョン装置20で供用してもよい。
(メタデータの生成処理例)
次に、図11を用いて、実施形態の、メタデータ生成システム1によるメタデータ生成処理の例について説明する。図11は、実施形態にかかるメタデータ生成システム1によるメタデータ生成処理の手順の一例を示すフロー図である。
次に、図11を用いて、実施形態の、メタデータ生成システム1によるメタデータ生成処理の例について説明する。図11は、実施形態にかかるメタデータ生成システム1によるメタデータ生成処理の手順の一例を示すフロー図である。
図11に示すように、テレビジョン装置20のタスク振り分け部22は、所定の放送番組の視聴が開始されると、データ処理部23へのタスクの振り分けを行う(ステップS101)。
つまり、タスク振り分け部22は、番組配列情報を参照しつつ、放送番組の内容またはフレームごとに、データ変換に必要なタスクを特定する。また、タスク振り分け部22は、特定したタスクをデータ処理部23に振り分ける。
つまり、タスク振り分け部22は、番組配列情報を参照しつつ、放送番組の内容またはフレームごとに、データ変換に必要なタスクを特定する。また、タスク振り分け部22は、特定したタスクをデータ処理部23に振り分ける。
また、タスク振り分け部22は、特定したタスクに基づいて、データ処理部23に余剰のリソースが生じうるか否かを判定する(ステップS102)。
余剰のリソースが生じないと判定した場合(ステップS102:No)、データ処理部23は、振り分けられたタスクに基づくステップS103~S105の処理を実行する。余剰のリソースが生じると判定した場合(ステップS102:Yes)、データ処理部23は、余剰リソースに応じたタスクを更にデータ処理部23に振り分ける(ステップS107)。
具体的には、データ処理部23は、視聴が開始された放送番組の視聴画面をフレームごとにキャプチャする(ステップS103)。また、データ処理部23は、視聴画面に含まれる情報を多次元配列に変換する(ステップS104)。また、データ処理部23は、多次元配列に基づいて各種の推論を行って推論結果を生成する(ステップS105)。
また、余剰リソースに応じたタスクを更に振り分けられている場合には、データ処理部23は、ステップS103~S105の処理と並行して、振り分けられたタスクに基づく処理を実行する(ステップS107)。
送受信部21は、以上のように生成された変換データをサーバ装置10へと送信する(ステップS106)。サーバ装置10の送受信部11は、テレビジョン装置20から変換データを受信する(ステップS111)。
統合部12は、複数のテレビジョン装置20から収集した変換データを取捨選択して、個々の放送番組に関する複数の変換データをそれぞれ統合し、これらの放送番組にそれぞれ対応する時系列データを生成する(ステップS112)。
広告判定部13は、例えば生成された時系列データに対応する番組配列情報を参照し、その時系列データについて、広告の挿入があるか否かを判定する(ステップS113)。
つまり、広告判定部13は、番組配列情報から、その時系列データに対応する放送番組がNHKの放送番組である場合には広告の挿入がなく、民放の放送番組で或る場合には広告の挿入があると判定する。ただし、広告判定部13は、番組配列情報に替えて、あるいは加えて、テレビジョン装置20のデータ処理部23によって広告の推定開始位置および推定終了位置が時系列データに付与されているか否かに基づいて、上記判定を行ってもよい。
時系列データに広告の挿入があると判定した場合(ステップS113:Yes)、広告判定部13は、時系列データに付与されている広告の推定開始位置および推定終了位置に基づいて広告の挿入位置を特定する(ステップS114)。時系列データに広告の挿入がないと判定した場合(ステップS113:No)、広告判定部13は、ステップS114の処理をスキップする。
メタデータ生成部14は、時系列データの広告の挿入位置を除く本編部分について、時系列データ、及び時系列データに付与されたデータ処理部23の推論結果に基づいて、放送番組の内容を表すメタデータを生成する(ステップS115)。
送受信部11は、以上のように生成されたメタデータをテレビジョン装置20へと送信する(ステップS116)。テレビジョン装置20の送受信部21は、サーバ装置10からメタデータを受信し(ステップS121)、例えば録画番組の視聴の際などに表示可能に記憶部29に格納する(ステップS122)。
以上により、実施形態のメタデータ生成システム1によるメタデータ生成処理が終了する。
(比較例)
近年のコンテンツ増加に伴い、コンテンツの検索機能、及び個々のコンテンツに対するレコメンド機能等が求められるとともに、効率的な視聴手段の提供も重要となっている。コンテンツの効率的な視聴を実現するために、例えばシーン情報を始めとするメタデータは有用である。
近年のコンテンツ増加に伴い、コンテンツの検索機能、及び個々のコンテンツに対するレコメンド機能等が求められるとともに、効率的な視聴手段の提供も重要となっている。コンテンツの効率的な視聴を実現するために、例えばシーン情報を始めとするメタデータは有用である。
テレビジョンの放送番組のメタデータは、これまで人手による作成が主流であり、放送終了から作成までに数時間を要するほか、メタデータの作成コストも膨大になっている。そこで、人工知能を用いたメタデータの自動生成の試みが始まっている。しかしながら、メタデータの自動生成には例えば以下の課題がある。
テレビジョン装置には、視聴、録画、及び再生のリアルタイム処理が求められる。このため、時系列データを取り扱う必要のあるメタデータの自動生成を、テレビジョン装置に行わせることが困難である。
また、テレビジョン装置においては、システムリソースが限定的である。このため、人工知能を用いた複雑な処理、及び同時並列的な処理をテレビジョン装置に行わせることが困難である。したがって、このような理由からも、メタデータの自動生成を、テレビジョン装置に行わせることが困難である。
一方で、メタデータの自動生成をサーバ装置に行わせる場合、膨大なコンテンツをサーバ装置で一括処理するには、サーバ装置側のコストが膨大になる。
例えば上述の特許文献1,2の技術では、ロゴイメージ及びパターンファイル等を予めクラウド側に用意し配布することで、テレビジョン装置に広告区間の検出を行わせる。しかしながら、ロゴイメージ等を広告の提供者から購入しなければならず、対象コンテンツを広げるためには膨大なコストを要する。また、広告区間の検出をテレビジョン装置に行わせているため、処理の遅延が懸念される。
また、上述の特許文献3の技術では、人工知能を用いた特徴量の生成を医療分野における端末装置にリアルタイムで行わせ、その特徴量を用いて時系列データを用いた処理を実行する。しかしながら、このような技術をテレビジョンの放送番組に適用することは困難である。
テレビジョンの放送番組では、例えばライブ視聴の途中で録画内容を再生するタイムシフト再生機能、及び全チャンネルの全放送番組をまとめて録画する機能等が求められている。これらに対応するためには、複数のAV(Audio/Visual)デコーダと、複数コンテンツをリアルタイムで並列処理するためのAI演算機をテレビジョン装置に搭載する必要がある。このような構成は、部材コスト及びランニングコストの両面において大きな障害となるため、コンシューマデバイスであるテレビジョン装置への適用は現実的ではない。
実施形態のテレビジョン装置20によれば、放送番組のライブ視聴を提供中に、放送番組の放送信号から、その放送番組の内容を表すメタデータの生成が可能な変換データを生成する。
このように、膨大なコンテンツの処理を個々のテレビジョン装置20に担わせることができ、例えばサーバ装置10で一括処理する場合と異なり、サーバ装置10の負担を軽減することができる。
また、上記のデータ変換処理は、例えばテレビジョン装置20の既存のハードウェア構成を用いて実行させうることが可能である。テレビジョン装置20に新たな構成を追加したり、テレビジョン装置20自体を新たに構築したりする必要が無く、部材コスト及びランニングコストを抑えることが可能である。
実施形態のテレビジョン装置20によれば、変換データをメタデータの生成を行うサーバ装置10へと送信する。このようなサーバ装置10へのアップロード頻度を高めることで、サーバ装置10が取り扱うデータが小まめに更新されるため、例えば短時間での処理が求められるタイムシフト再生等にも対応可能となる。
実施形態のテレビジョン装置20によれば、放送番組の情報をフレームごとに多次元配列に変換して変換データを生成する。このように、多次元配列へのデータ変換を行うことで、膨大なデータの取り扱いが可能となり、また、例えばDNNの入出力データに多次元配列を用いることで、DNN技術を用いたデータ解析が容易となる。また、サーバ装置10における取り扱いデータの容量を縮小することができ、より多くのコンテンツの情報を収集して処理することが可能となる。
実施形態のテレビジョン装置20によれば、番組配列情報に基づいてデータの変換に必要なタスクを特定し、データ処理部23に対し、特定したタスクの振り分けを行う。これにより、例えば放送番組の内容またはフレームごとに異なるタスクが必要となるデータ変換処理において、適正なタスクをデータ処理部23に振り分けて実行させることができる。また、データ処理部23の限られたリソースを効率的に利用することができる。
実施形態のテレビジョン装置20によれば、データ処理部23に余剰のリソースが存在する場合には、データの変換に利用可能な前処理のタスクをデータ処理部23に振り分ける。これにより、データ処理部23のリソースを有効活用することができる。
実施形態のサーバ装置10によれば、テレビジョン装置20が変換した変換データからメタデータを生成する。
これにより、時系列データを取り扱う必要のあるメタデータの生成をサーバ装置10に担わせることができ、テレビジョン装置20の視聴、録画、及び再生のリアルタイム処理に支障が生じることを抑制できる。
また、サーバ装置10では、専ら時系列データを取り扱ったメタデータの生成処理のみを実行すればよく、サーバ装置10の負担も軽減することができる。
実施形態のサーバ装置10によれば、データ処理部23による広告の推定開始位置から所定期間を超えて推定終了位置の情報が含まれていなかった場合には、推定開始位置で広告の挿入はなかったものと判定する。このように、時系列データを取り扱うことが可能なサーバ装置10において上記判定を行うことで、高精度に広告の挿入位置を特定することができる。
実施形態のサーバ装置10によれば、広告の推定開始位置と推定終了位置との間に、他の推定開始位置または他の推定終了位置が含まれる場合、これらの推定開始位置と推定終了位置との組み合わせの中から、広告の挿入期間が、広告の最短放送時間の倍数に最も近い組み合わせを広告の開始位置および終了位置として選択する。このように、時系列データを取り扱うことが可能なサーバ装置10において上記判定を行うことで、高精度に広告の挿入位置を特定することができる。
実施形態のサーバ装置10によれば、複数のテレビジョン装置20のうち、少なくとも放送番組のライブ視聴を提供中のテレビジョン装置20から収集した変換データを時系列データに統合する。このように、複数のテレビジョン装置20のそれぞれにデータ変換処理を分散させることで、テレビジョン装置20の負担を更に軽減することができる。
なお、上述の実施形態では、例えばライブ視聴を提供中の複数のテレビジョン装置20から、サーバ装置10が変換データを収集し統合して時系列データを生成することとした。しかし、メタデータの生成を行うサービス提供者が、自社内等に複数のテレビジョン装置20を設置し、これらのテレビジョン装置20からサーバ装置10へと変換データをアップロードさせてもよい。
この場合、個々のテレビジョン装置20に、それぞれ特定の放送局の放送番組を一貫してライブ視聴提供させておくことができる。これにより、1つのテレビジョン装置20から1つの放送局の放送番組に関する変換データを収集することができ、例えば複数のテレビジョン装置20の変換データを統合する処理が不要となる。
また、上述の実施形態では、受信装置がテレビジョン装置20であることとしたが、実施形態の構成はこれに限られない。例えば、受信装置が、放送信号の受信機能および放映機能、並びに音声認識サービス機能を備えたパソコン、スマートフォン、タブレット、携帯電話等の他の機器であってもよい。
本発明の実施形態について説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1…メタデータ生成システム、10…サーバ装置、11…送受信部、12…統合部、13…広告判定部、14…メタデータ生成部、15…記憶部、20…テレビジョン装置、21…送受信部、22…タスク振り分け部、23…データ処理部、24…放送受信部、29…記憶部。
Claims (12)
- 放送番組を受信してライブ視聴可能に提供する受信装置であって、
前記放送番組のライブ視聴を提供中に、前記放送番組の放送信号から、前記放送番組の内容を表すメタデータの生成が可能な変換データを生成するデータ処理部と、
前記変換データを前記メタデータの生成を行うサーバ装置へと送信する第1の送受信部と、を備える、
受信装置。 - 前記データ処理部は、
前記放送番組をフレームごとに多次元配列に変換して前記変換データを生成する、
請求項1に記載の受信装置。 - 前記データ処理部は、
前記多次元配列から前記放送番組の内容を推論した推論結果を含めて前記変換データを生成する、
請求項2に記載の受信装置。 - 前記放送番組の放送信号および前記放送信号に多重される番組配列情報を受信する放送受信部と、
前記番組配列情報に基づいて前記変換データの生成に必要なタスクを特定し、前記データ処理部に対し、特定した前記タスクの振り分けを行うタスク振り分け部と、を更に備える、
請求項1に記載の受信装置。 - 前記タスク振り分け部は、
前記データ処理部に対する前記タスクの振り分け後、前記データ処理部に余剰のリソースが存在する場合には、前記変換データの生成に利用可能な前処理のタスクを前記データ処理部に振り分ける、
請求項4に記載の受信装置。 - 請求項1乃至請求項5のいずれか1項に記載の受信装置と、
前記受信装置との通信が可能に前記受信装置に接続されたサーバ装置と、を備え、
前記サーバ装置は、
前記受信装置が生成した前記変換データを前記受信装置から受信する第2の送受信部と、
前記変換データに基づいて前記メタデータを生成するメタデータ生成部と、を備える、
メタデータ生成システム。 - 前記サーバ装置は、
前記放送番組における広告の挿入位置を特定する広告判定部を更に備え、
前記メタデータ生成部は、
前記広告の挿入位置を示す情報を含めて前記メタデータを生成する、
請求項6に記載のメタデータ生成システム。 - 前記データ処理部は、
前記広告の推定開始位置と推定終了位置とを示す情報を含めて前記変換データをフレームごとに生成し、
前記広告判定部は、
フレームごとの前記変換データを時系列に配列した時系列データに基づいて前記広告の挿入位置を判定する、
請求項7に記載のメタデータ生成システム。 - 前記広告判定部は、
前記推定開始位置から所定期間を超えて前記推定終了位置の情報が含まれていなかった場合には、前記推定開始位置で前記広告の挿入はなかったものと判定する、
請求項8に記載のメタデータ生成システム。 - 前記広告判定部は、
前記推定開始位置と前記推定終了位置との間に、他の推定開始位置または他の推定終了位置が含まれる場合、これらの推定開始位置と推定終了位置との組み合わせの中から、前記広告の挿入期間が、広告の最短放送時間の倍数に最も近い組み合わせを前記広告の開始位置および終了位置として選択する、
請求項8に記載のメタデータ生成システム。 - 前記サーバ装置は、
前記受信装置を含む複数の受信装置との通信が可能に前記複数の受信装置に接続されており、
前記複数の受信装置のうち、少なくとも前記放送番組のライブ視聴を提供中の受信装置から収集した前記変換データを時系列データに統合する統合部を更に備える、
請求項7に記載のメタデータ生成システム。 - 前記サーバ装置は、
前記複数の受信装置の少なくともいずれかの前記第1の送受信部に、前記変換データから生成した前記メタデータを送信する、
請求項11に記載のメタデータ生成システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022110677A JP2024008646A (ja) | 2022-07-08 | 2022-07-08 | 受信装置およびメタデータ生成システム |
PCT/CN2023/101699 WO2024007861A1 (zh) | 2022-07-08 | 2023-06-21 | 接收装置及元数据生成系统 |
CN202380013680.8A CN118020308A (zh) | 2022-07-08 | 2023-06-21 | 接收装置及元数据生成系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022110677A JP2024008646A (ja) | 2022-07-08 | 2022-07-08 | 受信装置およびメタデータ生成システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024008646A true JP2024008646A (ja) | 2024-01-19 |
Family
ID=89454189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022110677A Pending JP2024008646A (ja) | 2022-07-08 | 2022-07-08 | 受信装置およびメタデータ生成システム |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP2024008646A (ja) |
CN (1) | CN118020308A (ja) |
WO (1) | WO2024007861A1 (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103079092B (zh) * | 2013-02-01 | 2015-12-23 | 华为技术有限公司 | 在视频中获取人物信息的方法和装置 |
US10430830B2 (en) * | 2015-06-16 | 2019-10-01 | Samsung Electronics Co., Ltd. | Advertisement selection using uncertain user data |
CN108401176A (zh) * | 2018-02-06 | 2018-08-14 | 北京奇虎科技有限公司 | 一种实现视频人物标注的方法和装置 |
US20190373322A1 (en) * | 2018-05-29 | 2019-12-05 | Sony Interactive Entertainment LLC | Interactive Video Content Delivery |
KR102210806B1 (ko) * | 2018-10-02 | 2021-02-01 | 한림대학교 산학협력단 | 위 내시경 이미지의 딥러닝을 이용하여 위 병변을 진단하는 장치 및 방법 |
CN111669612B (zh) * | 2019-03-08 | 2023-02-28 | 腾讯科技(深圳)有限公司 | 基于直播的信息投放方法、装置和计算机可读存储介质 |
CN113010701A (zh) * | 2021-02-25 | 2021-06-22 | 北京四达时代软件技术股份有限公司 | 以视频为中心的融媒体内容推荐方法及装置 |
-
2022
- 2022-07-08 JP JP2022110677A patent/JP2024008646A/ja active Pending
-
2023
- 2023-06-21 WO PCT/CN2023/101699 patent/WO2024007861A1/zh active Application Filing
- 2023-06-21 CN CN202380013680.8A patent/CN118020308A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2024007861A1 (zh) | 2024-01-11 |
CN118020308A (zh) | 2024-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8275245B2 (en) | Replace content with like content to enhance program experience | |
JP5567851B2 (ja) | 1次メディア・ストリーム内に2次メディア・ストリームを表示する方法、システム、及びコンピュータ・プログラム | |
US20050238062A1 (en) | Communication of TV-anytime crids | |
CN103501449A (zh) | 与电视节目关联的视频源推荐方法及推荐装置 | |
JP6071184B2 (ja) | 受信装置、受信方法、プログラム、及び情報処理システム | |
JP4433249B2 (ja) | コンテンツ提示制御装置および方法 | |
KR101445764B1 (ko) | 멀티미디어 컨텐츠 리스트 및 서브리스트 제공방법, 및이를 적용한 방송수신장치 | |
US20110138418A1 (en) | Apparatus and method for generating program summary information regarding broadcasting content, method of providing program summary information regarding broadcasting content, and broadcasting receiver | |
JP2012134980A (ja) | パーソナライズド・サービス提供システムおよび方法 | |
RU2630432C2 (ru) | Приемное устройство, способ обработки информации, программа, передающее устройство и система взаимодействия передающих программ | |
JP2004007127A (ja) | 番組配信制御方法及び番組配信制御システム及び番組配信制御プログラムを記録した記録媒体 | |
US20030033612A1 (en) | Software appliance method and system | |
JP5306550B2 (ja) | 映像解析情報送信装置、映像解析情報配信システム及び配信方法、映像視聴システム及び映像視聴方法 | |
JP2010041500A (ja) | サーバ装置、クライアント装置、コンテンツ送出方法、コンテンツ再生装置、コンテンツ再生方法 | |
JP2024008646A (ja) | 受信装置およびメタデータ生成システム | |
JP5198643B1 (ja) | 映像解析情報アップロード装置及び映像視聴システム及び方法 | |
EP2458850A1 (en) | Program presentation apparatus and method | |
JP2001204020A (ja) | サムネイル指定情報記述方法 | |
JP5078417B2 (ja) | 信号処理装置及び信号処理方法 | |
JP2017011438A (ja) | 情報処理装置、プログラム、情報処理システム、及び受信装置 | |
KR20130013938A (ko) | 코너별 시청이 가능한 디지털 방송 시스템 및 그 서비스 제공 방법 | |
KR102049119B1 (ko) | 클라우드 환경에서 녹화 서비스 제공 방법 및 장치 | |
JP2018125864A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2013098742A (ja) | コンテンツ出力装置、及びコンテンツ出力方法 | |
JP6896661B2 (ja) | サーバの番組情報処理方法及びサーバ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240723 |