JP6663134B2 - 動画編集装置およびプログラム - Google Patents

動画編集装置およびプログラム Download PDF

Info

Publication number
JP6663134B2
JP6663134B2 JP2016043051A JP2016043051A JP6663134B2 JP 6663134 B2 JP6663134 B2 JP 6663134B2 JP 2016043051 A JP2016043051 A JP 2016043051A JP 2016043051 A JP2016043051 A JP 2016043051A JP 6663134 B2 JP6663134 B2 JP 6663134B2
Authority
JP
Japan
Prior art keywords
information
moving image
event
section
sections
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016043051A
Other languages
English (en)
Other versions
JP2017163181A (ja
Inventor
内橋 真吾
真吾 内橋
福井 基文
基文 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2016043051A priority Critical patent/JP6663134B2/ja
Priority to US15/233,516 priority patent/US10049701B2/en
Publication of JP2017163181A publication Critical patent/JP2017163181A/ja
Application granted granted Critical
Publication of JP6663134B2 publication Critical patent/JP6663134B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、動画編集装置およびプログラムに関する。
特許文献1には、コンテンツの中から数種類の典型的な要約コンテンツを自動生成し、ユーザの興味にあった要約コンテンツの選定を可能とするコンテンツ要約システムが開示されている。
特許文献2には、映像情報に含まれる複数のイベントのそれぞれについて、属性情報とキーワードに基づいて重要度を算出して、重要度が高い順に映像情報のシーンを選択してつなぎ合わせて要約情報を作成するコンテンツ情報編集装置が開示されている。
特許文献3には、再生中の動画像から抽出する下位メタ情報から上位メタ情報を算出し、再生中の動画像の上位メタ情報と、再生中の動画像以外の他の動画像の上位メタ情報に基づいてスコアを算出して、算出されたスコアに基づいて推薦動画像一覧を作成して再生中の動画像の再生終了後に出力するコンテンツ推薦方法が開示されている。
特開2002−259720号公報 特開2004−126811号公報 特開2011−217209号公報
ある動画に基づいて、利用者の嗜好に合致したダイジェスト動画等の要約情報を生成するような場合、利用者の嗜好情報を取得して、その嗜好情報に合致した区間やフレームのみを抜き出して要約情報を生成することが考えられる。
しかし、このような方法によりダイジェスト動画等の要約情報を生成すると、利用者の嗜好情報における特定の属性に合致した場面や画像ばかりが抽出された要約情報が生成されてしまう可能性がある。
本発明の目的は、動画から利用者の嗜好に合致した要約情報を生成する際に、複数の単語や概念等に基づいて要約情報を生成した場合と比較して、より利用者が希望する様々な分野の事象が含まれた多様性のある要約情報を生成可能な動画編集装置およびプログラムを提供することである。
[動画編集装置]
請求項1に係る本発明は、動画データを、当該動画データを分割した区間毎に各事象が含まれる確度を前記事象毎にそれぞれ示した動画属性情報とともに格納する格納手段と、
要約情報に含めたい各事象に関する第1情報と、要約情報に含めたい前記各事象の上位概念に関する第2情報とを入力する入力手段と、
前記入力手段により入力された第1情報及び第2情報に基づいて、前記格納手段に格納された動画データの複数の区間の中から、当該第1情報及び第2情報に合致した区間を選択する選択手段と、
前記選択手段により選択された区間の動画に基づいて、当該動画内容を表した要約情報を生成する生成手段とを備えた動画編集装置である。
請求項2に係る本発明は、動画データをその内容に応じて複数の区間に分割して、分割した区間毎に画像処理を行って前記各事象が含まれる確度をそれぞれ算出することにより前記動画属性情報を算出する算出手段をさらに備えた請求項1記載の動画編集装置である。
請求項3に係る本発明は、前記選択手段が、前記第1情報及び第2情報のうちの各事象に関する第1情報と前記動画属性情報における各事象の確度とから下位概念の合致度を前記区間毎に算出し、前記第1情報及び第2情報のうちの上位概念に関する第2情報と、当該上位概念に含まれる各事象に関する第1情報と前記動画属性情報における各事象の確度とを乗算した値のうちの最大値とから上位概念の合致度を前記区間毎に算出し、前記下位概念の合致度と前記上位概念の合致度とから、当該区間の第1情報及び第2情報との合致度を計算して、計算された合致度が最も大きい区間を選択し、選択した当該区間における確度が大きな値となっている事象に対応する第1情報と、当該事象を含む上位概念に関する第2情報とを小さくなるように変更した後、再度残りの区間に対して第1情報及び第2情報との合致度を順次計算することにより、入力された第1情報及び第2情報に合致した区間を選択する請求項1または2項記載の動画編集装置である。
請求項4に係る本発明は、前記選択手段が、動画データを分割した複数の区間の中から、予め設定された数の区間を無作為に選択し、無作為に選択された各区間における前記事象毎の確度のうち最も大きな値を選択して当該事象の確度とすることにより統合動画属性情報を生成し、前記第1情報及び第2情報のうちの上位概念に関する第2情報と、当該上位概念に含まれる各事象に関する第1情報と前記動画属性情報における各事象の確度とを乗算した値のうちの最大値とから上位概念の合致度を算出し、予め設定された数の区間を無作為に選択する処理を繰り返して、算出された上位概念の合致度が最大になる区間の組み合わせを、前記第1情報及び第2情報に合致した区間として選択する請求項1または2項記載の動画編集装置である。
請求項5に係る本発明は、前記生成手段が、前記選択手段により選択された区間をつなぎ合わせた要約動画を要約情報として生成する請求項1から4のいずれか1項記載の動画編集装置である。
請求項6に係る本発明は、前記生成手段が、前記選択手段により選択された区間からフレーム画像を取り出した複数の要約画像を要約情報として生成する請求項1から4のいずれか1項記載の動画編集装置である。
請求項7に係る本発明は、前記選択手段により選択される区間の数を指定する指定手段をさらに備えた請求項1から6のいずれか1項記載の動画編集装置である。
[プログラム]
請求項8に係る本発明は、動画データを、当該動画データを分割した区間毎に各事象が含まれる確度を前記事象毎にそれぞれ示した動画属性情報とともに格納する格納ステップと、
要約情報に含めたい各事象に関する第1情報と、要約情報に含めたい前記各事象の上位概念に関する第2情報とを入力する入力ステップと、
前記入力ステップにおいて入力された第1情報及び第2情報に基づいて、前記格納ステップにおいて格納された動画データの複数の区間の中から、当該第1情報及び第2情報に合致した区間を選択する選択ステップと、
前記選択ステップにより選択された区間の動画に基づいて、当該動画内容を表した要約情報を生成する生成ステップとをコンピュータに実行させるためのプログラムである。
請求項1に係る本発明によれば、動画から利用者の嗜好に合致した要約情報を生成する際に、複数の単語や概念等に基づいて要約情報を生成した場合と比較して、より利用者が希望する様々な分野の事象が含まれた多様性のある要約情報を生成可能な動画編集装置を提供することができる。
請求項2に係る本発明によれば、動画データから動画属性情報を算出することが可能な動画編集装置を提供することができる。
請求項3に係る本発明によれば、上位概念の異なる多様な区間を選択して要約情報を生成することが可能な動画編集装置を提供することができる。
請求項4に係る本発明によれば、上位概念の異なる多様な区間を選択して要約情報を生成することが可能な動画編集装置を提供することができる。
請求項5に係る本発明によれば、選択された複数の区間をつなぎ合わせた要約動画を生成することが可能な動画編集装置を提供することができる。
請求項6に係る本発明によれば、選択された複数の区間をつなぎ合わせた要約画像を生成することが可能な動画編集装置を提供することができる。
請求項7に係る本発明によれば、動画を分割した複数の区間の中から選択する区間の数を指定することが可能な動画編集装置を提供することができる。
請求項8に係る本発明によれば、動画から利用者の嗜好に合致した要約情報を生成する際に、複数の単語や概念等に基づいて要約情報を生成した場合と比較して、より利用者が希望する様々な分野の事象が含まれた多様性のある要約情報を生成可能なプログラムを提供することができる。
本発明の一実施形態の旅行情報提供システムのシステム構成を示す図である。 本発明の一実施形態における端末装置21のハードウェア構成を示すブロック図である。 本発明の一実施形態における端末装置21の機能構成を示すブロック図である。 動画ベクトル情報算出部33における動画ベクトル情報の算出処理について説明するためのフローチャートである。 動画ベクトル情報算出部33により算出されるN次元の動画ベクトル情報の具体例を示す図である。 本発明の一実施形態の旅行情報提供システムにおける上位概念と下位概念(事象)との関係例を説明するための図である。 ユーザの嗜好情報を入力する際に表示される入力画面例を示す図である。 ユーザの嗜好情報を入力する際に表示される入力画面例を示す図である。 ユーザの嗜好情報を入力する際に表示される入力画面例を示す図である。 図7〜図9に示すような画面例を介して取得された嗜好情報の一例を示す図である。 下位概念のスコアと上位概念のスコアの算出方法を説明するための図である。 下位概念のスコア、上位概念のスコアおよび動画スコアの具体的な算出式を示す図である。 具体的な値を用いて、下位概念のスコア、上位概念のスコア、動作スコアを具体的に算出した算出例を示す図である。 区間選択部35による第1の区間選択処理を説明するためのフローチャートである。 区間選択部35が、事象の係数と上位概念の係数を変更する際の具体例を説明するための図である。 区間選択部35において選択順に並び替えられた区間の具体例を示す図である。 要約情報生成部36により生成される要約情報の生成例を示す図である。 区間選択部35による第2の区間選択処理を説明するためのフローチャートである。 第2の区間選択処理を具体的に説明するための図である。 区間1、6、7が選択された場合の様子を説明するための図である。
次に、本発明の実施の形態について図面を参照して詳細に説明する。
図1は本発明の一実施形態の旅行情報提供システムの構成を示すシステム図である。
本発明の一実施形態の旅行情報提供システムは、図1に示されるように、インターネット等のネットワーク30により接続されたサーバ装置10、および端末装置21〜23により構成される。ここで、サーバ装置10は、旅行情報動画を提供しており、例えば各地の観光協会等により運営されている。
また、端末装置22、23は、それぞれ一般ユーザであるユーザA、Bのパーソナルコンピュータであり、ネットワーク30を介してサーバ装置10にアクセスして旅行動画を閲覧することが可能な構成となっている。
また、端末装置21は、例えば旅行情報提供業者等により運営された旅行情報提供サイトに設置されており、サーバ装置10から提供される旅行情報動画の中からユーザA、Bの嗜好情報に合致したものを選択して、選択した動画をユーザA、Bの嗜好に合わせてそれぞれダイジェスト動画やダイジェスト画像等の要約情報に編集した後にユーザA、Bに提供する動画編集装置である。
なお、図1では、説明を簡単にするために旅行情報動画を提供するサーバ装置10が1台しか示されていないが、実際には数多くのサーバ装置が存在する。また、図1には、ユーザも2人のユーザA、Bしか示されていないが、実際には数多くのユーザが旅行情報提供システムを利用している。
次に、本実施形態の旅行情報提供システムにおいて動画編集装置として機能する端末装置21のハードウェア構成を図2に示す。
端末装置21は、図2に示されるように、CPU11、メモリ12、ハードディスクドライブ(HDD)等の記憶装置13、ネットワーク30を介して外部の装置等との間でデータの送信及び受信を行う通信インタフェース(IF)14、タッチパネル又は液晶ディスプレイ並びにキーボードを含むユーザインタフェース(UI)装置15を有する。これらの構成要素は、制御バス16を介して互いに接続されている。
CPU11は、メモリ12または記憶装置13に格納された制御プログラムに基づいて所定の処理を実行して、端末装置21の動作を制御する。なお、本実施形態では、CPU11は、メモリ12または記憶装置13内に格納された制御プログラムを読み出して実行するものとして説明したが、当該プログラムをCD−ROM等の記憶媒体に格納してCPU11に提供することも可能である。
図3は、上記の制御プログラムが実行されることにより実現される端末装置21の機能構成を示すブロック図である。
本実施形態の端末装置21は、図3に示されるように、動画データ取得部31と、嗜好情報入力部32と、動画ベクトル情報算出部33と、動画ベクトル情報格納部34と、区間選択部35と、要約情報生成部36、選択区間数指定部37とを備えている。
動画データ取得部31は、例えばサーバ装置10により提供されている旅行情報動画等の動画データを、ネットワーク30を介して取得する。
嗜好情報入力部32は、要約情報に含めたい各事象の係数と、要約情報に含めたい各事象の上位概念の係数を嗜好情報として入力する。
ここで、本実施形態では、要約情報を作成する編集対象の動画が旅行情報動画であるため、各事象としては、例えば、ゴルフ、テニス、乗馬、いちご狩り、ラーメン、蕎麦、すし、城、神社、寺、世界遺産等の各種項目が設定されている。
また、各事象の上位概念とは、例えば、ゴルフ、テニス、乗馬、いちご狩りという事象に対しては、上位概念としてアクティビティーという項目が設定されており、ラーメン、蕎麦、すしという事象に対しては、上位概念として、グルメという項目が設定されており、城、神社、寺、世界遺産という事象に対しては、上位概念として観光名所という項目が設定されている。
なお、この嗜好情報の詳細については後述する。
動画ベクトル情報算出部33は、動画データ取得部31により取得された動画データに基づいて、その動画データに、動画データの内容を示す各事象が含まれる確度(度合い)を事象毎にそれぞれ示した動画ベクトル情報(動画属性情報)を算出する。
具体的には、動画ベクトル情報算出部33は、動画データをその内容に応じて複数の区間に分割して、分割した区間毎に画像処理を行って各事象が含まれる確度を算出することにより動画ベクトル情報を算出する。
動画ベクトル情報格納部34は、動画データ取得部31により取得された動画データを、動画ベクトル情報算出部33により算出された動画ベクトル情報とともに格納する。
選択区間数指定部37は、動画データから要約情報を生成する際に、区間選択部35により選択される区間の数を指定する。例えば、選択区間数指定部37は、動画データが8つの区間に分割される場合、その8つの区間の中から選択する区間の数として3という値を入力する。
区間選択部35は、嗜好情報入力部32により入力された嗜好情報に基づいて、動画ベクトル情報格納部34に格納された動画データの複数の区間の中から、嗜好情報に合致した区間を前記選択区間数指定部37により指定された区間の数だけ選択する。
要約情報生成部36は、区間選択部35により選択された区間の動画に基づいて、動画内容を表した要約情報を生成する。
例えば、要約情報生成部36は、区間選択部35により選択された区間をつなぎ合わせたダイジェスト動画(要約動画)を要約情報として生成するようにしても良い。また、要約情報生成部36は、区間選択部35により選択された区間からフレーム画像を取り出した複数のダイジェスト画像(要約画像)を要約情報として生成するようにしても良い。
なお、区間選択部35が、動画データを分割した複数の区間の中から、ユーザの嗜好情報に合致した区間を選択する方法としては様々な方法がある。
例えば、区間選択部35は、嗜好情報入力部32により入力された嗜好情報のうちの各事象の係数と動画ベクトル情報における各事象の確度とから下位概念のスコア(下位概念の合致度)を、分割された区間毎に算出し、嗜好情報のうちの上位概念の係数と、その上位概念に含まれる各事象の係数と動画ベクトル情報における各事象の確度とを乗算した値のうちの最大値とから上位概念のスコア(上位概念の合致度)を区間毎に算出する。そして、区間選択部35は、下位概念のスコアと上位概念のスコアとから、その区間の嗜好情報との動画スコア(合致度)を計算して、計算された動画スコアが最も大きい区間を選択し、選択した当該区間における確度が大きな値となっている事象に対応する係数と、当該事象を含む上位概念の係数とを小さくなるように変更した後、再度残りの区間に対して嗜好情報との合致度を順次計算することにより、入力された嗜好情報に合致した区間を選択する(第1の区間選択方法)。
また、別の区間選択方法を用いる場合には、区間選択部35は、動画データを分割した複数の区間の中から、予め設定された数の区間をランダム(無作為)に選択し、ランダムに選択された各区間における事象毎の確度のうち最も大きな値を選択してその事象の確度とすることにより統合動画ベクトル情報を生成し、嗜好情報のうちの上位概念の係数と、その上位概念に含まれる各事象の係数と動画ベクトル情報における各事象の確度とを乗算した値のうちの最大値とから上位概念のスコア(上位概念の合致度)を算出し、予め設定された数の区間をランダムに選択する処理を繰り返して、算出された上位概念のスコアが最大になる区間の組み合わせを、嗜好情報に合致した区間として選択するようにしても良い(第2の区間選択方法)。
次に、本実施形態の旅行情報提供システムにおける端末装置21の動作について図面を参照して詳細に説明する。
まず、図4のフローチャートを参照して、動画ベクトル情報算出部33における動画ベクトル情報の算出処理について説明する。
動画ベクトル情報算出部33は、動画データ取得部31により取得された動画の内容を解析して、内容のまとまり毎に1つの区間とすることにより、この動画を複数の区間に分割する(ステップS101)。
ここで、動画を複数の区間に分割する方法としては、一般的に用いられている方法を利用することができる。例えば、画像の特徴量を抽出して、抽出された特徴量が大幅に変化する点を境として動画を複数区間に分割するような方法を用いることができる。また、下記に示す論文に記載された方法を用いることができる。
John S. Boreczky and Lawrence A. Rowe, “Comparison of video shot boundary detection techniques”, J. Electron. Imaging. 5(2), p122-128 (Apr 01, 1996).
次に、動画ベクトル情報算出部33は、オブジェクト検出、画像認識、シーン認識、動き解析等の方法を用いて、分割した各区間の動画に含まれる各事象をそれぞれ検出して、区間毎の動画ベクトル情報を算出する(ステップS102)。
ここで、事象検出を行う際には、各区間をさらに小区間に分割して、各小区間について事象検出処理を行って、全小区間の検出値のうちの最大値をその区間の最終的な検出値とする。ここで、それぞれの小区間は互いに重なることもある。
また、この事象検出では、構造解析を区間中の各フレームについて行い、最良構図となる瞬間を中心とした検出結果を最終的な検出値とする。
なお、この事象検出では、前景背景解析を行って、前景に対してオブジェクト検出を行い、背景に対してシーン認識を行って事象検出するようにしても良い。
ここで、確度を検出する事象がN個ある場合には、算出される動画ベクトル情報はN次元のベクトル情報となる。
次に、上記のようにして算出されるN次元の動画ベクトル情報の具体例を図5に示す。
この図5では、ある動画データを8つの区間に分割して区間1〜8毎に、N個の事象それぞれの確度(0〜1)が算出された場合が示されている。ただし、動画データを分割する区間の数は8に限定されるものではない。
そして、確度を検出する事象としては、事象1(おすし)、事象2(そば)、事象3(スキューバダイビング)、事象4(ゴルフ)、事象5(乗馬)、・・・・、事象N(城)というN個の事象が設定されている。
ここで、N個の事象それぞれの確度とは、その事象が動画に含まれている確からしさの度合いを示す値であり、数値が高いほどこの事象が動画に含まれている可能性が高いことが示されている。
そして、この8つの区間毎にそれぞれN次元の動画ベクトル情報が算出されている。例えば、区間1については、(0.196、0.179、0.195、0.412、0.134、・・・、0.312)というN次元の動画ベクトル情報が生成される。
つまり、この動画ベクトル情報は、分割された区間毎に各事象が含まれている確度を示す情報となっている。
この図5を参照すると、例えば、事象1(おすし)の確度が区間6で「0.723」と大きな値となっており、区間6の動画は、おすしを食べている動画、またはおすしを紹介している動画等のおすしに何等かの関係がある動画である可能性が高いことを示している。
次に、本実施形態の旅行情報提供システムにおける上位概念と下位概念(事象)との関係例について図6を参照して説明する。
図6に示した例では、下位概念である事象1(おすし)、事象2(そば)に対して、上位概念として上位概念1(グルメ)という項目が設定されている。また、下位概念である事象3(スキューバダイビング)、事象4(ゴルフ)、事象5(乗馬)に対して、上位概念として上位概念2(アクティビティー)という項目が設定されている。
なお、1つの上位概念について、常に下位概念である事象が複数設定されている必要はなく、上位概念3(ショッピング)と事象6(ショッピング)のように1つの上位概念に1つの事象のみが設定されているような場合もあり得る。また、1つの事象が複数の上位概念に含まれるような場合もあり得る。例えば、「城」という事象が「観光名所」という上位概念に含まれるとともに、「歴史」という上位概念に含まれるような設定とすることも可能である。
ここで、w11、w12、w23、w24、w25、w36、・・・・、wMNは、それぞれ、あるユーザにおける事象1〜Nに対する嗜好の度合いを示す係数である。また、W1、W2、W3、・・・・、WMは、それぞれ、あるユーザの上位概念1〜Mに対する嗜好の度合いを示す係数である。
つまり、各事象の係数w11、w12、w23、w24、w25、w36、・・・・、wMNのうち、要約情報に含めたい事象に対応する係数を大きく設定すれば、その事象が含まれるダイジェスト動画等の要約情報が生成されるようになる。また、各上位概念の係数W1、W2、W3、・・・・、WMのうち、要約情報に含めたい上位概念に対応する係数を大きく設定すれば、その上位概念に属する事象が含まれる要約情報が生成される確率が高くなる。
次に、嗜好情報入力部32が、端末装置22、23等からユーザA、Bの嗜好情報を入力する際に表示する入力画面例を図7〜図9を参照して説明する。
ここでは、例えば、ユーザA、Bが旅行情報提供サイトにユーザ登録を行う際のアンケートにおいて、ユーザA、Bの旅行についての嗜好を調べて嗜好情報を生成する場合を用いて説明する。
先ず、嗜好情報入力部32では、図7に示すような画面を表示して、ユーザの旅行目的としてどのような項目を重視するかを質問して、各項目を重視する度合いを入力してもらう。図7に示した画面例では、「アクティビティー」の項目が他の項目ようにも重視する旅行目的として設定されているのが分かる。
次に、嗜好情報入力部32では、図8に示すような画面を表示して、「グルメ」という上位概念に含まれる下位概念である各事象について、旅行中に食べたいかどうかの度合い入力してもらう。
また、同様にして、嗜好情報入力部32では、図9に示すような画面を表示して、「アクティビティー」という上位概念に含まれる下位概念である各事象について、旅行中にやってみたい項目の度合い入力してもらう。図9に示した画面例では、「ゴルフ」の項目が他の項目よりも重視する旅行目的として設定されているのが分かる。
そして、順次他の上位概念の項目についてもユーザに対するアンケートが行われて、そのユーザの嗜好情報の取得が行われる。
嗜好情報入力部32は、図7〜図9に示したような画面表示を行ってユーザから旅行についての嗜好情報を取得して、上位概念の係数W1、W2、・・・、WN、および下位概念である事象の係数w11、w12、w23、・・・・、wMNを嗜好情報として設定する。
このようにして図7〜図9に示すような画面例を介して取得される嗜好情報の一例を図10に示す。
図10では、上位概念の係数として、上位概念1(グルメ)についての係数W1が「0.3」、上位概念2(アクティビティー)についての係数W2が「0.9」と設定されている。つまり、このユーザは、旅行目的として食事よりもアクティビティーを重視しており、このユーザに提供する旅行情報としては、アクティビティーが含まれる情報を優先して提供するような設定がされていることになる。
また、図10では、下位概念(事象)の係数として、事象1(おすし)についての係数W11が「0.5」、事象2(そば)についての係数W12が「0.6」、事象3(スキューバダイビング)についての係数W23が「0.0」、事象4(ゴルフ)についての係数W24が「0.8」と設定されている。つまり、このユーザは、おすしやそばの旅行情報も希望しているが、これらのグルメ関係の旅行情報よりもゴルフの旅行情報を希望しているため、このような値が設定されている。
なお、嗜好情報入力部32は、上記で説明したようにユーザの入力内容に基づいて嗜好情報を入力するのではなく、そのユーザのSNS(Social Networking Service)等への書き込み内容に基づいて、自動的に嗜好情報を取得して、上位概念の係数や各事象の係数と入力するようにしても良い。
次に、この図10に示したような嗜好情報が設定された場合に、区間選択部35が、下位概念のスコア、上位概念のスコアおよび動画スコアを算出する処理を図11〜図13を参照して説明する。
まず、下位概念のスコアと上位概念のスコアの算出方法について図11を参照して説明する。なお、この図11では、区間1についての下位概念のスコアと上位概念のスコアを算出する方法を説明している。
図11に示すように、区間選択部35は、図5に示したような各区間のN次元の動画ベクトル情報(S1、S2、S3、・・・・、SN)と、図10に示したような下位概念である事象の係数w11、w12、w23、・・・・、wMNとから下位概念のスコアを算出する。
また、区間選択部35は、N次元の動画ベクトル情報(S1、S2、S3、・・・・、SN)と、図10に示したような事象の係数w11、w12、w23、・・・・、wMNと、上位概念の係数W1、W2、・・・、WNとから上位概念のスコアを算出する。
そして、区間選択部35は、下位概念のスコアと上位概念のスコアとから、動画データと嗜好情報との合致度を示す動画スコアを計算する。
次に、下位概念のスコア、上位概念のスコアおよび動画スコアの具体的な算出式を図12に示す。
まず、下位概念のスコアは、図12の式(1)に示すように、動画ベクトル情報(S1、S2、S3、・・・・、SN)と、各事象の係数w11、w12、w23、・・・・、wMNとを乗算して、その累積値を演算することにより求められる。
具体的には、下位概念は、S1・w11+S2・w12+S3・w23+・・・+SN・wMNを演算することにより求められる。
そして、上位概念のスコアは、図12の式(2)に示すように、各上位概念のカテゴリー毎に、動画ベクトル情報の各事象の確度の値と各事象の係数とを乗算した値のうちの最大値と、その上位概念のカテゴリーの係数とを乗算して、それぞれの上位概念毎に得られた値を累積することにより求められる。
例えば、上位概念1(グルメ)については、先ずmax(S1・w11、S2・w12)により、S1・w11、S2・w12のうちの最大値を求める。例えば、ここではS1・w11が最大値であった場合、この値に上位概念1の係数W1を乗算したW1・S1・w11が上位概念1についての値となる。そして、この値をそれぞれの上位概念毎に求めて、それらを累積したものが上位概念のスコアとなる。
また、動画スコアは、図12の式(3)に示すように、下位概念のスコアと上位概念のスコアにそれぞれp、(1−p)を乗算してその結果を加算することにより算出される。なお、ここでpの値は、0≦p≦1となっている。つまり、このpの値は上位概念のスコアと下位概念のスコアのうちどちらを優先するかを設定する値であり、pの値が大きいほど下位概念のスコアを優先し、pの値が小さいほど上位概念のスコアを優先することになる。
この図12に示した算出式に、図5に示した動画情報ベクトル例における区間1の値や、図10に示した係数値を代入して、下位概念のスコア、上位概念のスコア、動作スコアを具体的に算出した算出例を図13に示す。なお、図13では、動画スコアを算出する際のpの値を0.4とした場合が示されている。
図13の式(1)に示されるように、下位概念のスコアとして、0.196×0.5+0.179×0.6+・・・・+0.312×0.2=20.124という値が算出されているのが分かる。
また、図13の式(2)に示されるように、上位概念のスコアとして、0.3×0.179×0.6+0.9×0.412×0.8+・・・・+0.2×0.312×0.2=30.806という値が算出されているのが分かる。
そして、図13の式(3)に示されるように、動画スコアとして、0.4×20.124+0.6×30.806≒26.533という値が算出されているのが分かる。
そして、区間選択部35は、このような動画スコアの算出を、動画データ取得部31により取得された旅行情報動画の区間毎に算出し、算出された値に基づいて要約情報に含める区間を選択する。
次に、上記のようにして区間選択部35により実行される区間選択方法についてフローチャートを参照して説明する。
最初に、図14のフローチャートを参照して、区間毎に動画スコアを算出して、算出した動画スコアが最も大きい区間を選択するとともに、事象の係数、上位概念の係数を変更して、次の区間を順次選択する第1の区間選択方法について説明する。
まず、区間選択部35は、選択対象の各区間に対して、上位概念のスコア、下位概念のスコアを算出し(ステップS201)、算出された上位概念のスコア、下位概念のスコアから各区間の動画スコアをそれぞれ算出する(ステップS202)。
そして、区間選択部35は、算出された動画スコアが最大の区間を1つ選択する(ステップS203)。
次に、区間選択部35は、動画ベクトル情報を算出する際に用いた、各事象の係数と各上位概念の係数の中から、変更する係数を選択して、その係数の値を例えば0.5を乗算することにより小さな値となるように変更する(ステップS204)。
具体的には、区間選択部35は、例えば各事象の係数と各上位概念の係数のうち、選択した区間における確度が大きかった事象に対応する係数およびその事象の上位概念の係数を変更する。
このように係数を変更する際の具体例を図15に示す。図15では、事象4(ゴルフ)についての係数および、その事象4(ゴフル)の上位概念2(アクティビティー)の係数を変更する場合が示されている。図15を参照すると、事象4(ゴルフ)の係数が08から0.4に変更され、上位概念2(アクティビティー)の係数が0.9から0.45に変更されているのが分かる。
そして、区間選択部35は、未選択の区間がある場合(ステップS205においてyes)、その未選択の区間に対してステップS201〜S204の処理を繰り返す。例えば、区間1を選択した場合、区間選択部35は、残りの区間2〜8に対して同様の処理を実行する。
そして、区間選択部35は、全ての区間についての処理が終了すると(ステップS205においてno)、各区間の選択順を出力し(ステップS206)、選択順が予め設定された順位以内の区間を、嗜好情報に合致した区間として選択する(ステップS207)。
このようにして選択順に並び替えられた区間の具体例を図16に示す。図16に示した区間のリストでは、区間1、6、7、4、5、2、8、3という順番で各区間が選択された例が示されている。
ここで、例えば、上位3つの区間を要約情報に含める区間として選択する場合、区間1、6、7の3つの区間が区間選択部35により選択されることになる。
そして、このような区間の選択が行われた場合に要約情報生成部36により生成される要約情報の生成例を図17に示す。
図17では、要約情報に含める区間として区間1、6、7が選択されているため、例えば区間1、6、7の動画を結合することによりダイジェスト動画(要約動画)が生成される場合が示されている。
また、図17には、この区間1、6、7のフレーム画像を抜き出すことにより、旅行情報動画からダイジェスト画像(要約画像)が生成される様子が示されている。
次に、図18のフローチャートを参照して、動画データを分割した複数の区間の中からランダムに複数の区間を選択して、その複数の区間の組の動画ベクトル情報から統合動画ベクトル情報を生成して、その統合動画ベクトル情報の上位概念のスコアが大きな値となるような複数の区間の組を見つけることにより、要約情報に含める区間を選択するようにした第2の区間選択方法について説明する。
まず、区間選択部35は、前区間の中から予め設定された数分の区間をランダムに選択する(ステップS301)。例えば、選択区間数指定部37により、要約情報に含める区間の数として3区間が指定されている場合、8つの区間の中から3つの区間が選択される。
次に、区間選択部35は、選択された3つの区間のそれぞれの事象の確度のうち最大値を選択して統合動画ベクトル情報を生成する(ステップS302)。
例えば、図19に示すように、ランダムに選択された3つの区間が区間1、5、8だった場合、事象毎に確度の最大値を選択することにより統合動画ベクトル情報が生成される。
そして、区間選択部35は、生成された統合動画ベクトル情報に基づいて上位概念のスコアを算出する(ステップS303)。ここで、上位概念スコアの算出方法は、図12の式(2)に示した算出方法と同一である。
そして、区間選択部35は、算出された上位概念スコアの値が、過去に算出された値より大きい場合には、その値を格納するとともに、その区間の組の情報を保存する(ステップS304)。逆に、算出された上位概念スコアの値が過去の最大値よりも小さい場合には、区間選択部35は、その上位概念のスコアの値や区間の組の情報を廃棄する。
そして、このステップS301〜S304の処理を設定された回数、例えば100回繰り返し(ステップS305)、その後保存されている区間の組の情報を出力する(ステップS306)。
この図18のフローチャートに示した第2の区間選択方法では、ランダムに選択された複数の区間において、事象の確度の値異なる事象で大きくなっている区間の組ほど、算出される上位概念のスコアが大きくなる。
特に、上位概念のスコアの算出では、上位概念毎に、事象の確度と事象の係数とを乗算した値の最大値のみが選択される。そのため、上位概念が異なる事象において確度の値が大きくなっているような区間の組ほど、算出される上位概念のスコアが大きくなる。
例えば、図20に示すように、区間1、6、7が選択された場合、区間6において事象1(おすし)の確度が0.723と大きな値となり、区間1において事象4(ゴルフ)の確度が0.412と大きな値となっている。
そのため、図20に示したような区間の組み合わせがランダムに選択された場合、算出される上位概念のスコアも大きな値となる。
この結果、複数の区間をランダムに選択して、その区間の動画ベクトル情報から最大値のみを選択して統合動画ベクトル情報を生成して、上位概念のスコアを算出して、この上位概念のスコアが大きくなるような区間の組を見つけるようにすることにより、同じ事象の確度ばかりが大きい区間だけでなく、ユーザの嗜好情報において係数が大きく設定されている様々な事象の確度が大きい区間の組が選択されることになる。
なお、上記実施形態では、旅行情報についての動画データを複数区間に分割して、分割された複数区間の中から嗜好情報に合致した区間を選択して要約情報を生成する場合を用いて説明したが、本発明はこれに限定されるものではなく、旅行情報動画以外の他の動画データから要約情報を生成する場合でも同様に本発明を適用することができるものである。
10 サーバ装置
11 CPU
12 メモリ
13 記憶装置
14 通信インタフェース(IF)
15 ユーザインタフェース(UI)装置
16 制御バス
21〜23 端末装置
30 ネットワーク
31 動画データ取得部
32 嗜好情報入力部
33 動画ベクトル情報算出部
34 動画ベクトル情報格納部
35 区間選択部
36 要約情報生成部
37 選択区間数指定部

Claims (8)

  1. 動画データを、当該動画データを分割した区間毎に各事象が含まれる確度を前記事象毎にそれぞれ示した動画属性情報とともに格納する格納手段と、
    要約情報に含めたい各事象に関する第1情報と、要約情報に含めたい前記各事象の上位概念に関する第2情報とを入力する入力手段と、
    前記入力手段により入力された第1情報と第2情報とに基づいて、前記格納手段に格納された動画データの複数の区間の中から、当該第1情報及び第2情報に合致した区間を選択する選択手段と、
    前記選択手段により選択された区間の動画に基づいて、当該動画内容を表した要約情報を生成する生成手段と、
    を備えた動画編集装置。
  2. 動画データをその内容に応じて複数の区間に分割して、分割した区間毎に画像処理を行って前記各事象が含まれる確度をそれぞれ算出することにより前記動画属性情報を算出する算出手段をさらに備えた請求項1記載の動画編集装置。
  3. 前記選択手段は、前記第1情報及び第2情報のうちの各事象に関する第1情報と前記動画属性情報における各事象の確度とから下位概念の合致度を前記区間毎に算出し、前記第1情報及び第2情報のうちの上位概念に関する第2情報と、当該上位概念に含まれる各事象に関する第1情報と前記動画属性情報における各事象の確度とを乗算した値のうちの最大値とから上位概念の合致度を前記区間毎に算出し、前記下位概念の合致度と前記上位概念の合致度とから、当該区間の第1情報及び第2情報との合致度を計算して、計算された合致度が最も大きい区間を選択し、選択した当該区間における確度が大きな値となっている事象に対応する第1情報と、当該事象を含む上位概念に関する第2情報とを小さくなるように変更した後、再度残りの区間に対して第1情報及び第2情報との合致度を順次計算することにより、入力された第1情報及び第2情報に合致した区間を選択する請求項1または2項記載の動画編集装置。
  4. 前記選択手段は、動画データを分割した複数の区間の中から、予め設定された数の区間を無作為(ランダム)に選択し、無作為に選択された各区間における前記事象毎の確度のうち最も大きな値を選択して当該事象の確度とすることにより統合動画属性情報を生成し、前記第1情報及び第2情報のうちの上位概念に関する第2情報と、当該上位概念に含まれる各事象に関する第1情報と前記動画属性情報における各事象の確度とを乗算した値のうちの最大値とから上位概念の合致度を算出し、予め設定された数の区間を無作為に選択する処理を繰り返して、算出された上位概念の合致度が最大になる区間の組み合わせを、前記第1情報及び第2情報に合致した区間として選択する請求項1または2項記載の動画編集装置。
  5. 前記生成手段は、前記選択手段により選択された区間をつなぎ合わせた要約動画を要約情報として生成する請求項1から4のいずれか1項記載の動画編集装置。
  6. 前記生成手段は、前記選択手段により選択された区間からフレーム画像を取り出した複数の要約画像を要約情報として生成する請求項1から4のいずれか1項記載の動画編集装置。
  7. 前記選択手段により選択される区間の数を指定する指定手段をさらに備えた請求項1から6のいずれか1項記載の動画編集装置。
  8. 動画データを、当該動画データを分割した区間毎に各事象が含まれる確度を前記事象毎にそれぞれ示した動画属性情報とともに格納する格納ステップと、
    要約情報に含めたい各事象に関する第1情報と、要約情報に含めたい前記各事象の上位概念に関する第2情報とを入力する入力ステップと、
    前記入力ステップにおいて入力された第1情報及び第2情報に基づいて、前記格納ステップにおいて格納された動画データの複数の区間の中から、当該第1情報及び第2情報に合致した区間を選択する選択ステップと、
    前記選択ステップにより選択された区間の動画に基づいて、当該動画内容を表した要約情報を生成する生成ステップと、
    をコンピュータに実行させるためのプログラム。
JP2016043051A 2016-03-07 2016-03-07 動画編集装置およびプログラム Active JP6663134B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016043051A JP6663134B2 (ja) 2016-03-07 2016-03-07 動画編集装置およびプログラム
US15/233,516 US10049701B2 (en) 2016-03-07 2016-08-10 Video editing apparatus, video editing method, and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016043051A JP6663134B2 (ja) 2016-03-07 2016-03-07 動画編集装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2017163181A JP2017163181A (ja) 2017-09-14
JP6663134B2 true JP6663134B2 (ja) 2020-03-11

Family

ID=59723726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016043051A Active JP6663134B2 (ja) 2016-03-07 2016-03-07 動画編集装置およびプログラム

Country Status (2)

Country Link
US (1) US10049701B2 (ja)
JP (1) JP6663134B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113079420B (zh) * 2020-01-03 2024-10-18 北京三星通信技术研究有限公司 视频生成方法、装置、电子设备及计算机可读存储介质
JP2024008334A (ja) * 2022-07-08 2024-01-19 株式会社東芝 情報処理装置、情報処理方法およびプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100305964B1 (ko) * 1999-10-22 2001-11-02 구자홍 사용자 적응적인 다단계 요약 스트림 제공방법
KR100357261B1 (ko) * 1999-12-30 2002-10-18 엘지전자 주식회사 멀티미디어 데이터의 의미적/구조적 정보 생성방법 및 그 정보의 기록매체와 멀티미디어 검색 및 브라우징 방법
JP2002232828A (ja) * 2001-01-29 2002-08-16 Jisedai Joho Hoso System Kenkyusho:Kk 映像ダイジェスト作成方法
JP2002259720A (ja) * 2001-03-02 2002-09-13 Internatl Business Mach Corp <Ibm> コンテンツ要約システム、映像要約システム、ユーザ端末、要約映像生成方法、要約映像受信方法、およびプログラム
JP3803301B2 (ja) * 2002-03-05 2006-08-02 日本電信電話株式会社 要約区間判定方法、要約情報提供方法、それらの方法を用いた装置、およびプログラム
JP2004126811A (ja) 2002-09-30 2004-04-22 Toshiba Corp コンテンツ情報編集装置とその編集プログラム
JP2009302985A (ja) * 2008-06-16 2009-12-24 Nippon Telegr & Teleph Corp <Ntt> 映像推薦方法、映像推薦装置、映像推薦プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2011217209A (ja) 2010-03-31 2011-10-27 Sony Corp 電子機器、コンテンツ推薦方法及びプログラム
JP2012038239A (ja) * 2010-08-11 2012-02-23 Sony Corp 情報処理装置、情報処理方法、及び、プログラム
JP6731178B2 (ja) * 2016-03-07 2020-07-29 富士ゼロックス株式会社 動画検索装置およびプログラム

Also Published As

Publication number Publication date
US20170256284A1 (en) 2017-09-07
US10049701B2 (en) 2018-08-14
JP2017163181A (ja) 2017-09-14

Similar Documents

Publication Publication Date Title
US11977542B2 (en) In-line editing of search refinements
JP5909228B2 (ja) ズーム可能なシーン内のズーム操作に関する代替意味論
KR101985714B1 (ko) 유연한 이미지 레이아웃
JP5846442B2 (ja) 情報処理装置、情報処理方法、および、プログラム
EP3739470A1 (en) Method and apparatus for performing categorised matching of videos, and selection engine
US20140108316A1 (en) Augmenting Recommendation Algorithms Based on Similarity Between Electronic Content
JP2015204105A (ja) 推薦情報を提供するための方法および装置
US8200023B2 (en) Method and system for processing photo product templates
EP3353681A1 (en) Computer-aided navigation of digital graphic novels
KR102001848B1 (ko) 애플리케이션-맞춤형 객체 사전-확대
US20180060743A1 (en) Electronic Book Reader with Supplemental Marginal Display
JP2019200782A (ja) グリフを生成する方法並びに生成されたグリフに基づきデータの視覚的表現を作成する方法、プログラム及びコンピュータ装置
WO2017196408A1 (en) Coalescing notifications associated with interactive digital content
US10126902B2 (en) Contextual help system
JP6663134B2 (ja) 動画編集装置およびプログラム
JP6731178B2 (ja) 動画検索装置およびプログラム
RU2586249C2 (ru) Способ обработки поискового запроса и сервер
US20240223872A1 (en) Automated preview generation for video entertainment content
US9298712B2 (en) Content and object metadata based search in e-reader environment
US20230205981A1 (en) System for superimposed communication by object oriented resource manipulation on a data network
RU2605001C2 (ru) Способ обработки поискового запроса пользователя и сервер, используемый в нем
CN114556330A (zh) 评估数字内容的视觉质量
US20160179804A1 (en) Bulk keyword management application
JP7386890B2 (ja) 製品ソースリンクを使用したメディア注釈
CN113553505A (zh) 视频推荐方法、装置及计算设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190123

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191031

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200128

R150 Certificate of patent or registration of utility model

Ref document number: 6663134

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350