JP2005167456A - Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置 - Google Patents

Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置 Download PDF

Info

Publication number
JP2005167456A
JP2005167456A JP2003401248A JP2003401248A JP2005167456A JP 2005167456 A JP2005167456 A JP 2005167456A JP 2003401248 A JP2003401248 A JP 2003401248A JP 2003401248 A JP2003401248 A JP 2003401248A JP 2005167456 A JP2005167456 A JP 2005167456A
Authority
JP
Japan
Prior art keywords
content
interest feature
program
feature
interest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003401248A
Other languages
English (en)
Inventor
Meiko Masaki
芽衣子 正木
Masayuki Misaki
正之 三▲さき▼
Takeshi Kawamura
岳 河村
Toshihiko Date
俊彦 伊達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2003401248A priority Critical patent/JP2005167456A/ja
Publication of JP2005167456A publication Critical patent/JP2005167456A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】AVコンテンツのジャンル毎に特定の特徴量に絞り、その特徴量が変化する区間のみに着目しているため、作品全体の中でのその場面の位置づけや、全体の流れといった番組構造に関わる興趣特徴パターンを抽出することができない。また、多様なユーザの視点に答えるためには、ジャンル毎に特定の特徴量だけの増減に着目した、狭い区間での判定ではなく、作品全体を大局的に判断する仕組みが必要である。
【解決手段】前記従来の課題を解決するために、AVコンテンツにおける興趣の時間的変化の様子を作品毎にパターン化し、そのパターンを用いてAVコンテンツの分類を行うことができるAVコンテンツ興趣特徴抽出装置を提供する。このことによって、大量のAVコンテンツからユーザが所望するAVコンテンツをユーザ自身で直感的に選択が可能となる。
【選択図】図1

Description

本発明はAVコンテンツの録画や再生、編集等を行うAVコンテンツ関連装置において、AVコンテンツの検索あるいは内容把握の効率化を図るために、蓄積されたAVコンテンツに対し、興趣を示す興趣特徴を推定し、その興趣特徴の時間推移を用いて1作品毎に表示や分類及び検索を行うための装置に関するものである。
近年、AVコンテンツの録画や再生、編集等AVコンテンツを行うAVコンテンツ関連装置の大容量化に伴い、映像の検索あるいは内容把握の効率化を図るための手段が求められている。その一つとして、AVコンテンツを短時間に要約したAVコンテンツ(以下要約コンテンツという)を提供するダイジェスト再生(要約再生)が研究されている。要約再生では、AVコンテンツの中から重要と思われるシーンを利用し、残りシーンの削除を行い、短縮した時間での再生を可能にしている。重要と思われるシーンの判定には、スポーツやニュースなど特定のジャンルごとに、特定のパラメータを設定し、判定を行っている。そのため、特定のパラメータの値が大きくなる近傍付近のみでそのシーンが要約再生として採用されるかが決められている。
従来、AVコンテンツデータベースなど大量に蓄積されたものを効率的に利用するため、ジャンル情報を取得し、音声の特徴を利用して、番組の要約を行っているものがあった(例えば、特許文献1参照)。図9は、前記特許文献1に記載された従来例を示すものである。
要約再生装置201は、入力された音声映像情報に付帯されている付帯情報を検出し、付帯情報を分離するデマルチプレクサ210と、デマルチプレクサ210によって付帯情報が除去された音声映像情報から予め設定されたパラメータに基づいて音声特徴量を取得する音声特徴量抽出部202と、デマルチプレクサ210から入力された付帯情報からジャンル情報を取得するジャンル情報取得部203と、ジャンル情報に基づいて音声特徴量を抽出する際の最適なパラメータを設定するパラメータ設定部206と、設定されたパラメータに適合する音声特徴量に基づいて蓄積された音声映像情報における抽出すべき要約セグメントを決定するとともにこの要約セグメントに基づいて再生部207を制御する制御部208とを備え、ジャンル毎に最適化されたパラメータによって要約再生を行うようになっている。
特開2003−101939号公報(第1頁、図1)
しかしながら、前記従来の構成では、AVコンテンツのジャンル毎に特定の特徴量に絞り、その特徴量が変化する区間のみに着目しているため、作品全体の中でのその場面の位置づけや、全体の流れといった番組構造に関わる興趣特徴パターンを抽出することができない。例えば、ニュース番組では冒頭に事件の見出しとなるような一文を話し、次の事件の内容に移る際には一定の無音区間があるなど、決まった構造をもちやすい。そのため、ある特定の特徴量のみで、結果を述べていると思われるシーンを定めることができる。しかし、結果のみが重要というわけではなく、何が重要かはユーザによって異なる。結果のみではなく、全体の話の展開を楽しむドラマや、選手のかけひきに着目し順を追って見たい視聴者には、結果のみに着目し、その他のシーンでは、削除を伴うAVコンテンツの要約再生は適切ではない。また、このように、多様なユーザの視点に答えるためには、ジャンル毎に特定の特徴量だけの増減に着目した、狭い区間での判定ではなく、作品全体を大局的に判断する仕組みが必要である。
本発明は、前記従来の課題を解決するもので、大量のAVコンテンツからユーザが所望するAVコンテンツをユーザ自身で直感的に選択を可能にするために、AVコンテンツにおける興趣の時間的変化の様子を作品毎にパターン化し、そのパターンを用いてAVコンテンツの分類を行うことができるAVコンテンツ興趣特徴抽出装置を提供することを目的とする。AVコンテンツの興趣パターンは、スポーツ中継番組であれば、得点シーンなど、観客が盛り上がっている場面、バラエティ番組では、笑いや拍手が多く発生している場面などで値が大きくなる。
前記従来の課題を解決するために、請求項1の発明は、AVコンテンツ興趣特徴抽出方法において、AVコンテンツのオーディオ信号から所定の音響的な特徴量を算出し、前記AVコンテンツに含まれる書誌情報を抽出し、前記音響的な特徴量から所定の音響イベントを算出し、前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出し、前記音響イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出することを特徴とするものである。
また、請求項2の発明は、請求項1記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴推定情報はAVコンテンツのジャンルを示す情報であることを特徴とするものである。
また、請求項3の発明は、請求項1記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴推定情報は前記書誌情報から推定することを特徴とするものである。
また、請求項4の発明は、請求項1記載のAVコンテンツ興趣特徴抽出方法において、前記音響イベントは特定の意味をもつ単音や音の集まりであることを特徴とするものである。
また、請求項5の発明は、請求項1記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴の時間的な変動を時系列で表示することを特徴とするものである。
また、請求項6の発明は、請求項5記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴の時間的な変動と共に、前記書誌情報もあわせて表示することを特徴とするものである。
また、請求項7の発明は、請求項5または6記載のAVコンテンツ興趣特徴抽出方法において、表示された前記番組興趣特徴において指定された箇所に対応する前記AVコンテンツの時間位置から前記AVコンテンツを再生可能にすることを特徴とするものである。
また、請求項8の発明は、請求項1記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴から番組興趣特徴パターンを抽出し、前記抽出した番組興趣特徴パターンを予め定められた基準に従って分類することを特徴とするものである。
また、請求項9の発明は、請求項8記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴パターンは作品時間で正規化することを特徴とするものである。
また、請求項10の発明は、請求項8記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴パターンは前記番組興趣特徴の時間的な変動を示す曲線の山の数に着目し分類することを特徴とするものである。
また、請求項11の発明は、請求項8記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴パターンは前記番組興趣特徴の時間的な変動を示す曲線の山の位置に着目し分類することを特徴とするものである。
また、請求項12の発明は、請求項8記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴パターンは前記番組興趣特徴の時間的な変動を示す曲線の山の数と位置に着目し分類することを特徴とするものである。
また、請求項13の発明は、請求項8記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴パターンから前記AVコンテンツの重要箇所を抽出することを特徴とするものである。
また、請求項14の発明は、請求項13記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴パターンごとに前記重要箇所の抽出方法を設定することを特徴とするものである。
また、請求項15の発明は、請求項13記載のAVコンテンツ興趣特徴抽出方法において、前記重要箇所は前記番組興趣特徴パターン曲線の山の部分を抽出することを特徴とするものである。
また、請求項16の発明は、請求項13記載のAVコンテンツ興趣特徴抽出方法において、前記重要箇所として抽出された部分をつなぎあわせて再生可能にすることを特徴とするものである。
また、請求項17の発明は、請求項13記載のAVコンテンツ興趣特徴抽出方法において、前記重要箇所として抽出されなかった部分を速い速度で再生可能にすることを特徴とするものである。
また、請求項18の発明は、請求項1記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴推定情報から前記算出する所定の音響的な特徴量を決定することを特徴とするものである。
また、請求項19の発明は、AVコンテンツ興趣特徴抽出方法において、AVコンテンツの映像信号から所定の動画像特徴量を算出し、前記AVコンテンツに含まれる書誌情報を抽出し、前記動画像特徴量から所定の動画像イベントを算出し、前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出し、前記動画像イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出することを特徴とするものである。
また、請求項20の発明は、請求項19記載のAVコンテンツ興趣特徴抽出方法において、前記動画像イベントは特定の意味をもつ画像の集まりであることを特徴とするものである。
また、請求項21の発明は、請求項19記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴推定情報から前記算出する所定の動画像特徴量を決定することを特徴とするものである。
また、請求項22の発明は、AVコンテンツ興趣特徴抽出方法において、AVコンテンツの映像信号から所定の動画像特徴量を算出し、前記AVコンテンツのオーディオ信号から所定の音響的な特徴量を算出し、前記AVコンテンツに含まれる書誌情報を抽出し、前記動画像特徴量から所定の動画像イベントを算出し、前記音響的な特徴量から所定の音響イベントを算出し、前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出し、前記動画像イベントと、前記音響イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出することを特徴とするものである。
また、請求項23の発明は、請求項22記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴推定情報から前記算出する所定の音響的な特徴量および動画特徴量を決定することを特徴とするものである。
また、請求項24の発明は、請求項8記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴パターンを蓄積し、検索条件となる前記番組興趣特徴パターンを指定し、類似した前記番組興趣特徴パターンをもつ前記AVコンテンツを検索することを特徴とするものである。
また、請求項25の発明は、請求項24記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴パターンは前記書誌情報をあわせて蓄積することを特徴とするものである。
また、請求項26の発明は、請求項24記載のAVコンテンツ興趣特徴抽出方法において、前記検索条件は前記番組興趣特徴パターンと時間情報をもつことを特徴とするものである。
また、請求項27の発明は、請求項24記載のAVコンテンツ興趣特徴抽出方法において、前記検索条件は前記番組興趣特徴パターンとキーワードをもつことを特徴とするものである。
また、請求項28の発明は、請求項24記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴パターンと、前記番組興趣特徴パターンに対応する語句との関係を保持し、前記検索条件は前記番組興趣特徴パターンに対応した語句であることを特徴とするものである。
また、請求項29の発明は、請求項24記載のAVコンテンツ興趣特徴抽出方法において、過去にユーザが入力した前記検索条件の履歴を保持しておき、前記ユーザが前記検索条件を入力する際に前記保持された履歴から前記検索条件を選択可能であることを特徴とするものである。
また、請求項30の発明は、請求項29記載のAVコンテンツ興趣特徴抽出方法において、前記検索条件の履歴は前記ユーザ自身もしくは前記ユーザと嗜好の類似した人物の履歴であることを特徴とするものである。
また、請求項31の発明は、請求項1、19、22のいずれかに記載のAVコンテンツ興趣特徴抽出方法において、前記番組興趣特徴の推定条件が変更可能であることを特徴とするものである。
また、請求項32の発明は、請求項31記載のAVコンテンツ興趣特徴抽出方法において、前記推定条件は重視する前記音響イベントや前記動画像イベントであることを特徴とするものである。
また、請求項33の発明は、AVコンテンツ興趣特徴抽出装置において、AVコンテンツのオーディオ信号から所定の音響的な特徴量を算出するオーディオ特徴量抽出手段と、前記AVコンテンツに含まれる書誌情報を抽出する書誌情報抽出手段と、前記音響的な特徴量から所定の音響イベントを算出する音響イベント抽出手段と、前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出する興趣条件選択手段と、前記音響イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出する興趣推定手段とを有することを特徴とするものである。
また、請求項34の発明は、請求項33記載のAVコンテンツ興趣特徴抽出装置において、前記興番組興趣特徴推定情報はAVコンテンツのジャンルを示す情報であることを特徴とするものである。
また、請求項35の発明は、請求項33記載のAVコンテンツ興趣特徴抽出装置において、前記興趣条件選択手段は前記書誌情報から前記番組興趣特徴推定情報を推定することを特徴とするものである。
また、請求項36の発明は、請求項33記載のAVコンテンツ興趣特徴抽出装置において、前記音響イベントは特定の意味をもつ単音や音の集まりであることを特徴とするものである。
また、請求項37の発明は、請求項33記載のAVコンテンツ興趣特徴抽出装置において、前記番組興趣特徴の時間的な変動を時系列で表示する興趣推移表示手段を有することを特徴とするものである。
また、請求項38の発明は、請求項37記載のAVコンテンツ興趣特徴抽出装置において、前記興趣推移表示手段は、前記番組興趣情報の時間的な変動と共に前記書誌情報もあわせて表示することを特徴とするものである。
また、請求項39の発明は、請求項37または38記載のAVコンテンツ興趣特徴抽出装置において、前記興趣推移表示手段は、表示された前記番組興趣特徴において指定された箇所に対応する前記AVコンテンツの時間位置から前記AVコンテンツを再生可能にすることを特徴とするものである。
また、請求項40の発明は、請求項33記載のAVコンテンツ興趣特徴抽出装置において、前記番組興趣特徴から番組興趣特徴パターンを抽出し、前記抽出した番組興趣特徴パターンを予め定められた基準に従って分類する状態遷移判定分類手段を有することを特徴とするものである。
また、請求項41の発明は、請求項40記載のAVコンテンツ興趣特徴抽出装置において、前記状態遷移判定分類手段は、前記番組興趣特徴を作品時間で正規化し、前記番組興趣特徴パターンに分類することを特徴とするものである。
また、請求項42の発明は、請求項40記載のAVコンテンツ興趣特徴抽出装置において、前記状態遷移判定分類手段は、前記番組興趣特徴の時間的な変動を示す曲線の山の数に着目して前記番組興趣特徴パターンに分類することを特徴とするものである。
また、請求項43の発明は、請求項40記載のAVコンテンツ興趣特徴抽出装置において、前記状態遷移判定分類手段は、前記番組興趣特徴の時間的な変動を示す曲線の山の位置に着目して前記番組興趣特徴パターンに分類することを特徴とするものである。
また、請求項44の発明は、請求項40記載のAVコンテンツ興趣特徴抽出装置において、前記状態遷移判定分類手段は、前記番組興趣特徴の時間的な変動を示す曲線の山の数と位置に着目して前記番組興趣特徴パターンに分類することを特徴とするものである。
また、請求項45の発明は、請求項40記載のAVコンテンツ興趣特徴抽出装置において、前記番組興趣特徴パターンから前記AVコンテンツの重要箇所を抽出する重要箇所抽出手段を有することを特徴とするものである。
また、請求項46の発明は、請求項45記載のAVコンテンツ興趣特徴抽出装置において、前記重要箇所抽出手段は前記番組興趣特徴パターンごとに抽出方法を設定することを特徴とするものである。
また、請求項47の発明は、請求項45記載のAVコンテンツ興趣特徴抽出装置において、前記重要箇所抽出手段は前記番組興趣特徴パターン曲線の山の部分を抽出することを特徴とするものである。
また、請求項48の発明は、請求項45記載のAVコンテンツ興趣特徴抽出装置において、前記重要箇所抽出手段により前記重要箇所として抽出された部分をつなぎあわせて再生可能にすることを特徴とするものである。
また、請求項49の発明は、請求項45記載のAVコンテンツ興趣特徴抽出装置において、前記重要箇所抽出手段により前記重要箇所として抽出されなかった部分を速い速度で再生可能にすることを特徴とするものである。
また、請求項50の発明は、請求項33記載のAVコンテンツ興趣特徴抽出装置において、前記番組興趣特徴推定情報から前記算出する所定の音響的な特徴量を決定することを特徴とするものである。
また、請求項51の発明は、AVコンテンツ興趣特徴抽出装置において、AVコンテンツの映像信号から所定の動画像特徴量を算出する動画像特徴量抽出手段と、前記AVコンテンツに含まれる書誌情報を抽出する書誌情報抽出手段と、前記動画像特徴量から所定の動画像イベントを算出する動画像イベント抽出手段と、前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出する興趣条件選択手段と、前記動画像イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出する興趣特徴推定手段とを有することを特徴とするものである。
また、請求項52の発明は、請求項51記載のAVコンテンツ興趣特徴抽出装置において、前記番組興趣特徴推定情報から前記算出する所定の動画像特徴量を決定することを特徴とするものである。
また、請求項53の発明は、請求項51記載のAVコンテンツ興趣特徴抽出装置において、前記動画像イベントは特定の意味をもつ画像の集まりであることを特徴とするものである。
また、請求項54の発明は、AVコンテンツ興趣特徴抽出装置において、前記AVコンテンツの映像信号から所定の動画像特徴量を算出する動画像特徴量抽出手段と、前記AVコンテンツのオーディオ信号から所定の音響的な特徴量を算出するオーディオ特徴量抽出手段と、前記AVコンテンツに含まれる書誌情報を抽出する書誌情報抽出手段と、前記動画像特徴量から所定の動画像イベントを算出する動画像特徴量抽出手段と、前記音響的な特徴量から所定の音響イベントを算出する音響イベント抽出手段と、前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出する興趣条件選択手段と、前記動画像イベントと、前記音響イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出する興趣推定手段とを有することを特徴とするものである。
また、請求項55の発明は、請求項54記載のAVコンテンツ興趣特徴抽出装置において、前記番組興趣特徴推定情報から前記算出する所定の音響的な特徴量及び動画像特徴量を決定することを特徴とするものである。
また、請求項56の発明は、請求項40記載のAVコンテンツ興趣特徴抽出装置において、前記番組興趣特徴パターンを蓄積する蓄積手段と、検索条件となる前記番組興趣特徴パターンを指定するユーザ入力手段と、類似した前記番組興趣特徴パターンをもつAVコンテンツを検索する検索手段とを有することを特徴とするものである。
また、請求項57の発明は、請求項56記載のAVコンテンツ興趣特徴抽出装置において、前記蓄積手段は前記番組興趣特徴パターンと前記書誌情報をあわせて蓄積することを特徴とするものである。
また、請求項58の発明は、請求項56記載のAVコンテンツ興趣特徴抽出装置において、前記ユーザ入力手段は前記検索条件として前記番組興趣特徴パターンと時間情報を入力することを特徴とするものである。
また、請求項59の発明は、請求項56記載のAVコンテンツ興趣特徴抽出装置において、前記ユーザ入力手段は前記検索条件として前記番組興趣特徴パターンとキーワードを入力することを特徴とするものである。
また、請求項60の発明は、請求項56記載のAVコンテンツ興趣特徴抽出装置において、前記検索手段は前記番組興趣特徴パターンと、前記番組興趣特徴パターンに対応する語句との関係を保持し、前記ユーザ入力手段は、前記検索条件として前記番組興趣特徴パターンに対応した語句を入力することを特徴とするものである。
また、請求項61の発明は、請求項56記載のAVコンテンツ興趣特徴抽出装置において、前記検索手段は、過去にユーザが入力した前記検索条件の履歴を保持しておき、前記ユーザが前記検索条件を入力する際に前記保持された履歴から前記検索条件を選択可能であることを特徴とするものである。
また、請求項62の発明は、請求項61記載のAVコンテンツ興趣特徴抽出装置において、前記検索条件の履歴は前記ユーザ自身もしくは前記ユーザと嗜好の類似した人物の履歴であることを特徴とするものである。
また、請求項63の発明は、請求項33、51、54のいずれかに記載のAVコンテンツ興趣特徴抽出装置において、前記興趣推定手段において、前記番組興趣特徴の推定条件が変更可能であることを特徴とするものである。
また、請求項64の発明は、請求項63記載のAVコンテンツ興趣特徴抽出装置において、前記推定条件は重視する前記音響イベントや前記動画像イベントであることを特徴とするものである。
本発明のAVコンテンツ興趣特徴抽出装置によれば、本構成によって、番組興趣特徴が得られることから、AVコンテンツ一作品を通しての番組興趣特徴時間的推移パターンを推定し、そのパターンを用いてAVコンテンツの分類を行うことにより、ユーザが所望するAVコンテンツをユーザ自身がより直感的に判断することができる。
また、番組興趣特徴の時間的な変動を時系列で表示することにより、各々のAVコンテンツについて、どのくらい重要箇所、即ち見所があるのか、見所はどこか、など作品全体の流れを大局的に判断する材料を提供することが可能となる。
また、番組興趣特徴パターンにより重要箇所を抽出することや、同じような番組興趣特徴パターンをもつAVコンテンツの検索を行うことができる。
また、番組興趣特徴の抽出ルールをユーザが設定できるようにすることにより、予め設定されているルールで抽出した番組興趣特徴ではなく、ユーザ独自の好みのルールに基づいた番組興趣特徴を抽出することができる。
以下本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
図1は、本発明の実施の形態1におけるAVコンテンツ興趣特徴抽出装置のブロック図である。
図1において、AVコンテンツ興趣特徴抽出装置120は、通信回線から送信された、または、図示にない受信部によって受信されたデジタル音声映像情報と、EPGや字幕情報、インターネット上にあるAVコンテンツの紹介ページ等、その番組に関する書誌情報が入力される。書誌情報は、例えば、ニュース番組、スポーツ中継番組、映画、ドラマ、歌番組およびバラエティ番組などのジャンル情報を一部に有しており、BSデジタル放送では、番組配列情報がこの番組に関する書誌情報に当たる。書誌情報はあらかじめ番組に付帯しているものや番組表などの公の情報、web等の視聴者が作成したような口コミ情報、またコンテンツ自身を解析することで得られる字幕認識結果や音声認識結果の書誌情報も含む。この書誌情報抽出手段102では、AVコンテンツの種別情報や時間情報を抽出するとともに、出演者名やタイトル名など、他の情報もAVコンテンツごとに抽出される。この情報はAVコンテンツ興趣特徴を算出する際の特徴量になるだけではなく、AVコンテンツ興趣情報を表示する際に番組内容として、書誌情報の一部もしくはすべてが表示される。また、AVコンテンツの検索キーワードとしても用いることができる。
オーディオ特徴量抽出手段101は、入力されたオーディオ信号に基づいて単位時間での分析を行って、音声、音楽、歓声、無音といった音響イベントを特定するための特徴量を算出する。特徴量としては、パワー包絡線の近似直線の傾きや数秒後のパワー値の比など音量変化に関する特徴量と、周波数重心や特定周波数の変化度合いを算出したり、エネルギー分布の比較を行ったりするスペクトルに関する特徴量と、自己相関等を用いて時間軸や周波数軸の波形とのマッチング具合を算出した特徴量と、ある閾値での交差回数や時間変化による推移求めた特徴量などを算出する。時間幅や周波数帯域だけが異なり、算出方法の共通したものもある。
オーディオ特徴量抽出手段で算出された各パラメータの値は、音響イベント抽出手段104で音響イベントの抽出に用いられる。音響イベントとは特定の意味をもつ単音や音の集まりをさす。例えば、図11に一例を示すように、音楽や音声、歓声などを指している。音響イベント抽出手段は特定の音響イベントの区間を推定するものである。音響イベント抽出手段は、あらかじめ音響イベントを判定する基準を音響イベントごとに持っており、オーディオ特徴量抽出手段で算出された特徴量と比較して音響イベントを算出する。例えば、音楽であれば、音の持続性を示す特徴量、ベース音を示す低域でのエネルギー分布を示す特徴量、周期的な繰り返し音つまりビートがあるかどうかを示す特徴量の値などが大きいときに音楽と判定する。このように、音響イベント判定に用いる特徴量の種類と閾値及び判定条件を音響イベントごとにあらかじめ用意している。なお、今回は閾値による判定を用いて説明したが、音響イベントごとに特徴量を算出した教師用のデータを作成し、それに基づいて機械学習を行い、作成されたモデルに基づき、音響イベントを検出しても同様の効果が得られる。また、特徴量の次元を主成分分析や線形判別分析などを用いて次元圧縮を行ったのちに閾値や評価関数による判別を行うか、学習によってモデル関数を作成し判別しても同様の効果が得られる。
興趣条件選択手段103は、書誌情報抽出手段の出力から興趣条件の基準となるジャンル情報を抽出する。書誌情報にジャンル情報が定義されていない場合は、書誌情報抽出手段で得られたキーワードから、ジャンルを推定する。事前にジャンルとタイトルに用いられる語句の共起頻度を調べておく。タイトルの用いられている語句について、最も高い共起頻度をもつジャンルをそのコンテンツのジャンルとする。例えば、タイトルに「ミュージック」や「歌」のような文字が含まれている場合は、そのAVコンテンツは歌番組であると判定する。また、タイトルに「第×話」のような文字が含まれている場合は、そのAVコンテンツはドラマであると判定する。尚、今回はタイトルに含まれる語句のみを用いて説明したが、タイトルだけではなく出演者など他の書誌情報を用いても同様の効果が得られる。
興趣推定手段105はジャンル情報と音響イベントの種類と発生頻度及び発生時間間隔、そして重なり具合から番組興趣特徴を算出する。番組興趣特徴とは、番組の重要なところやおもしろいところほど値が大きくなり、時間毎に算出される値である。たとえば、スポーツ中継番組であれば、歓声などの背景雑音には観客の反応が現れるので、野球のホームランのシーンやサッカーのゴールシーンなど盛り上がった場面では、自然にアナウンサーや観衆の声、つまり音声や歓声が大きくなる。このような音響イベントのパターンの検出を興趣推定手段105で行う。番組興趣特徴と各音響イベントとジャンルとの関係を示す一例を図11に示す。音楽番組では音楽部分が重要なため音楽が大きく他の音響イベントが小さいときに番組興趣特徴が大きくなる。スポーツ番組で音楽イベントが大きいときは、選手入場や応援など試合経過に影響を与えない部分が多いため番組興趣特徴が小さくなる。このように、番組興趣特徴の値を算出するための音響イベントの閾値及び判定条件をジャンルごとにあらかじめ設定しておく。また、番組興趣特徴は、ある時点で同時に起きた音響イベントの大小のみならず、音響イベントの種類と頻度及び時間間隔またそれらの重畳具合のパターンによって決定する。図12は番組興趣特徴の推定例を示したものである。番組興趣特徴はある単位時間フレーム内での音響イベントをジャンル等のAVコンテンツ内容情報に基づきあらかじめ設定された条件から算出される値である。そのため図12(a)のように、音楽番組では音楽の区間では番組興趣特徴が大きく、音楽が終わった直後に番組興趣特徴が小さくなる。これは音楽番組というジャンル情報から音楽イベントを重要と位置づけているためで、また似たような音響イベントを持つ場合でもAVコンテンツ内容によってその番組興趣特徴は全く異なる。
例えば、図12(b)は野球中継の音響イベント及び番組興趣特徴を示している。音楽区間は応援音声であり、突発音はホームランの音を示している。この場合、番組興趣特徴はホームランを打った瞬間が最も高くなる。これは突発音のあとに歓声が発生しているため、重要な突発音として処理されているためである。このように、番組興趣特徴は時間的に前後に発生しているイベントも考慮して、各音響イベントの頻度及び時間間隔またそれらの重畳具合を算出し、閾値を用いて判別を行う。なお、これら音響イベントの頻度及び時間間隔またそれらの重畳具合を多次元ベクトルで表現し、あらかじめ学習アルゴリズムによってモデルを作成し、それを用いて算出を行っても同様の効果が得られる。
興趣推移表示手段106は、番組興趣特徴を一作品の開始から終了まで時系列で表示する。図13(a)はある一作品の番組興趣特徴を示している。これにより、AVコンテンツ一作品のうちのどの位置で盛り上がっているかを一目で確認できる。興趣推移表示手段106は書誌情報抽出手段102で抽出されたAVコンテンツと対応した書誌情報を加工して、キーワードや要約を表示することも可能である。また、この番組興趣特徴で一作品の流れを把握し、この興趣推移表示のある点を指定して、興趣推移表示手段106が指定された箇所に対応するAVコンテンツの時間位置から再生を開始するようにAVコンテンツ再生手段(図示せず)に指示し、そこから再生を始めるといった、番組内での頭だしの選択や再生区間の指定も可能である。
(実施の形態2)
図2は、本発明の実施の形態2におけるAVコンテンツ興趣特徴抽出装置のブロック図である。図1と同一部分には同一符号を付してある。
状態遷移判定分類手段107は、番組興趣特徴から一作品毎のパターンを抽出し、分類を行う。図15は番組興趣特徴パターンの例をいくつか示す。図15(a)のように番組の後半部分で盛り上がっている様子や、図15(d)のように全体的に大きな変化はなく淡々と展開していくなど話の展開をパターン化する。この番組興趣特徴が似たようなパターンをもつ番組は類似した展開をしている可能性が高く、類似した話の展開や盛り上がり方をした番組を検索する際にも有効なため、一作品毎に図15のようなパターンを抽出し分類する。まず、算出された番組興趣特徴で示される曲線に対して平滑化処理を行う。次に、作品時間で正規化し、処理した曲線の変曲点と状態遷移判定分類手段107がもつ番組興趣特徴パターンの変曲点を比較し、山の数と位置に着目し分類する。例えば、図13(a)のような番組興趣特徴を示した曲線に平滑化処理を行い、作品開始時刻が0、終了時刻が1になるように正規化を行い、山の位置と数に着目して分類を行うことで、図13(b)のような始めと終わりに山のあるパターンに分類される。
重要箇所抽出手段108は状態遷移判定分類手段107で分類されたパターン毎に定められた条件に基づき重要箇所を抽出する。番組興趣特徴の算出にあたり、ジャンル等の条件を考慮しているため、番組興趣特徴の高いところはジャンルを問わず、重要度が高いところといえる。例えば、図16(a)のように、番組興趣特徴が2つの山をもつ場合、重要な箇所は山の頂上付近になる。そのため、番組興趣特徴の値が大きい頂上付近を抽出する。また、図16(b)のように、番組興趣特徴が平板なパターンに分類されたコンテンツでは、作品の最初と最後を含み、ほぼ均等な時間間隔で抽出される。これら抽出される区間数は重要箇所抽出手段108がコンテンツの長さに対してデフォルトの値をもっており、その値を用いる。抽出された重要箇所をもとに、そのシーンだけをつなぎ合わせて、要約再生を行ってもよいし、重要箇所をゆっくり再生し、その他を速い速度で再生するといった可変速再生を行ってもよい。尚、重要箇所の抽出条件は、要約再生や可変速再生といった用途に応じて変更してもよい。たとえば、図16(b)のように平板なパターンに分類されている場合、要約再生では始めと最後を含み、均等な間隔で抽出するが、可変速再生のようにカットを伴わない再生方法では図16(d)のように、中央を対象軸として、作品の端から指数的な間隔でその付近の速度を遅くし、他の部分では速く再生するという方法もある。要約再生では、視聴者は要約部分以外視聴しないため、要約部分のみで内容が理解できるものにしなくてはいけない。そのため重要箇所の抽出方法が大事であり、興趣特徴が平板な場合は、時間間隔を均等にすることで、内容がわからなくなるリスクを低減している。しかし、可変速再生では、全シーンを再生しており、視聴者は可変速再生中に見たいときはいつでも通常再生に戻ることができる。そこで、作品の初めと終わりを重点的に再生し他の部分を速い速度で再生するといった方法が考えられる。図16(d)はその場合の重要箇所の抽出方法を示したものである。また、図16(c)のように、興趣特徴の高くなるまでの部分部分も重要箇所として抽出し、通常再生を行うことで、盛り上がっていく過程がよりわかりやすくなる。要約再生はカットを伴うことから重要な結果を短時間で把握することに適しており、可変速再生は重要な流れを短時間で把握することに適している。このように用途に合わせて重要箇所の抽出ポイントの設定を変えてもよい。
(実施の形態3)
図3は、本発明の実施の形態3におけるAVコンテンツ興趣特徴抽出装置のブロック図である。図1と同一部分には同一符号を付してある。
興趣条件選択手段109は、書誌情報抽出手段102でのAVコンテンツのジャンル情報を用いて、抽出するオーディオ特徴量の選択設定を行う。特徴量を選択する理由として、その後のイベント抽出、興趣推定で不必要な特徴量の計算を省き、高速化を図るためである。例えば音声らしさを判定するために算出する特徴量でも、騒音が重畳したオーディオ信号と音楽が重畳した音声では振る舞いが異なるため、オーディオ特徴量抽出手段ではどんなオーディオ信号がきでもカバーできるよう、時間幅や周波数帯域だけが異なるような特徴量が数多く用意される。しかし、ジャンルがわかれば、コンテンツ中に含まれる音響イベントも絞られてくるため、不必要な特徴量の計算を省くことで処理の高速化が可能となる。そのため、興趣条件選択手段109ではあらかじめ、ジャンル毎にどの特徴量を計算するかを定めたリストを持っている。また、音響イベント抽出手段104でも同様にジャンル情報を用いることで、処理の削減が行うことができる。例えば、音声の場合、ニュース番組では音響イベントが音声だけの区間が多く、音響イベントが重畳する区間が少ない。しかし、スポーツ観戦番組では、歓声音などの背景雑音があるため、絶えず音響イベントが重畳する。このようにAVコンテンツのジャンルによって音響イベントの重畳状態は大きく異なる。このため、ジャンル情報を利用することで、高速化、高精度が望める。従って、オーディオ特徴量抽出手段101への特徴量の選択設定だけではなく、音響イベント抽出手段104への閾値の選択や、評価関数の選択、モデルの選択を行ってもよい。
(実施の形態4)
図4は、本発明の実施の形態4におけるAVコンテンツ興趣特徴抽出装置のブロック図である。図1と同一部分には同一符号を付してある。本実施の形態は、興趣特徴を抽出する対象が映像データであることが実施の形態1と異なる。
動画像特徴量抽出手段118は通信回線から送信された、または、図示にない受信部によって受信されたデジタル映像情報から分析を行って、ズーミングやパンといったカメラワークやテロップ、シーンチェンジといった動画像イベントを特定するための特徴量を算出する。特徴量には隣あうフレームの間での類似度やより間隔をおいた2枚のフレームの間での類似度や動き情報を算出する。類似度は画素の色差成分と輝度成分を用いて計算する。例えば、画素ごとに、加法混色いわゆる光の3原色赤緑青に分解して色相を2次元ベクトルで表現する。例えば、赤なら(−1,0)、緑なら(1,0)、黄色は(0,−1)、青は(0,−1)のように色相環と同じ位置関係になる。これら色相ベクトルにより、すべての色相は色相ベクトルとベクトル(1,0)との角度θで表現できる。1フレーム中の全画素について計算を行い、同じ色相をもつ頻度はベクトルの長さに対応させる。また、輝度も同様に1フレームをベクトルで表現する。また1フレーム内の位置関係や複数フレーム間に渡る動きを検出するため、画面をブロックごとに分割し、色相や輝度の特徴量を算出し、隣接ブロックの位置関係もあわせて算出しておく。複数フレームを比較することで、動き方向を示す特徴量を算出する。尚、本実施の形態では色相及び輝度で類似度を算出しているが、色相、明度、彩度を用いても同様の効果が得られる。
このように、動き方向を示す特徴量や、色相や輝度のなどの特徴量から、動画像イベント抽出手段110で動画像イベントの抽出に用いられる。動画像イベントとはズーミングやパンなどのカメラワークや、テロップやシーンチェンジなど、特定の意味をもつ映像の集まりをさす。フレーム間の類似比較を行い、フレーム間の差分値がある一定の閾値内にある場合は、類似フレームとみなし、同じショットとみなす。ショットとは、類似フレームごとにまとめあげたものをさす。類似フレーム群の先頭フレームをショットの代表画像とする。対談シーンなどは収録場所が固定しているため、話者ごとのショットが繰り返し現れる。このように、数種類のショットが繰り返し用いられている区間を同一シーンとし、これら数種類のショットがある閾値以上離れても用いられなくなったとき、シーンチェンジとして扱う。また、動き方向を示す特徴量と隣接ブロック間の特徴量から、ズームやパンなどのカメラワークを判定する。図17はニュース番組での動画像イベントを示す。字幕はニュースの見だしを示したテロップが流れているシーンである。
このような画像イベントの種類と発生頻度及び発生時間間隔、そして重なり具合から興趣推定手段111は番組興趣特徴を算出する。番組興趣特徴とは、番組の重要なところやおもしろいところほど値が大きくなり、時間毎に算出される値である。たとえばドラマであれば、クローズアップされている場面や、シーンチェンジが短い間隔で頻繁に起こる場面などで番組興趣特徴が大きくなる。クローズアップは登場人物が重要な台詞を述べる可能性が高く、短いシーンチェンジが頻繁に起こる場面は、緊迫した場面である可能性がある。また、ニュースであれば、テロップがニュースの冒頭に現れるため、テロップの検出がコーナーの冒頭を示すので、テロップの近傍において番組興趣特徴が高くなる。このように、番組興趣特徴は、動画像イベントの種類と頻度及び時間間隔またそれらの重畳具合のパターンによって決定する。このように、音響イベントからの番組興趣特徴算出の処理と同様に、閾値及び判定条件をジャンルごとにあらかじめ設定しておく。また番組興趣特徴は、ある時点で同時に起きた動画像イベントの有無のみならず、動画像イベントの種類と頻度及び時間間隔またそれらの重畳具合のパターンによって決定する。このように、番組興趣特徴は時間的に前後に発生しているイベントも考慮して、各動画像イベントの頻度及び時間間隔またそれらの重畳具合を算出し、閾値を用いて判別を行う。なお、これら動画像イベントの頻度及び時間間隔またそれらの重畳具合を多次元ベクトルで表現し、あらかじめ学習アルゴリズムによってモデルを作成し、それを用いて算出を行っても同様の効果が得られる。
算出された番組興趣特徴を興趣推移表示手段106によって表示を行う。
(実施の形態5)
図5は、本発明の実施の形態5におけるAVコンテンツ興趣特徴抽出装置のブロック図である。図1、図2及び図4と同一部分には同一符号を付してある。
書誌情報抽出手段102、興趣条件選択手段103、状態遷移判定分類手段107及び重要箇所抽出手段108は図2と同様の処理を行う。また、動画像特徴量抽出手段118、動画像イベント抽出手段110及び興趣推定手段111は図4と同様の処理を行う。
本実施の形態は、実施の形態2における番組興趣特徴を実施の形態4で示したような動画像イベントに基づいて算出し、重要個所を抽出することが出来る。
(実施の形態6)
図6は、本発明の実施の形態6におけるAVコンテンツ興趣特徴抽出装置のブロック図である。図1及び図4と同一部分には同一符号を付してある。
興趣推定手段112は、書誌情報抽出手段102と、音響イベント抽出手段104と、動画像イベント抽出手段110で得られた出力を入力とし、番組興趣特徴を算出する。図18のように番組興趣特徴は、動画像イベント及び音響イベントの種類と頻度及び時間間隔またそれらの重畳具合のパターンによって決定する。このように、音響イベントや動画像イベントどちらか片方のみを用いた番組興趣特徴算出の場合と同様に、閾値及び判定条件をジャンルごとにあらかじめ設定しておく。また番組興趣特徴は、ある時点で同時に起きた動画像イベント及び音響イベントの有無のみならず、動画像イベント及び音響イベントの種類と頻度及び時間間隔またそれらの重畳具合のパターンによって決定する。このように、番組興趣特徴は時間的に前後に発生しているイベントも考慮して、各動画像イベント及び音響イベントの頻度及び時間間隔またそれらの重畳具合を算出し、閾値を用いて判別を行う。なお、これら動画像イベント及び音響イベントの頻度及び時間間隔またそれらの重畳具合を多次元ベクトルで表現し、あらかじめ学習アルゴリズムによってモデルを作成し、それを用いて算出を行っても同様の効果が得られる。
算出された番組興趣特徴を興趣推移表示手段106によって表示する。
(実施の形態7)
図7は、本発明の実施の形態7におけるAVコンテンツ興趣特徴抽出装置のブロック図である。図6と同一部分には同一符号を付してある。
蓄積手段115は、AVコンテンツ一作品毎に、書誌情報抽出手段102で抽出された書誌情報と番組興趣特徴パターンを付帯して蓄積する。番組興趣特徴パターンは状態遷移判定分類手段107で分類されたもので、一作品中で番組興趣特徴の値が大きくなっている山の部分の個数と位置により分類されたものである。図14(a)や(b)のように、作品の中盤に番組興趣特徴が大きくなる山場をもつ作品は作品時間で正規化を行うため、番組興趣特徴パターンは1時間番組も2時間番組も同じパターンに分類される。
ユーザはユーザ入力手段113で、番組興趣特徴パターンを指定することで、検索手段114は同じ番組興趣特徴パターンをもつ作品を検索する。また、番組興趣特徴パターンのみならず、作品時間を指定し、絞り込むこともできる。また、キーワードを入力することで、蓄積された書誌情報から該当するキーワードを含む作品を検索する。またキーワードではなく、特定の作品を指定することで、その作品の時間、キーワード、及び番組興趣特徴パターンから類似した作品を検索することができる。また、見たい作品のイメージを表す印象語、例えば「ハラハラドキドキ」といった印象語での検索も可能とする。これは、番組興趣特徴パターンと印象語との対応関係を予め事前に調べておき、番組興趣特徴パターンと印象語との対応表を作成しておく。そうすることにより、印象語をキーワードとして入力することで、番組興趣特徴パターンを指定するのと同様の効果が得られる。なお、ユーザ入力手段113で、過去にユーザが検索に用いたキーワードや時間情報、番組興趣特徴パターンや印象語の履歴を保持しておき、ユーザが検索条件を入力する際にその履歴情報を表示し、ユーザはその中から入力する検索条件を選択できるようにすることにより、ユーザの入力手順を簡略化したり、省略したりしてもよい。
また、履歴情報はユーザ本人のものでなくてもユーザと嗜好の類似した人物の履歴情報を利用してもよい。これにより、嗜好の類似したユーザの履歴を複数保持する必要がなくなるため、記憶領域が削減できる。
(実施の形態8)
図8は、本発明の実施の形態8におけるAVコンテンツ興趣特徴抽出装置のブロック図である。図7と同一部分には同一符号を付してある。
ユーザ入力手段116は、番組興趣特徴を推定する際の重要とする観点をユーザに選択及び入力してもらう。デフォルト設定では、音楽番組では音楽区間の番組興趣特徴が高くなっている。しかしユーザによっては音楽番組中のトーク場面のほうが音楽区間よりも重要だと位置づける場合もある。また、音響イベントのみならず、画像イベントでも同様に、ズームアップをしているところではなく、パンしているところだけを取り出したいといった要求もある。そこで、このユーザ入力手段116により、興趣推定手段117に反映させるためにユーザの観点を入力する。つまり、重視する音響イベントや画像イベントを入力し、その区間を重視した番組興趣特徴推定を行う。状態遷移判定分類手段107でパターンに分類し、蓄積手段115で蓄積される。これら、ユーザの要望を反映した番組興趣特徴によってパターン分類された蓄積データを用いて、検索を行うことができる。尚、検索した後、実施の形態2の重要箇所抽出手段108を加え、要約再生や可変速再生を行ってもよい。また、蓄積手段115に蓄積は行わず、状態遷移判定分類手段107の後に実施の形態2の重要箇所抽出手段108を加え、要約再生や可変速再生を行ってもよい。例えば、以前みたことがある番組で、ある特定のシーンを探していて、場所はわからないが、ある突発音が鳴っていたことだけは覚えているといったようなときに、突発音が鳴っているシーンだけを取り出せるよう、ユーザの観点をユーザ入力手段116で入力し、興趣推定手段117で番組興趣特徴に反映させる。そうすることで、重要箇所抽出手段108により、重要な箇所のみ、つまり突発音を含むシーンが多く抽出され、ユーザは特定のシーンが見つけやすくなる。
本発明にかかるAVコンテンツ興趣特徴抽出装置は、番組興趣特徴を推定し、番組興趣特徴毎にAVコンテンツを分類する機能を有し、番組選択時の番組概要表示や要約再生等として有用である。また類似番組検索等の用途にも応用できる。
本発明の実施の形態1におけるAVコンテンツ特徴抽出装置のブロック図 本発明の実施の形態2におけるAVコンテンツ特徴抽出装置のブロック図 本発明の実施の形態3におけるAVコンテンツ特徴抽出装置のブロック図 本発明の実施の形態4におけるAVコンテンツ特徴抽出装置のブロック図 本発明の実施の形態5におけるAVコンテンツ特徴抽出装置のブロック図 本発明の実施の形態6におけるAVコンテンツ特徴抽出装置のブロック図 本発明の実施の形態7におけるAVコンテンツ特徴抽出装置のブロック図 本発明の実施の形態8におけるAVコンテンツ特徴抽出装置のブロック図 従来の映像要約装置のブロック図 音響イベントを説明する模式図 興趣特徴を推定する際の判断基準例を示す図 興趣特徴を説明する模式図 興趣特徴の平滑化を説明する模式図 興趣特徴の時間軸の正規化を説明する模式図 興趣特徴の状態遷移分類パターンを説明する模式図 興趣特徴の重要箇所抽出方法を説明する模式図 動画像イベントを説明する模式図 動画像イベント及び音響イベントを説明する模式図
符号の説明
101 オーディオ特徴量抽出手段
102 書誌情報抽出手段
103 興趣条件選択手段
104 音響イベント抽出手段
105 興趣推定手段
106 興趣推移表示手段
107 状態遷移判定分類手段
108 重要箇所抽出手段
109 興趣条件選択手段
110 動画像イベント抽出手段
111 興趣推定手段
112 興趣推定手段
113 ユーザ入力手段
114 検索手段
115 蓄積手段
116 ユーザ入力手段
117 興趣推定手段
118 動画像特徴量抽出手段
120 AVコンテンツ興趣特徴抽出装置
201 要約再生装置
202 音声特徴量抽出部
203 ジャンル情報取得部
204 蓄積部
205 操作部
206 パラメータ設定部
207 再生部
208 制御部
209 表示部
210 デマルチプレクサ

Claims (64)

  1. AVコンテンツのオーディオ信号から所定の音響的な特徴量を算出し、
    前記AVコンテンツに含まれる書誌情報を抽出し、
    前記音響的な特徴量から所定の音響イベントを算出し、
    前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出し、
    前記音響イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出する
    ことを特徴とするAVコンテンツ興趣特徴抽出方法。
  2. 前記番組興趣特徴推定情報はAVコンテンツのジャンルを示す情報である
    ことを特徴とする請求項1記載のAVコンテンツ興趣特徴抽出方法。
  3. 前記番組興趣特徴推定情報は前記書誌情報から推定する
    ことを特徴とする請求項1記載のAVコンテンツ興趣特徴抽出方法。
  4. 前記音響イベントは特定の意味をもつ単音や音の集まりである
    ことを特徴とする請求項1記載のAVコンテンツ興趣特徴抽出方法。
  5. 前記番組興趣特徴の時間的な変動を時系列で表示する
    ことを特徴とする請求項1記載のAVコンテンツ興趣特徴抽出方法。
  6. 前記番組興趣特徴の時間的な変動と共に、前記書誌情報もあわせて表示する
    ことを特徴とする請求項5記載のAVコンテンツ興趣特徴抽出方法。
  7. 表示された前記番組興趣特徴において指定された箇所に対応する前記AVコンテンツの時間位置から前記AVコンテンツを再生可能にする
    ことを特徴とする請求項5または6記載のAVコンテンツ興趣特徴抽出方法。
  8. 前記番組興趣特徴から番組興趣特徴パターンを抽出し、前記抽出した番組興趣特徴パターンを予め定められた基準に従って分類する
    ことを特徴とする請求項1記載のAVコンテンツ興趣特徴抽出方法。
  9. 前記番組興趣特徴パターンは作品時間で正規化する
    ことを特徴とする請求項8記載のAVコンテンツ興趣特徴抽出方法。
  10. 前記番組興趣特徴パターンは前記番組興趣特徴の時間的な変動を示す曲線の山の数に着目し分類する
    ことを特徴とする請求項8記載のAVコンテンツ興趣特徴抽出方法。
  11. 前記番組興趣特徴パターンは前記番組興趣特徴の時間的な変動を示す曲線の山の位置に着目し分類する
    ことを特徴とする請求項8記載のAVコンテンツ興趣特徴抽出方法。
  12. 前記番組興趣特徴パターンは前記番組興趣特徴の時間的な変動を示す曲線の山の数と位置に着目し分類する
    ことを特徴とする請求項8記載のAVコンテンツ興趣特徴抽出方法。
  13. 前記番組興趣特徴パターンから前記AVコンテンツの重要箇所を抽出する
    ことを特徴とする請求項8記載のAVコンテンツ興趣特徴抽出方法。
  14. 前記番組興趣特徴パターンごとに前記重要箇所の抽出方法を設定する
    ことを特徴とする請求項13記載のAVコンテンツ興趣特徴抽出方法。
  15. 前記重要箇所は前記番組興趣特徴パターン曲線の山の部分を抽出する
    ことを特徴とする請求項13記載のAVコンテンツ興趣特徴抽出方法。
  16. 前記重要箇所として抽出された部分をつなぎあわせて再生可能にする
    ことを特徴とする請求項13記載のAVコンテンツ興趣特徴抽出方法。
  17. 前記重要箇所として抽出されなかった部分を速い速度で再生可能にする
    ことを特徴とする請求項13記載のAVコンテンツ興趣特徴抽出方法。
  18. 前記番組興趣特徴推定情報から前記算出する所定の音響的な特徴量を決定することを特徴とする請求項1記載のAVコンテンツ興趣特徴抽出方法。
  19. AVコンテンツの映像信号から所定の動画像特徴量を算出し、
    前記AVコンテンツに含まれる書誌情報を抽出し、
    前記動画像特徴量から所定の動画像イベントを算出し、
    前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出し、
    前記動画像イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出する
    ことを特徴とするAVコンテンツ興趣特徴抽出方法。
  20. 前記動画像イベントは特定の意味をもつ画像の集まりである
    ことを特徴とする請求項19記載のAVコンテンツ興趣特徴抽出方法。
  21. 前記番組興趣特徴推定情報から前記算出する所定の動画像特徴量を決定することを特徴とする請求項19記載のAVコンテンツ興趣特徴抽出方法。
  22. AVコンテンツの映像信号から所定の動画像特徴量を算出し、
    前記AVコンテンツのオーディオ信号から所定の音響的な特徴量を算出し、
    前記AVコンテンツに含まれる書誌情報を抽出し、
    前記動画像特徴量から所定の動画像イベントを算出し、
    前記音響的な特徴量から所定の音響イベントを算出し、
    前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出し、
    前記動画像イベントと、前記音響イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出する
    ことを特徴とするAVコンテンツ興趣特徴抽出方法。
  23. 前記番組興趣特徴推定情報から前記算出する所定の動画像特徴量及び音響的な特徴量を決定することを特徴とする請求項22記載のAVコンテンツ興趣特徴抽出方法。
  24. 前記番組興趣特徴パターンを蓄積し、
    検索条件となる前記番組興趣特徴パターンを指定し、
    類似した前記番組興趣特徴パターンをもつ前記AVコンテンツを検索する
    ことを特徴とする請求項8記載のAVコンテンツ興趣特徴抽出方法。
  25. 前記番組興趣特徴パターンは前記書誌情報をあわせて蓄積する
    ことを特徴とする請求項24記載のAVコンテンツ興趣特徴抽出方法。
  26. 前記検索条件は前記番組興趣特徴パターンと時間情報をもつ
    ことを特徴とする請求項24記載のAVコンテンツ興趣特徴抽出方法。
  27. 前記検索条件は前記番組興趣特徴パターンとキーワードをもつ
    ことを特徴とする請求項24記載のAVコンテンツ興趣特徴抽出方法。
  28. 前記番組興趣特徴パターンと、前記番組興趣特徴パターンに対応する語句との関係を保持し、前記検索条件は前記番組興趣特徴パターンに対応した語句である
    ことを特徴とする請求項24記載のAVコンテンツ興趣特徴抽出方法。
  29. 過去にユーザが入力した前記検索条件の履歴を保持しておき、前記ユーザが前記検索条件を入力する際に前記保持された履歴から前記検索条件を選択可能である
    ことを特徴とする請求項24記載のAVコンテンツ興趣特徴抽出方法。
  30. 前記検索条件の履歴は前記ユーザ自身もしくは前記ユーザと嗜好の類似した人物の履歴である
    ことを特徴とする請求項29記載のAVコンテンツ興趣特徴抽出方法。
  31. 前記番組興趣特徴の推定条件が変更可能である
    ことを特徴とする請求項1、19、22のいずれかに記載のAVコンテンツ興趣特徴抽出方法。
  32. 前記推定条件は重視する前記音響イベントや前記動画像イベントである
    ことを特徴とする請求項31記載のAVコンテンツ興趣特徴抽出方法。
  33. AVコンテンツのオーディオ信号から所定の音響的な特徴量を算出するオーディオ特徴量抽出手段と、
    前記AVコンテンツに含まれる書誌情報を抽出する書誌情報抽出手段と、
    前記音響的な特徴量から所定の音響イベントを算出する音響イベント抽出手段と、
    前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出する興趣条件選択手段と、
    前記音響イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出する興趣推定手段
    とを有することを特徴とするAVコンテンツ興趣特徴抽出装置。
  34. 前記興番組興趣特徴推定情報はAVコンテンツのジャンルを示す情報である
    ことを特徴とする請求項33記載のAVコンテンツ興趣特徴抽出装置。
  35. 前記興趣条件選択手段は前記書誌情報から前記番組興趣特徴推定情報を推定する
    ことを特徴とする請求項33記載のAVコンテンツ興趣特徴抽出装置。
  36. 前記音響イベントは特定の意味をもつ単音や音の集まりである
    ことを特徴とする請求項33記載のAVコンテンツ興趣特徴抽出装置。
  37. 前記番組興趣特徴の時間的な変動を時系列で表示する興趣推移表示手段を有する
    ことを特徴とする請求項33記載のAVコンテンツ興趣特徴抽出装置。
  38. 前記興趣推移表示手段は、前記番組興趣情報の時間的な変動と共に前記書誌情報もあわせて表示する
    ことを特徴とする請求項37記載のAVコンテンツ興趣特徴抽出装置。
  39. 前記興趣推移表示手段は、表示された前記番組興趣特徴において指定された箇所に対応する前記AVコンテンツの時間位置から前記AVコンテンツを再生可能にする
    ことを特徴とする請求項37または38記載のAVコンテンツ興趣特徴抽出装置。
  40. 前記番組興趣特徴から番組興趣特徴パターンを抽出し、前記抽出した番組興趣特徴パターンを予め定められた基準に従って分類する状態遷移判定分類手段
    を有することを特徴とする請求項33記載のAVコンテンツ興趣特徴抽出装置。
  41. 前記状態遷移判定分類手段は、前記番組興趣特徴を作品時間で正規化し、前記番組興趣特徴パターンに分類する
    ことを特徴とする請求項40記載のAVコンテンツ興趣特徴抽出装置。
  42. 前記状態遷移判定分類手段は、前記番組興趣特徴の時間的な変動を示す曲線の山の数に着目して前記番組興趣特徴パターンに分類する
    ことを特徴とする請求項40記載のAVコンテンツ興趣特徴抽出装置。
  43. 前記状態遷移判定分類手段は、前記番組興趣特徴の時間的な変動を示す曲線の山の位置に着目して前記番組興趣特徴パターンに分類する
    ことを特徴とする請求項40記載のAVコンテンツ興趣特徴抽出装置。
  44. 前記状態遷移判定分類手段は、前記番組興趣特徴の時間的な変動を示す曲線の山の数と位置に着目して前記番組興趣特徴パターンに分類する
    ことを特徴とする請求項40記載のAVコンテンツ興趣特徴抽出装置。
  45. 前記番組興趣特徴パターンから前記AVコンテンツの重要箇所を抽出する重要箇所抽出手段を有することを特徴とする請求項40記載のAVコンテンツ興趣特徴抽出装置。
  46. 前記重要箇所抽出手段は前記番組興趣特徴パターンごとに抽出方法を設定する
    ことを特徴とする請求項45記載のAVコンテンツ興趣特徴抽出装置。
  47. 前記重要箇所抽出手段は前記番組興趣特徴パターン曲線の山の部分を抽出する
    ことを特徴とする請求項45記載のAVコンテンツ興趣特徴抽出装置。
  48. 前記重要箇所抽出手段により前記重要箇所として抽出された部分をつなぎあわせて再生可能にする
    ことを特徴とする請求項45記載のAVコンテンツ興趣特徴抽出装置。
  49. 前記重要箇所抽出手段により前記重要箇所として抽出されなかった部分を速い速度で再生可能にする
    ことを特徴とする請求項45記載のAVコンテンツ興趣特徴抽出装置。
  50. 前記オーディオ特徴量抽出手段は、前記番組興趣特徴推定情報から前記算出する所定の音響的な特徴量を決定することを特徴とする請求項33記載のAVコンテンツ興趣特徴抽出装置。
  51. AVコンテンツの映像信号から所定の動画像特徴量を算出する動画像特徴量抽出手段と、
    前記AVコンテンツに含まれる書誌情報を抽出する書誌情報抽出手段と、
    前記動画像特徴量から所定の動画像イベントを算出する動画像イベント抽出手段と、
    前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出する興趣条件選択手段と、
    前記動画像イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出する興趣特徴推定手段
    とを有することを特徴とするAVコンテンツ興趣特徴抽出装置。
  52. 前記動画像特徴量抽出手段は、前記番組興趣特徴推定情報から前記算出する所定の動画像特徴量を決定することを特徴とする請求項51記載のAVコンテンツ興趣特徴抽出装置。
  53. 前記動画像イベントは特定の意味をもつ画像の集まりである
    ことを特徴とする請求項51記載のAVコンテンツ興趣特徴抽出装置。
  54. 前記AVコンテンツの映像信号から所定の動画像特徴量を算出する動画像特徴量抽出手段と、
    前記AVコンテンツのオーディオ信号から所定の音響的な特徴量を算出するオーディオ特徴量抽出手段と、
    前記AVコンテンツに含まれる書誌情報を抽出する書誌情報抽出手段と、
    前記動画像特徴量から所定の動画像イベントを算出する動画像特徴量抽出手段と、
    前記音響的な特徴量から所定の音響イベントを算出する音響イベント抽出手段と、
    前記書誌情報に含まれる前記AVコンテンツの番組興趣特徴を推定するために用いる番組興趣特徴推定情報を抽出する興趣条件選択手段と、
    前記動画像イベントと、前記音響イベントと、前記番組興趣特徴推定情報とから、予め定められた推定条件に基づいて前記番組興趣特徴を算出する興趣推定手段
    とを有することを特徴とするAVコンテンツ興趣特徴抽出装置。
  55. 前記動画像特徴量抽出手段は、前記番組興趣特徴推定情報から前記算出する所定の音響的な特徴量及び動画像特徴量を決定することを特徴とする請求項54記載のAVコンテンツ興趣特徴抽出装置。
  56. 前記番組興趣特徴パターンを蓄積する蓄積手段と、
    検索条件となる前記番組興趣特徴パターンを指定するユーザ入力手段と、
    類似した前記番組興趣特徴パターンをもつAVコンテンツを検索する検索手段
    とを有することを特徴とする請求項40記載のAVコンテンツ興趣特徴抽出装置。
  57. 前記蓄積手段は前記番組興趣特徴パターンと前記書誌情報をあわせて蓄積する
    ことを特徴とする請求項56記載のAVコンテンツ興趣特徴抽出装置。
  58. 前記ユーザ入力手段は前記検索条件として前記番組興趣特徴パターンと時間情報を入力する
    ことを特徴とする請求項56記載のAVコンテンツ興趣特徴抽出装置。
  59. 前記ユーザ入力手段は前記検索条件として前記番組興趣特徴パターンとキーワードを入力する
    ことを特徴とする請求項56記載のAVコンテンツ興趣特徴抽出装置。
  60. 前記検索手段は前記番組興趣特徴パターンと、前記番組興趣特徴パターンに対応する語句との関係を保持し、前記ユーザ入力手段は、前記検索条件として前記番組興趣特徴パターンに対応した語句を入力する
    ことを特徴とする請求項56記載のAVコンテンツ興趣特徴抽出装置。
  61. 前記検索手段は、過去にユーザが入力した前記検索条件の履歴を保持しておき、前記ユーザが前記検索条件を入力する際に前記保持された履歴から前記検索条件を選択可能である
    ことを特徴とする請求項56記載のAVコンテンツ興趣特徴抽出装置。
  62. 前記検索条件の履歴は前記ユーザ自身もしくは前記ユーザと嗜好の類似した人物の履歴である
    ことを特徴とする請求項61記載のAVコンテンツ興趣特徴抽出装置。
  63. 前記興趣推定手段において、前記番組興趣特徴の推定条件が変更可能である
    ことを特徴とする請求項33、51、54のいずれかに記載のAVコンテンツ興趣特徴抽出装置。
  64. 前記推定条件は重視する前記音響イベントや前記動画像イベントである
    ことを特徴とする請求項63記載のAVコンテンツ興趣特徴抽出装置。
JP2003401248A 2003-12-01 2003-12-01 Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置 Pending JP2005167456A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003401248A JP2005167456A (ja) 2003-12-01 2003-12-01 Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003401248A JP2005167456A (ja) 2003-12-01 2003-12-01 Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置

Publications (1)

Publication Number Publication Date
JP2005167456A true JP2005167456A (ja) 2005-06-23

Family

ID=34725241

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003401248A Pending JP2005167456A (ja) 2003-12-01 2003-12-01 Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置

Country Status (1)

Country Link
JP (1) JP2005167456A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007060060A (ja) * 2005-08-23 2007-03-08 Sony Corp 再生システム、再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム
JP2007300280A (ja) * 2006-04-28 2007-11-15 Toshiba Corp 映像再生装置および映像再生方法
JP2008236603A (ja) * 2007-03-23 2008-10-02 Pioneer Electronic Corp 動画コンテンツ判別装置、映像信号処理ユニット、及び、動画コンテンツ判別方法
JP2011066546A (ja) * 2009-09-15 2011-03-31 Tokyo Kogei Univ コマ割り画像生成装置及びプログラム
JP2012222450A (ja) * 2011-04-05 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 類似映像出力方法、類似映像出力装置および類似映像出力プログラム
JP2016506150A (ja) * 2012-12-18 2016-02-25 トムソン ライセンシングThomson Licensing 時間情報に基づきコンテンツを索引付けする方法、装置及びシステム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007060060A (ja) * 2005-08-23 2007-03-08 Sony Corp 再生システム、再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム
JP4683281B2 (ja) * 2005-08-23 2011-05-18 ソニー株式会社 再生システム、再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム
US8103149B2 (en) 2005-08-23 2012-01-24 Sony Corporation Playback system, apparatus, and method, information processing apparatus and method, and program therefor
JP2007300280A (ja) * 2006-04-28 2007-11-15 Toshiba Corp 映像再生装置および映像再生方法
JP2008236603A (ja) * 2007-03-23 2008-10-02 Pioneer Electronic Corp 動画コンテンツ判別装置、映像信号処理ユニット、及び、動画コンテンツ判別方法
JP2011066546A (ja) * 2009-09-15 2011-03-31 Tokyo Kogei Univ コマ割り画像生成装置及びプログラム
JP2012222450A (ja) * 2011-04-05 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 類似映像出力方法、類似映像出力装置および類似映像出力プログラム
JP2016506150A (ja) * 2012-12-18 2016-02-25 トムソン ライセンシングThomson Licensing 時間情報に基づきコンテンツを索引付けする方法、装置及びシステム

Similar Documents

Publication Publication Date Title
JP5322550B2 (ja) 番組推奨装置
JP4449216B2 (ja) 映像情報の編集方法及び編集装置
JP4905103B2 (ja) 動画再生装置
EP2107477B1 (en) Summarizing reproduction device and summarizing reproduction method
JP4778231B2 (ja) ビデオシーケンスに対してインデックス付けするシステムおよび方法
US20080059526A1 (en) Playback apparatus, searching method, and program
WO2010073355A1 (ja) 番組データ処理装置、方法、およびプログラム
JP4300697B2 (ja) 信号処理装置及び方法
JP5135024B2 (ja) コンテンツのシーン出現を通知する装置、方法およびプログラム
JP4683281B2 (ja) 再生システム、再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム
JP2006525537A (ja) コンテンツ解析を用いて音楽ビデオを要約する方法及び装置
JP2005514841A (ja) マルチメディア・コンテンツをリンクするよう複数モードのストーリーをセグメントする方法及び装置
JP2006319980A (ja) イベントを利用した動画像要約装置、方法及びプログラム
JP4882746B2 (ja) 情報信号処理方法、情報信号処理装置及びコンピュータプログラム記録媒体
JP4621607B2 (ja) 情報処理装置及びその方法
JP4735413B2 (ja) コンテンツ再生装置およびコンテンツ再生方法
JP2007336283A (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP4925938B2 (ja) ダイジェスト映像情報作成方法、ダイジェスト映像情報作成プログラム、および、映像装置
JP2010246000A (ja) 映像サーチ再生装置
JP2005167456A (ja) Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置
JP2010109852A (ja) 映像インデクシング方法、映像録画再生装置、及び映像再生装置
JP2008153920A (ja) 動画像一覧表示装置
JP3838775B2 (ja) マルチメディア処理装置、記録媒体
KR100370249B1 (ko) 샷 세그멘테이션 정보를 이용한 비디오 스키밍 시스템
KR20020023063A (ko) 비디오 콘텐트의 구조적 정보를 이용한 비디오 스키밍방법과 장치