JP2015195418A - 記録再生装置、記録再生方法、記録装置及び再生装置 - Google Patents

記録再生装置、記録再生方法、記録装置及び再生装置 Download PDF

Info

Publication number
JP2015195418A
JP2015195418A JP2012179652A JP2012179652A JP2015195418A JP 2015195418 A JP2015195418 A JP 2015195418A JP 2012179652 A JP2012179652 A JP 2012179652A JP 2012179652 A JP2012179652 A JP 2012179652A JP 2015195418 A JP2015195418 A JP 2015195418A
Authority
JP
Japan
Prior art keywords
unit
scene
feature
metadata
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012179652A
Other languages
English (en)
Inventor
雅志 神谷
Masashi Kamiya
雅志 神谷
智子 三木
Tomoko Miki
智子 三木
大塚 功
Isao Otsuka
功 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2012179652A priority Critical patent/JP2015195418A/ja
Priority to PCT/JP2013/056074 priority patent/WO2014027475A1/ja
Publication of JP2015195418A publication Critical patent/JP2015195418A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8233Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a character code signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】ユーザが動画全体の展開を理解できるように要約再生を行うことができるようにすること。【解決手段】記録再生装置1は、記憶されるマルチメディアデータから字幕データを抽出して、抽出された字幕データ内の字幕文字列を語句に分割し、分割された語句の各々に対して、その概念が特徴的であるほど高い値を示す特徴度を決定し、この特徴度を含むメタデータを、マルチメディアデータとともに記憶する記録処理部100と、読み出されたメタデータを分析して、特徴度により示される値が予め定められた値よりも高い語句を含む字幕文字列の表示時間を再生時間として要約再生を行う再生処理部130とを備える。【選択図】図1

Description

本発明は、記録再生装置、記録再生方法、記録装置及び再生装置に関する。
例えば、映画、ドラマ、スポーツイベント又はニュース放送等を複写したビデオ等の動画を素早く視聴及び分析するために、要約を作成するための方法が知られている。
従来の要約方法は、まず、視聴開始前に注目キーワードを設定する。キーワードの設定は、ユーザ自身が任意に設定するか、装置が過去に視聴した番組において出現頻度の高い語彙(単語又は句)を自動的に設定するか、装置がネットワークに接続されている情報サイトから流行語を取得して設定するか等により行われる。そして、番組中の字幕データのうち設定されたキーワードに一致する語彙が含まれているショット(画像的に連続したフレーム(静止画)の集まり)が抽出される。次に、抽出されたショットの前後の一連のショット群が、ユーザが注目すべきシーン(話題等で互いに関連する一連のショット群)として抽出される。各ショットに出現する字幕データの語彙同士の意味的又は形態的な類似度が求められ、その類似度が或る閾値を越える場合に、ショットは、同一のシーンとして抽出される。また、ショットは、映像的特徴及び音響的特徴の少なくとも何れか一方の類似度が算出され、その類似度が或る閾値を越える場合に同一のシーンとして抽出される(例えば、特許文献1参照)。
また、従来の要約方法には、音声信号の特徴を利用するものがある。この方法は、まず、特許文献1のように映像的特徴及び音響的特徴の少なくとも何れか一方を用いて、一連のショット群をセグメントとして抽出する。そして、抽出された各セグメントについて、音声の特徴を利用して、ある範囲内で連続的な重要度レベルが算出される。ユーザは、その範囲内で閾値を設定し、その閾値を超える重要度レベルを持つセグメントを要約として抽出する(例えば、特許文献2参照)。
特開2006−129122号公報 特開2006−345554号公報
しかしながら、従来の要約方法には、いくつかの問題がある。第1に、特許文献1に記載された要約方法は、ユーザが入力した語彙との一致度、ユーザが過去に視聴した番組における出現頻度を示す「主観的特徴度」、又は、世間での流行度を表す「流行的特徴度」を用いている。そして、特許文献1に記載された要約方法は、これらの特徴度が高いシーンを要約として抽出しているが、これらは全体の展開とは無関係な「非内容的特徴度」である。即ち、特許文献1に記載された要約方法では、単に、ユーザが入力した語彙、出現頻度の高い語彙及び流行の語彙を含むシーンが抽出され、このようなシーンが再生されたとしても、ユーザは、全体の展開を理解できない。例えば、ユーザが野球中継をよく見るのであれば、過去の視聴履歴にはチーム名及び様々な選手名が頻出しており、これらがキーワードとなる。これらのキーワードに基づく要約では、全体の展開を理解するために重要な得点シーンが抽出されるわけではない。多くの場合、試合展開とは関係なく、チーム名及び選手名が出現するシーンが繰り返し抽出されてしまう。
第2に、特許文献2に記載された要約方法は、「音声的特徴度」を用いている。これは、音声信号の変動と番組の盛り上がり度合いとの間に相関があることを利用したものである。例えば、野球中継等のスポーツ番組においては、得点シーンでは音量が他のシーンと比較して大きくなる傾向がある。従って、このような音声信号の特徴と番組の盛り上がり度合いとの間に相関がある動画であれば、ユーザは、この「音声的特徴度」に基づいた要約によって全体の展開を理解できる。
しかしながら、音声信号の変動と番組の盛り上がり度合いとの間に相関が無い動画の場合、要約が再生されたとしても、ユーザは、全体の展開を理解できない。例えば、推理小説が原作のドラマにおいては、犯人を特定する推理が行われるシーンは非常に重要なシーンである。しかしながら、このようなシーンにおいて、主人公が淡々と推理を行っている場合には、他のシーンに比べて音量等の音声信号の変動は小さい。従って、そのような場合には、このようなシーンは、要約として抽出されず、ユーザは、要約の再生を視聴しても、どのようにして犯人が特定されたのかを理解できない。即ち、「音声的特徴度」を用いても、番組の内容によっては「内容的特徴度」に基づいて要約が作成されることにはならない。
そこで、本発明は、以上のような問題を解消するためになされたものであって、ユーザが動画全体の展開を理解できるように要約再生を行うことができるようにすることを目的とする。
本発明の一態様に係る記録再生装置は、映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出部と、前記字幕データ抽出部により抽出された字幕データ内の字幕文字列を語句に分割する分割部と、前記分割部により分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定する特徴度決定部と、前記字幕文字列の表示時間と、前記特徴度決定部で決定された特徴度と、を含むメタデータを生成するメタデータ生成部と、前記マルチメディアデータと、前記メタデータ生成部により生成されたメタデータと、を記憶する記録部と、前記記録部から読み出されたメタデータを分析して、前記特徴度により示される値が予め定められた値よりも高い語句を含む字幕文字列の表示時間を、再生時間として特定するメタデータ分析部と、前記マルチメディアデータの内、前記メタデータ分析部により特定された再生時間に対応する部分を再生する制御を行う再生制御部と、を備えることを特徴とする。
本発明の一態様によれば、ユーザが動画全体の展開を理解できるように要約再生を行うことができる。
実施の形態1〜7に係る記録再生装置の構成を概略的に示すブロック図である。 実施の形態1における記録処理部の構成を概略的に示すブロック図である。 実施の形態1における特徴度データベースにおける特徴度を説明するための概略図である。 実施の形態1におけるメタデータの構造を示す概略図である。 実施の形態1における記憶媒体に記憶されるデータのファイル及びディレクトリの階層構造を示す概略図である。 実施の形態1〜7における再生処理部の構成を概略的に示すブロック図である。 実施の形態1における記録処理部での処理を示すフローチャートである。 実施の形態1における再生処理部での処理を示すフローチャートである。 実施の形態1における特徴度と特徴度閾値との間の関係を概略的に示すグラフである。 実施の形態1における記録処理部の変形例を示す概略図である。 実施の形態1における記録処理部の変形例を示す概略図である。 実施の形態1における再生処理部の変形例を示す概略図である。 実施の形態1の変形例におけるOSDプレーンを示す概略図である。 実施の形態1の変形例において、OSDプレーンが重畳された映像を示す概略図である。 実施の形態2における記録処理部の構成を概略的に示すブロック図である。 実施の形態2におけるメタデータの構造を示す概略図である。 実施の形態3における記録処理部の構成を概略的に示すブロック図である。 実施の形態4における記録処理部の構成を概略的に示すブロック図である。 実施の形態5における記録処理部の構成を概略的に示すブロック図である。 実施の形態5におけるメタデータの構造を示す概略図である。 実施の形態6における記録処理部の構成を概略的に示すブロック図である。 実施の形態6におけるメタデータの構造を示す概略図である。 実施の形態7における記録処理部の構成を概略的に示すブロック図である。 実施の形態7におけるメタデータの構造を示す概略図である。
実施の形態1.
図1は、実施の形態1に係る記録再生装置1の構成を概略的に示すブロック図である。記録再生装置1は、データ処理部10と、全体制御部11と、ユーザインタフェース部(以下、U/I部という)12とを備える。なお、図1の括弧内の符号は、それぞれ実施の形態2〜7の構成を示している。
データ処理部10は、データを記録し、記録されたデータを再生する。データ処理部10は、データを記録する記録処理部100と、記録されたデータを再生する再生処理部130とを備える。
全体制御部11は、記録再生装置1での処理を統括的に制御する。
U/I部12は、ユーザからの指示を受ける入力部である。
図2は、記録処理部100の構成を概略的に示すブロック図である。記録処理部100は、書き込みドライブ101と、記録処理制御部102と、記録データ生成部110とを備える。
書き込みドライブ101は、記録処理制御部102からの制御に応じて、データを記憶媒体8に書き込む(記録する)データ書込部である。例えば、書き込みドライブ101は、書き込み中のデータが無く、記憶媒体8への書き込みが可能な場合、書き込み可信号を記録処理制御部102に与える。また、書き込みドライブ101は、記録データ生成部110からデータを受け取った場合には、書き込み不可信号を記録処理制御部102に与えて、受け取ったデータを記憶媒体8へ書き込む。
記録処理制御部102は、書き込みドライブ101及び記録データ生成部110を統括的に制御する。例えば、記録処理制御部102は、書き込みドライブ101から書き込み可信号を受け取った場合には、書き込み許可信号を記録データ生成部110に与える。また、記録処理制御部102は、書き込みドライブ101から書き込み不可信号を受信した場合には、書込み禁止信号を記録データ生成部110に与える。
記録データ生成部110は、TV9から出力されたマルチメディアデータを受け取り、このマルチメディアデータからメタデータを生成する。ここで、マルチメディアデータは、映像を表示するための映像信号、この映像信号に基づいて表示される映像に同期して音声を出力するための音声信号、及び、この映像信号に基づいて表示される映像に重畳することのできる字幕を表示するための字幕データ等を含む。そして、記録データ生成部110は、マルチメディアデータ及びメタデータを書き込みドライブ101に与えて、記憶媒体8に記録させる。記録データ生成部110は、字幕データ抽出部111と、形態素解析データベース112と、分割部113と、特徴度データベース114と、特徴度決定部115と、番組情報抽出部116と、メタデータ生成部117と、書き込みバッファ118とを備える。
字幕データ抽出部111は、TV9よりマルチメディアデータを受け取り、このマルチメディアデータから字幕データを抽出する。さらに、字幕データ抽出部111は、抽出された字幕データから、字幕として表示される字幕文字列を各々抽出する。そして、字幕データ抽出部111は、抽出された字幕データをメタデータ生成部117に与え、抽出された字幕文字列を分割部113に与える。
形態素解析データベース112は、文字列から単語を解析するために必要な形態素解析情報を格納する形態素解析情報記憶部である。例えば、形態素解析データベース112は、分割部113からの形態素解析要求を受け取り、形態素解析に必要な情報を分割部113に与える。
分割部113は、字幕データ抽出部111より字幕文字列を受け取り、この字幕文字列を単語毎に分割する。例えば、分割部113は、形態素解析データベース112を利用して、受け取った字幕文字列から単語を分割する。そして、分割部113は、分割された単語を特徴度決定部115に与える。
特徴度データベース114は、単語と、当該単語の特徴度とを対応付けた特徴度情報を記憶する特徴度情報記憶部である。ここで、特徴度は、単語の概念が特徴的であるほど高い値を示すものである。そして、例えば、特徴度データベース114は、特徴度決定部115からの特徴度算出要求を受け取り、特徴度の算出に必要な情報を特徴度決定部115に与える。
図3は、特徴度データベース114における特徴度を説明するための概略図である。
特徴度データベース114は、上位及び下位関係等を考慮して単語を分類したシソーラスと呼ばれる辞書を利用して特徴度を定めている。シソーラスは、図3に示されているように、上位及び下位関係をもつ木構造のようなものである。特徴度データベース114は、より下位に分類されている単語に対して高い特徴度を与え、より上位に分類されている単語に対して低い特徴度を与えている。言い換えると、特徴度データベース114は、単語の概念がより下位概念であるほど、特徴度の値が高くなる。例えば、「哺乳類」、「生物」及び「人間」の3つの単語は、シソーラスでは、上位から「生物」、「哺乳類」及び「人間」の順に分類される。「哺乳類」は「生物」の具体例の1つであり、「人間」は「哺乳類」の具体例の1つだからである。よって、特徴度データベース114は、このように、より具体的なものに対して高い特徴度を与えている。
また、特徴度データベース114は、シソーラスを利用する例に限られず、例えば、様々な分野に関する大量の文書を利用して構築することもできる。この方法では、単語毎に出現する文書数をカウントし、より小数の文書に出現する単語に対し、より高い特徴度が与えられる。一方で、より多くの文書に出現する単語に対し、より低い特徴度が与えられる。言い換えると、特徴度データベース114は、予め定められた調査範囲において、単語の出現頻度が低いほど、特徴度の値が高くなる。例えば、「今日」という単語は、多くの文章に出現しがちな単語であるため、より低い特徴度が与えられる。一方、それと比較して医療分野に特化した単語である「カテーテル」は、出現する文書数が少ないため、より高い特徴度が与えられる。このように、より特定の分野に特化したような単語に対して高い特徴度を与えるよう、特徴度データベース114が構築されていてもよい。
なお、このように文書を利用する方法では、Webページの記述を利用することも考えられる。例えば、より小数のWebページに出現する単語に対し、より高い特徴度が与えられる。一方で、より多くのWebページに出現する単語に対し、より低い特徴度が与えられる。
図2の説明に戻り、特徴度決定部115は、分割部113から与えられた単語の特徴度を決定する。例えば、特徴度決定部115は、特徴度データベース114を参照することにより、分割部113から与えられた単語の特徴度を決定する。そして、特徴度決定部115は、単語と、その単語に対して決定された特徴度とをメタデータ生成部117に与える。
番組情報抽出部116は、TV9よりマルチメディアデータを受け取り、このマルチメディアデータから、番組を特定するために必要な情報を含む番組情報を抽出する。そして、番組情報抽出部116は、抽出された番組情報をメタデータ生成部117に与える。なお、番組情報抽出部116は、マルチメディアデータに番組情報が含まれていない場合には、TV9よりマルチメディアデータとは別に、必要なデータを受け取り、受け取ったデータから番組情報を抽出する。
メタデータ生成部117は、字幕データ抽出部111から字幕データ、特徴度決定部115から単語及びその特徴度、番組情報抽出部116から番組情報を受け取り、これらの情報を用いて、TV9から出力されたマルチメディアデータのメタデータを生成する。そして、メタデータ生成部117は、生成されたメタデータを書き込みバッファ118に与える。
図4は、メタデータ生成部117が生成するメタデータ150の構造を示す概略図である。メタデータ150は、TV9から出力されたマルチメディアデータに含まれている番組毎に、その番組で表示される字幕と、字幕毎の表示時間と、字幕に含まれている単語及びその特徴度とを含む。メタデータ150は、階層A、階層B、階層C、階層D及び階層Eの5つの階層を有する。
階層Aのメタデータ150は、最上位階層に配置されている。このメタデータ150の下位に、メタデータ情報151、番組特定情報152、字幕情報153及び単語情報154が続いている。
階層Bのメタデータ情報151は、全ての番組のメタデータ情報を管理するための、包括的な記述であるメタデータ管理情報1510と、番組毎のメタデータ情報1511〜151mとを含む。
階層Cの番組特定情報152は、階層Bにおける番組毎のメタデータ情報1511〜151m毎に、番組名及び放送日時等を含む番組情報1520及び番組中に出現する字幕データ1521〜152nを含む。なお、字幕データ1521〜152nの各々は、一度に表示される文字列毎のデータになっているものとする。
階層Dの字幕情報153は、階層Cにおける字幕データ1521〜152n毎に、字幕として表示される文字列である字幕文字列1530#1、字幕文字列1530#1が表示される表示開始時刻1530#2、字幕文字列1530#1が表示される表示終了時刻1530#3、及び、字幕文字列1530#1に含まれる単語を特定する単語データ1531〜153pを含む。
階層Eの単語情報154は、階層Dにおける単語データ1521〜152n毎に、単語1540及び単語1540の特徴度1541を含む。
なお、図4においては、メタデータ150を5つの階層とする場合について説明したが、メタデータ150は、字幕の表示時間及び字幕に含まれている単語の特徴度を特定できれば、階層をいくつ有していてもよい。また、図4に示されているメタデータ150は、記録されている全ての番組のメタデータを1つのファイルとして扱う場合について説明したが、例えば、番組毎に独立したファイルが形成されていてもよい。
図2の説明に戻り、書き込みバッファ118は、TV9よりマルチメディアデータを受け取り、また、メタデータ生成部117よりメタデータ150を受け取り、これらのデータを一時的に保持する。そして、書き込みバッファ118は、記録処理制御部102の制御に応じて、これらのデータを書き込みドライブ101に与える。例えば、書き込みバッファ118は、記録処理制御部102より書き込み許可信号を受けると、これらのデータを書き込みドライブ101に与える。そして、前述のように、書き込みドライブ101は、これらのデータを記憶媒体8に記憶する。
図5は、記憶媒体8に記憶されるデータのファイル及びディレクトリの階層構造を示す概略図である。
ルートディレクトリ160は、マルチメディアディレクトリ161及びメタデータディレクトリ162を含む。
マルチメディアディレクトリ161は、情報管理ファイル161a、マルチメディアファイル161b及びバックアップファイル161cを格納する。
情報管理ファイル161aは、マルチメディアディレクトリ161に格納されるファイルを管理するための情報のファイルである。
マルチメディアファイル161bは、TV9から出力されたマルチメディアデータを格納するファイルである。
バックアップファイル161cは、バックアップ用のファイルである。
メタデータディレクトリ162は、メタデータファイル162aを格納する。
メタデータファイル162aは、メタデータ150を格納するファイルである。
なお、本実施の形態において記憶媒体8に格納されるデータのファイル及びディレクトリの構造は、図5に示された構造に限られず、他のファイル及びディレクトリの構造でもよい。
また、情報管理ファイル161a及びマルチメディアデータファイル161bの何れかは、メタデータ150の有無又はメタデータ150が無効であることを示すフラグを含んでいてもよい。
図6は、再生処理部130の構成を概略的に示すブロック図である。再生処理部130は、再生処理制御部131と、読み取りドライブ132と、再生データ生成部140とを備える。なお、図6の括弧内の符号は、それぞれ実施の形態2〜7の構成を示している。
再生処理制御部131は、読み取りドライブ132及び再生データ生成部140を統括的に制御する。例えば、再生処理制御部131は、再生データ生成部140より、U/I部12を介して入力された、再生処理部130での再生モードを示す再生モード制御信号を受け取る。そして、再生処理制御部131は、受け取った再生モード制御信号を読み取りドライブ132及び再生データ生成部140に与える。本実施の形態における再生モードは、記憶媒体8に記憶されているマルチメディアデータの全体を順次再生する通常再生モードと、このマルチメディアデータの一部を順次再生する要約再生モードとがある。
読み取りドライブ132は、再生処理制御部131及び再生データ生成部140からの制御に応じて、記憶媒体8からデータを読み出す。例えば、読み取りドライブ132は、再生処理制御部131から受け取った再生モード制御信号を解析して、この再生モード制御信号が通常再生モードを示すものか、要約再生モードを示すものかを判別する。そして、読み取りドライブ132は、再生モード制御信号が通常再生モードを示す場合には、記憶媒体8からマルチメディアデータを読み出して、このマルチメディアデータを再生データ生成部140に与える。
一方、読み取りドライブ132は、再生モード制御信号が要約再生モードを示す場合には、記憶媒体8からメタデータ150を読み出して、このメタデータ150を再生データ生成部140に与える。そして、読み取りドライブ132は、要約して再生するマルチメディアデータの部分を示す再生制御信号を再生データ生成部140から受け取り、受け取った再生制御信号で示される部分のデータ(部分データ)を記憶媒体8から読み出して、読み出した部分データを再生データ生成部140に与える。
再生データ生成部140は、通常再生モードでは、読み取りドライブ132から与えられたマルチメディアデータをTV9に与える。
また、再生データ生成部140は、要約再生モードでは、読み取りドライブ132から与えられたメタデータ150を解析することにより、特徴度の高い字幕部分を特定して、特定した部分に対応するデータを読み取りドライブ132に読み出させる。そして、再生データ生成部140は、読み取りドライブ132から与えられた部分データをTV9に与える。
再生データ生成部140は、ユーザインタフェース制御部(以下、U/I制御部という)141と、読み取りドライブインターフェース部(以下、読み取りドライブI/F部という)142と、メタデータ分析部143と、再生制御部144とを備える。
U/I制御部141は、U/I部12の制御を行う。例えば、U/I制御部141は、U/I部12を介して、ユーザより再生モード等のユーザ設定の入力を受けて、このユーザ設定を再生処理制御部131に与える。また、U/I制御部141は、U/I部12を介して、特徴度の高低を判断するための特徴度閾値の入力を受けて、この特徴度閾値をメタデータ分析部143に与える。
読み取りドライブI/F部142は、読み取りドライブ132から与えられたデータの種類を判別して、判別された種類に応じて、当該データの送り先を変更する。例えば、読み取りドライブI/F部142は、読み取りドライブ132から与えられたデータがマルチメディアデータであるか、又は、メタデータ150であるかを判別する。そして、読み取りドライブI/F部142は、読み取りドライブ132から与えられたデータがマルチメディアデータである場合は、このデータをTV9に与える。一方、読み取りドライブI/F部142は、読み取りドライブ132から与えられたデータがメタデータ150である場合は、このデータをメタデータ分析部143に与える。
メタデータ分析部143は、読み取りドライブI/F部142から与えられたメタデータ150を分析して、U/I制御部141から与えられた特徴度閾値を用いて特徴度が高い字幕が表示される時間を特定して、特定された時間を再生時間として再生制御部144に通知する。例えば、メタデータ分析部143は、再生処理制御部131から与えられた再生モード制御信号が、通常再生モードを示すか、要約再生モードを示すかを判別する。そして、メタデータ分析部143は、再生モード制御信号が通常再生モードを示す場合には、処理を終了する。一方、メタデータ分析部143は、再生モード制御信号が要約再生モードを示す場合には、読み取りドライブI/F部142よりメタデータ150を受け取る。そして、メタデータ分析部143は、受け取ったメタデータ150のC層から、字幕データ1521〜152nを読み出す。メタデータ分析部143は、読み出した字幕データ1521〜152nの各々から、その下位に格納されている特徴度を読み出す。そして、メタデータ分析部143は、読み出された特徴度から、U/I制御部141から与えられた特徴度閾値を超える特徴度を特定する。メタデータ分析部143は、特定された特徴度を有する単語が含まれる字幕文字列の表示開始時刻及び表示終了時刻を読み出した字幕データ1521〜152nから取得する。そして、メタデータ分析部143は、取得された表示開始時刻及び表示終了時刻を、再生開始時刻及び再生終了時刻として再生制御部144に通知する。
再生制御部144は、再生制御を行う。例えば、再生制御部144は、メタデータ分析部143から与えられた再生時間(例えば、再生開始時刻及び再生終了時刻)を示す再生制御信号を生成し、この再生制御信号を読み取りドライブ132に与える。これにより、再生制御部144は、マルチメディアデータの内、メタデータ分析部143により特定された再生時間に対応する部分の要約再生を制御することができる。
図7は、記録処理部100での処理を示すフローチャートである。
まず、字幕データ抽出部111は、TV9からマルチメディアデータを受け取り、受け取ったマルチメディアデータから、字幕データを抽出する(S10)。そして、字幕データ抽出部111は、抽出された字幕データに含まれている字幕文字列を、分割部113に与えるとともに、抽出された字幕データを、メタデータ生成部117に与える。
次に、分割部113は、形態素解析データベース112を利用して、字幕データ抽出部111から与えられた字幕文字列を分割して、単語を取得する(S11)。そして、分割部113は、取得された単語を、特徴度決定部115に与える。
次に、特徴度決定部115は、特徴度データベース114を参照して、分割部113から与えられた単語の特徴度を取得する(S12)。そして、特徴度決定部115は、分割部113から与えられた単語及びその特徴度を、メタデータ生成部117に与える。
また、番組情報抽出部116は、TV9からマルチメディアデータを受け取り、受け取ったマルチメディアデータから、番組情報を抽出する(S13)。そして、番組情報抽出部116は、抽出された番組情報を、メタデータ生成部117に与える。
次に、メタデータ生成部117は、字幕データ抽出部111から字幕データ、特徴度決定部115から単語及びその特徴度、並びに、番組情報抽出部116から番組情報を受け取る。そして、メタデータ生成部117は、これらからメタデータを生成する(S14)。具体的には、メタデータ生成部117は、番組情報抽出部116から受け取った番組情報中の番組タイトル及び放送日時のデータを、図4に示されているメタデータ150の構造に従って、C層の番組情報1520として格納する。また、メタデータ生成部117は、字幕データ抽出部111から受け取った字幕データ中の表示開始時刻、表示終了時刻及び字幕文字列を、図4に示されているメタデータ150の構造に従って、D層に格納する。さらに、特徴度決定部115から受け取った単語及びその特徴度を、図4に示されているメタデータ150の構造に従って、E層に格納する。そして、メタデータ生成部117は、生成されたメタデータを、書き込みバッファ118に与える。
書き込みバッファ118は、TV9からのマルチメディアデータ、及び、メタデータ生成部117からのメタデータを受け取り、一時的に保持する。そして、書き込みバッファ118は、記録処理制御部102から書き込み許可信号を受信すると、一時的に保持したマルチメディアデータ及びメタデータを書き込みドライブ101へ出力する。書き込みドライブ101は、書き込みバッファ118から与えられたマルチメディアデータ及びメタデータを記憶媒体8に書き込むことで記録する(S15)。
図8は、再生処理部130での処理を示すフローチャートである。
読み取りドライブ132は、再生処理制御部131から受信した再生モード制御信号を判別する(S20)。そして、再生処理制御部131から受信した再生モード制御信号が通常再生モードを示す場合(S20:NO)には、処理はステップS21に進み、再生処理制御部131から受信した再生モード制御信号が要約再生モードを示す場合(S20:YES)には、処理はステップS22に進む。なお、再生処理制御部131は、U/I制御部141より、通常再生モードのユーザ設定を受け取った場合には、通常再生モードを示す再生モード制御信号を読み取りドライブ132に与え、要約再生モードのユーザ設定を受け取った場合には、要約再生モードを示す再生モード制御信号を読み取りドライブ132に与える。
ステップS21では、読み取りドライブ132は、記憶媒体8からマルチメディアデータを読み出し、読み取りドライブI/F部142に与える。そして、読み取りドライブI/F部142は、受け取ったマルチメディアデータを外部へ出力する。
ステップS22では、読み取りドライブ132は、記憶媒体8からメタデータを読み出し、読み取りドライブI/F部142に与える。そして、読み取りドライブI/F部142は、読み取りドライブ132から与えられたメタデータを、メタデータ分析部143に与える。
次に、メタデータ分析部143は、読み取りドライブI/F部142から与えられたメタデータを受け取り、受け取られたメタデータのC層〜E層より、単語、その特徴度及び字幕データを読み出す(S23)。
次に、メタデータ分析部143は、ステップS23で読み出された単語及びその特徴度の内、U/I制御部141から受け取った特徴度閾値を超える単語を特定する。また、メタデータ分析部143は、特定された単語が含まれる字幕文字列の表示開始時刻及び表示終了時刻を、ステップS23で読み出された字幕データから取得する。そして、メタデータ分析部143は、取得された表示開始時刻及び表示終了時刻を、再生開始時刻及び再生終了時刻として再生制御部144に与える(S24)。
次に、再生制御部144は、メタデータ分析部143から受け取った再生開始時刻及び再生終了時刻を、再生箇所を指定する再生制御信号として読み取りドライブ132に与える(S25)。
次に、読み取りドライブ132は、再生制御部144から再生箇所を指定する再生制御信号を受け取り、この再生制御信号で指定された再生箇所のマルチメディアデータを、記憶媒体8から読み出す。そして、読み取りドライブ132は、読み出されたマルチメディアデータを、読み取りドライブI/F部142に与える。読み取りドライブI/F部142は、受け取ったマルチメディアデータを外部へ出力する(S26)。
以上のように、本実施の形態1に係る記録再生装置1によれば、記録対象であるマルチメディアデータから、単語及びその特徴度を抽出して、メタデータとして記憶媒体8に記録しておくため、要約再生時に、特徴度が予め定められた特徴度閾値を超える単語を含む字幕文字列が表示される時間の映像を抽出することができる。
図9は、特徴度と特徴度閾値との間の関係を概略的に示すグラフである。図9に示されているグラフは、横軸を再生時刻(再生対象番組の先頭からの経過時刻)とし、縦軸を特徴度としている。図9に示されているように、記憶媒体8に記憶されているメタデータ内の特徴度170は、連続的に変化する。また、図9に示されている符号171は、特徴度閾値を示し、この特徴度閾値171はユーザの設定により変化させることができる。要約再生をする際は、特徴度閾値171よりも高い特徴度170を有する単語について、その単語が出現する字幕文字列の表示開始時刻172A、172Bから表示終了時刻173A、173Bまでの区間174A、174Bの映像が再生され、それ以外の区間175A、175B、175Cの映像はスキップされる。なお、図中の符号176は、現在再生されている箇所(時刻)を示している。
以上のように、実施の形態1に係る記録再生装置1においては、記録される番組の字幕文字列に含まれる単語について、特徴度を抽出することが可能であり、この特徴度に基づいて番組の要約を作成することができる。字幕文字列は、出演者の会話及びナレーションといった、番組内容を直接的に表す要素を文字データとしたものである。このため、特徴度は、「内容的特徴度」ということができ、特徴度の変動と番組内容の重要度との相関は高い。従って、この特徴度が高い単語を含む箇所を要約として再生することで、ユーザは全体の展開を短時間で理解することができる。また、実施の形態1に係る記録再生装置1は、字幕文字列を含む番組であればジャンルを問わず特徴度を算出できるため、全てのジャンルの番組について有効的に要約再生を行うことができる。
実施の形態1に係る記録再生装置1は、特徴度を算出する単語について、分割部113によって分割及び抽出された全ての単語を対象にしてもよいし、品詞によって対象とする単語を絞ってもよい。例えば、分割部113が抽出した単語のうち、名詞に絞って特徴度が算出され、メタデータに記録されるように構成することもできる。これにより、特徴度算出処理を行う回数等を減らすことができる。さらに、メタデータに記録するデータ量を抑えることができる。
実施の形態1に係る記録再生装置1は、単語を特徴度抽出の単位としているが、複合名詞や句等としてもよい。例えば、「凶悪犯罪者」の文字列を、「凶悪」、「犯罪」及び「者」に分割するのではなく、「凶悪犯罪者」のままその特徴道が抽出されてもよい。これにより、より番組中での出現意図に沿った形で語又は句を抽出することができ、特徴度を付与することができるため、より精度の高い要約を生成することができる。この場合には、例えば、分割部113は、字幕文字列から語句を分割する。特徴度データベース114は、語句と、当該語句の特徴度とを対応付けた特徴度情報を記憶する。特徴度決定部115は、語句の特徴度を決定する。メタデータ生成部117は、語句とその特徴度をメタデータ150に含める。そして、メタデータ分析部143は、メタデータを分析して、特徴度の高い語句の字幕表示時間を再生時間として特定する。
実施の形態1に係る記録再生装置1は、更に、図10に示されているように、特徴度決定部115−1が、図示されていない通信部を介して、外部のネットワーク180に接続することができるように構成され、外部のネットワーク180上にあるアップデートデータベース181を参照して必要な情報を取得することで、特徴度データベース114をアップデートできるように構成されていてもよい。これにより、流行語、若者が用いる言葉、又は、業界用語等の新語が出現した場合でも、全ての単語に関して特徴度を算出することができる。
実施の形態1に係る記録再生装置1は、図2に示されているように、記録再生装置1の内部に特徴度データベース114を備え、特徴度を決定しているが、このような例に限定されるものではない。例えば、図11に示されているように、特徴度決定部115−2が、図示されていない通信部を介して、外部のネットワーク180に接続することができるように構成され、外部のネットワーク180上にある特徴度データベース114−1を用いて特徴度を決定してもよい。これにより、記録再生装置1の内部に特徴度データベース114を備える必要がなく、ハードウェア又はソフトウェアのリソースを抑えることができる。
実施の形態1に係る記録再生装置1は、メタデータ分析部143が特徴度閾値を超える特徴度を有する単語を抽出し、その単語を含む字幕文字列の表示開始時刻と表示終了時刻を特定しているが、1つの字幕文字列中に複数の単語が含まれる場合も想定される。この場合、同一の字幕文字列中に1語でも特徴度閾値を超える特徴度を有する単語があれば再生対象とする、又は、同一の字幕文字列中の単語が持つ特徴度の平均が特徴度閾値を超える場合に、再生対象とするといった方法を採用することができる。
実施の形態1に係る記録再生装置1は、図12に示されているように、再生制御部144−1が図13に示されているようなOSDプレーン190を生成し、重畳部145がこれを図14に示されているようにマルチメディアデータの映像197に重畳して外部に出力するように構成されていてもよい。図13に示されているOSDプレーン190は、横軸191を再生時刻とし、縦軸192を特徴度としているグラフを表示する。このOSDプレーン190は、メタデータ分析部143によって抽出された再生時刻と特徴度193との関係を表しており、また、現在再生している箇所194及び設定されている特徴度閾値195を表すこともできる。さらに、このようなOSDプレーン190を重畳させるか否かは、ユーザが設定することもできる。
実施の形態1に係る記録再生装置1は、記録時に特徴度の決定及びメタデータを生成するようにしているが、記録時にこれらをせずに、要約再生時において特徴度を算出し、特徴度閾値との比較処理を行ってもよい。この場合には、記録時の処理量を抑えることができる。一方、実施の形態1のように記録時にメタデータを生成する場合には、再生時の処理量を抑えることができる。
実施の形態2.
図1に示されているように、実施の形態2に係る記録再生装置2は、データ処理部20と、全体制御部11と、U/I部12とを備える。実施の形態2に係る記録再生装置2は、データ処理部20において、実施の形態1に係る記録再生装置1と異なっている。
データ処理部20は、データを記録し、記録されたデータを再生する。データ処理部20は、データを記録する記録処理部200と、記録されたデータを再生する再生処理部230とを備える。実施の形態2におけるデータ処理部20は、記録処理部200及び再生処理部230において、実施の形態1におけるデータ処理部10と異なっている。
図15は、記録処理部200の構成を概略的に示すブロック図である。記録処理部200は、書き込みドライブ101と、記録処理制御部102と、記録データ生成部210とを備える。実施の形態2における記録処理部200は、記録データ生成部210において、実施の形態1における記録処理部100と異なっている。
記録データ生成部210は、TV9から出力されたマルチメディアデータを受け取り、このマルチメディアデータからメタデータを生成する。そして、記録データ生成部210は、マルチメディアデータ及びメタデータを書き込みドライブ101に与えて、記憶媒体8に記録させる。記録データ生成部210は、字幕データ抽出部111と、形態素解析データベース112と、分割部113と、特徴度データベース114と、特徴度決定部215と、番組情報抽出部116と、メタデータ生成部217と、書き込みバッファ118と、電子番組表データ抽出部としてのEPG(Electronic Program Guide)データ抽出部219と、電子番組表分割部としてのEPG分割部220とを備える。実施の形態2における記録データ生成部210は、特徴度決定部215及びメタデータ生成部217での処理の点、並びに、EPGデータ抽出部219及びEPG分割部220がさらに備えられている点において、実施の形態1における記録データ生成部110と異なっている。
EPGデータ抽出部219は、TV9よりマルチメディアデータを受け取り、このマルチメディアデータから、個別EPGデータを抽出する。個別EPGデータは、記録対象の番組に関する、番組内容、出演者及び見どころ等の文字データである。そして、EPGデータ抽出部219は、抽出された個別EPGデータを、EPG分割部220に与える。なお、EPGデータ抽出部219は、マルチメディアデータにEPGデータが含まれていない場合には、TV9よりマルチメディアデータとは別に、EPGデータを受け取り、このEPGデータから個別EPGデータを抽出する。
EPG分割部220は、EPGデータ抽出部219から個別EPGデータを受け取り、この個別EPGデータに含まれている文字列を単語に分割する。例えば、EPG分割部220は、形態素解析データベース112を利用して、個別EPGデータに含まれている文字列から単語を分割する。なお、EPG分割部220により分割された単語を、分割部113により分割された単語と区別するために、EPG単語という。そして、EPG分割部220は、分割されたEPG単語を特徴度決定部215に与える。
特徴度決定部215は、実施の形態1と同様の処理を行う他、分割部113から与えられた単語と、EPG分割部220から与えられたEPG単語とを比較して、分割部113から与えられた単語の内、EPG分割部220から与えられたEPG単語と一致する単語があるか否かを判断する。特徴度決定部215は、分割部113から与えられた単語の内、EPG分割部220から与えられたEPG単語と一致する単語がある場合には、このような単語に、その特徴度を高めるための重み値を与える。そして、特徴度決定部215は、分割部113から与えられた単語、その特徴度、及び、その重み値がある場合にはその重み値をメタデータ生成部217に与える。
メタデータ生成部217は、字幕データ抽出部111から字幕データ、特徴度決定部215から単語、その特徴度及びその重み値、番組情報抽出部116から番組情報を受け取り、これらの情報を用いて、TV9から出力されたマルチメディアデータのメタデータを生成する。そして、メタデータ生成部217は、生成されたメタデータを書き込みバッファ118に与える。
図16は、メタデータ生成部217が生成するメタデータ250の構造を示す概略図である。実施の形態2におけるメタデータ250は、階層Eの単語情報254において、実施の形態1におけるメタデータ150と異なっている。
階層Eの単語情報254は、階層Dにおける単語データ1521〜152n毎に、単語1540及び単語1540の特徴度1541を含む。さらに、単語情報254は、付与されている場合には、重み値2542を含む。
図6に示されているように、再生処理部230は、再生処理制御部131と、読み取りドライブ132と、再生データ生成部240とを備える。実施の形態2における再生処理部230は、再生データ生成部240において、実施の形態1における再生処理部130と異なっている。
再生データ生成部240は、U/I制御部141と、読み取りドライブI/F部142と、メタデータ分析部243と、再生制御部144とを備える。実施の形態2における再生データ生成部240は、メタデータ分析部243において、実施の形態1における再生データ生成部140と異なっている。
メタデータ分析部243は、読み取りドライブI/F部142から与えられたメタデータ150を分析して、U/I制御部141から与えられた特徴度閾値を用いて特徴度が高い字幕が表示される時間を特定して、特定された時間を再生時間として再生制御部144に通知する。例えば、メタデータ分析部243は、再生処理制御部131から与えられた再生モード制御信号が、通常再生モードを示すか、要約再生モードを示すかを判別する。そして、メタデータ分析部243は、再生モード制御信号が通常再生モードを示す場合には、処理を終了する。一方、メタデータ分析部243は、再生モード制御信号が通常再生モードを示す場合には、読み取りドライブI/F部142よりメタデータ250を受け取る。そして、メタデータ分析部243は、受け取ったメタデータ250のC層から、字幕データ1521〜152nを読み出す。メタデータ分析部243は、読み出した字幕データ1521〜152nの各々から、その下位に格納されている特徴度と、存在する場合には重み値とを読み出す。そして、メタデータ分析部243は、読み出された特徴度、及び、重み値が存在する場合には重み値を特徴度に掛け合わせた修正特徴度から、U/I制御部141から与えられた特徴度閾値を超える特徴度及び修正特徴度を特定する。メタデータ分析部243は、特定された特徴度を有する単語及び特定された修正特徴度を有する単語が含まれる字幕文字列の表示開始時刻及び表示終了時刻を、読み出した字幕データ1521〜152nから取得する。そして、メタデータ分析部243は、取得された表示開始時刻及び表示終了時刻を、再生開始時刻及び再生終了時刻として再生制御部144に通知する。言い換えると、実施の形態2におけるメタデータ分析部243は、閾値処理をする際に、重み値を考慮する点において、実施の形態1におけるメタデータ分析部143と異なっている。
個別EPGデータの文字列は、番組の見どころについて記述した、文字による要約といえる。実施の形態2に係る記録再生装置2は、この文字による要約に含まれる単語について、重み値を設定することができ、その値を反映した上で要約再生を行えるため、より精度の高い要約再生を行うことができる。
実施の形態2に係る記録再生装置2は、記録処理部200にEPG分割部220を持つように構成しているが、EPG分割部220における、受信された文字データから単語に分割する処理については、分割部113と同様のため、これらを共通化してもよい。それにより、ハードウェア又はソフトウェアのリソースを抑えることができる。
実施の形態2に係る記録再生装置2は、重み値をメタデータ250のE層に別途記録するように構成しているがこのような例に限定されるものではない。例えば、特徴度決定部215が、重み値を特徴度に掛け合わせた上で、メタデータ生成部217に与えることで、メタデータ250のE層が、実施の形態1と同様に、単語1540及び特徴度1541により構成されていてもよい。これにより、メタデータ250に記録されるデータを減らすことができ、メタデータの容量を減らすことができる。また、再生時にメタデータから重み値を抽出し、掛け合わせる必要が無いために処理が簡単化できる。
実施の形態2に係る記録再生装置2は、重み値を利用した要約再生を行えるよう構成しているが、実際に重み値を用いるか用いないかをユーザが設定できるように構成されていてもよい。この場合、メタデータ分析部243は、U/I制御部141を介してユーザによる設定を読み込み、重み値を掛け合わせるか否かを制御するようにすればよい。これにより、同じ構成で2通りの要約再生が実施でき、ユーザは所望の要約再生方法を選択できる。
実施の形態2に係る記録再生装置2でも、語句を特徴度抽出の単位とすることができる。この場合には、例えば、EPG分割部220は、個別EPGデータの文字列を語句に分割する。特徴度決定部215は、分割部113から与えられた語句と、EPG分割部220より与えられた語句を比較して、重み値を付与する。メタデータ生成部217は、メタデータ250に、語句、その特徴度及びその重み値を含める。
実施の形態3.
図1に示されているように、実施の形態3に係る記録再生装置3は、データ処理部30と、全体制御部11と、U/I部12とを備える。実施の形態3に係る記録再生装置3は、データ処理部30において、実施の形態1に係る記録再生装置1と異なっている。
データ処理部30は、データを記録し、記録されたデータを再生する。データ処理部30は、データを記録する記録処理部300と、記録されたデータを再生する再生処理部230とを備える。実施の形態3におけるデータ処理部30は、記録処理部300及び再生処理部230において、実施の形態1におけるデータ処理部10と異なっている。なお、実施の形態3における再生処理部230は、実施の形態2と同様に構成されている。
図17は、記録処理部300の構成を概略的に示すブロック図である。記録処理部300は、書き込みドライブ101と、記録処理制御部102と、記録データ生成部310とを備える。実施の形態3における記録処理部300は、記録データ生成部310において、実施の形態1における記録処理部100と異なっている。
記録データ生成部310は、TV9から出力されたマルチメディアデータを受け取り、このマルチメディアデータからメタデータを生成する。そして、記録データ生成部310は、マルチメディアデータ及びメタデータを書き込みドライブ101に与えて、記憶媒体8に記録させる。記録データ生成部310は、字幕データ抽出部111と、形態素解析データベース112と、分割部113と、特徴度データベース114と、特徴度決定部315と、番組情報抽出部116と、メタデータ生成部217と、書き込みバッファ118と、音声情報生成部321とを備える。実施の形態3における記録データ生成部310は、特徴度決定部315及びメタデータ生成部217での処理の点、並びに、音声情報生成部321がさらに備えられている点において、実施の形態1における記録データ生成部110と異なっている。なお、メタデータ生成部217での処理は、実施の形態2におけるメタデータ生成部217と同様である。
音声情報生成部321は、TV9よりマルチメディアデータを受け取り、このマルチメディアデータから、字幕文字列が表示される区間の音声信号を、表示される字幕文字列毎に抽出する。次に、音声情報生成部321は、抽出された音声信号から、その字幕文字列が表示される区間における音量を示す音量データを取得する。次に、音声情報生成部321は、取得された音量データで示される音量を、その字幕文字列が表示される区間において積分することで、その字幕文字列が表示される区間における音量値を算出する。そして、音声情報生成部321は、算出された音量値を特徴度決定部315に与える。
特徴度決定部315は、実施の形態1と同様の処理を行う他、音声情報生成部321から与えられた音量値が大きいほど、その区間における字幕文字列に含まれている単語の特徴度が高くなるような重み値を、その区間における字幕文字列に含まれている単語に付与する。ここで、特徴度決定部315は、音量値を一定範囲の値に正規化することで、重み値とする。そして、特徴度決定部315は、分割部113から与えられた単語、その特徴度、及び、その重み値をメタデータ生成部217に与える。
大きな音量で話している内容は重要な内容である場合があるが、実施の形態3に係る記録再生装置3は、1つの字幕文字列毎に、その字幕文字列が発せられたときの音量を重み値として表すことで、その重要度を反映して要約再生を行うことができる。
実施の形態3に係る記録再生装置3でも、語句を特徴度抽出の単位とすることができる。この場合には、例えば、特徴度決定部315は、音声情報生成部321から与えられる音量値に基づいて語句に重み値を付与する。
実施の形態4.
図1に示されているように、実施の形態4に係る記録再生装置4は、データ処理部40と、全体制御部11と、U/I部12とを備える。実施の形態4に係る記録再生装置4は、データ処理部40において、実施の形態1に係る記録再生装置1と異なっている。
データ処理部40は、データを記録し、記録されたデータを再生する。データ処理部40は、データを記録する記録処理部400と、記録されたデータを再生する再生処理部230とを備える。実施の形態4におけるデータ処理部40は、記録処理部400及び再生処理部230において、実施の形態1におけるデータ処理部10と異なっている。なお、実施の形態4における再生処理部230は、実施の形態2と同様に構成されている。
図18は、記録処理部400の構成を概略的に示すブロック図である。記録処理部400は、書き込みドライブ101と、記録処理制御部102と、記録データ生成部410とを備える。実施の形態4における記録処理部400は、記録データ生成部410において、実施の形態1における記録処理部100と異なっている。
記録データ生成部410は、TV9から出力されたマルチメディアデータを受け取り、このマルチメディアデータからメタデータを生成する。そして、記録データ生成部410は、マルチメディアデータ及びメタデータを書き込みドライブ101に与えて、記憶媒体8に記録させる。記録データ生成部410は、字幕データ抽出部111と、形態素解析データベース112と、分割部113と、特徴度データベース114と、特徴度決定部415と、番組情報抽出部116と、メタデータ生成部217と、書き込みバッファ118と、音声認識処理部422とを備える。実施の形態4における記録データ生成部410は、特徴度決定部415及びメタデータ生成部217での処理の点、並びに、音声認識処理部422がさらに備えられている点において、実施の形態1における記録データ生成部110と異なっている。なお、メタデータ生成部217での処理は、実施の形態2におけるメタデータ生成部217と同様である。
音声認識処理部422は、TV9よりマルチメディアデータを受け取り、このマルチメディアデータから、字幕文字列が表示されている区間の音声信号を抽出する。次に、音声認識処理部422は、音声認識を行い、各単語が発せられている区間(以下、単語区間という)を特定する。次に、音声認識処理部422は、抽出された音声信号から特定された単語区間における音量を示す音量データを取得する。次に、音声認識処理部422は、取得された音量データで示される音量を、その単語区間において積分することで、その単語区間における音量値である単語音量値を算出する。そして、音声情報生成部321は、認識された単語(以下、認識単語という)と、その単語音量値とを特徴度決定部415に与える。
特徴度決定部415は、実施の形態1と同様の処理を行う他、分割部113から与えられた単語と、音声認識処理部422から与えられた認識単語とを比較して、分割部113から与えられた単語の内、音声認識処理部422から与えられた認識単語と一致する単語を特定する。次に、特徴度決定部415は、特定された単語に、一致する認識単語の単語音量値が大きいほど、特定された単語の特徴度が高くなる重み値を付与する。例えば、特徴度決定部415は、単語音量値を一定範囲の値に正規化することで、重み値とすることができる。なお、同じ単語が何度も出現している場合でも、分割部113、音声認識処理部422及び特徴度決定部415は、出現時刻等を利用して、一つ一つの単語を区別して、それぞれの単語についての単語音量値から重み値を算出することができる。そして、特徴度決定部415は、分割部113から与えられた単語、その特徴度、及び、その重み値をメタデータ生成部217に与える。
実施の形態3は、1つの字幕文字列単位で音量を積分して重み値を算出しているが、実施の形態4は、1つの単語単位で音量を積分して重み値を算出している。即ち、実施の形態3では、1つの字幕文字列に含まれる単語の重み値は全て同じであるのに対して、実施の形態4では、1つの字幕文字列に含まれる単語であっても、単語毎に重み値が算出される。
大きな音量で発言された単語は内容において重要な場合があるが、実施の形態4に係る記録再生装置4によれば、単語毎に、その単語が発せられたときの音量を重み値として表すことで、その重要度を反映して要約再生を行うことができる。言い換えると、実施の形態3に比べ、より細かい音量情報を重み値として反映することができる。
なお、実施の形態2〜4は、それぞれ異なる種類の重み値を算出して要約生成に利用するものであるが、当然の事ながら、要約再生に利用できる重み値は1種類に限らない。つまり、記録再生装置は、実施の形態2〜4における複数の重み値をメタデータに記録し、その中から1乃至複数の重み値を閾値処理の際に掛け合わせるように構成されていてもよい。
実施の形態4に係る記録再生装置4でも、語句を特徴度抽出の単位とすることができる。この場合には、例えば、音声認識処理部422は、語句に対して音量値を算出する。特徴度決定部415は、音声認識処理部422から与えられた音量値に基づいて、語句に重み値を付与する。
実施の形態5.
図1に示されているように、実施の形態5に係る記録再生装置5は、データ処理部50と、全体制御部11と、U/I部12とを備える。実施の形態5に係る記録再生装置5は、データ処理部50において、実施の形態1に係る記録再生装置1と異なっている。
データ処理部50は、データを記録し、記録されたデータを再生する。データ処理部50は、データを記録する記録処理部500と、記録されたデータを再生する再生処理部530とを備える。実施の形態5におけるデータ処理部50は、記録処理部500及び再生処理部530において、実施の形態1におけるデータ処理部10と異なっている。
図19は、記録処理部500の構成を概略的に示すブロック図である。記録処理部500は、書き込みドライブ101と、記録処理制御部102と、記録データ生成部510とを備える。実施の形態5における記録処理部500は、記録データ生成部510において、実施の形態1における記録処理部100と異なっている。
記録データ生成部510は、TV9から出力されたマルチメディアデータを受け取り、このマルチメディアデータからメタデータを生成する。そして、記録データ生成部510は、マルチメディアデータ及びメタデータを書き込みドライブ101に与えて、記憶媒体8に記録させる。記録データ生成部510は、字幕データ抽出部111と、形態素解析データベース112と、分割部113と、特徴度データベース114と、番組情報抽出部116と、メタデータ生成部517と、書き込みバッファ118と、シーン抽出部523と、シーン特徴度算出部524とを備える。実施の形態5における記録データ生成部510は、メタデータ生成部517での処理の点、シーン抽出部523が設けられている点、並びに、実施の形態1における特徴度決定部115の代わりにシーン特徴度算出部524が設けられている点において、実施の形態1における記録データ生成部110と異なっている。なお、本実施の形態における分割部113は、分割された単語をシーン特徴度算出部524に与える。
シーン抽出部523は、TV9から出力されたマルチメディアデータを受け取り、このマルチメディアデータを、複数のシーンに分割する。例えば、シーン抽出部523は、マルチメディアデータから、動きベクトル、カラーヒストグラム、音声周波数、特性、音量及び音声関連情報の少なくとも何れか1つを抽出し、抽出されたものを分析することで、マルチメディアデータをいくつかのシーンに分割する。このようなシーンの分割方法は、一般に多くの方法が知られている。そして、シーン抽出部523は、分割された各々のシーンについて、シーン再生時間(シーン再生開始時刻及びシーン再生終了時刻)をメタデータ生成部517及びシーン特徴度算出部524に与える。
シーン特徴度算出部524は、特徴度データベース114を利用することで、分割部113から与えられた単語の特徴度を求める算出部である。さらに、シーン特徴度算出部524は、シーン抽出部523から与えられたシーン再生時間に表示される字幕文字列に含まれる単語の特徴度の平均を求め、求められた平均をシーン特徴度とする。そして、シーン特徴度算出部524は、シーン再生時間とそのシーン特徴度とをメタデータ生成部517に与える。
メタデータ生成部517は、字幕データ抽出部111から字幕データ、シーン特徴度算出部524からシーン再生時間及びそのシーン特徴度、並びに、番組情報抽出部116から番組情報を受け取り、これらの情報を用いて、TV9から出力されたマルチメディアデータのメタデータを生成する。そして、メタデータ生成部517は、生成されたメタデータを書き込みバッファ118に与える。
図20は、メタデータ生成部517が生成するメタデータ550の構造を示す概略図である。メタデータ550は、TV9から出力されたマルチメディアデータに含まれている番組毎に、その番組に含まれるシーンの再生時間と、そのシーンのシーン特徴度とを示す。メタデータ550は、階層A、階層B、階層C及び階層Dの4つの階層を有する。
階層Aのメタデータ550は、最上位階層に配置されている。このメタデータ550の下位に、メタデータ情報551、番組特定情報552及びシーン情報553が続いている。
階層Bのメタデータ情報551は、全ての番組のメタデータ情報を管理するための、包括的な記述であるメタデータ管理情報5510と、番組毎のメタデータ情報5511〜551mとを含む。
階層Cの番組特定情報552は、階層Bにおける番組毎のメタデータ情報5511〜551m毎に、番組名及び放送日時等を含む番組情報5520及び番組に含まれるシーンデータ5521〜552nを含む。なお、シーンデータ5521〜552nの各々は、番組から分割された各々のシーンを示すデータになっているものとする。
階層Dのシーン情報553は、階層Cにおけるシーンデータ5521〜552n毎に、シーン再生開始時刻5530、シーン再生終了時刻5531、及び、シーン特徴度5532を含む。
なお、図20においては、メタデータ550を4つの階層とする場合について説明したが、メタデータ550は、シーンの再生時間及びそのシーンのシーン特徴度を特定できれば、階層をいくつ有していてもよい。また、図20に示されているメタデータ550は、記録されている全ての番組のメタデータを1つのファイルとして扱う場合について説明したが、例えば、番組毎に独立したファイルが形成されていてもよい。
図6に示されているように、再生処理部530は、再生処理制御部131と、読み取りドライブ132と、再生データ生成部540とを備える。実施の形態5における再生処理部530は、再生データ生成部540において、実施の形態1における再生処理部130と異なっている。
再生データ生成部540は、U/I制御部541と、読み取りドライブI/F部142と、メタデータ分析部543と、再生制御部144とを備える。実施の形態5における再生データ生成部540は、U/I制御部541及びメタデータ分析部543において、実施の形態1における再生データ生成部140と異なっている。
U/I制御部541は、U/I部12の制御を行う。例えば、U/I制御部541は、U/I部12を介して、ユーザより再生モード等のユーザ設定の入力を受けて、このユーザ設定を再生処理制御部131に与える。また、U/I制御部541は、U/I部12を介して、シーン特徴度の高低を判断するためのシーン特徴度閾値の入力を受けて、このシーン特徴度閾値をメタデータ分析部543に与える。
メタデータ分析部543は、読み取りドライブI/F部142から与えられたメタデータ550を分析して、U/I制御部541から与えられたシーン特徴度閾値を用いてシーン特徴度が高いシーンのシーン再生時間を特定して、特定されたシーン再生時間を再生制御部144に通知する。例えば、メタデータ分析部543は、再生処理制御部131から与えられた再生モード制御信号が、通常再生モードを示すか、要約再生モードを示すかを判別する。そして、メタデータ分析部543は、再生モード制御信号が通常再生モードを示す場合には、処理を終了する。一方、メタデータ分析部543は、再生モード制御信号が通常再生モードを示す場合には、読み取りドライブI/F部142よりメタデータ550を受け取る。そして、メタデータ分析部543は、受け取ったメタデータ550のC層から、シーンデータ5521〜552nを読み出す。メタデータ分析部543は、読み出されたシーンデータ5521〜552nの各々から、その下位に格納されているシーン特徴度を読み出す。そして、メタデータ分析部543は、読み出されたシーン特徴度から、U/I制御部541より与えられたシーン特徴度閾値を超えるシーン特徴度を特定する。メタデータ分析部543は、特定されたシーン特徴度を有するシーンのシーン再生開始時刻及びシーン再生終了時刻を、読み出されたシーンデータ5521〜552nから取得する。そして、メタデータ分析部543は、取得されたシーン再生開始時刻及びシーン再生終了時刻を再生制御部144に通知する。なお、再生制御部144は、メタデータ分析部543から与えられたシーン再生開始時刻及びシーン再生終了時刻を示す再生制御信号を生成し、この再生制御信号を読み取りドライブ132に与える。
番組は、シーンを単位として、重要か重要でないか(特徴的か特徴的でないか)を分類できる場合が多いが、実施の形態5に係る記録再生装置5は、番組をシーンに分割し、そのシーンに含まれる単語の特徴度を利用することで、シーン毎の重要性を値で表すことができる。これにより、シーン単位で要約再生を行うことができる。
実施の形態5に係る記録再生装置5は、実施の形態2〜4で示したような重み値を利用することもできる。このような場合、記録再生装置5は、各種重み値をメタデータに記録しておき、シーン特徴度にその重み値を掛け合わせた上で、閾値処理をして再生シーンを決定する。
実施の形態5に係る記録再生装置5でも、語句を特徴度抽出の単位とすることができる。この場合には、例えば、シーン特徴度算出部524は、シーン再生時間に表示される字幕文字列に含まれる語句の特徴度の平均を、シーン特徴度として求める。
実施の形態6.
図1に示されているように、実施の形態6に係る記録再生装置6は、データ処理部60と、全体制御部11と、U/I部12とを備える。実施の形態6に係る記録再生装置6は、データ処理部60において、実施の形態1に係る記録再生装置1と異なっている。
データ処理部60は、データを記録し、記録されたデータを再生する。データ処理部60は、データを記録する記録処理部600と、記録されたデータを再生する再生処理部630とを備える。実施の形態6におけるデータ処理部60は、記録処理部600及び再生処理部630において、実施の形態1におけるデータ処理部10と異なっている。
図21は、記録処理部600の構成を概略的に示すブロック図である。記録処理部600は、書き込みドライブ101と、記録処理制御部102と、記録データ生成部610とを備える。実施の形態6における記録処理部600は、記録データ生成部610において、実施の形態1における記録処理部100と異なっている。
記録データ生成部610は、TV9から出力されたマルチメディアデータを受け取り、このマルチメディアデータからメタデータを生成する。そして、記録データ生成部610は、マルチメディアデータ及びメタデータを書き込みドライブ101に与えて、記憶媒体8に記録させる。記録データ生成部610は、字幕データ抽出部111と、形態素解析データベース112と、分割部113と、特徴度データベース114と、特徴度決定部115と、番組情報抽出部116と、メタデータ生成部617と、書き込みバッファ118と、シーン抽出部523と、非重要語率算出部625とを備える。実施の形態6における記録データ生成部610は、メタデータ生成部617での処理の点、並びに、シーン抽出部523及び非重要語率算出部625がさらに備えられている点において、実施の形態1における記録データ生成部110と異なっている。但し、特徴度決定部115は、単語及びその特徴度を非重要語率算出部625に与える。
シーン抽出部523は、実施の形態5におけるシーン抽出部523と同様の処理を行う。但し、実施の形態6においては、シーン抽出部523は、シーン再生時間を非重要語率算出部625に与える。
非重要語率算出部625は、シーン抽出部523から与えられたシーン再生時間で特定されるシーン毎に、当該シーンで表示される字幕文字列に含まれる単語の内、単語重要度が相対的に低い単語が含まれている割合である非重要語率を算出する算出部である。例えば、非重要語率算出部625は、番組において表示される全ての字幕文字列に含まれる全ての単語及びその特徴度を、特徴度決定部115から受け取る。次に、非重要語率算出部625は、受け取った単語をその特徴度の大きさ順に整列させる。次に、非重要語率算出部625は、整列された単語の内、予め設定された範囲(特徴度が相対的に低い範囲)に含まれる単語を非重要語として特定する。例えば、整列させた単語が100個ある場合に、特徴度が下から10%の範囲に含まれる10語を、特徴度が低いものから順に、非重要語として特定する。但し、10%の境界において、特徴度の大きさが複数の単語で同値である場合には、10語という枠に捉われず、同値の複数の単語も非重要語として特定する。次に、非重要語率算出部625は、シーン抽出部523から、シーン再生開始時刻及びシーン再生終了時刻を受け取り、各シーン中に含まれる全単語数を算出する。次に、非重要語率算出部625は、シーン毎に、算出された全単語数のうち、非重要語が含まれている割合を算出し、算出された割合を非重要語率とする。そして、非重要語率算出部625は、シーン再生時間及びその非重要語率をメタデータ生成部617に与える。
メタデータ生成部617は、字幕データ抽出部111から字幕データ、非重要語率算出部625からシーン再生時間及びその非重要語率、並びに、番組情報抽出部116から番組情報を受け取り、これらの情報を用いて、TV9から出力されたマルチメディアデータのメタデータを生成する。そして、メタデータ生成部617は、生成されたメタデータを書き込みバッファ118に与える。
図22は、メタデータ生成部617が生成するメタデータ650の構造を示す概略図である。実施の形態6におけるメタデータ650は、階層Dのシーン情報653において、実施の形態5におけるメタデータ550と異なっている。
階層Dのシーン情報653は、階層Cにおけるシーンデータ5521〜552n毎に、シーン再生開始時刻5530、シーン再生終了時刻5531、及び、非重要語率6532を含む。
図6に示されているように、再生処理部630は、再生処理制御部131と、読み取りドライブ132と、再生データ生成部640とを備える。実施の形態6における再生処理部630は、再生データ生成部640において、実施の形態1における再生処理部130と異なっている。
再生データ生成部640は、U/I制御部641と、読み取りドライブI/F部142と、メタデータ分析部643と、再生制御部144とを備える。実施の形態6における再生データ生成部640は、U/I制御部641及びメタデータ分析部643において、実施の形態1における再生データ生成部140と異なっている。
U/I制御部641は、U/I部12の制御を行う。例えば、U/I制御部641は、U/I部12を介して、ユーザより再生モード等のユーザ設定の入力を受けて、このユーザ設定を再生処理制御部131に与える。また、U/I制御部641は、U/I部12を介して、非重要語率の高低を判断するための非重要語率閾値の入力を受けて、この非重要語率閾値をメタデータ分析部643に与える。
メタデータ分析部643は、読み取りドライブI/F部142から与えられたメタデータ650を分析して、U/I制御部641から与えられた非重要語率閾値を用いて非重要語率が低いシーンが再生される時間を特定して、特定された時間を再生時間として再生制御部144に通知する。例えば、メタデータ分析部643は、再生処理制御部131から与えられた再生モード制御信号が、通常再生モードを示すか、要約再生モードを示すかを判別する。そして、メタデータ分析部643は、再生モード制御信号が通常再生モードを示す場合には、処理を終了する。一方、メタデータ分析部643は、再生モード制御信号が通常再生モードを示す場合には、読み取りドライブI/F部142よりメタデータ650を受け取る。そして、メタデータ分析部643は、受け取ったメタデータ650のC層から、シーンデータ5521〜552nを読み出す。メタデータ分析部643は、読み出したシーンデータ5521〜552nの各々から、その下位に格納されている非重要語率を読み出す。そして、メタデータ分析部643は、読み出された非重要語率から、U/I制御部641から与えられた非重要語率閾値を下回る非重要語率を特定する。メタデータ分析部643は、特定された非重要語率を有するシーンのシーン再生開始時刻及びシーン再生終了時刻を、読み出したシーンデータ5521〜552nから取得する。そして、メタデータ分析部643は、取得されたシーン再生開始時刻及びシーン再生終了時刻を再生制御部144に通知する。
実施の形態6に係る記録再生装置6は、あるシーンにおいて特徴度が低い単語がどれ位占めているかを考慮して要約再生を行うことができる。シーン毎の特徴度の平均は、例えば、殆ど全ての単語の特徴度が低くても、特徴度が極端に高い単語が1つあるシーンは平均が上がることになる。しかしながら、ユーザが全体の内容を理解する上では、このようなシーンより、特徴度の平均が低くても特徴度が比較的高い語が多く出現するシーンのほうが重要なシーンである場合もある。従って、実施の形態6に係る記録再生装置6は、このような場合にも対応した要約再生を行うことができる。
実施の形態6に係る記録再生装置6は、実施の形態2〜4で示したような、重み値を利用することもできる。このような場合には、記録再生装置6は、各種重み値をメタデータに記録しておき、非重要語率にその重み値を掛け合わせた上で、閾値処理をして再生シーンを決定する。
実施の形態6に係る記録再生装置6でも、語句を特徴度抽出の単位とすることができる。この場合には、例えば、非重要語率算出部625は、シーン毎に、特徴度が相対的に低い語句が含まれている割合である非重要語句率を算出する。
実施の形態7.
図1に示されているように、実施の形態7に係る記録再生装置7は、データ処理部70と、全体制御部11と、U/I部12とを備える。実施の形態7に係る記録再生装置7は、データ処理部70において、実施の形態1に係る記録再生装置1と異なっている。
データ処理部70は、データを記録し、記録されたデータを再生する。データ処理部70は、データを記録する記録処理部700と、記録されたデータを再生する再生処理部730とを備える。実施の形態7におけるデータ処理部70は、記録処理部700及び再生処理部730において、実施の形態1におけるデータ処理部10と異なっている。
図23は、記録処理部700の構成を概略的に示すブロック図である。記録処理部700は、書き込みドライブ101と、記録処理制御部102と、記録データ生成部710とを備える。実施の形態7における記録処理部700は、記録データ生成部710において、実施の形態1における記録処理部100と異なっている。
記録データ生成部710は、TV9から出力されたマルチメディアデータを受け取り、このマルチメディアデータからメタデータを生成する。そして、記録データ生成部710は、マルチメディアデータ及びメタデータを書き込みドライブ101に与えて、記憶媒体8に記録させる。記録データ生成部710は、字幕データ抽出部111と、形態素解析データベース112と、分割部113と、特徴度データベース114と、特徴度決定部115と、番組情報抽出部116と、メタデータ生成部717と、書き込みバッファ118と、シーン抽出部523と、非重要語率算出部625と、セクション割当部726とを備える。実施の形態7における記録データ生成部710は、メタデータ生成部717での処理の点、並びに、シーン抽出部523、非重要語率算出部625及びセクション割当部726がさらに備えられている点において、実施の形態1における記録データ生成部110と異なっている。但し、特徴度決定部115は、単語及びその特徴度を非重要語率算出部625に与える。
シーン抽出部523は、実施の形態5におけるシーン抽出部523と同様の処理を行う。但し、実施の形態7においては、シーン抽出部523は、シーン再生時間を非重要語率算出部625及びセクション割当部726に与える。
非重要語率算出部625は、実施の形態6における非重要語率算出部625と同様の処理を行う。
セクション割当部726は、シーン抽出部523からシーン再生時間を受け取り、受け取られたシーン再生時間で示されるシーンをいくつかのセクションに割り当てる。具体的には、セクション割当部726は、番組先頭からの経過時刻を算出して、所定の経過時刻において、シーンをセクションに割り当てる。例えば、60分の番組におけるシーンを4セクションに割り当てる場合、セクション割当部726は、各シーンが0〜14分、15分〜29分、30分〜44分、45分〜60分のどの範囲にあるかで、各シーンにセクション1〜4の番号を割り当てる。また、シーンが複数の時間帯に跨っている場合は、セクション割当部726は、例えば、シーンの再生開始時刻と再生終了時刻との間の中心がどちらの時間帯に含まれているかで、割り当てるセクションを判断する。これ以外にも、セクション割当部726は、映像信号及び音声信号の少なくとも何れか一方の特徴から得たシーン同士の関連度を考慮して、セクションを割り当てることもできる。この場合、セクション割当部726は、シーンの関連度が低いところでセクションを分割する。また、経過時刻で割り当てる場合にも、セクション割当部726は、複数の時間帯に跨っているシーンを、シーン同士の関連度を考慮してセクションへの割り当てを判断することもできる。そして、セクション割当部726は、シーン(シーン再生時間)とそのシーンに割り当てたセクションを示すセクション情報(セクション番号)との対応をメタデータ生成部717に通知する。
メタデータ生成部717は、字幕データ抽出部111から字幕データ、非重要語率算出部625からシーン再生時間及びその非重要語率、セクション割当部726からシーン再生時間及びそのセクション番号、並びに、番組情報抽出部116から番組情報を受け取り、これらの情報を用いて、TV9から出力されたマルチメディアデータのメタデータを生成する。そして、メタデータ生成部717は、生成されたメタデータを書き込みバッファ118に与える。
図24は、メタデータ生成部717が生成するメタデータ750の構造を示す概略図である。実施の形態7におけるメタデータ750は、階層Dのシーン情報753において、実施の形態6におけるメタデータ650と異なっている。
階層Dのシーン情報753は、階層Cにおけるシーンデータ5521〜552n毎に、シーン再生開始時刻5530、シーン再生終了時刻5531、非重要語率6532、及び、セクション番号7533を含む。
図6に示されているように、再生処理部730は、再生処理制御部131と、読み取りドライブ132と、再生データ生成部740とを備える。実施の形態7における再生処理部730は、再生データ生成部740において、実施の形態1における再生処理部130と異なっている。
再生データ生成部740は、U/I制御部741と、読み取りドライブI/F部142と、メタデータ分析部743と、再生制御部144とを備える。実施の形態7における再生データ生成部740は、メタデータ分析部743において、実施の形態1における再生データ生成部140と異なっている。
U/I制御部741は、U/I部12の制御を行う。例えば、U/I制御部741は、U/I部12を介して、ユーザより再生モード等のユーザ設定の入力を受けて、このユーザ設定を再生処理制御部131に与える。なお、実施の形態7においては、U/I制御部741は、実施の形態1とは異なり、U/I部12を介して、特徴度の高低を判断するための特徴度閾値の入力を受ける必要はない。
メタデータ分析部743は、読み取りドライブI/F部142から与えられたメタデータ750を分析して、セクション毎に、非重要語率が相対的に低いシーンが再生される時間を所定数特定して、特定された時間を再生時間として再生制御部144に通知する。例えば、メタデータ分析部743は、再生処理制御部131から与えられた再生モード制御信号が、通常再生モードを示すか、要約再生モードを示すかを判別する。そして、メタデータ分析部743は、再生モード制御信号が通常再生モードを示す場合には、処理を終了する。一方、メタデータ分析部743は、再生モード制御信号が通常再生モードを示す場合には、読み取りドライブI/F部142よりメタデータ750を受け取る。そして、メタデータ分析部743は、受け取ったメタデータ750のC層から、シーンデータ5521〜552nを読み出す。メタデータ分析部743は、読み出したシーンデータ5521〜552nの各々から、その下位に格納されているセクション番号毎に非重要語率を読み出す。そして、メタデータ分析部743は、セクション番号毎に、低いものから順に数個の非重要語率を抽出する。メタデータ分析部743は、抽出された非重要語率を有するシーンのシーン再生開始時刻及びシーン再生終了時刻を、読み出されたシーンデータ5521〜552nから取得する。言い換えると、メタデータ分析部743は、セクション番号毎に、非重要語率が相対的に低いシーンを特定して、特定されたシーンのシーン再生開始時刻及びシーン再生終了時刻を取得する。そして、メタデータ分析部743は、取得されたシーン再生開始時刻及びシーン再生終了時刻を再生制御部144に通知する。ここで、抽出する個数については、予め定められていてもよく、また、メタデータ分析部743が、ユーザによる設定をU/I制御部741から受け取って決定してもよい。
実施の形態7に係る記録再生装置7は、シーンを幾つかのセクションに割り当てておき、セクション毎にシーンを幾つか抽出することで、番組全体から満遍なくシーンを抽出して、要約再生を行うことができる。特徴度の平均が高いシーン、又は、非重要語率の高い若しくは低いシーンを抽出する場合、番組の前半から後半まで万遍なくシーンが抽出されるとは限らず、番組の前半部分のみから抽出されてしまうときがある。従って、実施の形態7に係る記録再生装置7は、例えば、4つのセクションにシーンを割り当てれば、概ね「起承転結」に沿ったシーンを抽出することができる。
実施の形態7に係る記録再生装置7は、実施の形態2〜4で示したような、重み値を利用することも可能である。このような場合、記録再生装置7は、各種重み値をメタデータに記録しておき、非重要語率にその重み値を掛け合わせた上で、閾値処理をして再生シーンを決定する。
実施の形態7に係る記録再生装置7でも、語句を特徴度抽出の単位とすることができる。
以上に記載された実施の形態1〜7においては、記憶媒体8、書き込みドライブ101及び読み取りドライブ132により、マルチメディアデータ及びメタデータを記憶する記憶部が構成されている。但し、記憶部は、このような例に限定されるものではなく、例えば、HDD(Hard Disk Drive)又は半導体メモリ等により構成されていてもよい。また、以上に記載された実施の形態1〜7は、書き込みドライブ101と、読み取りドライブ132とが別々に備えられていたが、これらが1つのドライブで構成されていてもよい。
なお、以上に記載された実施の形態1〜7は、本発明を記録再生装置1〜7に適用した例を示しているが、このような例に限定されない。例えば、本発明は、記録処理部100〜700を備えないことにより、再生装置として構成されてもよく、また、再生処理部130〜730を備えないことにより、記録装置として構成されてもよい。
以上に記載された実施の形態1〜7においては、データ処理部10〜70は、TV9から出力されたマルチメディアデータを記録しているが、このような例に限定されるものではない。例えば、図示してはいないが、記録再生装置1にデジタル放送を受信するためのデジタル放送受信部が備えられ、データ処理部10は、このようなデジタル放送受信部から得られるマルチメディアデータを記録してもよい。さらに、図示してはいないが、記録再生装置1にディスプレイ等の表示部が備えられ、データ処理部10〜70は、このような表示部に、記憶媒体8にから読み出されたデータを出力してもよい。
1,2,3,4,5,6,7:記録再生装置、 8:記憶媒体、 9:TV、 10,20,30,40,50,60,70:データ処理部、 11:全体制御部、 12:ユーザインタフェース部、 100,200,300,400,500,600,700:記録処理部、 101:書き込みドライブ、 102:記録処理制御部、 110,210,310,410,510,610,710:記録データ生成部、 111:字幕データ抽出部、 112:形態素解析データベース、 113:分割部、 114,114−1:特徴度データベース、 115、115−1,115−2,215,315,415:特徴度決定部、 116:番組情報抽出部、 117,217,517,617,717:メタデータ生成部、 118:書き込みバッファ、 219:EPGデータ抽出部、 220:EPG分割部、 321:音声情報生成部、 422:音声認識処理部、 523:シーン抽出部、 524:シーン特徴度算出部、 625:非重要語率算出部、 726:セクション割当部、 130,230,530,630,730:再生処理部、 131:再生処理制御部、 132:読み取りドライブ、 140,240,540,640,740:再生データ生成部、 141:ユーザインタフェース制御部、 142:読み取りドライブインターフェース部、 143,243,543,643,743:メタデータ分析部、 144,144−1:再生制御部、 145:重畳部、 180:ネットワーク、 181:アップデートデータベース。

Claims (32)

  1. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出部と、
    前記字幕データ抽出部により抽出された字幕データ内の字幕文字列を語句に分割する分割部と、
    前記分割部により分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定する特徴度決定部と、
    前記字幕文字列の表示時間と、前記特徴度決定部で決定された特徴度と、を含むメタデータを生成するメタデータ生成部と、
    前記マルチメディアデータと、前記メタデータ生成部により生成されたメタデータと、を記憶する記録部と、
    前記記録部から読み出されたメタデータを分析して、前記特徴度により示される値が予め定められた値よりも高い語句を含む字幕文字列の表示時間を、再生時間として特定するメタデータ分析部と、
    前記マルチメディアデータの内、前記メタデータ分析部により特定された再生時間に対応する部分を再生する制御を行う再生制御部と、を備えること
    を特徴とする記録再生装置。
  2. 前記語句、及び、前記語句の特徴度を対応付けた特徴度情報を記憶する特徴度情報記憶部をさらに備え、
    前記特徴度決定部は、前記特徴度情報記憶部に記憶されている特徴度情報を参照することにより、前記分割部により分割された語句の特徴度を決定すること
    を特徴とする請求項1に記載の記録再生装置。
  3. 前記特徴度情報は、前記語句の概念がより下位概念であるほど、前記特徴度の値が高くなること
    を特徴とする請求項2に記載の記録再生装置。
  4. 前記特徴度情報は、予め定められた調査範囲において、前記語句の出現頻度が低いほど、前記特徴度の値が高くなること
    を特徴とする請求項2に記載の記録再生装置。
  5. ネットワークとの間で通信を行う通信部をさらに備え、
    前記特徴度決定部は、前記通信部を介して、前記ネットワークから情報を取得することで、前記特徴度情報を更新すること
    を特徴とする請求項2から4の何れか1項に記載の記録再生装置。
  6. ネットワークとの間で通信を行う通信部をさらに備え、
    前記特徴度決定部は、前記通信部を介して、前記語句、及び、前記語句の特徴度を対応付けた特徴度情報を記憶する特徴度記憶装置にアクセスして、当該特徴度情報を参照することにより、前記分割部により分割された語句の特徴度を決定すること
    を特徴とする請求項1に記載の記録再生装置。
  7. 電子番組表データから、前記マルチメディアデータとして前記記録部に記憶させる番組に対応する部分のデータを、個別番組表データとして抽出する電子番組表データ抽出部と、
    前記電子番組表データ抽出部で抽出された個別番組表データに含まれている文字列から語句を分割する電子番組表分割部と、をさらに備え、
    前記特徴度決定部は、前記分割部により分割された語句の内、前記電子番組表分割部により分割された語句と一致する語句に対して、前記特徴度により示される値を高めるための重み値を付与し、
    前記メタデータ分析部は、前記特徴度により示される値を前記特徴度決定部により付与された重み値で高めることにより算出された値が前記予め定められた値よりも高いか否かを判断すること
    を特徴とする請求項1から6の何れか1項に記載の記録再生装置。
  8. 前記マルチメディアデータは、前記映像信号に基づいて表示される映像に同期して音声を出力するための音声信号をさらに含み、
    前記音声信号から、前記字幕文字列の表示時間における音量を取得する音声情報生成部をさらに備え、
    前記特徴度決定部は、前記音声情報生成部により前記音量が取得された前記字幕文字列に含まれる語句に対して、前記音声情報生成部により取得された音量が大きいほど、前記特徴度により示される値を高めるための重み値を付与し、
    前記メタデータ分析部は、前記特徴度により示される値を前記特徴度決定部により付与された重み値で高めることにより算出された値が前記予め定められた値よりも高いか否かを判断すること
    を特徴とする請求項1から6の何れか1項に記載の記録再生装置。
  9. 前記マルチメディアデータは、前記映像信号に基づいて表示される映像に同期して出力される音声を示す音声信号をさらに含み、
    前記音声信号から、前記字幕文字列に含まれる各々の語句の表示時間における音量を取得する音声情報生成部をさらに備え、
    前記特徴度決定部は、前記音声情報生成部により前記音量が取得された前記各々の語句に対して、前記音声情報生成部により取得された音量が大きいほど、前記特徴度により示される値を高めるための重み値を付与し、
    前記メタデータ分析部は、前記特徴度により示される値を前記特徴度決定部により付与された重み値で高めることにより算出された値が予め定められた値よりも高いか否かを判断すること
    を特徴とする請求項1から6の何れか1項に記載の記録再生装置。
  10. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出部と、
    前記字幕データ抽出部により抽出された字幕データ内の字幕文字列を語句に分割する分割部と、
    前記映像信号から複数のシーンを抽出し、当該複数のシーンに含まれる各々のシーンの表示時間を、シーン表示時間として特定するシーン抽出部と、
    前記分割部により分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定し、前記シーン抽出部により特定されたシーン表示時間に表示される前記字幕文字列に含まれている語句の特徴度の平均を、シーン特徴度として算出する算出部と、
    前記シーン抽出部により特定されたシーン表示時間と、前記算出部により算出されたシーン特徴度と、を含むメタデータを生成するメタデータ生成部と、
    前記マルチメディアデータと、前記メタデータ生成部により生成されたメタデータと、を記憶する記録部と、
    前記記録部から読み出されたメタデータを分析して、前記シーン特徴度により示される値が予め定められた値よりも高いシーンのシーン表示時間を、再生時間として特定するメタデータ分析部と、
    前記マルチメディアデータの内、前記メタデータ分析部により特定された再生時間に対応する部分を再生する制御を行う再生制御部と、を備えること
    を特徴とする記録再生装置。
  11. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出部と、
    前記字幕データ抽出部により抽出された字幕データ内の字幕文字列を語句に分割する分割部と、
    前記分割部により分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定する特徴度決定部と、
    前記映像信号から複数のシーンを抽出し、当該複数のシーンに含まれる各々のシーンの表示時間を、シーン表示時間として特定するシーン抽出部と、
    前記特徴度決定部により決定された特徴度で示される値が相対的に低い語句を非重要語句として特定し、前記シーン抽出部で抽出されたシーン毎に、前記字幕文字列に含まれている全ての語句における前記特定された非重要語句の割合を非重要語句率として算出する算出部と、
    前記シーン抽出部により特定されたシーン表示時間と、前記算出部により算出された非重要語句率と、を含むメタデータを生成するメタデータ生成部と、
    前記マルチメディアデータと、前記メタデータ生成部により生成されたメタデータと、を記憶する記録部と、
    前記記録部から読み出されたメタデータを分析して、前記非重要語句率が予め定められた値よりも低いシーンのシーン表示時間を、再生時間として特定するメタデータ分析部と、
    前記マルチメディアデータの内、前記メタデータ分析部により特定された再生時間に対応する部分を再生する制御を行う再生制御部と、を備えること
    を特徴とする記録再生装置。
  12. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出部と、
    前記字幕データ抽出部により抽出された字幕データ内の字幕文字列を語句に分割する分割部と、
    前記分割部により分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定する特徴度決定部と、
    前記映像信号から複数のシーンを抽出し、当該複数のシーンに含まれる各々のシーンの表示時間を、シーン表示時間として特定するシーン抽出部と、
    前記シーン抽出部で抽出されたシーンを複数のセクションに割り当てるセクション割当部と、
    前記特徴度決定部により決定された特徴度で示される値が相対的に低い語句を非重要語句として特定し、前記シーン抽出部で抽出されたシーン毎に、前記字幕文字列に含まれている全ての語句における前記特定された非重要語句の割合を非重要語句率として算出する算出部と、
    前記シーン抽出部により特定されたシーン表示時間と、前記算出部により算出された非重要語句率と、前記セクション割当部により割り当てられたセクションを示すセクション情報と、を含むメタデータを生成するメタデータ生成部と、
    前記マルチメディアデータと、前記メタデータ生成部により生成されたメタデータと、を記憶する記録部と、
    前記記録部から読み出されたメタデータを分析して、前記セクション情報で示されるセクション毎に、前記非重要語句率が相対的に低いシーンを特定し、当該特定されたシーンのシーン表示時間を、再生時間として特定するメタデータ分析部と、
    前記マルチメディアデータの内、前記メタデータ分析部により特定された再生時間に対応する部分を再生する制御を行う再生制御部と、を備えること
    を特徴とする記録再生装置。
  13. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出過程と、
    前記字幕データ抽出過程で抽出された字幕データ内の字幕文字列を語句に分割する分割過程と、
    前記分割過程で分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定する特徴度決定過程と、
    前記字幕文字列の表示時間と、前記特徴度決定過程で決定された特徴度と、を含むメタデータを生成するメタデータ生成過程と、
    前記マルチメディアデータと、前記メタデータ生成過程で生成されたメタデータと、を記憶する記録過程と、
    前記記録過程で記憶されたメタデータを分析して、前記特徴度により示される値が予め定められた値よりも高い語句を含む字幕文字列の表示時間を、再生時間として特定するメタデータ分析過程と、
    前記マルチメディアデータの内、前記メタデータ分析過程により特定された再生時間に対応する部分を再生する制御を行う再生制御過程と、を有すること
    を特徴とする記録再生方法。
  14. 前記特徴度決定過程は、前記語句、及び、前記語句の特徴度を対応付けた特徴度情報を参照することにより、前記分割過程で分割された語句の特徴度を決定すること
    を特徴とする請求項13に記載の記録再生方法。
  15. 前記特徴度情報は、前記語句の概念がより下位概念であるほど、前記特徴度の値が高くなるものであること
    を特徴とする請求項14に記載の記録再生方法。
  16. 前記特徴度情報は、予め定められた調査範囲において、前記語句の出現頻度が低いほど、前記特徴度の値が高くなるものであること
    を特徴とする請求項14に記載の記録再生方法。
  17. ネットワークから情報を取得することで、前記特徴度情報を更新する更新過程をさらに有すること
    を特徴とする請求項14から16の何れか1項に記載の記録再生方法。
  18. 前記特徴度決定過程は、ネットワークを介して、前記語句、及び、前記語句の特徴度を対応付けた特徴度情報を記憶する特徴度記憶装置にアクセスして、当該特徴度情報を参照することにより、前記分割過程で分割された語句の特徴度を決定すること
    を特徴とする請求項13に記載の記録再生方法。
  19. 電子番組表データから、前記マルチメディアデータとして前記記憶過程で記憶させる番組に対応する部分のデータを、個別番組表データとして抽出する電子番組表データ抽出過程と、
    前記電子番組表データ抽出過程で抽出された個別番組表データに含まれている文字列から語句を分割する電子番組表分割過程と、をさらに有し、
    前記特徴度決定過程は、前記分割過程で分割された語句の内、前記電子番組表分割過程で分割された語句と一致する語句に対して、前記特徴度により示される値を高めるための重み値を付与し、
    前記メタデータ分析過程は、前記特徴度により示される値を前記特徴度決定過程で付与された重み値で高めることにより算出された値が前記予め定められた値よりも高いか否かを判断すること
    を特徴とする請求項13から18の何れか1項に記載の記録再生方法。
  20. 前記マルチメディアデータは、前記映像信号に基づいて表示される映像に同期して音声を出力するための音声信号をさらに含み、
    前記音声信号から、前記字幕文字列の表示時間における音量を取得する音声情報生成過程をさらに有し、
    前記特徴度決定過程は、前記音声情報生成過程で前記音量が取得された前記字幕文字列に含まれる語句に対して、前記音声情報生成過程で取得された音量が大きいほど、前記特徴度により示される値を高めるための重み値を付与し、
    前記メタデータ分析過程は、前記特徴度により示される値を前記特徴度決定過程で付与された重み値で高めることにより算出された値が前記予め定められた値よりも高いか否かを判断すること
    を特徴とする請求項13から18の何れか1項に記載の記録再生方法。
  21. 前記マルチメディアデータは、前記映像信号に基づいて表示される映像に同期して出力される音声を示す音声信号をさらに含み、
    前記音声信号から、前記字幕文字列に含まれる各々の語句の表示時間における音量を取得する音声情報生成過程をさらに有し、
    前記特徴度決定過程は、前記音声情報生成過程で前記音量が取得された前記各々の語句に対して、前記音声情報生成過程で取得された音量が大きいほど、前記特徴度により示される値を高めるための重み値を付与し、
    前記メタデータ分析過程は、前記特徴度により示される値を前記特徴度決定過程で付与された重み値で高めることにより算出された値が前記予め定められた値よりも高いか否かを判断すること
    を特徴とする請求項13から18の何れか1項に記載の記録再生方法。
  22. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出過程と、
    前記字幕データ抽出過程で抽出された字幕データ内の字幕文字列を語句に分割する分割過程と、
    前記映像信号から複数のシーンを抽出し、当該複数のシーンに含まれる各々のシーンの表示時間を、シーン表示時間として特定するシーン抽出過程と、
    前記分割過程で分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定し、前記シーン抽出過程で特定されたシーン表示時間に表示される前記字幕文字列に含まれている語句の特徴度の平均を、シーン特徴度として算出する算出過程と、
    前記シーン抽出過程で特定されたシーン表示時間と、前記算出過程で算出されたシーン特徴度と、を含むメタデータを生成するメタデータ生成過程と、
    前記マルチメディアデータと、前記メタデータ生成過程で生成されたメタデータと、を記憶する記録過程と、
    前記記録過程で記憶されたメタデータを分析して、前記シーン特徴度により示される値が予め定められた値よりも高いシーンのシーン表示時間を、再生時間として特定するメタデータ分析過程と、
    前記マルチメディアデータの内、前記メタデータ分析過程で特定された再生時間に対応する部分を再生する制御を行う再生制御過程と、を有すること
    を特徴とする記録再生方法。
  23. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出過程と、
    前記字幕データ抽出過程で抽出された字幕データ内の字幕文字列を語句に分割する分割過程と、
    前記分割過程で分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定する特徴度決定過程と、
    前記映像信号から複数のシーンを抽出し、当該複数のシーンに含まれる各々のシーンの表示時間を、シーン表示時間として特定するシーン抽出過程と、
    前記特徴度決定過程で決定された特徴度の内、前記特徴度で示される値が相対的に低い語句を、非重要語句として特定し、前記シーン抽出過程で抽出されたシーンに表示される字幕文字列に含まれている全ての語句における前記特定された非重要語句の割合を、非重要語句率として算出する算出過程と、
    前記シーン抽出過程で特定されたシーン表示時間と、前記算出過程で算出された非重要語句率と、を含むメタデータを生成するメタデータ生成過程と、
    前記マルチメディアデータと、前記メタデータ生成過程で生成されたメタデータと、を記憶する記録過程と、
    前記記録過程で記憶されたメタデータを分析して、前記非重要語句率が予め定められた値よりも低いシーンのシーン表示時間を、再生時間として特定するメタデータ分析過程と、
    前記マルチメディアデータの内、前記メタデータ分析過程で特定された再生時間に対応する部分を再生する制御を行う再生制御過程と、を有すること
    を特徴とする記録再生方法。
  24. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出過程と、
    前記字幕データ抽出過程で抽出された字幕データ内の字幕文字列を語句に分割する分割過程と、
    前記分割過程で分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定する特徴度決定過程と、
    前記映像信号から複数のシーンを抽出し、当該複数のシーンに含まれる各々のシーンの表示時間を、シーン表示時間として特定するシーン抽出過程と、
    前記シーン抽出過程で抽出されたシーンを複数のセクションに割り当てるセクション割当過程と、
    前記特徴度決定過程で決定された特徴度の内、前記特徴度で示される値が相対的に低い語句を、非重要語句として特定し、前記シーン抽出過程で抽出されたシーンに表示される字幕文字列に含まれている全ての語句における前記特定された非重要語句の割合を、非重要語句率として算出する算出過程と、
    前記シーン抽出過程で特定されたシーン表示時間と、前記算出過程で算出された非重要語句率と、前記セクション割当過程で割り当てられたセクションを示すセクション情報と、を含むメタデータを生成するメタデータ生成過程と、
    前記マルチメディアデータと、前記メタデータ生成過程で生成されたメタデータと、を記憶する記録過程と、
    前記記録過程で記憶されたメタデータを分析して、前記セクション情報で示されるセクション毎に、前記非重要語句率が相対的に低いシーンを特定し、当該特定されたシーンのシーン表示時間を、再生時間として特定するメタデータ分析過程と、
    前記マルチメディアデータの内、前記メタデータ分析部により特定された再生時間に対応する部分を再生する制御を行う再生制御過程と、を有すること
    を特徴とする記録再生方法。
  25. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出部と、
    前記字幕データ抽出部により抽出された字幕データ内の字幕文字列を語句に分割する分割部と、
    前記分割部により分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定する特徴度決定部と、
    前記字幕文字列の表示時間と、前記特徴度決定部で決定された特徴度と、を含むメタデータを生成するメタデータ生成部と、
    前記マルチメディアデータと、前記メタデータ生成部により生成されたメタデータと、を記憶する記録部と、を備えること
    を特徴とする記録装置。
  26. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出部と、
    前記字幕データ抽出部により抽出された字幕データ内の字幕文字列を語句に分割する分割部と、
    前記映像信号から複数のシーンを抽出し、当該複数のシーンに含まれる各々のシーンの表示時間を、シーン表示時間として特定するシーン抽出部と、
    前記分割部により分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定し、前記シーン抽出部により特定されたシーン表示時間に表示される前記字幕文字列に含まれている語句の特徴度の平均を、シーン特徴度として算出する算出部と、
    前記シーン抽出部により特定されたシーン表示時間と、前記算出部により算出されたシーン特徴度と、を含むメタデータを生成するメタデータ生成部と、
    前記マルチメディアデータと、前記メタデータ生成部により生成されたメタデータと、を記憶する記録部と、を備えること
    を特徴とする記録装置。
  27. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出部と、
    前記字幕データ抽出部により抽出された字幕データ内の字幕文字列を語句に分割する分割部と、
    前記分割部により分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定する特徴度決定部と、
    前記映像信号から複数のシーンを抽出し、当該複数のシーンに含まれる各々のシーンの表示時間を、シーン表示時間として特定するシーン抽出部と、
    前記特徴度決定部により決定された特徴度で示される値が相対的に低い語句を非重要語句として特定し、前記シーン抽出部で抽出されたシーン毎に、前記字幕文字列に含まれている全ての語句における前記特定された非重要語句の割合を非重要語句率として算出する算出部と、
    前記シーン抽出部により特定されたシーン表示時間と、前記算出部により算出された非重要語句率と、を含むメタデータを生成するメタデータ生成部と、
    前記マルチメディアデータと、前記メタデータ生成部により生成されたメタデータと、を記憶する記録部と、を備えること
    を特徴とする記録装置。
  28. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータから、当該字幕データを抽出する字幕データ抽出部と、
    前記字幕データ抽出部により抽出された字幕データ内の字幕文字列を語句に分割する分割部と、
    前記分割部により分割された語句の各々に対して、前記語句の概念が特徴的であるほど高い値を示す特徴度を決定する特徴度決定部と、
    前記映像信号から複数のシーンを抽出し、当該複数のシーンに含まれる各々のシーンの表示時間を、シーン表示時間として特定するシーン抽出部と、
    前記シーン抽出部で抽出されたシーンを複数のセクションに割り当てるセクション割当部と、
    前記特徴度決定部により決定された特徴度で示される値が相対的に低い語句を非重要語句として特定し、前記シーン抽出部で抽出されたシーン毎に、前記字幕文字列に含まれている全ての語句における前記特定された非重要語句の割合を非重要語句率として算出する算出部と、
    前記シーン抽出部により特定されたシーン表示時間と、前記算出部により算出された非重要語句率と、前記セクション割当部により割り当てられたセクションを示すセクション情報と、を含むメタデータを生成するメタデータ生成部と、
    前記マルチメディアデータと、前記メタデータ生成部により生成されたメタデータと、を記憶する記録部と、を備えること
    を特徴とする記録装置。
  29. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータ、並びに、前記字幕文字列の表示時間と、前記字幕文字列に含まれている各々の語句の概念が特徴的であるほど高い値を示す特徴度と、を含むメタデータ、を記憶する記録部と、
    前記記録部から読み出されたメタデータを分析して、前記特徴度により示される値が予め定められた値よりも高い語句を含む字幕文字列の表示時間を、再生時間として特定するメタデータ分析部と、
    前記マルチメディアデータの内、前記メタデータ分析部により特定された再生時間に対応する部分を再生する制御を行う再生制御部と、を備えること
    を特徴とする再生装置。
  30. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータ、並びに、前記映像信号から抽出されたシーンのシーン表示時間と、当該シーン毎に、前記字幕文字列に含まれている各々の語句の概念が特徴的であるほど高い値を示す特徴度を平均することにより算出されたシーン特徴度、を含むメタデータを記憶する記憶部と、
    前記記録部から読み出されたメタデータを分析して、前記シーン特徴度により示される値が予め定められた値よりも高いシーンのシーン表示時間を、再生時間として特定するメタデータ分析部と、
    前記マルチメディアデータの内、前記メタデータ分析部により特定された再生時間に対応する部分を再生する制御を行う再生制御部と、を備えること
    を特徴とする再生装置。
  31. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータ、並びに、前記映像信号から抽出された複数のシーンのシーン表示時間と、当該シーン毎に、語句の概念が特徴的であるほど高い値を示す特徴度の値が相対的に低い非重要語句が、前記字幕文字列に含まれている全ての語句中に含まれている割合である非重要語句率と、を含むメタデータ、を記憶する記録部と、
    前記記録部から読み出されたメタデータを分析して、前記非重要語句率が予め定められた値よりも低いシーンのシーン表示時間を、再生時間として特定するメタデータ分析部と、
    前記マルチメディアデータの内、前記メタデータ分析部により特定された再生時間に対応する部分を再生する制御を行う再生制御部と、を備えること
    を特徴とする再生装置。
  32. 映像信号と、当該映像信号に基づいて表示される映像に重畳することのできる字幕文字列及び当該字幕文字列の表示時間を有する字幕データと、を含むマルチメディアデータ、並びに、前記映像信号から抽出された複数のシーンのシーン表示時間と、当該シーン毎に、語句の概念が特徴的であるほど高い値を示す特徴度の値が相対的に低い非重要語句が、前記字幕文字列に含まれている全ての語句中に含まれている割合である非重要語句率と、前記複数のシーンの各々に割り当てられたセクションを示すセクション情報と、を含むメタデータ、を記憶する記憶部と、
    前記記録部から読み出されたメタデータを分析して、前記セクション情報で示されるセクション毎に、前記非重要語句率が相対的に低いシーンを特定し、当該特定されたシーンのシーン表示時間を、再生時間として特定するメタデータ分析部と、
    前記マルチメディアデータの内、前記メタデータ分析部により特定された再生時間に対応する部分を再生する制御を行う再生制御部と、を備えること
    を特徴とする再生装置。
JP2012179652A 2012-08-14 2012-08-14 記録再生装置、記録再生方法、記録装置及び再生装置 Pending JP2015195418A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012179652A JP2015195418A (ja) 2012-08-14 2012-08-14 記録再生装置、記録再生方法、記録装置及び再生装置
PCT/JP2013/056074 WO2014027475A1 (ja) 2012-08-14 2013-03-06 記録再生装置、記録再生方法、記録装置及び再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012179652A JP2015195418A (ja) 2012-08-14 2012-08-14 記録再生装置、記録再生方法、記録装置及び再生装置

Publications (1)

Publication Number Publication Date
JP2015195418A true JP2015195418A (ja) 2015-11-05

Family

ID=50685516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012179652A Pending JP2015195418A (ja) 2012-08-14 2012-08-14 記録再生装置、記録再生方法、記録装置及び再生装置

Country Status (2)

Country Link
JP (1) JP2015195418A (ja)
WO (1) WO2014027475A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6200392B2 (ja) * 2014-09-05 2017-09-20 日本電信電話株式会社 情報提示装置および情報提示プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4080768B2 (ja) * 2002-03-14 2008-04-23 富士通株式会社 重要度評価プログラム
JP2005065561A (ja) * 2003-08-22 2005-03-17 Ichiro Sakuma 血管壁細胞への遺伝子の導入方法
JP4396446B2 (ja) * 2004-08-20 2010-01-13 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP4580885B2 (ja) * 2006-03-27 2010-11-17 株式会社東芝 シーン情報抽出方法、シーン抽出方法および抽出装置
JP2008048297A (ja) * 2006-08-21 2008-02-28 Sony Corp コンテンツ提供方法、コンテンツ提供方法のプログラム、コンテンツ提供方法のプログラムを記録した記録媒体及びコンテンツ提供装置
JP4925938B2 (ja) * 2007-06-20 2012-05-09 株式会社日立製作所 ダイジェスト映像情報作成方法、ダイジェスト映像情報作成プログラム、および、映像装置
JP5537285B2 (ja) * 2010-06-28 2014-07-02 日本放送協会 要約映像生成装置及び要約映像生成プログラム
JP5225418B2 (ja) * 2011-03-25 2013-07-03 株式会社東芝 情報処理装置及び方法

Also Published As

Publication number Publication date
WO2014027475A1 (ja) 2014-02-20

Similar Documents

Publication Publication Date Title
CN101777371B (zh) 再现信息存储介质上存储的av数据的再现装置
JP4981026B2 (ja) 複合ニュース・ストーリーの合成
KR100828166B1 (ko) 동영상의 음성 인식과 자막 인식을 통한 메타데이터 추출방법, 메타데이터를 이용한 동영상 탐색 방법 및 이를기록한 기록매체
JP4905103B2 (ja) 動画再生装置
US8204317B2 (en) Method and device for automatic generation of summary of a plurality of images
JP4449216B2 (ja) 映像情報の編集方法及び編集装置
US9465870B2 (en) System and method for digital video retrieval involving speech recognition
CN1993755B (zh) 包括元数据的存储介质及其再现设备和方法
JP4920395B2 (ja) 動画要約自動作成装置、方法、及びコンピュータ・プログラム
JP4873018B2 (ja) データ処理装置、データ処理方法、及び、プログラム
US20090129749A1 (en) Video recorder and video reproduction method
WO2007127695A2 (en) Prefernce based automatic media summarization
US10014029B2 (en) Video processing apparatus and method
JP2004533756A (ja) 自動コンテンツ分析及びマルチメデイア・プレゼンテーションの表示
JP2001028722A (ja) 動画像管理装置及び動画像管理システム
TW200849030A (en) System and method of automated video editing
JP4064902B2 (ja) メタ情報生成方法、メタ情報生成装置、検索方法および検索装置
JP3685733B2 (ja) マルチメディアデータ検索装置、マルチメディアデータ検索方法およびマルチメディアデータ検索プログラム
JP4032122B2 (ja) 映像編集装置、映像編集プログラム、記録媒体、および映像編集方法
WO2014027475A1 (ja) 記録再生装置、記録再生方法、記録装置及び再生装置
JP2004289530A (ja) 記録再生装置
JP4782133B2 (ja) 代表タイトル情報が付加されたメタデータを含むavデータを記録した情報記録媒体、その再生装置及びメタデータの検索方法
JP5088119B2 (ja) データ生成装置、データ生成プログラムおよび情報処理装置
JP2006332765A (ja) コンテンツ検索・再生方法、コンテンツ検索・再生装置、並びにプログラムおよび記録媒体
Tsoneva Automated summarization of movies and TV series on a semantic level