JP2004513547A - 音声特性を利用してビデオプログラム中のハイライトを検出するシステム及び方法 - Google Patents

音声特性を利用してビデオプログラム中のハイライトを検出するシステム及び方法 Download PDF

Info

Publication number
JP2004513547A
JP2004513547A JP2002540156A JP2002540156A JP2004513547A JP 2004513547 A JP2004513547 A JP 2004513547A JP 2002540156 A JP2002540156 A JP 2002540156A JP 2002540156 A JP2002540156 A JP 2002540156A JP 2004513547 A JP2004513547 A JP 2004513547A
Authority
JP
Japan
Prior art keywords
signal energy
energy level
keyword
audio signal
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2002540156A
Other languages
English (en)
Inventor
ダグタス,セラーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2004513547A publication Critical patent/JP2004513547A/ja
Ceased legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7834Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/215Recordable discs
    • G11B2220/216Rewritable discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Circuits (AREA)

Abstract

ビデオプログラム中のプログラムハイライトを検出するための装置が開示される。本装置は、1)上記ビデオプログラムの音声トラック中の所定のキーワードの位置を検出できるキーワード検出回路と、2)上記所定のキーワードの上記検出した位置近傍の上記音声トラックの音声信号エネルギレベルを算出し、該音声信号エネルギレベルを所定の閾値と比較することができる音声信号エネルギレベル検出回路とを含む。上記音声信号エネルギレベル検出回路は、上記音声信号エネルギレベルが上記所定の閾値を超えているとの判断に応答して、上記所定のキーワードの上記検出した位置をプログラムハイライトとして特定する。

Description

【0001】
[発明の技術分野]
本発明は、一般的にはビデオ再生デバイスに係り、より詳細には、スポーツ番組のようなビデオプログラムのハイライトを検出及び再生するシステムに関する。
【0002】
[発明の背景]
広範な種類のビデオ再生デバイスが市場で入手可能である。大部分の人々は、ビデオテープレコーダ(VTR)とも称されるビデオカセットレコーダ(VCR)を所有するか若しくはよく知っている。最近では、ビデオプログラムを記録するために磁気カセットテープではなくコンピューター磁気ハードディスクを使用するビデオレコーダが、市場で見受けられる。例えば、ReplayTVTMレコーダ及びTiVOTMレコーダは、例えばMPEG−2圧縮を使用してハードディスクドライブにテレビジョンプログラムをデジタルで記録する。更に、幾つかのビデオ再生デバイスは、磁気ディスクではなく読み取り/書き込み可能なデジタル多用途ディスク(DVD)に記録を行う。
【0003】
ビデオプログラムを再生できる略すべてのシステムは、記録済みのビデオプログラムを通した鑑賞者による選択的な走査を可能とする、早送りモード及び巻戻しモードを有する。これらのモードは、不要な時間を節約するものである。多くの人は、プログラムの興味のある部分(即ち、“ハイライト”)を見るためや、コマーシャルを含むプログラムの興味のない部分をスキップするために、早送り(FF)や巻戻し(REW)を使用する。典型的なシナリオでは、スポーツファンは、フットボールの試合を大幅に短い時間で走査する為に早送りモードを使用し、興味のあるプレイ(タッチダウンやロングパスのような)を通常速度で見るために早送りを止める。
【0004】
しかしながら、かかるプログラム鑑賞方法は、依然として人の介入を多大に必要とし、本質において幾分行き当たりばったり式である。鑑賞者は、興味のある事象を検出すべく、早送り動作中において常にスクリーンを監視しなければならない。鑑賞者は、しばしば、興味深い事象(タッチダウンのような)の大部分を、当該興味深い事象が生じていることに気が付く前に、走査し過ぎてしまう。鑑賞者は、僅かに巻戻して、興味のある事象を通常速度でリプレイしなければならない。
【0005】
ビデオプログラムにおけるハイライト(若しくは興味のある事象)を選択的に鑑賞するプロセスを自動化するために、多くの技術が提案されているが、限られて度合いの成功しかなしえていない。これらの先行技術のシステムは、ビデオプログラムに関する所定のワードのライブラリを検索するキーワードに基づく方法、特定のカテゴリーの音声(即ち、スピーチ、音楽、無音状態)を探す音声コンテンツに基づく方法、例えば風景の変化に基づきビデオプログラムを自動的に解析する映像処理方法を使用している。残念ながら、ビデオハイライトを選択することは人間にとって簡単明瞭な作業でありうる一方で、ビデオプログラム中で真の興味のある事象を自動的に検出することは、多大なコンピューター的な労力を必要とする非常に誤りの発生しやすい処理であることが常である。
【0006】
それ故に、ビデオプログラム中の興味のある事象を検出できる改善型のシステム及び方法に対する必要性が先行技術において存在する。特に、ビデオプログラムを記録し、記録したビデオプログラム中の興味のある事象を特定できるビデオ再生デバイスに対する要請がある。より詳細には、記録済みビデオプログラム中のハイライトを特定でき、後のユーザの要求に応じてハイライトを選択的に再生することができるビデオ再生デバイスに対する要請がある。
【0007】
[発明の概要]
先行技術の上述の欠点に対処するため、本発明の主要な目的は、内部の記憶装置に記録されたビデオプログラムを再生できるビデオ再生デバイスにおいて使用される、上記ビデオプログラム中のプログラムハイライトを検出する装置を提供することにある。本発明の効果的な実施例によれば、上記装置は、1)上記ビデオプログラムの音声トラック中の所定のキーワードの位置を検出できるキーワード検出回路と、2)上記所定のキーワードの上記検出した位置近傍の上記音声トラックの音声信号エネルギレベルを算出し、該音声信号エネルギレベルを所定の閾値と比較することができる音声信号エネルギレベル検出回路とを含む。
【0008】
本発明の一実施例によれば、上記音声信号エネルギレベル検出回路は、上記音声信号エネルギレベルが上記所定の閾値を超えているとの判断に応答して、上記所定のキーワードの上記検出した位置をプログラムハイライトとして特定する。
【0009】
本発明の他の実施例によれば、上記キーワード検出回路は、上記ビデオプログラム中のクローズド・キャプション文字を検出できるクローズド・キャプション検出器と、上記検出されたクローズド・キャプション文字内のキーワードを検出するプロセッサとを含む。
【0010】
本発明の更なる他の実施例によれば、上記プロセッサは、上記検出されたクローズド・キャプション文字を、上記プロセッサに関連するメモリ内に記憶された複数のキーワードと比較することによって、上記検出されたクローズド・キャプション文字中の上記キーワードを検出する。
【0011】
本発明の更なる他の実施例によれば、上記キーワード検出回路は、上記音声トラックで検出された話し言葉を文字に変換する音声認識アプリケーションプログラムを実行できる音声プロセッサを含み、上記音声プロセッサは、更に、上記変換された文字中のキーワードを検出することができる。
【0012】
本発明の更なる他の実施例によれば、上記音声プロセッサは、上記変換された文字を、上記音声プロセッサに関連するメモリに記憶された複数のキーワードと比較することによって、上記変換された文字中のキーワードを検出する。
【0013】
本発明の更なる他の実施例によれば、上記音声信号エネルギレベル検出回路は、上記所定のキーワードの上記検出された位置近傍のウインドウにおける平均音声信号エネルギレベルを算出することによって、上記音声トラックの上記音声信号エネルギレベルを導出する。
【0014】
本発明の更なる他の実施例によれば、上記音声信号エネルギレベル検出回路は、上記所定のキーワードの上記検出された位置に先行するプログラムハイライトの開始点及び上記所定のキーワードの上記検出された位置に後続するプログラムハイライトの終了点を決定することによって、上記所定のキーワードの上記検出された位置をプログラムハイライトとして特定する。
【0015】
本発明の他の主要な目的は、キーワード検出回路を必要としない、ビデオプログラム中のプログラムハイライトを検出するための装置を提供することにある。本発明の一実施例では、上記装置は、音声トラックのN個の連続するセグメントの音声信号エネルギレベルを計算し、上記音声信号エネルギレベルを所定の閾値と比較することができる音声信号エネルギレベル検出回路を含む。音声信号エネルギレベル検出回路は、上記音声信号エネルギレベルが上記所定の閾値を超えたとの判断に応答して、上記N個の連続するセグメントをプログラムハイライトとして特定する。模範的実施例では、プログラムハイライトは、平均の音声信号エネルギレベルが上記所定の閾値を超える上記N個の連続するセグメントを導出することによって、特定される。
【0016】
上述は、当業者が次の発明の詳細な説明をより良く理解しうるように、本発明の特徴及び技術的な効果をより幅広く概説している。本発明の請求項の主題を形成する、本発明の更なる特徴及び効果が以下で開示されることになる。当業者であれば、本発明の同一の目的を実現するための修正若しくは他の構造を設計するために、基礎として開示された特別な実施例及び概念を容易に利用しうることがわかるだろう。当業者であれば、かかる均等な構造が最も広い形態での本発明の精神及び観点を逸脱しないことを理解すべきである。
【0017】
“発明の詳細な説明”の前に、本特許文献を通して使用されるある一定の言葉及びフレーズの定義を与えることが効果的であるだろう。用語“含む”は、それらの構成要素以外の構成要素を排除するものでない。用語“若しくは”は非限定的で及び/又はを意味し、フレーズ“関連して”は、そこからの派生物と同様、含む、そこに含まれる、相互結合している、包含する、接続している、結合している、連通している、協働する、介在する、並設される、近傍にある、境界関係を持つ、持つ、備える、特性を有する等を意味する。用語“コントローラ”は、少なくとも1の動作を制御するあらゆるデバイス、システム若しくはそれらの一部を意味し、かかるデバイスは、ハードウェア、ファームウェア、ソフトウェア若しくはそれらの任意の組み合わせで実現されてよい。あらゆる特定のコントローラに関連する機能は、局所的であれ遠隔的であれ、中央化若しくは分散化されてよい。特に、コントローラは、1以上のアプリケーションプログラム及び/又は動作システムプログラムを実行する、1以上のデータプロセッサ及び関連する入出力デバイス並びにメモリを含んでよい。ある一定の言葉及びフレーズに対する定義が本特許文献を通して付与されたが、当業者であれば、かかる定義が、多くの場合、過去や未来にも適用されることを理解すべきである。
【0018】
本発明及びその効果のより完全な理解のため、類似する番号が類似する対象を指示している添付図面と関連して、次の詳細な説明に参照がなされる。
【0019】
[発明の詳細な説明]
以下説明する図1乃至図4、及び、本特許文献における本発明の原理を説明するために使用される種々の実施例は、例示的なものであり、本発明の観点を制限するように解釈されるべきでない。当業者であれば、本発明の原理が、あらゆる適切に構成された再生デバイスにおいて実施されてよいことを理解するだろう。
【0020】
図1は、本発明の一実施例による模範的なビデオ再生デバイス150及びテレビジョンセット105を示す。ビデオ再生デバイス150は、ケーブルテレビジョンサービスプロバイダー(Cable Co.)、ローカルアンテナ、インターネットやDVD若しくはVHSテーププレーヤのような外部ソースからのテレビジョン信号を受信し、テレビジョンセット105に鑑賞者の選択したチャンネルを送信する。記録モードでは、ビデオ再生デバイス150は、入力する高周波(RF)のテレビジョン信号を復調して、ビデオ再生デバイス150内の記憶媒体若しくはビデオ再生デバイス150に接続する記憶媒体に記録及び記憶されるベースバンドビデオ信号を生成しうる。再生モードでは、ビデオ再生デバイス150は、ユーザが選択する、記憶したベースバンドビデオ信号(即ち、プログラム)を記憶媒体から読み出し、それをテレビジョンセット105に送信する。
【0021】
例えば、ビデオ再生デバイス150が、ビデオテープレコーダ(VTR)とも称されるカセットレコーダ(VCR)である場合、ビデオ再生デバイス150は、入力されるテレビジョン信号を磁気カセットテープに記憶し、記憶したテレビジョン信号を磁気カセットテープから取り出す。ビデオ再生デバイス150は、ReplayTVTMレコーダ及びTiVOTMレコーダのような、ディスクドライブに基づくデバイスである場合、ビデオ再生デバイス150は、入力されるテレビジョン信号を磁気カセットテープにではなくコンピューター磁気ハードディスクに記憶し、ハードディスクから記憶したテレビジョン信号を取り出す。更なる他の実施例では、ビデオ再生デバイス150は、ローカルのリード/ライト(R/W)デジタル多用途ディスク(DVD)やリード/ライト(R/W)CD−ROMに対して記憶・読み出しを行ってもよい。
【0022】
ビデオ再生デバイス150は、鑑賞者の操作によるリモートコントローラからコマンド(チャンネルアップ、チャンネルダウン、音量アップ、音量ダウン、記録、再生、早送り(FF)、巻戻し等)を受信する赤外線(IR)センサ160を含む。テレビジョンセット105は、スクリーン10と、赤外線(IR)センサ115と、1以上の手動制御スイッチ120(破線で囲まれた部位)とを含む、従来的なテレビジョンである。IRセンサ115も、鑑賞者の操作によるリモートコントローラからコマンド(音量アップ、音量ダウン、電源オン/オフ等)を受信する。
【0023】
ビデオ再生デバイス150が、特定の種のソースからの特定種の入力テレビジョン信号を受信することに限定されないことに注意されたい。上述の如く、外部のソースは、ケーブルサービスプロバイダー、従来のラジオ放送アンテナ、衛星放送受信アンテナ、インターネット接続、若しくは、DVDプレーヤやVHSテーププレーヤのようなローカル記憶装置であってよい。幾つかの実施例では、ビデオ再生デバイス150は、記録することができなくてもよいが、挿入・排出可能なDVDやCD−ROMから読み出されるテレビジョン信号を再生することに限定されて良い。従って、入力信号は、デジタル信号、アナログ信号若しくはインターネットプロトコル(IP)パケットであってよい。しかし、本発明の原理を説明する際の明瞭性及び簡潔性の目的から、次の説明は、ビデオ再生デバイス150がケーブルサービスプロバイダーからの入力テレビジョン信号(アナログ及び/又はデジタル)を受信する実施例に向けられる。但し、当業者であれば、本発明の原理が無線放送テレビジョン信号、ローカル記憶システム、若しくはMPEGデータを含むIPパケットの入力ストリーム等にも容易に適用されうることを理解するだろう。
【0024】
図2は、本発明の一実施例による模範的なビデオ再生デバイス150の詳細図である。ビデオ再生デバイス150は、IRセンサ160と、ビデオプロセッサ210と、MPEG2エンコーダ220と、ハードディスクドライブ230と、MPEG2デコーダ/NTSCエンコーダ240と、ビデオレコーダ(VR)コントローラ250とを含む。ビデオ再生デバイス150は、更に、クローズド・キャプション(CC)検出器260と、音声プロセッサ270と、メモリ280とを含む。VRコントローラ250は、鑑賞モード、記録モード、再生モード、早送り(FF)モード、巻戻しモードをとりわけ含む、ビデオ再生デバイス150の全体の動作を指示する。本発明の原理によると、ビデオ再生デバイス150は、以下詳説されるように、ビデオプログラムから選択したハイライトを再生するスキャンモードをも提供する。
【0025】
鑑賞モードでは、VRコントローラ250によって、ケーブルサービスプロバイダーからの入力テレビジョン信号が、ビデオプロセッサ210により復調及び処理されると共に、ハードディスクドライブ230への記憶若しくはそれからの読み出し無しで、テレビジョンセット105に送信される。ビデオプロセッサ21は、ケーブルサービスプロバイダーからの入力テレビジョン信号を受信し、ユーザが選択したチャンネルに調整し、選択したRF信号をテレビジョンセット105での表示に適したベースバンドテレビジョン信号(例えば、スーパービデオ信号)に変換する、高周波(RF)前置回路を含む。また、ビデオプロセッサ210は、再生モード中、MPEG2デコーダ/NTSCエンコーダ240からの従来的なNTSC信号を受信し、テレビジョンセット105にベースバンドテレビジョン信号を送信することができる。
【0026】
記録モードでは、VRコントローラ250によって、入力テレビジョン信号がハードディスクドライブ230に記憶される。VRコントローラ250の制御下で、MPEG2エンコーダ220は、ケーブルサービスプロバイダーからの入力テレビジョン信号を受信し、ハードディスクドライブ230への記憶用のMPEGフォーマットに、受信したRF信号を変換する。再生モードでは、VRコントローラ250は、記憶したテレビジョン信号(即ち、プログラム)をMPEG2デコーダ/NTSCエンコーダ240に流すようにハードディスクドライブ230に指示をし、MPEG2デコーダ/NTSCエンコーダ240は、テレビジョンセット105に送信される例えばスーパービデオ(S−Video)信号へと、ハードディスクドライブ230からのMPEG2データを変換する。MPEG2エンコーダ220及びMPEG2デコーダ/NTSCエンコーダ240に対するMPEG2規格の選択は例示的なものあることに注意されたい。本発明の代替実施例では、MPEGエンコーダ及びデコーダは、MPEG−1、MPEG−2、MPEG−4及びMPEG−7規格のうちの一若しくはそれ以上に準拠してよい。
【0027】
本出願及び請求の範囲の目的のため、ハードディスクドライブ230は、リード−ライトデジタル多用途ディスク(DVD−RW)、書き換え可能なCD−ROMやVCRテープ等のための従来的な磁気ディスクドライブ及び光ディスクドライブを含む、読み出し及び書き込みの双方が可能な大容量記憶装置を含むように定義される。実際には、ハードディスクドライブ230は、ビデオ再生デバイス150に永久的に内蔵されているという従来的な意味で固定されている必要はない。むしろ、ハードディスクドライブ230は、記録ビデオプログラムを記録する目的でビデオ再生デバイス150に割り当てられるあらゆる大容量記憶装置を含む。従って、ハードディスクドライブ230は、リード−ライトDVDや書き換え可能なCD−ROMを保持するジュークボックスデバイスのような、取り付けられる周辺ドライブや脱着可能なディスクドライブを含んでよい。更に、本発明の有利な実施例では、ハードディスクドライブ230は、例えばユーザのホームパーソナルコンピューター内のディスクドライブやインターネットサービスプロバイダー(ISP)でのサーバー上のディスクドライブを含む、ビデオ再生デバイス150がアクセスしネットワーク接続(例えば、インターネットプロトコル(IP)接続)を介して制御してよい外部の大容量記憶装置を含んでよい。
【0028】
再生モード中、VRコントローラ250は、IRセンサ160を介してユーザからのスキャンコマンドを受信してよい。スキャンモードでは、ビデオ再生デバイス150は、ハードディスクドライブ230上に記憶されたビデオプログラム(例えば、スポーツ番組)から抽出されるハイライトのみを再生することができる。これを達成するため、ビデオ再生デバイス150は、ハードディスクドライブ230に記録されている際(若しくは、記録された後)にビデオプログラムを解析してよく、ビデオプログラムのハイライト部分を自動的に検出及びラベル付け(標識付け)するため、文字ベースの探索及び選択した音声特性の組み合わせを利用してよい。後のスキャンモード中、ビデオ再生デバイス150は、記憶したビデオプログラム中のラベル付けされたハイライト部分を検出し、テレビジョン105での再生のために当該ラベル付けされたハイライト部分のみを抽出する。
【0029】
本発明の模範的実施例では、メモリ280は、音声認識プログラム282とキーワード(KW)ライブラリ284とを記憶するランダムアクセスメモリ(RAM)を構成してよい。音声認識プログラム282は、ビデオプログラムの音声トラック中の話し言葉を検出し、検出した話し言葉を文字ワードに変換する、音声プロセッサ270によって実行されるプログラム指令を含む。音声プロセッサ270は、文字ワードとキーワード(KW)ライブラリ284に記憶された選択したキーワーワードとの比較を行う。これらが適合したとき、音声プロセッサ270は、記憶したビデオプログラムの対応するセグメントに関連するキーワード識別子をハードディスクドライブ230上に記憶する。スポーツ番組に関して、キーワードは、タッチダウン、サック、インターセプト、ファンブル、フィールドゴール、ホームラン、得点、トリプル、盗塁、スリーポイントシュート、ファーストブレイク、タイムアウト、ゴール、セーブ、パワープレイ、ハットトリック等のような、言葉及びフレーズを含んでよい。
【0030】
本発明の代替実施例では、音声プロセッサ270は、ビデオプログラム中のキーワードを特定するため、クローズド・キャプション(CC)検出器260から受信する文字を利用してよい。クローズド・キャプション(CC)検出器260は、MPEG2デコーダ/NTSCエンコーダ240からのビデオストリームを受信し、NTSC出力信号からCC文字を検出する。CC文字は、典型的には、ビデオ信号のライン21のエンドでの消去時間に挿入される。CC検出器260は、CC文字に対応するビデオプログラムのセグメントを特定するため、CCデータの各ラインに関連するタイムスタンプを利用する。CC検出器260は、CC文字の各ライン及びタイムスタンプを音声プロセッサ270に送信する。音声プロセッサ270は、CC文字ワードと、キーワード(KW)ライブラリ284に記憶された選択したキーワーワードとの比較を行う。これらが適合したとき、音声プロセッサ270は、タイムスタンプにより特定される記憶ビデオプログラムの対応するセグメントに関連するキーワード識別子をハードディスクドライブ230上に記憶する。
【0031】
実際のスポーツ放送では、多くのキーワードは、潜在的なハイライト事象中よりも、アナウンサー間での通常的会話中に使用される。これは、音声プロセッサ270がハイライトに対応しない記憶ビデオプログラムのセグメントにキーワード識別子を付すという多くの“誤認(false positive)”を生んでしまう。誤認の数を低減すべく、音声プロセッサ270は、記憶ビデオプログラム中の特定されたキーワードの発生に対応する高い音声エネルギ(例えば、観衆のノイズ)の期間を特定するために記憶ビデオプログラムの音声トラックを解析する。
【0032】
音声トラック情報は、ビデオストリームを認識し、分類し、ある意味論的特性を備えたセグメントに分割する際に効果的に使用されてきた。それは、新たなプログラムの話者ベースのセグメント化及び音声認識手段によるキーワードの突き止めの際に使用されてきた。また、音声データは、コンテンツインデックス化のために非常に効果的に利用することができる。というのは、それは、ビデオ処理と比較して、大幅に少ない処理パワー及び記憶スペースしか必要としないからである。
【0033】
音声プロセッサ270は、先ず、音声トラック情報の文字的な検索を実行する。このステップは、通常的には、候補(即ち、特定のキーワードを含むプログラムのセグメント)の長いリストを出力する。上述の如く、これらのセグメントの多くは、解説者がしばしば先の試合やプレイを参照してこれらの言葉を使用するので、実際のハイライトを表わさない。このとき、音声プロセッサ270は、誤認から実際のハイライトを区別するため、検出したキーワード周辺の各セグメントからの音声信号特性を使用する。
【0034】
本発明の模範的実施例では、音声プロセッサ270は、音声トラック情報を1秒の長さのセグメントで処理する。音声プロセッサ270は、各セグメントに対する絶対値平均として、音声の興奮レベルX(A)を計算する。Aが音声信号である場合、興奮レベルX(A)は、ABSを絶対値を表わす関数として、X(A)=AVG(ABS(A))となる。次いで、音声プロセッサ270は、たいていの状況では真の興味のある事象(即ち、ハイライト)が少なくとも5秒間続くことから、例えば5つのセグメント(5秒に相当)の送りウインドウを使用して、平均強度を計算する。このとき、所定の閾値を超える平均興奮レベルを持つ5つのセグメントの集合は、ハイライトシーケンスを形成するために結合され、ハードディスクドライブ230上にハイライトとして識別化(即ち、マーク)される。模範的実施例では、音声プロセッサ270は、プログラム全体に亘る最大値の1/2である閾値を使用してよい。代替実施例では、音声プロセッサ270は、ビデオプログラムの10分若しくは15分のブロックのような、長時間のプログラムに亘る最大値の1/2である閾値を使用してよい。
【0035】
本発明は、トークショーからのハイライト(即ち、ジョーク)を抽出するといった、スポーツでない事象との関連で使用されてもよい。ジョークや他のハイライトを検出すべく、音声プロセッサ270は、トークショーから“ベスト”ジョークを見出すために、上述の音声ベースのアルゴリズムの変形を使用する。例えば、音声プロセッサ270は、スタジオ環境で記録された少量の笑い効果を検出するため、正規化された興奮レベルNX(A)を使用してよい。ここで、ABSを絶対値を表わす関数として、興奮レベルNX(A)は、NX(A)=AVG(ABS(A))/MAX(ABS(A))である。音声プロセッサ270は、ウインドウの重なりのない一秒ごとにこの値を計算し、候補として最も高い値を選択する。第2段階では、音声プロセッサ270は、離れたピーク及びコマーシャル中に発生するピークをプログラムセグメントの開始若しくは終了時に除去してよい。
【0036】
図3は、本発明の一実施例によるハードディスクドライブ230上に記憶される模範的なビデオプログラム300を示す。ビデオプログラム300中の模範的なハイライトは、ビデオ再生デバイス150によるスキャンもモードでの後の再生のために音声プロセッサ270により識別及びラベル付けされている。ビデオプログラム300は、一秒のセグメントの一連の集まり、S0乃至Snからなる。2つの模範的キーワード、KW1及びKW2の位置が指示される。KW1は、ビデオプログラム300の約4分16秒(即ち、256秒)で、S256とS258の境界で発生する。KW2は、ビデオプログラム300の約15分18秒、S918とS919の境界で発生する。
【0037】
KW1及びKW2周辺の音声エネルギレベルが上述の如く所定の閾値レベルを超えるかの音声プロセッサ270による判断の結果として、音声プロセッサ270は、セグメントS252及びS261をハイライト(ラベル付けされたハイライト1)として指定し、セグメントS914及びS923をハイライト(ラベル付けされたハイライト2)として指定している。スキャンモード中、ビデオ再生デバイス150は、ハイライト1(セグメントの開始S0でなく)まで直接的にスキップし、ハイライト1(即ち、S252−S261)を通常速度で再生する。ハイライト1が再生された後、ビデオ再生デバイス150は、ハイライト1とハイライト2の間のS262−S913をスキップ(早送り)し、ハイライト2即ち、S914−S923)を通常速度で再生する。
【0038】
模範的ビデオプログラム300において、ハイライト1,2の長さ(即ち、10秒)は、例示に過ぎない。代替実施例では、音声プロセッサ270は、模範的な10秒のハイライトよりも長い若しくは短い、キーワードに関連するハイライトを指定してもよい。例えば、音声プロセッサ270は、20秒、30秒若しくはユーザが選択する長さのハイライトを指定してもよい。更に、キーワードがハイライトの中心に位置する必要性はない。例えば、音声プロセッサ270は、30秒のハイライトを、高い音声信号エネルギレベルの期間中に生ずるキーワードに先行する20秒の前部及びそれに後続する10秒の後部で指定してよい。
【0039】
最後に、音声プロセッサ270により特定されるハイライトの長さが、キーワードを包囲する高い音声信号エネルギレベルの期間の長さと同一である必要性はない。上述では、音声プロセッサ270は、平均音声興奮レベルが所定の閾値レベルを超えている間、キーワードの発生に一致する5秒間のウインドウを検索していた。しかしながら、音声プロセッサ270が、かかる5秒間のウインドウを検出し、ハイライトが存在すると判断すると、音声プロセッサ270は、キーワードに先行する20秒及び後続する10秒としてハイライトを定義してよい。このように、ビデオ再生デバイス150は、重大な事象の発生につながる比較的に低い音声興奮の期間を再生してもよい。
【0040】
図4は、本発明の一実施例による模範的なビデオ再生デバイス150の動作を示すフローチャート400である。ビデオハイライトを生成し鑑賞する本処理は、ビデオ再生デバイス150がハードディスクドライブ230上にビデオプログラムを記録した(ステップ405)ときに開始される。ビデオ再生デバイス150は、予定された時刻で、若しくは、鑑賞者がリモートコントローラを操作することによる手動の記録コマンドに応答して、ビデオプログラムを記録してよい。次いで、音声プロセッサ270は、記録したプログラムビデオの音声トラック中のキーワードを検出してよい。キーワードは、音声認識プログラム282により検出される言葉と、キーワードライブラリ284に記憶されたキーワードとを比較することによって、或いは、クローズド・キャプション(CC)検出器260から受信した文字と、キーワードライブラリ284に記憶されたキーワードとを比較することによって、検出されてよい。音声プロセッサ270は、ビデオプログラムを記録している間(即ち、リアルタイムで)キーワードを検出してよく、若しくは、ビデオプログラムを記録した後に(即ち、オフラインで)キーワードを検出してもよい(ステップ410)。
【0041】
キーワードが発生する各場所で、音声プロセッサ270は、上述の如く、各キーワード位置周辺に配置される可変サイズのウインドウにおける音声信号のエネルギを、所定の閾値と比較する(ステップ415)。ウインドウにおける音声信号エネルギレベルが閾値を超える場合、音声プロセッサ270は、キーワード位置をビデオプログラムハイライトとして特定する(ステップ420)。キーワード位置をハイライトとして特定するために、音声プロセッサ270は、検出可能なマーカー(若しくはフラグ)をビデオプログラム中の各ハイライトの開始点及び終了点に挿入してよい。記録ビデオプログラムがディスクドライブ上に記憶される場合、音声プロセッサ270は、各ハイライトの開始点アドレス及び終了点アドレスをビデオプログラムに関連するデータファイルに記憶することによって、各ハイライト位置を特定してよい。上述の如く、検出したキーワードの位置に対するハイライトの位置及び長さは、可変であってよい。効果的な実施例では、ハイライトの位置及び長さは、VRコントローラ250により制御されるTV105上のグラフィカルユーザインターフェースを通してユーザにより変更されてよい。最後に、スキャンモード中、ビデオ再生デバイス150は、TV105上での再生のためにハードディスクドライブ230からビデオプログラムハイライトのみを抽出する(ステップ425)。
【0042】
本発明は、詳細に説明されてきたが、当業者であれば、最も広い形態での本発明の精神及び観点から逸脱することなく種々の変更、置換、代替をなしうることを理解すべきである。
【図面の簡単な説明】
【図1】
本発明の一実施例による模範的なビデオ再生デバイス及びテレビジョンを示す図である。
【図2】
本発明の一実施例による模範的なビデオ再生デバイスをより詳細に示す図である。
【図3】
本発明の一実施例による模範的なビデオ再生デバイス内のハードディスクドライブ上に記憶される模範的なビデオプログラムを示す図である。
【図4】
本発明の一実施例による模範的なビデオ再生デバイスの動作を示すフローチャートである。

Claims (19)

  1. 内部の記憶装置に記録されたビデオプログラムを再生できるビデオ再生デバイスにおいて使用される、上記ビデオプログラム中のプログラムハイライトを検出する装置であって、
    上記ビデオプログラムの音声トラック中の所定のキーワードの位置を検出できるキーワード検出回路と、
    上記所定のキーワードの上記検出した位置近傍の上記音声トラックの音声信号エネルギレベルを算出すると共に、該音声信号エネルギレベルを所定の閾値と比較することができる音声信号エネルギレベル検出回路とを含む、装置。
  2. 上記音声信号エネルギレベル検出回路は、上記音声信号エネルギレベルが上記所定の閾値を超えているとの判断に応答して、上記所定のキーワードの上記検出した位置をプログラムハイライトとして特定する、請求項1記載の装置。
  3. 上記キーワード検出回路は、上記ビデオプログラム中のクローズド・キャプション文字を検出できるクローズド・キャプション検出器と、上記検出されたクローズド・キャプション文字内のキーワードを検出するプロセッサとを含む、請求項2記載の装置。
  4. 上記プロセッサは、上記検出されたクローズド・キャプション文字を、上記プロセッサに関連するメモリ内に記憶された複数のキーワードと比較することによって、上記検出されたクローズド・キャプション文字中の上記キーワードを検出する、請求項3記載の装置。
  5. 上記キーワード検出回路は、上記音声トラックで検出された話し言葉を文字に変換する音声認識アプリケーションプログラムを実行できる音声プロセッサを含み、上記音声プロセッサは、更に、上記変換された文字中のキーワードを検出することができる、請求項2記載の装置。
  6. 上記音声プロセッサは、上記変換された文字を、上記音声プロセッサに関連するメモリに記憶された複数のキーワードと比較することによって、上記変換された文字中のキーワードを検出する、請求項5記載の装置。
  7. 上記音声信号エネルギレベル検出回路は、上記所定のキーワードの上記検出された位置近傍のウインドウにおける平均音声信号エネルギレベルを算出することによって、上記音声トラックの上記音声信号エネルギレベルを導出する、請求項2記載の装置。
  8. 上記音声信号エネルギレベル検出回路は、上記所定のキーワードの上記検出された位置に先行するプログラムハイライトの開始点及び上記所定のキーワードの上記検出された位置に後続するプログラムハイライトの終了点を決定することによって、上記所定のキーワードの上記検出された位置をプログラムハイライトとして特定する、請求項2記載の装置。
  9. 複数のビデオプログラムを記憶できる記憶装置と、
    入力ビデオプログラムを受信し、上記記憶装置上に上記入力ビデオプログラムを記憶することができるビデオ記録回路とを含み、
    請求項1による装置を更に含む、ビデオデバイス。
  10. ビデオ再生デバイスの記憶装置に記録されたビデオプログラムを再生できるビデオ再生デバイスにおいて使用される、上記ビデオプログラム中のプログラムハイライトを検出する方法であって、
    ビデオプログラムの音声トラック中の所定のキーワードの位置を検出する検出ステップと、
    上記所定のキーワードの上記検出された位置近傍の上記音声トラックの音声信号エネルギレベルを算出するステップと、
    上記音声信号エネルギレベルを所定の閾値と比較するステップとを含む、方法。
  11. 上記音声信号エネルギレベルが上記所定の閾値を超えるか否かを判断するステップを更に含み、
    上記音声信号エネルギレベルが上記所定の閾値を超えているとの判断に応答して、上記所定のキーワードの上記検出した位置をプログラムハイライトとして特定する、請求項10記載の方法。
  12. 上記検出ステップが、上記ビデオプログラム中のクローズド・キャプションを検出するサブステップと、
    上記検出されたクローズド・キャプション中のキーワードを検出する検出サブステップとを含む、請求項11記載の方法。
  13. 上記検出サブステップは、上記検出されたクローズド・キャプション文字を、上記ビデオ再生デバイスに関連するキーワードライブラリ内に記憶された複数のキーワードと比較するサブステップを含む、請求項12記載の方法。
  14. 上記検出ステップは、上記音声トラックで検出された話し言葉を文字に変換する音声認識アプリケーションプログラムを実行するサブステップと、
    上記変換された文字中のキーワードを検出するサブステップとを含む、請求項13記載の方法。
  15. 上記変換された文字中のキーワードを検出する上記サブステップは、上記変換された文字を、上記ビデオ再生デバイスに関連するキーワードライブラリに記憶された複数のキーワードと比較するサブステップを含む、請求項14記載の方法。
  16. 上記音声トラックの音声信号エネルギレベルを算出する上記ステップは、上記所定のキーワードの上記検出された位置近傍のウインドウ内の平均音声信号エネルギを算出するサブステップを含む、請求項11記載の方法。
  17. 内部の記憶装置に記録されたビデオプログラムを再生できるビデオ再生デバイスにおいて使用される、上記ビデオプログラム中のプログラムハイライトを検出する装置であって、
    音声トラックのN個の連続するセグメントの音声信号エネルギレベルを計算し、上記音声信号エネルギレベルを所定の閾値と比較することができる音声信号エネルギレベル検出回路を含む、装置。
  18. 上記音声信号エネルギレベル検出回路は、上記音声信号エネルギレベルが上記所定の閾値を超えたとの判断に応答して、上記N個の連続するセグメントをプログラムハイライトとして特定する、請求項17記載の装置。
  19. 上記音声信号エネルギレベル検出回路は、上記N個の連続するセグメントの平均の音声信号エネルギレベルを算出することによって、上記音声トラックの上記音声信号エネルギレベルを導出する、請求項18記載の装置。
JP2002540156A 2000-10-30 2001-10-16 音声特性を利用してビデオプログラム中のハイライトを検出するシステム及び方法 Ceased JP2004513547A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/699,605 US6973256B1 (en) 2000-10-30 2000-10-30 System and method for detecting highlights in a video program using audio properties
PCT/EP2001/011975 WO2002037498A2 (en) 2000-10-30 2001-10-16 System and method for detecting highlights in a video program using audio properties

Publications (1)

Publication Number Publication Date
JP2004513547A true JP2004513547A (ja) 2004-04-30

Family

ID=24810056

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002540156A Ceased JP2004513547A (ja) 2000-10-30 2001-10-16 音声特性を利用してビデオプログラム中のハイライトを検出するシステム及び方法

Country Status (6)

Country Link
US (1) US6973256B1 (ja)
EP (1) EP1332497A2 (ja)
JP (1) JP2004513547A (ja)
KR (1) KR100833807B1 (ja)
CN (1) CN100364008C (ja)
WO (1) WO2002037498A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007274237A (ja) * 2006-03-30 2007-10-18 Denso Corp 移動体用放送受信装置
KR20100085720A (ko) * 2009-01-21 2010-07-29 삼성전자주식회사 하이라이트 영상 구성 방법 및 장치

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6233389B1 (en) 1998-07-30 2001-05-15 Tivo, Inc. Multimedia time warping system
US7558472B2 (en) 2000-08-22 2009-07-07 Tivo Inc. Multimedia signal processing system
EP1885128A3 (en) 1999-09-20 2008-03-12 Tivo, Inc. Closed caption tagging system
US7266287B2 (en) * 2001-12-14 2007-09-04 Hewlett-Packard Development Company, L.P. Using background audio change detection for segmenting video
US7386217B2 (en) * 2001-12-14 2008-06-10 Hewlett-Packard Development Company, L.P. Indexing video by detecting speech and music in audio
FR2842014B1 (fr) * 2002-07-08 2006-05-05 Lyon Ecole Centrale Procede et appareil pour affecter une classe sonore a un signal sonore
US7483624B2 (en) * 2002-08-30 2009-01-27 Hewlett-Packard Development Company, L.P. System and method for indexing a video sequence
AU2003293071A1 (en) * 2002-11-22 2004-06-18 Roy Rosser Autonomous response engine
US20040167767A1 (en) * 2003-02-25 2004-08-26 Ziyou Xiong Method and system for extracting sports highlights from audio signals
US8959567B1 (en) * 2003-08-15 2015-02-17 Verizon Patent And Licensing Inc. Identification and recording of program sub-segments
WO2005076594A1 (en) * 2004-02-06 2005-08-18 Agency For Science, Technology And Research Automatic video event detection and indexing
US7505671B2 (en) * 2004-02-25 2009-03-17 Casio Computer Co., Ltd. Recording/reproduction apparatus, system and program which reproduces a section of a recorded program based on a keyword relating to the section and a reproduction speed corresponding to the keyword
CN102665112B (zh) 2004-11-19 2015-08-19 Tivo股份有限公司 用于多媒体内容的安全传输和回放的方法和设备
US9210368B2 (en) * 2004-12-28 2015-12-08 Google Technology Holdings LLC Digital video recorder for automatically recording an upcoming program that is being advertised
CN100426847C (zh) * 2005-08-02 2008-10-15 智辉研发股份有限公司 以语音特征为基础的精采片段检测电路及其相关方法
JP4683281B2 (ja) * 2005-08-23 2011-05-18 ソニー株式会社 再生システム、再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム
US7584428B2 (en) * 2006-02-09 2009-09-01 Mavs Lab. Inc. Apparatus and method for detecting highlights of media stream
TW200742431A (en) * 2006-04-21 2007-11-01 Benq Corp Playback apparatus, playback method and computer-readable medium
EP2030439B1 (en) * 2006-06-15 2018-09-19 The Nielsen Company (US), LLC Methods and apparatus to meter content exposure using closed caption information
US7873982B2 (en) 2006-06-22 2011-01-18 Tivo Inc. Method and apparatus for creating and viewing customized multimedia segments
US7661121B2 (en) * 2006-06-22 2010-02-09 Tivo, Inc. In-band data recognition and synchronization system
US8457768B2 (en) * 2007-06-04 2013-06-04 International Business Machines Corporation Crowd noise analysis
JP2009027430A (ja) * 2007-07-19 2009-02-05 Canon Inc 動画再生装置
KR101370904B1 (ko) * 2007-08-17 2014-03-10 엘지전자 주식회사 영상물의 녹화 방법 및 그 방법을 채용한 방송 수신기
US8659657B2 (en) * 2008-01-25 2014-02-25 International Business Machines Corporation System and method for pattern based thresholding applied to video surveillance monitoring
US8805689B2 (en) 2008-04-11 2014-08-12 The Nielsen Company (Us), Llc Methods and apparatus to generate and use content-aware watermarks
US20090320064A1 (en) * 2008-06-19 2009-12-24 Microsoft Corporation Triggers for Media Content Firing Other Triggers
US20090320061A1 (en) * 2008-06-19 2009-12-24 Microsoft Corporation Advertising Based on Keywords in Media Content
US8707342B2 (en) * 2008-06-19 2014-04-22 Microsoft Corporation Referencing data in triggers from applications
JP2010011038A (ja) * 2008-06-26 2010-01-14 Sony Corp 情報処理装置、情報処理方法およびコンピュータプログラム
JP5528008B2 (ja) * 2008-07-17 2014-06-25 キヤノン株式会社 再生装置及び再生方法
US20110066437A1 (en) * 2009-01-26 2011-03-17 Robert Luff Methods and apparatus to monitor media exposure using content-aware watermarks
US20100194988A1 (en) * 2009-02-05 2010-08-05 Texas Instruments Incorporated Method and Apparatus for Enhancing Highlight Detection
WO2010109613A1 (ja) * 2009-03-25 2010-09-30 富士通株式会社 再生制御プログラム、再生制御方法及び再生装置
US8438596B2 (en) 2009-04-08 2013-05-07 Tivo Inc. Automatic contact information transmission system
US8886528B2 (en) * 2009-06-04 2014-11-11 Panasonic Corporation Audio signal processing device and method
CN102073635B (zh) * 2009-10-30 2015-08-26 索尼株式会社 节目端点时间检测装置和方法以及节目信息检索系统
CN102073636A (zh) * 2009-10-30 2011-05-25 索尼株式会社 节目高潮检索方法和系统
TW201122863A (en) * 2009-12-31 2011-07-01 Hon Hai Prec Ind Co Ltd Video search device, search system, and search method
KR101086810B1 (ko) 2010-02-02 2011-11-25 인하대학교 산학협력단 자막이 입혀진 동영상을 검출하기 위한 장치 및 방법
US8606090B2 (en) 2011-03-17 2013-12-10 Sony Corporation Sport program chaptering
CN102724598A (zh) * 2011-12-05 2012-10-10 新奥特(北京)视频技术有限公司 一种拆分新闻条目的方法
KR20130071873A (ko) * 2011-12-21 2013-07-01 삼성전자주식회사 컨텐츠재생장치 및 그 제어방법
KR20150021258A (ko) * 2013-08-20 2015-03-02 삼성전자주식회사 디스플레이장치 및 그 제어방법
US9693030B2 (en) 2013-09-09 2017-06-27 Arris Enterprises Llc Generating alerts based upon detector outputs
BR112016006860B8 (pt) 2013-09-13 2023-01-10 Arris Entpr Inc Aparelho e método para criar um único fluxo de dados de informações combinadas para renderização em um dispositivo de computação do cliente
US9924148B2 (en) * 2014-02-13 2018-03-20 Echostar Technologies L.L.C. Highlight program
CN105407382A (zh) * 2014-09-15 2016-03-16 扬智科技股份有限公司 车辆间的无线通信方法、多媒体快播方法与缓存方法
KR101994291B1 (ko) * 2014-10-14 2019-06-28 한화테크윈 주식회사 통합써머리를 제공하는 영상재생장치 및 방법
KR102306538B1 (ko) * 2015-01-20 2021-09-29 삼성전자주식회사 콘텐트 편집 장치 및 방법
US9824279B2 (en) * 2015-03-24 2017-11-21 Facebook, Inc. Systems and methods for providing playback of selected video segments
CN105047203B (zh) * 2015-05-25 2019-09-10 广州酷狗计算机科技有限公司 一种音频处理方法、装置及终端
CN105120195B (zh) * 2015-09-18 2019-04-26 谷鸿林 内容录制、再现系统和方法
US10575036B2 (en) 2016-03-02 2020-02-25 Google Llc Providing an indication of highlights in a video content item
CN106571137A (zh) * 2016-10-28 2017-04-19 努比亚技术有限公司 一种终端语音打点控制装置及其方法
CN106603381B (zh) * 2016-11-24 2020-06-02 北京小米移动软件有限公司 处理聊天信息的方法及装置
CN107154264A (zh) * 2017-05-18 2017-09-12 北京大生在线科技有限公司 在线教学精彩片段提取的方法
CN108093124B (zh) * 2017-11-15 2021-01-08 维沃移动通信有限公司 一种音频定位方法、装置及移动终端
CN108521612B (zh) * 2018-04-25 2021-02-09 腾讯科技(深圳)有限公司 视频摘要的生成方法、装置、服务器及存储介质
KR102153201B1 (ko) 2018-12-19 2020-09-07 서울과학기술대학교 산학협력단 채팅 데이터와 오디오 데이터를 이용한 하이라이트 영상 생성 장치
KR102153211B1 (ko) 2019-01-11 2020-09-07 서울과학기술대학교 산학협력단 채팅 데이터와 오디오 데이터를 이용한 하이라이트 영상 생성 장치 및 방법
US11308273B2 (en) * 2019-05-14 2022-04-19 International Business Machines Corporation Prescan device activation prevention
CN111131844A (zh) * 2019-12-02 2020-05-08 钛马信息网络技术有限公司 一种行车记录仪的资源共享方法及系统
CN114822512B (zh) * 2022-06-29 2022-09-02 腾讯科技(深圳)有限公司 音频数据的处理方法、装置、电子设备及存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5136655A (en) 1990-03-26 1992-08-04 Hewlett-Pacard Company Method and apparatus for indexing and retrieving audio-video data
US5481296A (en) * 1993-08-06 1996-01-02 International Business Machines Corporation Apparatus and method for selectively viewing video information
US5664227A (en) 1994-10-14 1997-09-02 Carnegie Mellon University System and method for skimming digital audio/video data
US5794249A (en) 1995-12-21 1998-08-11 Hewlett-Packard Company Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system
JPH09284707A (ja) * 1996-04-12 1997-10-31 Sony Corp 記録装置
KR100206804B1 (ko) * 1996-08-29 1999-07-01 구자홍 하일라이트 부분 자동 선택 녹화 방법
US5828809A (en) 1996-10-01 1998-10-27 Matsushita Electric Industrial Co., Ltd. Method and apparatus for extracting indexing information from digital video data
EP1450276A3 (en) 1996-10-31 2007-08-08 Sensormatic Electronics Corporation Intelligent video information management system
GB9705999D0 (en) * 1997-03-22 1997-05-07 Philips Electronics Nv Video signal analysis and storage
JPH1155613A (ja) 1997-07-30 1999-02-26 Hitachi Ltd 記録および/または再生装置およびこれに用いられる記録媒体
JP3096280B2 (ja) 1997-11-10 2000-10-10 日本電信電話株式会社 電子映像文書作成利用方法及びプログラム格納媒体
US6163510A (en) * 1998-06-30 2000-12-19 International Business Machines Corporation Multimedia search and indexing system and method of operation using audio cues with signal thresholds
EP0984367B1 (en) 1998-09-03 2003-05-14 Ricoh Company, Ltd. Recording media with video, respectively audio index information, information management and retrieval methods for video, respectively audio information and a video retrieval system
JP2000250944A (ja) * 1998-12-28 2000-09-14 Toshiba Corp 情報提供方法、情報提供装置、情報受信装置、並びに情報記述方法
US6236395B1 (en) * 1999-02-01 2001-05-22 Sharp Laboratories Of America, Inc. Audiovisual information management system
US6332120B1 (en) * 1999-04-20 2001-12-18 Solana Technology Development Corporation Broadcast speech recognition system for keyword monitoring

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007274237A (ja) * 2006-03-30 2007-10-18 Denso Corp 移動体用放送受信装置
JP4662208B2 (ja) * 2006-03-30 2011-03-30 株式会社デンソー 移動体用放送受信装置
KR20100085720A (ko) * 2009-01-21 2010-07-29 삼성전자주식회사 하이라이트 영상 구성 방법 및 장치
US9055196B2 (en) 2009-01-21 2015-06-09 Samsung Electronics Co., Ltd. Method and apparatus for forming highlight content
KR101628237B1 (ko) 2009-01-21 2016-06-22 삼성전자주식회사 하이라이트 영상 구성 방법 및 장치

Also Published As

Publication number Publication date
EP1332497A2 (en) 2003-08-06
KR100833807B1 (ko) 2008-05-30
US6973256B1 (en) 2005-12-06
WO2002037498A3 (en) 2002-08-22
KR20020067581A (ko) 2002-08-22
CN1404609A (zh) 2003-03-19
CN100364008C (zh) 2008-01-23
WO2002037498A2 (en) 2002-05-10

Similar Documents

Publication Publication Date Title
KR100833807B1 (ko) 오디오 성질들을 이용하여 비디오 프로그램에서하이라이트들을 검출하는 시스템 및 방법
JP4317127B2 (ja) 音楽ビデオを索引化して要約するシステム及び方法
US6819863B2 (en) System and method for locating program boundaries and commercial boundaries using audio categories
US7046911B2 (en) System and method for reduced playback of recorded video based on video segment priority
US7136571B1 (en) System and method for fast playback of video with selected audio
JP4767216B2 (ja) ダイジェスト生成装置、方法及びプログラム
KR100865042B1 (ko) 비디오 프로그램의 멀티미디어 설명 데이터를 생성하는 시스템 및 방법, 비디오 디스플레이 시스템, 및 컴퓨터 판독 가능 기록 매체
JP2004516752A (ja) 映像番組のマルチメディア要約にアクセスするシステム及び方法
KR20020001820A (ko) 소정 기록 시간 간격에 앞서 또는 소정 기록 시간 간격을넘어 프로그램들을 기록하기 위한 방법들 및 장치
JP4426743B2 (ja) 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム
JP2004511972A (ja) クローズドキャプションテキストと共にビデオを再生するシステム及び方法
WO2007046171A1 (ja) 記録再生装置
KR20060102639A (ko) 동영상 재생 시스템 및 방법
JP2001320674A (ja) 映像記録再生方法、及び映像記録再生装置
JP2002133837A (ja) 録画シーン検索方法および記録再生装置
US8000584B1 (en) Approach for storing digital content onto digital versatile discs (DVDs)
KR20020062752A (ko) 오디오의 피치 왜곡 없는 사전-기록된 비디오의 가변 속도재생을 위한 비디오 재생 장치
JP2011078028A (ja) 電子機器、メタデータ生成方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041014

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061120

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070327

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070725

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070820

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20071005

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20101124