JP2011504034A5 - - Google Patents

Download PDF

Info

Publication number
JP2011504034A5
JP2011504034A5 JP2010533692A JP2010533692A JP2011504034A5 JP 2011504034 A5 JP2011504034 A5 JP 2011504034A5 JP 2010533692 A JP2010533692 A JP 2010533692A JP 2010533692 A JP2010533692 A JP 2010533692A JP 2011504034 A5 JP2011504034 A5 JP 2011504034A5
Authority
JP
Japan
Prior art keywords
section
shot
criteria
audio output
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010533692A
Other languages
English (en)
Other versions
JP2011504034A (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/IB2008/054691 external-priority patent/WO2009063383A1/en
Publication of JP2011504034A publication Critical patent/JP2011504034A/ja
Publication of JP2011504034A5 publication Critical patent/JP2011504034A5/ja
Pending legal-status Critical Current

Links

Claims (14)

  1. オーディオビジュアル信号の意味的なまとまりに対応するセグメントの開始点を決定する方法であって、前記方法は、
    低オーディオ出力についての基準を満たすセクションを検出するため前記信号のオーディオ成分を処理するステップと、
    ショットに対応するセクションの境界を識別するため前記オーディオビジュアル信号を処理するステップと、
    を含み、前記オーディオビジュアル信号のビデオ成分は、司会者が表示されている見込みが高い画像を有する特定のタイプのショットを識別するための基準に合致する少なくとも1つのショットにより形成されるビデオセクションであって、前記特定のタイプのショットのみを含むビデオセクションを識別するための基準を評価するために処理され、
    前記低オーディオ出力についての基準を満たすセクションの少なくとも終了点が、識別されたビデオセクションの境界間の特定の間隔にある場合に、前記低オーディオ出力についての基準を満たすセクションに一致し且つ前記識別されたビデオセクションの境界間に位置する点が、セグメントの開始点として選択され、
    識別されたビデオセクションに一致する低オーディオ出力についての基準を満たすセクションがないことが決定されると、前記ビデオセクションの境界が、セグメントの開始点として選択される方法。
  2. 前記オーディオビジュアル信号のビデオ成分の処理は、前記特定のタイプのショットを識別するための基準の評価を含み、前記評価は、ショットの少なくとも1つの画像が少なくとも1つの更なる画像に対する類似度を満たすか否かの決定を含む、請求項1に記載の方法。
  3. 前記特定のタイプのショットを識別するための基準の評価は、ショットの少なくとも1つの画像が、前記ショットに含まれる少なくとも1つの更なる画像に対する類似度を満たすか否かの決定を含む、請求項2に記載の方法。
  4. 前記特定のタイプのショットを識別するための基準の評価は、ショットの少なくとも1つの画像が、少なくとも1つの更なるショットの少なくとも1つの更なる画像に対する類似度を満たすか否かの決定を含む、請求項2又は3に記載の方法。
  5. 前記オーディオビジュアル信号に亘って類似する画像を含むショットの分布の一様性を解析するステップを含む、請求項4に記載の方法。
  6. 前記オーディオビジュアル信号のビデオ成分の処理は、前記特定のタイプのショットを識別するための基準の評価を含み、前記評価は、前記ショットに含まれる少なくとも1つの画像の内容を解析し、前記ショットに含まれる少なくとも1つの画像に表示されるいずれかの人物の顔を検出することを含む、請求項1乃至5のいずれか一項に記載の方法。
  7. 前記ビデオセクションを識別するための基準を評価するための前記オーディオビジュアル信号のビデオ成分の処理は、
    a)ショットが、司会者が表示されている見込みが高い画像を有する前記特定のタイプのショットを識別するための基準に合致するとそれぞれが決定された、連続するショットのシーケンスのうちの最初のものか否かを決定するステップであって、前記シーケンスは特定の最短の長さよりも長い長さを持つステップと、
    b)ショットが、司会者が表示されている見込みが高い画像を有する前記特定のタイプのショットを識別するための基準に合致し、更に特定の最短の長さよりも長い長さを持つという基準に合致するか否かを決定するステップと、
    のうち少なくとも一方を含む、請求項1乃至6のいずれか一項に記載の方法。
  8. 前記低オーディオ出力についての基準を満たす複数のセクションのそれぞれの少なくとも終了点が、識別されたビデオセクションの境界間の特定の間隔にあることを決定すると、前記複数のセクションのうち最初に出現するセクションに一致する点を、セグメントの開始点として選択するステップを含む、請求項1乃至7のいずれか一項に記載の方法。
  9. 前記低オーディオ出力についての基準を満たす複数のセクションのうち第2のものであり且つ前記最初のセクションに後続するセクションに一致する点を、少なくとも前記最初のセクションと前記第2のセクションとの間の間隔の長さが特定の閾値を超えると決定したときに、更なるセグメントの開始点として選択するステップを更に含む、請求項8に記載の方法。
  10. 前記識別されたビデオセクションのそれぞれについて、前記低オーディオ出力についての基準を満たすセクションの少なくとも終了点が、前記識別されたビデオセクションの境界間の特定の間隔にあるか否かを連続的に決定するステップを含む、請求項1乃至10のいずれか一項に記載の方法。
  11. 前記低オーディオ出力についての基準を満たすセクションは、第1のウィンドウよりも長い第2のウィンドウに亘る平均オーディオ出力に対する、第1のウィンドウに亘る平均オーディオ出力を評価することにより検出される、請求項1乃至10のいずれか一項に記載の方法。
  12. オーディオビジュアル信号を意味的なまとまりに対応するセグメントにセグメント化するためのシステムであって、前記システムは、
    低オーディオ出力についての基準を満たすセクションを検出するため前記信号のオーディオ成分を処理し、
    ショットに対応するセクションの境界を識別するため前記オーディオビジュアル信号を処理する
    ように構成され、前記オーディオビジュアル信号のビデオ成分は、司会者が表示されている見込みが高い画像を有する特定のタイプのショットを識別するための基準に合致する少なくとも1つのショットにより形成されるビデオセクションであって、前記特定のタイプのショットのみを含むビデオセクションを識別するための基準を評価するために処理され、前記システムは更に、
    前記低オーディオ出力についての基準を満たすセクションの少なくとも終了点が、識別されたビデオセクションの境界間の特定の間隔にあることが決定されると、前記低オーディオ出力についての基準を満たすセクションに一致し且つ前記ビデオセクションの境界間に位置する点を、セグメントの開始点として選択するように構成され、前記システムは、
    識別されたビデオセクションに一致する低オーディオ出力についての基準を満たすセクションがないことが決定されると、前記ビデオセクションの境界を、セグメントの開始点として選択するように構成される、システム。
  13. 請求項1乃至11のいずれか一項に記載の方法を実行するように構成された、請求項12に記載のシステム。
  14. 機械読み取り可能な媒体に組み込まれたときに、請求項1乃至11のいずれか一項に記載の方法を、情報処理能力を持つシステムに実行させることが可能な命令のセットを含む、コンピュータプログラム。
JP2010533692A 2007-11-14 2008-11-10 オーディオビジュアル信号における意味的なまとまりの開始点を決定する方法 Pending JP2011504034A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP07120629 2007-11-14
PCT/IB2008/054691 WO2009063383A1 (en) 2007-11-14 2008-11-10 A method of determining a starting point of a semantic unit in an audiovisual signal

Publications (2)

Publication Number Publication Date
JP2011504034A JP2011504034A (ja) 2011-01-27
JP2011504034A5 true JP2011504034A5 (ja) 2011-12-22

Family

ID=40409946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010533692A Pending JP2011504034A (ja) 2007-11-14 2008-11-10 オーディオビジュアル信号における意味的なまとまりの開始点を決定する方法

Country Status (6)

Country Link
US (1) US20100259688A1 (ja)
EP (1) EP2210408A1 (ja)
JP (1) JP2011504034A (ja)
KR (1) KR20100105596A (ja)
CN (1) CN101855897A (ja)
WO (1) WO2009063383A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5302855B2 (ja) * 2009-11-05 2013-10-02 日本放送協会 代表静止画像抽出装置およびそのプログラム
US9355683B2 (en) * 2010-07-30 2016-05-31 Samsung Electronics Co., Ltd. Audio playing method and apparatus
CN102591892A (zh) * 2011-01-13 2012-07-18 索尼公司 数据分段设备和方法
JP6005910B2 (ja) * 2011-05-17 2016-10-12 富士通テン株式会社 音響装置
WO2014072772A1 (en) * 2012-11-12 2014-05-15 Nokia Corporation A shared audio scene apparatus
CN103079041B (zh) * 2013-01-25 2016-01-27 深圳先进技术研究院 新闻视频自动分条装置及新闻视频自动分条的方法
CN109614952B (zh) * 2018-12-27 2020-08-25 成都数之联科技有限公司 一种基于瀑布图的目标信号检测识别方法
US11694444B2 (en) * 2020-09-30 2023-07-04 Snap Inc. Setting ad breakpoints in a video within a messaging system
US11856255B2 (en) 2020-09-30 2023-12-26 Snap Inc. Selecting ads for a video within a messaging system
US11792491B2 (en) 2020-09-30 2023-10-17 Snap Inc. Inserting ads into a video within a messaging system

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6961954B1 (en) * 1997-10-27 2005-11-01 The Mitre Corporation Automated segmentation, information extraction, summarization, and presentation of broadcast news
US20030131362A1 (en) * 2002-01-09 2003-07-10 Koninklijke Philips Electronics N.V. Method and apparatus for multimodal story segmentation for linking multimedia content
US7383508B2 (en) * 2002-06-19 2008-06-03 Microsoft Corporation Computer user interface for interacting with video cliplets generated from digital video
US7212248B2 (en) * 2002-09-09 2007-05-01 The Directv Group, Inc. Method and apparatus for lipsync measurement and correction
GB0406504D0 (en) * 2004-03-23 2004-04-28 British Telecomm Method and system for detecting audio and video scene changes
US7305128B2 (en) * 2005-05-27 2007-12-04 Mavs Lab, Inc. Anchor person detection for television news segmentation based on audiovisual features

Similar Documents

Publication Publication Date Title
JP2011504034A5 (ja)
US8433108B2 (en) Video fingerprinting
US20070201817A1 (en) Method and system for playing back videos at speeds adapted to content
ATE475969T1 (de) Verfahren zur zeitlichen segmentierung eines videos in videobildfolgen und zur auswahl von keyframes für das auffinden von bildinhalten unter einbeziehung einer subshot-detektion
US20160063343A1 (en) Method for selecting frames from video sequences based on incremental improvement
EP3171586A3 (en) Scene change detection for perceptual quality evaluation in video sequences
CN107623860A (zh) 多媒体数据分割方法和装置
CA2971176C (en) Detection of failures in advertisement replacement
WO2009150425A3 (en) Automatic detection of repeating video sequences
JP2018526837A5 (ja)
JP2008065793A5 (ja)
JP2011504702A5 (ja)
CN107609149B (zh) 一种视频定位方法和装置
JP2011504034A (ja) オーディオビジュアル信号における意味的なまとまりの開始点を決定する方法
WO2013097101A1 (zh) 分析视频文件的方法和装置
KR20200059303A (ko) 타임스탬프 전이 해상도를 향상시키는 시스템 및 방법
JP2013218612A5 (ja)
CN101193297A (zh) 估计视频串流中视频片段的边界位置的方法
CN103177099A (zh) 视频比对方法及系统
JP5096259B2 (ja) 要約コンテンツ生成装置および要約コンテンツ生成プログラム
JP2010141847A5 (ja) 画像処理装置及び画像処理方法、撮像装置
KR101667011B1 (ko) 입체 영상의 장면 전환 검출 장치 및 방법
CN103686238B (zh) 视频播放检测方法和装置
TW200633527A (en) Pull-down detection apparatus and pull-down detection method
Chan et al. Shot boundary detection using genetic algorithm optimization