JP2011504034A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2011504034A5 JP2011504034A5 JP2010533692A JP2010533692A JP2011504034A5 JP 2011504034 A5 JP2011504034 A5 JP 2011504034A5 JP 2010533692 A JP2010533692 A JP 2010533692A JP 2010533692 A JP2010533692 A JP 2010533692A JP 2011504034 A5 JP2011504034 A5 JP 2011504034A5
- Authority
- JP
- Japan
- Prior art keywords
- section
- shot
- criteria
- audio output
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 claims 6
- 230000000875 corresponding Effects 0.000 claims 3
- 238000004590 computer program Methods 0.000 claims 1
- 238000000034 method Methods 0.000 claims 1
Claims (14)
- オーディオビジュアル信号の意味的なまとまりに対応するセグメントの開始点を決定する方法であって、前記方法は、
低オーディオ出力についての基準を満たすセクションを検出するため前記信号のオーディオ成分を処理するステップと、
ショットに対応するセクションの境界を識別するため前記オーディオビジュアル信号を処理するステップと、
を含み、前記オーディオビジュアル信号のビデオ成分は、司会者が表示されている見込みが高い画像を有する特定のタイプのショットを識別するための基準に合致する少なくとも1つのショットにより形成されるビデオセクションであって、前記特定のタイプのショットのみを含むビデオセクションを識別するための基準を評価するために処理され、
前記低オーディオ出力についての基準を満たすセクションの少なくとも終了点が、識別されたビデオセクションの境界間の特定の間隔にある場合に、前記低オーディオ出力についての基準を満たすセクションに一致し且つ前記識別されたビデオセクションの境界間に位置する点が、セグメントの開始点として選択され、
識別されたビデオセクションに一致する低オーディオ出力についての基準を満たすセクションがないことが決定されると、前記ビデオセクションの境界が、セグメントの開始点として選択される方法。 - 前記オーディオビジュアル信号のビデオ成分の処理は、前記特定のタイプのショットを識別するための基準の評価を含み、前記評価は、ショットの少なくとも1つの画像が少なくとも1つの更なる画像に対する類似度を満たすか否かの決定を含む、請求項1に記載の方法。
- 前記特定のタイプのショットを識別するための基準の評価は、ショットの少なくとも1つの画像が、前記ショットに含まれる少なくとも1つの更なる画像に対する類似度を満たすか否かの決定を含む、請求項2に記載の方法。
- 前記特定のタイプのショットを識別するための基準の評価は、ショットの少なくとも1つの画像が、少なくとも1つの更なるショットの少なくとも1つの更なる画像に対する類似度を満たすか否かの決定を含む、請求項2又は3に記載の方法。
- 前記オーディオビジュアル信号に亘って類似する画像を含むショットの分布の一様性を解析するステップを含む、請求項4に記載の方法。
- 前記オーディオビジュアル信号のビデオ成分の処理は、前記特定のタイプのショットを識別するための基準の評価を含み、前記評価は、前記ショットに含まれる少なくとも1つの画像の内容を解析し、前記ショットに含まれる少なくとも1つの画像に表示されるいずれかの人物の顔を検出することを含む、請求項1乃至5のいずれか一項に記載の方法。
- 前記ビデオセクションを識別するための基準を評価するための前記オーディオビジュアル信号のビデオ成分の処理は、
a)ショットが、司会者が表示されている見込みが高い画像を有する前記特定のタイプのショットを識別するための基準に合致するとそれぞれが決定された、連続するショットのシーケンスのうちの最初のものか否かを決定するステップであって、前記シーケンスは特定の最短の長さよりも長い長さを持つステップと、
b)ショットが、司会者が表示されている見込みが高い画像を有する前記特定のタイプのショットを識別するための基準に合致し、更に特定の最短の長さよりも長い長さを持つという基準に合致するか否かを決定するステップと、
のうち少なくとも一方を含む、請求項1乃至6のいずれか一項に記載の方法。 - 前記低オーディオ出力についての基準を満たす複数のセクションのそれぞれの少なくとも終了点が、識別されたビデオセクションの境界間の特定の間隔にあることを決定すると、前記複数のセクションのうち最初に出現するセクションに一致する点を、セグメントの開始点として選択するステップを含む、請求項1乃至7のいずれか一項に記載の方法。
- 前記低オーディオ出力についての基準を満たす複数のセクションのうち第2のものであり且つ前記最初のセクションに後続するセクションに一致する点を、少なくとも前記最初のセクションと前記第2のセクションとの間の間隔の長さが特定の閾値を超えると決定したときに、更なるセグメントの開始点として選択するステップを更に含む、請求項8に記載の方法。
- 前記識別されたビデオセクションのそれぞれについて、前記低オーディオ出力についての基準を満たすセクションの少なくとも終了点が、前記識別されたビデオセクションの境界間の特定の間隔にあるか否かを連続的に決定するステップを含む、請求項1乃至10のいずれか一項に記載の方法。
- 前記低オーディオ出力についての基準を満たすセクションは、第1のウィンドウよりも長い第2のウィンドウに亘る平均オーディオ出力に対する、第1のウィンドウに亘る平均オーディオ出力を評価することにより検出される、請求項1乃至10のいずれか一項に記載の方法。
- オーディオビジュアル信号を意味的なまとまりに対応するセグメントにセグメント化するためのシステムであって、前記システムは、
低オーディオ出力についての基準を満たすセクションを検出するため前記信号のオーディオ成分を処理し、
ショットに対応するセクションの境界を識別するため前記オーディオビジュアル信号を処理する
ように構成され、前記オーディオビジュアル信号のビデオ成分は、司会者が表示されている見込みが高い画像を有する特定のタイプのショットを識別するための基準に合致する少なくとも1つのショットにより形成されるビデオセクションであって、前記特定のタイプのショットのみを含むビデオセクションを識別するための基準を評価するために処理され、前記システムは更に、
前記低オーディオ出力についての基準を満たすセクションの少なくとも終了点が、識別されたビデオセクションの境界間の特定の間隔にあることが決定されると、前記低オーディオ出力についての基準を満たすセクションに一致し且つ前記ビデオセクションの境界間に位置する点を、セグメントの開始点として選択するように構成され、前記システムは、
識別されたビデオセクションに一致する低オーディオ出力についての基準を満たすセクションがないことが決定されると、前記ビデオセクションの境界を、セグメントの開始点として選択するように構成される、システム。 - 請求項1乃至11のいずれか一項に記載の方法を実行するように構成された、請求項12に記載のシステム。
- 機械読み取り可能な媒体に組み込まれたときに、請求項1乃至11のいずれか一項に記載の方法を、情報処理能力を持つシステムに実行させることが可能な命令のセットを含む、コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP07120629 | 2007-11-14 | ||
PCT/IB2008/054691 WO2009063383A1 (en) | 2007-11-14 | 2008-11-10 | A method of determining a starting point of a semantic unit in an audiovisual signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011504034A JP2011504034A (ja) | 2011-01-27 |
JP2011504034A5 true JP2011504034A5 (ja) | 2011-12-22 |
Family
ID=40409946
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010533692A Pending JP2011504034A (ja) | 2007-11-14 | 2008-11-10 | オーディオビジュアル信号における意味的なまとまりの開始点を決定する方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20100259688A1 (ja) |
EP (1) | EP2210408A1 (ja) |
JP (1) | JP2011504034A (ja) |
KR (1) | KR20100105596A (ja) |
CN (1) | CN101855897A (ja) |
WO (1) | WO2009063383A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5302855B2 (ja) * | 2009-11-05 | 2013-10-02 | 日本放送協会 | 代表静止画像抽出装置およびそのプログラム |
US9355683B2 (en) * | 2010-07-30 | 2016-05-31 | Samsung Electronics Co., Ltd. | Audio playing method and apparatus |
CN102591892A (zh) * | 2011-01-13 | 2012-07-18 | 索尼公司 | 数据分段设备和方法 |
JP6005910B2 (ja) * | 2011-05-17 | 2016-10-12 | 富士通テン株式会社 | 音響装置 |
WO2014072772A1 (en) * | 2012-11-12 | 2014-05-15 | Nokia Corporation | A shared audio scene apparatus |
CN103079041B (zh) * | 2013-01-25 | 2016-01-27 | 深圳先进技术研究院 | 新闻视频自动分条装置及新闻视频自动分条的方法 |
CN109614952B (zh) * | 2018-12-27 | 2020-08-25 | 成都数之联科技有限公司 | 一种基于瀑布图的目标信号检测识别方法 |
US11694444B2 (en) * | 2020-09-30 | 2023-07-04 | Snap Inc. | Setting ad breakpoints in a video within a messaging system |
US11856255B2 (en) | 2020-09-30 | 2023-12-26 | Snap Inc. | Selecting ads for a video within a messaging system |
US11792491B2 (en) | 2020-09-30 | 2023-10-17 | Snap Inc. | Inserting ads into a video within a messaging system |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6961954B1 (en) * | 1997-10-27 | 2005-11-01 | The Mitre Corporation | Automated segmentation, information extraction, summarization, and presentation of broadcast news |
US20030131362A1 (en) * | 2002-01-09 | 2003-07-10 | Koninklijke Philips Electronics N.V. | Method and apparatus for multimodal story segmentation for linking multimedia content |
US7383508B2 (en) * | 2002-06-19 | 2008-06-03 | Microsoft Corporation | Computer user interface for interacting with video cliplets generated from digital video |
US7212248B2 (en) * | 2002-09-09 | 2007-05-01 | The Directv Group, Inc. | Method and apparatus for lipsync measurement and correction |
GB0406504D0 (en) * | 2004-03-23 | 2004-04-28 | British Telecomm | Method and system for detecting audio and video scene changes |
US7305128B2 (en) * | 2005-05-27 | 2007-12-04 | Mavs Lab, Inc. | Anchor person detection for television news segmentation based on audiovisual features |
-
2008
- 2008-11-10 US US12/741,840 patent/US20100259688A1/en not_active Abandoned
- 2008-11-10 KR KR1020107012915A patent/KR20100105596A/ko not_active Application Discontinuation
- 2008-11-10 EP EP08848729A patent/EP2210408A1/en not_active Withdrawn
- 2008-11-10 CN CN200880115993A patent/CN101855897A/zh active Pending
- 2008-11-10 JP JP2010533692A patent/JP2011504034A/ja active Pending
- 2008-11-10 WO PCT/IB2008/054691 patent/WO2009063383A1/en active Application Filing
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011504034A5 (ja) | ||
US8433108B2 (en) | Video fingerprinting | |
US20070201817A1 (en) | Method and system for playing back videos at speeds adapted to content | |
ATE475969T1 (de) | Verfahren zur zeitlichen segmentierung eines videos in videobildfolgen und zur auswahl von keyframes für das auffinden von bildinhalten unter einbeziehung einer subshot-detektion | |
US20160063343A1 (en) | Method for selecting frames from video sequences based on incremental improvement | |
EP3171586A3 (en) | Scene change detection for perceptual quality evaluation in video sequences | |
CN107623860A (zh) | 多媒体数据分割方法和装置 | |
CA2971176C (en) | Detection of failures in advertisement replacement | |
WO2009150425A3 (en) | Automatic detection of repeating video sequences | |
JP2018526837A5 (ja) | ||
JP2008065793A5 (ja) | ||
JP2011504702A5 (ja) | ||
CN107609149B (zh) | 一种视频定位方法和装置 | |
JP2011504034A (ja) | オーディオビジュアル信号における意味的なまとまりの開始点を決定する方法 | |
WO2013097101A1 (zh) | 分析视频文件的方法和装置 | |
KR20200059303A (ko) | 타임스탬프 전이 해상도를 향상시키는 시스템 및 방법 | |
JP2013218612A5 (ja) | ||
CN101193297A (zh) | 估计视频串流中视频片段的边界位置的方法 | |
CN103177099A (zh) | 视频比对方法及系统 | |
JP5096259B2 (ja) | 要約コンテンツ生成装置および要約コンテンツ生成プログラム | |
JP2010141847A5 (ja) | 画像処理装置及び画像処理方法、撮像装置 | |
KR101667011B1 (ko) | 입체 영상의 장면 전환 검출 장치 및 방법 | |
CN103686238B (zh) | 视频播放检测方法和装置 | |
TW200633527A (en) | Pull-down detection apparatus and pull-down detection method | |
Chan et al. | Shot boundary detection using genetic algorithm optimization |