KR100650407B1 - 멀티 모달 기반의 고속 비디오 요약 생성 방법 및 그 장치 - Google Patents
멀티 모달 기반의 고속 비디오 요약 생성 방법 및 그 장치 Download PDFInfo
- Publication number
- KR100650407B1 KR100650407B1 KR1020050109309A KR20050109309A KR100650407B1 KR 100650407 B1 KR100650407 B1 KR 100650407B1 KR 1020050109309 A KR1020050109309 A KR 1020050109309A KR 20050109309 A KR20050109309 A KR 20050109309A KR 100650407 B1 KR100650407 B1 KR 100650407B1
- Authority
- KR
- South Korea
- Prior art keywords
- event
- shot
- section
- video summary
- detecting
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7834—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using audio features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Television Signal Processing For Recording (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
Description
Claims (20)
- 멀티 모달 기반의 고속 비디오 요약 생성 방법에 있어서,비디오 데이터에서 오디오 정보를 기반으로 이벤트 후보 구간을 검출하는 단계;상기 검출된 이벤트 후보 구간에서 샷 변환을 검출하는 단계;상기 검출된 이벤트 후보 구간에서 상기 검출된 샷 변환 정보 및 비쥬얼(visual) 정보를 기반으로 최종 이벤트 구간을 검출하는 단계; 및상기 추출된 최종 이벤트 구간을 조합하여 비디오 요약 정보를 생성하는 단계를 포함하는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제1항에 있어서,오디오 정보를 기반으로 이벤트 후보 구간을 검출하는 상기 단계는,상기 오디오 정보를 기반으로 오디오 이벤트 구간을 검출하는 단계; 및상기 오디오 이벤트 구간으로 검출된 세그먼트를 중심으로 일정 구간을 상기 이벤트 후보 구간으로 검출하는 단계를 포함하는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제2항에 있어서,상기 이벤트 후보 구간은 상기 세그먼트를 중심으로 전방 또는 후방의 일정 구간인 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제2항에 있어서,상기 이벤트 후보 구간은 상기 검출된 세그먼트를 중심으로 전후방 일정 시간만큼의 구간인 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제2항에 있어서,상기 비디오 데이터가 스포츠 경기와 연관된 데이터인 경우, 상기 오디오 이벤트 구간은 환호성, 아나운서의 고조도 또는 박수 소리에 따라 결정되는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제2항에 있어서,상기 비디오 데이터가 뉴스와 연관된 데이터인 경우, 상기 오디오 이벤트 구간은 묵음 구간에 따라 결정되는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제2항에 있어서,상기 비디오 데이터가 드라마 또는 영화와 연관된 데이터인 경우, 상기 오디오 이벤트 구간은 음악 구간 혹은 폭발음에 따라 결정되는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제1항에 있어서,최종 이벤트 구간을 검출하는 상기 단계는,상기 이벤트 후보 구간 내에서 이벤트 기준 샷을 검출하는 단계:상기 검출된 이벤트 기준 샷을 중심으로 인접한 이벤트 구성 샷을 검출하는 단계; 및상기 검출된 이벤트 구성 샷을 이용하여 샷 단위로 최종 이벤트 구간을 확정하는 단계를 포함하는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제8항에 있어서,상기 비디오 데이터가 축구 경기와 연관된 데이터인 경우, 상기 이벤트 기준 샷은 패널티 영역 샷인 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제9항에 있어서,상기 이벤트 기준 샷을 검출하는 단계는,N*N 블록으로 프레임을 나누고, 각 블록마다 픽셀값에 대한 임계값을 결정하는 단계;상기 각 블록내 픽셀값이 상기 임계값보다 크면 '255'로 할당하고, 상기 픽셀값이 상기 임계값보다 작으면 '0'으로 할당하는 단계;상기 할당된 값이 '255'인 픽셀의 위치를 소정 식에 대입하고, 가장 많은 픽셀 수를 갖는 위치를 계산하는 단계;상기 가장 많은 픽셀수가 임계값보다 큰 경우, 상기 계산된 위치가 패널티 라인의 기울기와 거리에 해당하는지 여부를 판단하는 단계; 및상기 계산된 위치가 상기 패널티 라인의 기울기와 거리에 해당하는 경우, 상기 이벤트 기준 샷을 상기 패널티 영역 샷으로 검출하는 단계를 포함하는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제9항에 있어서,상기 검출된 이벤트 기준 샷을 중심으로 인접한 이벤트 구성 샷을 검출하는 상기 단계는,상기 패널티 영상 샷의 후방으로 클로즈업(Close up) 샷이 소정 개수 이상 존재하는지 여부를 판단하는 단계; 및상기 소정 개수 이상의 클로즈업 샷이 존재하는 경우, 상기 클로즈업 샷을 상기 이벤트 구성 샷으로 설정하는 단계를 포함하는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제11항에 있어서,상기 비디오 데이터가 축구 경기와 연관된 데이터인 경우,최종 이벤트 구간을 확정하는 상기 단계는,상기 패널티 영역 샷 및 상기 클로즈업 샷으로 상기 최종 이벤트 구간을 확정하는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제8항에 있어서,상기 비디오 데이터가 뉴스와 연관된 데이터인 경우,상기 이벤트 기준 샷은 앵커 샷인 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제13항에 있어서,이벤트 기준 샷을 검출하는 상기 단계는,앵커 모델 후보 샷을 추출하는 단계;상기 추출된 앵커 모델 후보 샷으로부터 앵커 모델을 생성하는 단계; 및상기 생성된 앵커 모델과 키 프레임을 비교하여 상기 이벤트 기준 샷을 상기 앵커 샷으로 설정하는 단계를 포함하는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제8항에 있어서,상기 비디오 데이터가 영화와 연관된 데이터인 경우,상기 이벤트 기준 샷은 정면 클로즈업 샷이고,상기 이벤트 구성 샷은 액션 샷인 것을 특징으로 하는 고속 비디오 요약 생 성 방법.
- 제15항에 있어서,이벤트 기준 샷을 검출하는 상기 단계는,상기 비디오 데이터의 샷에서 얼굴을 검출하는 단계;상기 검출된 얼굴에서 눈 사이의 거리를 측정하는 단계; 및상기 측정된 눈 사이의 거리가 임계값보다 큰 경우 상기 이벤트 기준 샷을 정면 클로즈업 샷으로 설정하는 단계를 포함하는 것을 특징으로 하는 고속 비디오 요약 생성 방법.
- 제1항 내지 제16항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록하는 컴퓨터 판독 가능한 기록매체.
- 멀티 모달 기반의 고속 비디오 요약 생성 장치에 있어서,비디오 데이터에서 오디오 정보를 기반으로 이벤트 후보 구간을 검출하는 이벤트 후보 구간 검출부;상기 검출된 이벤트 후보 구간에서 샷 변환을 검출하는 샷 변환 검출부;상기 검출된 이벤트 후보 구간에서 상기 검출된 샷 변환 정보 및 비쥬얼(visual) 정보를 기반으로 최종 이벤트 구간을 검출하는 최종 이벤트 구간 검출부; 및상기 추출된 최종 이벤트 구간을 조합하여 비디오 요약 정보를 생성하는 비디오 요약 정보 생성부를 포함하는 것을 특징으로 하는 고속 비디오 요약 생성 장치.
- 제18항에 있어서,상기 이벤트 후보 구간 검출부는,상기 오디오 정보를 기반으로 오디오 이벤트 구간을 검출하고, 상기 오디오 이벤트 구간으로 검출된 세그먼트를 중심으로 일정 구간을 상기 이벤트 후보 구간으로 검출하는 것을 특징으로 하는 고속 비디오 요약 생성 장치.
- 제19항에 있어서,상기 이벤트 후보 구간은 상기 세그먼트를 중심으로 전방 또는 후방의 일정 구간인 것을 특징으로 하는 고속 비디오 요약 생성 장치.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050109309A KR100650407B1 (ko) | 2005-11-15 | 2005-11-15 | 멀티 모달 기반의 고속 비디오 요약 생성 방법 및 그 장치 |
JP2006221615A JP4532449B2 (ja) | 2005-11-15 | 2006-08-15 | マルチモーダル基盤のビデオ要約生成方法およびその装置 |
US11/520,741 US9251853B2 (en) | 2005-11-15 | 2006-09-14 | Method, medium, and system generating video abstract information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020050109309A KR100650407B1 (ko) | 2005-11-15 | 2005-11-15 | 멀티 모달 기반의 고속 비디오 요약 생성 방법 및 그 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100650407B1 true KR100650407B1 (ko) | 2006-11-29 |
Family
ID=37713760
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020050109309A KR100650407B1 (ko) | 2005-11-15 | 2005-11-15 | 멀티 모달 기반의 고속 비디오 요약 생성 방법 및 그 장치 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9251853B2 (ko) |
JP (1) | JP4532449B2 (ko) |
KR (1) | KR100650407B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190137359A (ko) * | 2018-06-01 | 2019-12-11 | 네이버 주식회사 | 동영상 서비스 제공 방법 및 이를 이용하는 서비스 서버 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100771244B1 (ko) * | 2006-06-12 | 2007-10-29 | 삼성전자주식회사 | 동영상 데이터 처리 방법 및 장치 |
US8797178B2 (en) * | 2008-03-10 | 2014-08-05 | Microsoft Corporation | Efficient stream sharing for multi-user sensor data collection |
JP5245919B2 (ja) * | 2009-03-04 | 2013-07-24 | 富士通株式会社 | 情報処理装置およびプログラム |
CN102289490B (zh) * | 2011-08-11 | 2013-03-06 | 浙江宇视科技有限公司 | 视频摘要生成方法及设备 |
US9667937B2 (en) * | 2013-03-14 | 2017-05-30 | Centurylink Intellectual Property Llc | Auto-summarizing video content system and method |
CN104182959B (zh) * | 2013-05-22 | 2017-10-27 | 浙江大华技术股份有限公司 | 目标搜索方法及装置 |
CN104123396B (zh) * | 2014-08-15 | 2017-07-07 | 三星电子(中国)研发中心 | 一种基于云电视的足球视频摘要生成方法及装置 |
US10433030B2 (en) | 2014-10-09 | 2019-10-01 | Thuuz, Inc. | Generating a customized highlight sequence depicting multiple events |
US10536758B2 (en) | 2014-10-09 | 2020-01-14 | Thuuz, Inc. | Customized generation of highlight show with narrative component |
US11863848B1 (en) | 2014-10-09 | 2024-01-02 | Stats Llc | User interface for interaction with customized highlight shows |
CN108307250B (zh) * | 2018-01-23 | 2020-10-30 | 浙江大华技术股份有限公司 | 一种生成视频摘要的方法及装置 |
US11373404B2 (en) | 2018-05-18 | 2022-06-28 | Stats Llc | Machine learning for recognizing and interpreting embedded information card content |
US11025985B2 (en) | 2018-06-05 | 2021-06-01 | Stats Llc | Audio processing for detecting occurrences of crowd noise in sporting event television programming |
US11264048B1 (en) | 2018-06-05 | 2022-03-01 | Stats Llc | Audio processing for detecting occurrences of loud sound characterized by brief audio bursts |
CN108810657B (zh) | 2018-06-15 | 2020-11-06 | 网宿科技股份有限公司 | 一种设置视频封面的方法和系统 |
CN110489593B (zh) * | 2019-08-20 | 2023-04-28 | 腾讯科技(深圳)有限公司 | 视频的话题处理方法、装置、电子设备及存储介质 |
CN112069361A (zh) * | 2020-08-27 | 2020-12-11 | 新华智云科技有限公司 | 一种基于多模态融合的视频描述文本生成方法 |
CN113177460B (zh) * | 2021-04-25 | 2023-07-07 | 台州智必安科技有限责任公司 | 基于卷积神经网络的双分支Anchor Free人脸检测方法及系统 |
EP4099326A1 (en) * | 2021-06-03 | 2022-12-07 | Lemon Inc. | Video remixing method |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0879674A (ja) * | 1994-09-06 | 1996-03-22 | Hitachi Ltd | 動画像検索方式 |
JPH09198797A (ja) * | 1996-01-17 | 1997-07-31 | Sony Corp | 情報信号処理装置及び情報信号処理方法 |
JPH1032776A (ja) * | 1996-07-18 | 1998-02-03 | Matsushita Electric Ind Co Ltd | 映像表示方法及び記録再生装置 |
JP3124239B2 (ja) * | 1996-11-13 | 2001-01-15 | 沖電気工業株式会社 | 映像情報検出装置 |
US6714909B1 (en) * | 1998-08-13 | 2004-03-30 | At&T Corp. | System and method for automated multimedia content indexing and retrieval |
US20050060641A1 (en) * | 1999-09-16 | 2005-03-17 | Sezan Muhammed Ibrahim | Audiovisual information management system with selective updating |
FR2807902B1 (fr) * | 2000-04-17 | 2002-10-25 | Thomson Multimedia Sa | Procede de detection de changement de plan dans une succession d'images video |
JP2002044572A (ja) * | 2000-07-21 | 2002-02-08 | Sony Corp | 情報信号処理装置及び情報信号処理方法および情報信号記録装置 |
US8020183B2 (en) * | 2000-09-14 | 2011-09-13 | Sharp Laboratories Of America, Inc. | Audiovisual management system |
JP3838483B2 (ja) * | 2000-12-27 | 2006-10-25 | Kddi株式会社 | オーディオ概要情報、オーディオビデオ概要情報の抽出装置、再生装置、および記録媒体 |
KR100411340B1 (ko) * | 2001-03-09 | 2003-12-18 | 엘지전자 주식회사 | 뉴스 비디오 콘텐트의 뉴스 기사 기반 요약 및 브라우징시스템 |
KR100438269B1 (ko) * | 2001-03-23 | 2004-07-02 | 엘지전자 주식회사 | 뉴스 비디오 브라우징 시스템에서 앵커 샷 자동 검출 방법 |
JP4546682B2 (ja) * | 2001-06-26 | 2010-09-15 | パイオニア株式会社 | 映像情報要約装置、映像情報要約方法および映像情報要約処理プログラム |
JP4615166B2 (ja) * | 2001-07-17 | 2011-01-19 | パイオニア株式会社 | 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム |
US7657836B2 (en) * | 2002-07-25 | 2010-02-02 | Sharp Laboratories Of America, Inc. | Summarization of soccer video content |
AU2003265318A1 (en) * | 2002-08-02 | 2004-02-23 | University Of Rochester | Automatic soccer video analysis and summarization |
JP4109065B2 (ja) * | 2002-09-27 | 2008-06-25 | クラリオン株式会社 | 記録再生装置、記録装置、それらの制御方法、制御プログラム及び記録媒体 |
-
2005
- 2005-11-15 KR KR1020050109309A patent/KR100650407B1/ko not_active IP Right Cessation
-
2006
- 2006-08-15 JP JP2006221615A patent/JP4532449B2/ja not_active Expired - Fee Related
- 2006-09-14 US US11/520,741 patent/US9251853B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190137359A (ko) * | 2018-06-01 | 2019-12-11 | 네이버 주식회사 | 동영상 서비스 제공 방법 및 이를 이용하는 서비스 서버 |
KR102080315B1 (ko) * | 2018-06-01 | 2020-02-24 | 네이버 주식회사 | 동영상 서비스 제공 방법 및 이를 이용하는 서비스 서버 |
Also Published As
Publication number | Publication date |
---|---|
JP4532449B2 (ja) | 2010-08-25 |
JP2007143114A (ja) | 2007-06-07 |
US9251853B2 (en) | 2016-02-02 |
US20070109446A1 (en) | 2007-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100650407B1 (ko) | 멀티 모달 기반의 고속 비디오 요약 생성 방법 및 그 장치 | |
KR100785076B1 (ko) | 스포츠 동영상에서의 실시간 이벤트 검출 방법 및 그 장치 | |
CN102685398B (zh) | 一种新闻视频场景生成方法 | |
US9961403B2 (en) | Visual summarization of video for quick understanding by determining emotion objects for semantic segments of video | |
RU2693906C2 (ru) | Основанный на правилах анализ важности видео | |
JP5420199B2 (ja) | 映像解析装置、映像解析方法、ダイジェスト自動作成システム及びハイライト自動抽出システム | |
US7555149B2 (en) | Method and system for segmenting videos using face detection | |
ES2556601T3 (es) | Sistemas y métodos para la producción autónoma de vídeos a partir de múltiples datos detectados | |
CN101563935B (zh) | 将二维视频转换为三维视频的方法和系统 | |
Wang et al. | Altfreezing for more general video face forgery detection | |
KR100717402B1 (ko) | 멀티미디어 데이터의 장르를 판단하는 장치 및 방법 | |
Sowmya et al. | A survey on video forgery detection | |
CN110692251B (zh) | 组合数字视频内容的方法及系统 | |
JP6557592B2 (ja) | 映像シーン分割装置及び映像シーン分割プログラム | |
KR102573933B1 (ko) | 기계 학습 기반의 실감 미디어 저작 방법 및 장치 | |
Wang et al. | Affection arousal based highlight extraction for soccer video | |
KR20170098232A (ko) | 오브젝트 검출에 기초하여 외삽된 이미지를 생성하는 방법 및 장치 | |
Zhang et al. | Key frame extraction method for lecture videos based on spatio-temporal subtitles | |
US11636676B2 (en) | Method and apparatus for extracting color scheme from video | |
JP2013195725A (ja) | 画像表示システム | |
KR101323369B1 (ko) | 영상 프레임 군집화 장치 및 방법 | |
JP2016119552A (ja) | 映像コンテンツ処理装置、映像コンテンツ処理方法及びプログラム | |
KR101003504B1 (ko) | 유해 멀티미디어 판별시스템 및 그 판별방법 | |
KR102179590B1 (ko) | 동영상 내 등장인물 갈등정보 추출 장치 | |
Satriyanto et al. | Dynamic background video forgery detection using Gaussian mixture model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20121030 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20131030 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20141030 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20151029 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20161028 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20171030 Year of fee payment: 12 |
|
LAPS | Lapse due to unpaid annual fee |