RU2016148407A - Основанный на правилах анализ важности видео - Google Patents

Основанный на правилах анализ важности видео Download PDF

Info

Publication number
RU2016148407A
RU2016148407A RU2016148407A RU2016148407A RU2016148407A RU 2016148407 A RU2016148407 A RU 2016148407A RU 2016148407 A RU2016148407 A RU 2016148407A RU 2016148407 A RU2016148407 A RU 2016148407A RU 2016148407 A RU2016148407 A RU 2016148407A
Authority
RU
Russia
Prior art keywords
video
frame
video frame
importance
file
Prior art date
Application number
RU2016148407A
Other languages
English (en)
Other versions
RU2016148407A3 (ru
RU2693906C2 (ru
Inventor
Нитин СУРИ
Тзон-Джи ВАН
Омкар МЕХЕНДАЛЕ
Эндрю С. АЙВОРИ
Уилльям Д. СПРУЛ
Original Assignee
МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи filed Critical МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Publication of RU2016148407A publication Critical patent/RU2016148407A/ru
Publication of RU2016148407A3 publication Critical patent/RU2016148407A3/ru
Application granted granted Critical
Publication of RU2693906C2 publication Critical patent/RU2693906C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/49Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/786Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using motion, e.g. object motion or camera motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Picture Signal Circuits (AREA)

Claims (55)

1. Один или более машиночитаемых носителей, хранящих машиноисполняемые команды, которые исполняются для предписания одному или более процессорам выполнять действия, содержащие этапы, на которых:
декодируют (402) видеофайл для получения по меньшей мере видеокадра или видеокадра и звуковых данных, связанных с видеокадром;
анализируют (404) одну или более высокоуровневых особенностей по меньшей мере видеокадра или видеокадра и звуковых данных, связанных с видеокадром, на основе по меньшей мере одного из локального правила и глобального правила для получения одной или более оценок особенностей для видеокадра, причем эти одна или более высокоуровневых особенностей включают в себя по меньшей мере одну особенность, которая связана с перемещением или расположением человеческого лица на видеокадре;
объединяют (412) упомянутые одну или более оценок особенностей видеокадра для получения оценки важности кадра для видеокадра;
сегментируют (416) видеофайл на видеофрагменты с разными значениями важности фрагмента, основываясь, по меньшей мере, на оценках важности кадра, соответствующих видеокадру, и других оценках важности кадра, соответствующих дополнительным видеокадрам видеофайла;
ранжируют (420) видеофрагменты согласно значениям важности фрагментов; и
когда попытка ранжирования заканчивается неудачно из-за недостаточного наличия высокоуровневых особенностей в видеокадре, получают оценки особенностей как для высокоуровневых особенностей, так и для низкоуровневых особенностей видеокадров для выполнения ранжирования.
2. Один или более машиночитаемых носителей по п. 1, при этом действия дополнительно содержат этапы, на которых:
вычисляют значение важности видео для видеофайла, основываясь, по меньшей мере, на оценках важности кадра всех видеокадров в видеофайле; и
ранжируют видеофайл по отношению к дополнительным видеофайлам, основываясь, по меньшей мере, на значении важности видео, соответствующем видеофайлу, и других значениях важности видео, соответствующих дополнительным видеофайлам.
3. Один или более машиночитаемых носителей по п. 1, при этом анализ включает в себя этапы, на которых:
выполняют обнаружение лиц в видеокадре для обнаружения одного или более человеческих лиц;
выполняют отслеживание лиц для отслеживания этих одного или более человеческих лиц;
назначают отрицательное или положительное смещение оценки видеокадру, основываясь, по меньшей мере, на размере лица, расположении лица или одной или более характерных особенностях лица для по меньшей мере одного человеческого лица в видеокадре, каковые одна или более характерных особенностей лица включают в себя отсутствие или присутствие по меньшей мере одного из улыбки и открытых глаз на по меньшей мере одном человеческом лице;
выполняют по меньшей мере одно из распознавания лиц и группирования лиц в отношении по меньшей мере одного человеческого лица из упомянутых одного или более человеческих лиц;
идентифицируют одного или более главных героев, основываясь на по меньшей мере одном из данных группирования лиц и данных распознавания лиц;
назначают дополнительно положительное смещение оценки видеокадру в случае присутствия главного героя в видеокадре; и
вычисляют оценку важности лица для видеокадра, которая учитывает отрицательное смещение оценки и положительное смещение оценки.
4. Компьютерно-реализуемый способ, содержащий этапы, на которых:
декодируют (402) видеофайл для получения по меньшей мере видеокадра или видеокадра и звуковых данных, связанных с видеокадром;
анализируют (404) одну или более высокоуровневых особенностей по меньшей мере видеокадра или видеокадра и звуковых данных, связанных с видеокадром, на основе по меньшей мере одного из локального правила и глобального правила для получения одной или более оценок особенностей для видеокадра;
объединяют (412) эти одну или более оценок особенностей видеокадра для получения оценки важности кадра для видеокадра;
вычисляют (504) значение важности видео для видеофайла, основываясь, по меньшей мере, на оценках важности кадра, соответствующих видеокадру, и других оценках важности кадра, соответствующих дополнительным видеокадрам из видеофайла;
ранжируют (508) видеофайл относительно дополнительных видеофайлов, основываясь, по меньшей мере, на значениях важности видео, соответствующих видеофайлу, и других значениях важности видео, соответствующих дополнительным видеофайлам; и
когда попытка ранжирования заканчивается неудачно из-за недостаточного наличия высокоуровневых особенностей в видеокадре, получают оценки особенностей как для высокоуровневых особенностей, так и для низкоуровневых особенностей видеокадров для выполнения ранжирования.
5. Компьютерно-реализуемый способ по п. 4, дополнительно содержащий этап, на котором сегментируют (416) видеофайл на видеофрагменты с разной важностью фрагмента, основываясь, по меньшей мере, на оценках важности кадра всех видеокадров в видеофайле или данных перемещений, связанных со множеством видеокадров в видеофайле.
6. Компьютерно-реализуемый способ по п. 4, в котором сегментация видеофайла на основе, по меньшей мере, данных перемещения, связанных со множеством видеокадров в видеофайле, включает в себя этапы, на которых:
обнаруживают (706) характерные точки в видеокадре видеофайла посредством обнаружения общих точек между множеством субдискретизированных изображений;
сопоставляют (710) характерные точки в видеокадре с дополнительным набором характерных точек в предыдущем видеокадре видеофайла;
вычисляют (712) матрицу гомографического преобразования, которая описывает перемещение характерных точек между видеокадрами;
вычисляют (714) данные перемещения для видеокадра исходя из матрицы гомографического преобразования, причем данные перемещения включают в себя величину и направление компонентов масштабирования и вертикального линейного перемещения характерных точек;
объединяют данные перемещения для видеокадра с данными перемещения для одного или более оставшихся кадров в видеофайле;
вычисляют (716) скользящее среднее для данных перемещения видеокадров в видеофайле;
устанавливают (718) зоны пересечения нуля для поиска информации локальных максимумов и минимумов для данных перемещения, основываясь, по меньшей мере, на скользящем среднем; и
определяют (720) видеофрагменты видео файла, основываясь, по меньшей мере, на информации локальных максимумов и минимумов данных перемещения.
7. Компьютерно-реализуемый способ по п. 4, в котором анализ включает в себя этапы, на которых:
выполняют (602) обнаружение лиц в видеокадре для обнаружения одного или более человеческих лиц;
выполняют (604) отслеживание лиц для отслеживания этих одного или более человеческих лиц;
назначают (608) отрицательное смещение оценки или положительное смещение оценки видеокадру, основываясь, по меньшей мере, на размере лица, расположении лица или одной или более характерных особенностях лица по меньшей мере одного человеческого лица в видеокадре, причем эти одна или более характерных особенностей лица включают в себя отсутствие или присутствие по меньшей мере одного из улыбки и открытых глаз на по меньшей мере одном человеческом лице;
выполняют (610) по меньшей мере одно из распознавания лиц и группирования лиц в отношении по меньшей мере одного человеческого лица из упомянутых одного или более человеческих лиц;
идентифицируют (612) одного или более главных героев, основываясь на по меньшей мере одном из данных группирования лиц и данных распознавания лиц;
назначают (614) положительное смещение оценки видеокадру в случае присутствия главного героя в видеокадре; и
вычисляют (616) оценку важности лица для видеокадра, которая учитывает отрицательное смещение оценки и положительное смещение оценки.
8. Система, содержащая
один или более процессоров;
память, которая включает в себя множество машиноисполняемых компонентов, которые исполняются одним или более процессорами для выполнения множества действий, каковое множество действий содержат действия, чтобы:
декодировать (402) видеофайл для получения по меньшей мере видеокадра или видеокадра и звуковых данных, связанных с видеокадром;
анализировать (404) одну или более особенностей по меньшей мере видеокадра или видеокадра и звуковых данных, связанных с видеокадром, на основе по меньшей мере одного из локального правила и глобального правила для получения одной или более оценок особенностей для видеокадра, причем локальное правило влияет на назначение важности особенности для видеокадра, и глобальное правило влияет на назначение важности особенности для множества видеокадров в видеофайле, который включает в себя видеокадр;
объединять (412) одну или более оценок особенностей видеокадра для получения оценки важности кадра для видеокадра;
сегментировать (418) видеофайл на видеофрагменты с разной важностью фрагмента, основываясь, по меньшей мере, на данных перемещения, связанных с видеокадром и дополнительными видеокадрами в видеофайле;
ранжировать (420) видео фрагменты согласно значениям важности фрагмента для видеофрагментов, которые вычисляются, основываясь, по меньшей мере, на оценках важности кадра видеокадра и дополнительных видеокадров в видеофайле; и
когда попытка ранжирования заканчивается неудачно из-за недостаточного наличия высокоуровневых особенностей на видеокадре, получать оценки особенностей как для высокоуровневых особенностей, так и для низкоуровневых особенностей видеокадров для выполнения ранжирования.
9. Система по п. 8, в которой действия дополнительно содержат:
вычисление значения важности видео для видеофайла, основываясь, по меньшей мере, на оценках важности кадра для видеокадров в видеофайле; и
ранжирование видеофайла по отношению к дополнительным видеофайлам, основываясь, по меньшей мере, на значении важности видео, соответствующем видеофайлу, и других значениях важности видео, соответствующих дополнительным видеофайлам.
RU2016148407A 2014-06-12 2015-06-10 Основанный на правилах анализ важности видео RU2693906C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/303,466 US10664687B2 (en) 2014-06-12 2014-06-12 Rule-based video importance analysis
US14/303,466 2014-06-12
PCT/US2015/034992 WO2015191650A1 (en) 2014-06-12 2015-06-10 Rule-based video importance analysis

Publications (3)

Publication Number Publication Date
RU2016148407A true RU2016148407A (ru) 2018-06-09
RU2016148407A3 RU2016148407A3 (ru) 2019-01-22
RU2693906C2 RU2693906C2 (ru) 2019-07-05

Family

ID=53488465

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2016148407A RU2693906C2 (ru) 2014-06-12 2015-06-10 Основанный на правилах анализ важности видео

Country Status (11)

Country Link
US (1) US10664687B2 (ru)
EP (1) EP3155557A1 (ru)
JP (1) JP6694829B2 (ru)
KR (1) KR102354692B1 (ru)
CN (1) CN106462744B (ru)
AU (1) AU2015274708B2 (ru)
BR (1) BR112016028586B1 (ru)
CA (1) CA2948529A1 (ru)
MX (1) MX2016016293A (ru)
RU (1) RU2693906C2 (ru)
WO (1) WO2015191650A1 (ru)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160149956A1 (en) * 2014-11-21 2016-05-26 Whip Networks, Inc. Media management and sharing system
US9607224B2 (en) * 2015-05-14 2017-03-28 Google Inc. Entity based temporal segmentation of video streams
US9832484B2 (en) * 2015-05-20 2017-11-28 Texas Instruments Incorporated Still block detection in a video sequence
US9911202B2 (en) * 2015-08-24 2018-03-06 Disney Enterprises, Inc. Visual salience of online video as a predictor of success
US10602153B2 (en) 2015-09-11 2020-03-24 Facebook, Inc. Ultra-high video compression
US10602157B2 (en) 2015-09-11 2020-03-24 Facebook, Inc. Variable bitrate control for distributed video encoding
US10063872B2 (en) 2015-09-11 2018-08-28 Facebook, Inc. Segment based encoding of video
US10375156B2 (en) 2015-09-11 2019-08-06 Facebook, Inc. Using worker nodes in a distributed video encoding system
US10506235B2 (en) 2015-09-11 2019-12-10 Facebook, Inc. Distributed control of video encoding speeds
US10341561B2 (en) * 2015-09-11 2019-07-02 Facebook, Inc. Distributed image stabilization
US10499070B2 (en) 2015-09-11 2019-12-03 Facebook, Inc. Key frame placement for distributed video encoding
US10002435B2 (en) 2016-01-29 2018-06-19 Google Llc Detecting motion in images
EP3417608B1 (en) * 2016-02-18 2020-05-13 IMINT Image Intelligence AB System and method for video processing
US10432983B2 (en) * 2016-04-04 2019-10-01 Twitter, Inc. Live video classification and preview selection
US10402436B2 (en) * 2016-05-12 2019-09-03 Pixel Forensics, Inc. Automated video categorization, value determination and promotion/demotion via multi-attribute feature computation
US10347294B2 (en) * 2016-06-30 2019-07-09 Google Llc Generating moving thumbnails for videos
WO2018017836A1 (en) 2016-07-21 2018-01-25 Twitter, Inc. Live video streaming services with machine-learning based highlight replays
JP6866142B2 (ja) * 2016-12-09 2021-04-28 キヤノン株式会社 プログラム、画像処理装置、および画像処理方法
JP6948787B2 (ja) * 2016-12-09 2021-10-13 キヤノン株式会社 情報処理装置、方法およびプログラム
US10734027B2 (en) * 2017-02-16 2020-08-04 Fusit, Inc. System and methods for concatenating video sequences using face detection
EP3396964B1 (en) * 2017-04-25 2020-07-22 Accenture Global Solutions Ltd Dynamic content placement in a still image or a video
EP3396963B1 (en) 2017-04-25 2021-04-07 Accenture Global Solutions Limited Dynamic media content rendering
EP3396596B1 (en) * 2017-04-25 2020-08-19 Accenture Global Solutions Limited Heat ranking of media objects
US10409859B2 (en) * 2017-05-15 2019-09-10 Facebook, Inc. Video heat maps personalized for online system users
CN107437083B (zh) * 2017-08-16 2020-09-22 广西荷福智能科技有限公司 一种自适应池化的视频行为识别方法
CN107578000B (zh) * 2017-08-25 2023-10-31 百度在线网络技术(北京)有限公司 用于处理图像的方法及装置
WO2019070325A1 (en) * 2017-10-03 2019-04-11 Google Llc MICRO-VIDEO SYSTEM, FORMAT AND METHOD OF GENERATION
US10628486B2 (en) * 2017-11-15 2020-04-21 Google Llc Partitioning videos
EP3528196A1 (en) 2018-02-16 2019-08-21 Accenture Global Solutions Limited Dynamic content generation
CN108337535B (zh) * 2018-03-21 2020-12-29 广州视源电子科技股份有限公司 客户端视频的转发方法、装置、设备和存储介质
US10942816B1 (en) * 2018-09-06 2021-03-09 NortonLifeLock Inc. Systems and methods for dynamically adjusting a backup policy
EP3672256A1 (en) 2018-12-20 2020-06-24 Accenture Global Solutions Limited Dynamic media placement in video feed
US11514713B2 (en) * 2019-05-31 2022-11-29 Apple Inc. Face quality of captured images
CN110087145B (zh) * 2019-06-06 2020-04-21 北京字节跳动网络技术有限公司 用于处理视频的方法和装置
US11373407B2 (en) * 2019-10-25 2022-06-28 International Business Machines Corporation Attention generation
CN111125022A (zh) * 2019-11-15 2020-05-08 浙江大华技术股份有限公司 录像覆盖权重的确定方法、装置、设备和存储介质
WO2021174118A1 (en) * 2020-02-26 2021-09-02 Nvidia Corporation Object detection using image alignment for autonomous machine applications
CN114697700A (zh) * 2020-12-28 2022-07-01 北京小米移动软件有限公司 视频剪辑方法、视频剪辑装置及存储介质
CN112995676A (zh) * 2021-04-25 2021-06-18 北京金和网络股份有限公司 一种音视频压缩方法、装置、设备、系统及存储介质
US11917206B2 (en) 2021-12-17 2024-02-27 Lenovo (Singapore) Pte. Ltd. Video codec aware radio access network configuration and unequal error protection coding
US11824653B2 (en) 2021-12-17 2023-11-21 Lenovo (Singapore) Pte. Ltd. Radio access network configuration for video approximate semantic communications
US20240096102A1 (en) * 2022-09-17 2024-03-21 Nvidia Corporation Freespace detection using machine learning for autonomous systems and applications
CN115396622B (zh) * 2022-10-28 2023-03-24 广东电网有限责任公司中山供电局 一种低码率视频重构的电子设备

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001160066A (ja) 1998-12-25 2001-06-12 Matsushita Electric Ind Co Ltd データ処理装置、データ処理方法および記録媒体、並びに該データ処理方法をコンピュータに実行させるためのプログラム
SE9902328A0 (sv) 1999-06-18 2000-12-19 Ericsson Telefon Ab L M Förfarande och system för att alstra sammanfattad video
EP1182584A3 (en) 2000-08-19 2005-12-28 Lg Electronics Inc. Method and apparatus for video skimming
US20020167537A1 (en) 2001-05-11 2002-11-14 Miroslav Trajkovic Motion-based tracking with pan-tilt-zoom camera
US7143352B2 (en) 2002-11-01 2006-11-28 Mitsubishi Electric Research Laboratories, Inc Blind summarization of video content
NZ560223A (en) 2003-06-23 2008-12-24 Sony Pictures Entertainment Fingerprinting of data
WO2005001715A1 (en) 2003-06-30 2005-01-06 Koninklijke Philips Electronics, N.V. System and method for generating a multimedia summary of multimedia streams
JP4453976B2 (ja) 2004-03-30 2010-04-21 正彦 谷内田 画像生成装置、画像データ列生成システム、及び画像伝送システム
US8879856B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
US20100005485A1 (en) 2005-12-19 2010-01-07 Agency For Science, Technology And Research Annotation of video footage and personalised video generation
US7836050B2 (en) 2006-01-25 2010-11-16 Microsoft Corporation Ranking content based on relevance and quality
KR100749045B1 (ko) * 2006-01-26 2007-08-13 삼성전자주식회사 음악 내용 요약본을 이용한 유사곡 검색 방법 및 그 장치
US7889794B2 (en) 2006-02-03 2011-02-15 Eastman Kodak Company Extracting key frame candidates from video clip
US20080019661A1 (en) 2006-07-18 2008-01-24 Pere Obrador Producing output video from multiple media sources including multiple video sources
US8200063B2 (en) 2007-09-24 2012-06-12 Fuji Xerox Co., Ltd. System and method for video summarization
JP2009118009A (ja) 2007-11-02 2009-05-28 Sony Corp 撮像装置、その制御方法およびプログラム
EP2112619B1 (en) 2008-04-22 2012-07-25 Universität Stuttgart Video data processing
WO2010006334A1 (en) * 2008-07-11 2010-01-14 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
JP4645707B2 (ja) 2008-09-01 2011-03-09 ソニー株式会社 コンテンツデータ処理装置
US8145648B2 (en) 2008-09-03 2012-03-27 Samsung Electronics Co., Ltd. Semantic metadata creation for videos
US8195038B2 (en) 2008-10-24 2012-06-05 At&T Intellectual Property I, L.P. Brief and high-interest video summary generation
JP4623201B2 (ja) 2008-10-27 2011-02-02 ソニー株式会社 画像処理装置、画像処理方法およびプログラム
JP5247356B2 (ja) 2008-10-29 2013-07-24 キヤノン株式会社 情報処理装置およびその制御方法
JP2011040860A (ja) 2009-08-07 2011-02-24 Nikon Corp 画像処理装置及び画像処理プログラム
US8553982B2 (en) * 2009-12-23 2013-10-08 Intel Corporation Model-based play field registration
CN101853286B (zh) 2010-05-20 2016-08-10 上海全土豆网络科技有限公司 视频缩略图智能选取方法
US8619150B2 (en) 2010-05-25 2013-12-31 Intellectual Ventures Fund 83 Llc Ranking key video frames using camera fixation
US8599316B2 (en) 2010-05-25 2013-12-03 Intellectual Ventures Fund 83 Llc Method for determining key video frames
US8665345B2 (en) 2011-05-18 2014-03-04 Intellectual Ventures Fund 83 Llc Video summary including a feature of interest
US8649558B2 (en) * 2011-05-31 2014-02-11 Wisconsin Alumni Research Foundation Video processing with region-based warping
CN102263907B (zh) 2011-08-04 2013-09-18 央视国际网络有限公司 比赛视频的播放控制方法及其片段信息的生成方法和装置
WO2013030634A1 (en) 2011-08-31 2013-03-07 Rocks International Group Pte Ltd Virtual advertising platform
US8873813B2 (en) 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
US20130179112A1 (en) * 2012-01-09 2013-07-11 Honeywell International Inc. Robust method for signal segmentation for motion classification in personal navigation
WO2013186958A1 (ja) 2012-06-13 2013-12-19 日本電気株式会社 映像重要度算出方法、映像処理装置およびその制御方法と制御プログラムを格納した記憶媒体
US8995823B2 (en) 2012-07-17 2015-03-31 HighlightCam, Inc. Method and system for content relevance score determination
US10362977B2 (en) * 2013-10-01 2019-07-30 Sway Operations, Llc System and method for measuring reaction time of a subject

Also Published As

Publication number Publication date
CA2948529A1 (en) 2015-12-17
RU2016148407A3 (ru) 2019-01-22
BR112016028586A2 (pt) 2017-08-22
KR20170018042A (ko) 2017-02-15
BR112016028586B1 (pt) 2022-12-20
BR112016028586A8 (pt) 2021-06-08
CN106462744A (zh) 2017-02-22
EP3155557A1 (en) 2017-04-19
KR102354692B1 (ko) 2022-01-21
AU2015274708A1 (en) 2016-11-17
US10664687B2 (en) 2020-05-26
US20150363635A1 (en) 2015-12-17
AU2015274708B2 (en) 2020-03-26
RU2693906C2 (ru) 2019-07-05
JP2017528016A (ja) 2017-09-21
MX2016016293A (es) 2017-03-31
JP6694829B2 (ja) 2020-05-20
CN106462744B (zh) 2019-12-03
WO2015191650A1 (en) 2015-12-17

Similar Documents

Publication Publication Date Title
RU2016148407A (ru) Основанный на правилах анализ важности видео
US11107225B2 (en) Object recognition device and computer readable storage medium
JP2017528016A5 (ru)
US10242250B2 (en) Picture ranking method, and terminal
CN106557726B (zh) 一种带静默式活体检测的人脸身份认证系统及其方法
AU2017302250A1 (en) Optical character recognition in structured documents
US9858677B2 (en) Method of image analysis
US20170161591A1 (en) System and method for deep-learning based object tracking
US9489567B2 (en) Tracking and recognition of faces using selected region classification
SA517382337B1 (ar) اشتقاق متجه الحركة في ترميز الفيديو
US10990829B2 (en) Stitching maps generated using simultaneous localization and mapping
US20130301911A1 (en) Apparatus and method for detecting body parts
US20160300116A1 (en) Image processing apparatus, image processing method and computer-readable storage medium
US11087137B2 (en) Methods and systems for identification and augmentation of video content
JP2011258180A5 (ru)
GB2605723A (en) Video segmentation based on weighted knowledge graph
JP2013206458A (ja) 画像における外観及びコンテキストに基づく物体分類
RU2015102525A (ru) Сегментация изображения для верификации данных
Rong et al. Scene text recognition in multiple frames based on text tracking
US20160027050A1 (en) Method of providing advertisement service using cloud album
EP2998928B1 (en) Apparatus and method for extracting high watermark image from continuously photographed images
US11210528B2 (en) Information processing apparatus, information processing method, system, and storage medium to determine staying time of a person in predetermined region
CN108334811B (zh) 一种人脸图像处理方法及装置
KR102339478B1 (ko) Dna 정보를 이용한 얼굴 추정 방법, 이를 수행하기 위한 기록 매체 및 장치
KR20130057585A (ko) 입체 영상의 장면 전환 검출 장치 및 방법