RU2023132864A - Модификация объектов в фильме - Google Patents

Модификация объектов в фильме Download PDF

Info

Publication number
RU2023132864A
RU2023132864A RU2023132864A RU2023132864A RU2023132864A RU 2023132864 A RU2023132864 A RU 2023132864A RU 2023132864 A RU2023132864 A RU 2023132864A RU 2023132864 A RU2023132864 A RU 2023132864A RU 2023132864 A RU2023132864 A RU 2023132864A
Authority
RU
Russia
Prior art keywords
instance
sequence
image frames
image
modified
Prior art date
Application number
RU2023132864A
Other languages
English (en)
Inventor
Скотт МАНН
Хёнву КИМ
Шон ДАНИЧЕВСКИЙ
Роб ХОЛЛ
Гэри Майлз СКАЛЛИОН
Original Assignee
Флоулесс Холдингс Лимитед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Флоулесс Холдингс Лимитед filed Critical Флоулесс Холдингс Лимитед
Publication of RU2023132864A publication Critical patent/RU2023132864A/ru

Links

Claims (67)

1. Реализуемый компьютером способ обработки видеоданных, содержащих последовательность кадров изображения, причем способ включает в себя:
обособление экземпляра объекта в последовательности кадров изображения;
генерацию, с использованием модели машинного обучения, модифицированного экземпляра объекта; и
модификацию видеоданных для постепенного перехода, на протяжении подпоследовательности упомянутой последовательности кадров изображения, между по меньшей мере частью обособленного экземпляра объекта и соответствующей по меньшей мере частью модифицированного экземпляра объекта.
2. Реализуемый компьютером способ по п. 1, в котором модификация видеоданных включает в себя:
определение значений параметров для искусственной модели объекта, причем первые значения параметров соответствуют обособленному экземпляру объекта;
модификацию первых значений параметров для искусственной модели объекта для определения вторых значений параметров для искусственной модели объекта, причем вторые значения параметров соответствуют модифицированному экземпляру объекта;
инкрементную интерполяцию между первыми значениями параметров и вторыми значениями параметров на протяжении подпоследовательности последовательности кадров изображения для определения тем самым интерполированных значений параметров для искусственной модели объекта;
генерацию, с использованием модели машинного обучения, инкрементно модифицированного экземпляра объекта на основе интерполированных значений параметров;и
замену обособленного экземпляра объекта инкрементно модифицированным экземпляром объекта в подпоследовательности последовательности кадров изображения.
3. Реализуемый компьютером способ по п. 1 или 2, в котором модификация видеоданных включает в себя:
определение данных оптического потока, указывающих, для подпоследовательности последовательности кадров изображения, оцененную деформацию, связывающую экземпляр объекта с модифицированным экземпляром объекта;
инкрементное, на протяжении подпоследовательности последовательности кадров изображения, применение оцененной деформации к экземпляру объекта для определения инкрементно деформированного экземпляра объекта;
инкрементное, на протяжении подпоследовательности последовательности кадров изображения, применение обратной оцененной деформации к модифицированному экземпляру объекта для определения инкрементно деформированного модифицированного экземпляра объекта; и
инкрементное, на протяжении подпоследовательности последовательности кадров изображения, преобразование наплывом инкрементно деформированного первого экземпляра объекта в инкрементно деформированный модифицированный первый экземпляр объекта.
4. Реализуемый компьютером способ по п. 3, в котором:
инкрементный наплыв происходит со скоростью наплыва;
инкрементное применение оцененной деформации и обратной оцененной деформации происходит со скоростью деформации; и
отношение скорости наплыва к скорости деформации увеличивается до максимального значения, а затем уменьшается в пределах подпоследовательности последовательности кадров изображения.
5. Реализуемый компьютером способ по любому из предшествующих пунктов, дополнительно включающий в себя:
определение данных оптического потока, указывающих оцененную деформацию, которая связывает экземпляр объекта с модифицированным экземпляром объекта на протяжении последовательности кадров изображения;
применение оцененной деформации к экземпляру объекта для определения деформированного экземпляра объекта;
размытие деформированного экземпляра объекта; размытие модифицированного экземпляра объекта;
корректировку цветов модифицированного экземпляра объекта на основе попиксельного соотношения размытого деформированного экземпляра объекта и размытого модифицированного экземпляра объекта, чтобы генерировать модифицированный экземпляр объекта с цветовым тонированием; и
обновление модифицированного экземпляра объекта до модифицированного экземпляра объекта с цветовым тонированием перед модификацией видеоданных.
6. Способ по п. 5, в котором каждое из размытия деформированного экземпляра объекта и размытия модифицированного экземпляра объекта выполняют с использованием фильтра размытия с характеристическим масштабом длины от 3 до 20 пикселей.
7. Реализуемый компьютером способ по п. 1, в котором объектом является человеческое лицо.
8. Реализуемый компьютером способ по п. 7, в котором по меньшей мере часть обособленного экземпляра объекта включает в себя рот, но исключает глаза человеческого лица.
9. Реализуемый компьютером способ по любому из предшествующих пунктов, дополнительно включающий в себя:
обнаружение события в последовательности кадров изображения и/или в звуковой дорожке, связанной с последовательностью кадров изображения;
определение одного или более кадров изображения из последовательности кадров изображения, в которых имеет место обнаруженное событие; и
определение подпоследовательности последовательности кадров изображения в зависимости от определенного одного или более кадров изображения, в которых происходит обнаруженное событие.
10. Реализуемый компьютером способ по п. 9, в котором подпоследовательность последовательности кадров изображения определяют так, что подпоследовательность заканчивается до того, как событие произойдет.
11. Реализуемый компьютером способ по п. 9 или 10, в котором объектом является человеческое лицо, а событием является то, что человеческое лицо начинает говорить.
12. Реализуемый компьютером способ по любому из предшествующих пунктов, в котором:
упомянутая подпоследовательность последовательности кадров изображения является первой подпоследовательностью последовательности кадров изображения; и
упомянутая модификация видеоданных заключается в постепенном переходе от по меньшей мере части обособленного экземпляра объекта к соответствующей по меньшей мере части модифицированного экземпляра объекта,
при этом способ включает в себя дальнейшую модификацию видеоданных для постепенного перехода от упомянутой по меньшей мере части модифицированного экземпляра объекта обратно к соответствующей по меньшей мере части обособленного экземпляра объекта на протяжении второй подпоследовательности последовательности кадров изображения.
13. Реализуемый компьютером способ по любому из предшествующих пунктов, в котором генерация модифицированного экземпляра объекта включает в себя:
определение значений параметров искусственной модели объекта с использованием обособленного экземпляра объекта;
модификацию значений параметров искусственной модели объекта; и
рендеринг модифицированного экземпляра объекта с использованием обученной модели машинного обучения и модифицированных значений параметров для искусственной модели объекта.
14. Реализуемый компьютером способ по п. 13, в котором упомянутая последовательность кадров изображения представляет собой первую последовательность кадров изображения, экземпляр объекта является первым экземпляром объекта, а значения параметров для экземпляра объекта являются вторыми значения параметров для второго экземпляра объекта, причем способ дополнительно содержит:
идентификацию соответствующих вторых экземпляров объекта внутри множества вторых последовательностей кадров изображения;
для по меньшей мере некоторых из идентифицированных вторых экземпляров
объекта:
обособление упомянутого второго экземпляра объекта внутри кадров изображения, содержащих упомянутый экземпляр объекта;
определение, с использованием обособленного второго экземпляра объекта, связанных вторых значений параметров для искусственной модели объекта; и
обучение, с использованием обособленного второго экземпляра объекта и связанных вторых значений параметров для искусственной модели объекта, модели машинного обучения для реконструкции обособленного второго экземпляра объекта на основе, по меньшей мере частично, связанных вторых значений параметров для искусственной модели объекта.
15. Компьютерный программный продукт, содержащий инструкции, которые при выполнении программы компьютером заставляют компьютер выполнять способ по любому предыдущему пункту.
16. Носитель данных, хранящий видеоданные, которые содержат:
первую последовательность кадров изображения, содержащую фотографическое изображение объекта;
вторую последовательность кадров изображения, в которой по меньшей мере часть фотографического изображения объекта заменена соответствующей по меньшей мере частью искусственного изображения объекта; и
третью последовательность кадров изображения между первой последовательностью кадров изображения и второй последовательностью кадров изображения, в которой по меньшей мере часть фотографического изображения объекта модифицирована для постепенного перехода между упомянутой по меньшей мере частью фотографического изображения объекта в конце первой последовательности кадров изображения и соответствующей по меньшей мере частью искусственного изображения объекта в начале второй последовательности кадров изображения.
17. Носитель данных по п. 16, в котором искусственное изображение объекта представляет собой искусственное изображение, сгенерированное с использованием нейронного рендерера.
18. Носитель данных по п. 16 или 17, в котором:
модификация по меньшей мере части фотографического изображения объекта включает в себя одновременно деформацию и преобразование наплывом упомянутой по меньшей мере части фотографического изображения объекта в упомянутую по меньшей мере часть искусственного изображения объекта;
деформация происходит инкрементно со скоростью деформации;
наплыв происходит инкрементно со скоростью наплыва; и
отношение скорости наплыва к скорости деформации увеличивается до максимального значения, а затем уменьшается в пределах третьей последовательности кадров изображения.
19. Носитель данных по любому из пп. 16-18, в котором:
искусственное изображение объекта является первым искусственным изображением объекта;
модификация упомянутой по меньшей мере части фотографического изображения объекта представляет собой прогрессивную интерполяцию между вторым искусственным изображением объекта и первым искусственным изображением объекта,
при этом второе искусственное изображение объекта геометрически соответствует фотографическому изображению объекта.
20. Носитель информации по любому из пп. 16-19, в котором объектом является человеческое лицо.
21. Носитель данных по п. 19, в котором упомянутая по меньшей мере часть обособленного экземпляра объекта включает в себя рот, но исключает глаза человеческого лица.
22. Аудиовизуальный продукт, произведенный способом по любому из пп. 1-14.
RU2023132864A 2021-05-26 2022-05-26 Модификация объектов в фильме RU2023132864A (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US63/193,553 2021-05-26
US63/203,354 2021-07-19
US17/561,356 2021-12-23

Publications (1)

Publication Number Publication Date
RU2023132864A true RU2023132864A (ru) 2024-02-28

Family

ID=

Similar Documents

Publication Publication Date Title
WO2021208122A1 (zh) 基于深度学习的视频盲去噪方法及装置
US11017586B2 (en) 3D motion effect from a 2D image
US11875491B2 (en) Method and system for image processing
US11741581B2 (en) Training method for image processing model, image processing method, network device, and storage medium
JP4961800B2 (ja) 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
CN111667442A (zh) 一种基于事件相机的高质量高帧率图像重建方法
CN106063242B (zh) 用于控制颤抖可见性的系统和方法
CN111586409B (zh) 插值帧的生成方法、装置、电子设备和存储介质
JP4548520B2 (ja) 係数生成装置および方法、画像生成装置および方法、並びにプログラム
CN112164011A (zh) 基于自适应残差与递归交叉注意力的运动图像去模糊方法
EP2629531A1 (en) Method for converting 2d into 3d based on image motion information
CN112055249B (zh) 一种视频插帧方法及装置
CN114339030A (zh) 一种基于自适应可分离卷积的网络直播视频稳像方法
KR102242343B1 (ko) 고해상도 동영상 프레임 율 고속 변환 방법 및 장치
CN116894770A (zh) 图像处理方法、图像处理设备和计算机程序
CN114692733A (zh) 端到端的抑制时域噪声放大的视频风格迁移方法、系统及存储介质
US11948278B2 (en) Image quality improvement method and image processing apparatus using the same
Yahia et al. Frame interpolation using convolutional neural networks on 2d animation
RU2023132864A (ru) Модификация объектов в фильме
Ercan et al. Hypere2vid: Improving event-based video reconstruction via hypernetworks
Shaw et al. Hdr reconstruction from bracketed exposures and events
JP2021057824A5 (ru)
TW536918B (en) Method to increase the temporal resolution of continuous image series
CN114554248B (zh) 一种基于神经网络的视频插帧方法
EP4344227A1 (en) Video frame interpolation method and apparatus, and device