RU2023132864A - Модификация объектов в фильме - Google Patents
Модификация объектов в фильме Download PDFInfo
- Publication number
- RU2023132864A RU2023132864A RU2023132864A RU2023132864A RU2023132864A RU 2023132864 A RU2023132864 A RU 2023132864A RU 2023132864 A RU2023132864 A RU 2023132864A RU 2023132864 A RU2023132864 A RU 2023132864A RU 2023132864 A RU2023132864 A RU 2023132864A
- Authority
- RU
- Russia
- Prior art keywords
- instance
- sequence
- image frames
- image
- modified
- Prior art date
Links
- 238000000034 method Methods 0.000 claims 19
- 238000010801 machine learning Methods 0.000 claims 4
- 230000004048 modification Effects 0.000 claims 4
- 238000012986 modification Methods 0.000 claims 4
- 230000007704 transition Effects 0.000 claims 4
- 230000004941 influx Effects 0.000 claims 3
- 230000007423 decrease Effects 0.000 claims 2
- 230000003287 optical effect Effects 0.000 claims 2
- 239000003086 colorant Substances 0.000 claims 1
- 238000004590 computer program Methods 0.000 claims 1
- 230000001537 neural effect Effects 0.000 claims 1
- 230000000750 progressive effect Effects 0.000 claims 1
- 238000009877 rendering Methods 0.000 claims 1
- 230000009466 transformation Effects 0.000 claims 1
Claims (67)
1. Реализуемый компьютером способ обработки видеоданных, содержащих последовательность кадров изображения, причем способ включает в себя:
обособление экземпляра объекта в последовательности кадров изображения;
генерацию, с использованием модели машинного обучения, модифицированного экземпляра объекта; и
модификацию видеоданных для постепенного перехода, на протяжении подпоследовательности упомянутой последовательности кадров изображения, между по меньшей мере частью обособленного экземпляра объекта и соответствующей по меньшей мере частью модифицированного экземпляра объекта.
2. Реализуемый компьютером способ по п. 1, в котором модификация видеоданных включает в себя:
определение значений параметров для искусственной модели объекта, причем первые значения параметров соответствуют обособленному экземпляру объекта;
модификацию первых значений параметров для искусственной модели объекта для определения вторых значений параметров для искусственной модели объекта, причем вторые значения параметров соответствуют модифицированному экземпляру объекта;
инкрементную интерполяцию между первыми значениями параметров и вторыми значениями параметров на протяжении подпоследовательности последовательности кадров изображения для определения тем самым интерполированных значений параметров для искусственной модели объекта;
генерацию, с использованием модели машинного обучения, инкрементно модифицированного экземпляра объекта на основе интерполированных значений параметров;и
замену обособленного экземпляра объекта инкрементно модифицированным экземпляром объекта в подпоследовательности последовательности кадров изображения.
3. Реализуемый компьютером способ по п. 1 или 2, в котором модификация видеоданных включает в себя:
определение данных оптического потока, указывающих, для подпоследовательности последовательности кадров изображения, оцененную деформацию, связывающую экземпляр объекта с модифицированным экземпляром объекта;
инкрементное, на протяжении подпоследовательности последовательности кадров изображения, применение оцененной деформации к экземпляру объекта для определения инкрементно деформированного экземпляра объекта;
инкрементное, на протяжении подпоследовательности последовательности кадров изображения, применение обратной оцененной деформации к модифицированному экземпляру объекта для определения инкрементно деформированного модифицированного экземпляра объекта; и
инкрементное, на протяжении подпоследовательности последовательности кадров изображения, преобразование наплывом инкрементно деформированного первого экземпляра объекта в инкрементно деформированный модифицированный первый экземпляр объекта.
4. Реализуемый компьютером способ по п. 3, в котором:
инкрементный наплыв происходит со скоростью наплыва;
инкрементное применение оцененной деформации и обратной оцененной деформации происходит со скоростью деформации; и
отношение скорости наплыва к скорости деформации увеличивается до максимального значения, а затем уменьшается в пределах подпоследовательности последовательности кадров изображения.
5. Реализуемый компьютером способ по любому из предшествующих пунктов, дополнительно включающий в себя:
определение данных оптического потока, указывающих оцененную деформацию, которая связывает экземпляр объекта с модифицированным экземпляром объекта на протяжении последовательности кадров изображения;
применение оцененной деформации к экземпляру объекта для определения деформированного экземпляра объекта;
размытие деформированного экземпляра объекта; размытие модифицированного экземпляра объекта;
корректировку цветов модифицированного экземпляра объекта на основе попиксельного соотношения размытого деформированного экземпляра объекта и размытого модифицированного экземпляра объекта, чтобы генерировать модифицированный экземпляр объекта с цветовым тонированием; и
обновление модифицированного экземпляра объекта до модифицированного экземпляра объекта с цветовым тонированием перед модификацией видеоданных.
6. Способ по п. 5, в котором каждое из размытия деформированного экземпляра объекта и размытия модифицированного экземпляра объекта выполняют с использованием фильтра размытия с характеристическим масштабом длины от 3 до 20 пикселей.
7. Реализуемый компьютером способ по п. 1, в котором объектом является человеческое лицо.
8. Реализуемый компьютером способ по п. 7, в котором по меньшей мере часть обособленного экземпляра объекта включает в себя рот, но исключает глаза человеческого лица.
9. Реализуемый компьютером способ по любому из предшествующих пунктов, дополнительно включающий в себя:
обнаружение события в последовательности кадров изображения и/или в звуковой дорожке, связанной с последовательностью кадров изображения;
определение одного или более кадров изображения из последовательности кадров изображения, в которых имеет место обнаруженное событие; и
определение подпоследовательности последовательности кадров изображения в зависимости от определенного одного или более кадров изображения, в которых происходит обнаруженное событие.
10. Реализуемый компьютером способ по п. 9, в котором подпоследовательность последовательности кадров изображения определяют так, что подпоследовательность заканчивается до того, как событие произойдет.
11. Реализуемый компьютером способ по п. 9 или 10, в котором объектом является человеческое лицо, а событием является то, что человеческое лицо начинает говорить.
12. Реализуемый компьютером способ по любому из предшествующих пунктов, в котором:
упомянутая подпоследовательность последовательности кадров изображения является первой подпоследовательностью последовательности кадров изображения; и
упомянутая модификация видеоданных заключается в постепенном переходе от по меньшей мере части обособленного экземпляра объекта к соответствующей по меньшей мере части модифицированного экземпляра объекта,
при этом способ включает в себя дальнейшую модификацию видеоданных для постепенного перехода от упомянутой по меньшей мере части модифицированного экземпляра объекта обратно к соответствующей по меньшей мере части обособленного экземпляра объекта на протяжении второй подпоследовательности последовательности кадров изображения.
13. Реализуемый компьютером способ по любому из предшествующих пунктов, в котором генерация модифицированного экземпляра объекта включает в себя:
определение значений параметров искусственной модели объекта с использованием обособленного экземпляра объекта;
модификацию значений параметров искусственной модели объекта; и
рендеринг модифицированного экземпляра объекта с использованием обученной модели машинного обучения и модифицированных значений параметров для искусственной модели объекта.
14. Реализуемый компьютером способ по п. 13, в котором упомянутая последовательность кадров изображения представляет собой первую последовательность кадров изображения, экземпляр объекта является первым экземпляром объекта, а значения параметров для экземпляра объекта являются вторыми значения параметров для второго экземпляра объекта, причем способ дополнительно содержит:
идентификацию соответствующих вторых экземпляров объекта внутри множества вторых последовательностей кадров изображения;
для по меньшей мере некоторых из идентифицированных вторых экземпляров
объекта:
обособление упомянутого второго экземпляра объекта внутри кадров изображения, содержащих упомянутый экземпляр объекта;
определение, с использованием обособленного второго экземпляра объекта, связанных вторых значений параметров для искусственной модели объекта; и
обучение, с использованием обособленного второго экземпляра объекта и связанных вторых значений параметров для искусственной модели объекта, модели машинного обучения для реконструкции обособленного второго экземпляра объекта на основе, по меньшей мере частично, связанных вторых значений параметров для искусственной модели объекта.
15. Компьютерный программный продукт, содержащий инструкции, которые при выполнении программы компьютером заставляют компьютер выполнять способ по любому предыдущему пункту.
16. Носитель данных, хранящий видеоданные, которые содержат:
первую последовательность кадров изображения, содержащую фотографическое изображение объекта;
вторую последовательность кадров изображения, в которой по меньшей мере часть фотографического изображения объекта заменена соответствующей по меньшей мере частью искусственного изображения объекта; и
третью последовательность кадров изображения между первой последовательностью кадров изображения и второй последовательностью кадров изображения, в которой по меньшей мере часть фотографического изображения объекта модифицирована для постепенного перехода между упомянутой по меньшей мере частью фотографического изображения объекта в конце первой последовательности кадров изображения и соответствующей по меньшей мере частью искусственного изображения объекта в начале второй последовательности кадров изображения.
17. Носитель данных по п. 16, в котором искусственное изображение объекта представляет собой искусственное изображение, сгенерированное с использованием нейронного рендерера.
18. Носитель данных по п. 16 или 17, в котором:
модификация по меньшей мере части фотографического изображения объекта включает в себя одновременно деформацию и преобразование наплывом упомянутой по меньшей мере части фотографического изображения объекта в упомянутую по меньшей мере часть искусственного изображения объекта;
деформация происходит инкрементно со скоростью деформации;
наплыв происходит инкрементно со скоростью наплыва; и
отношение скорости наплыва к скорости деформации увеличивается до максимального значения, а затем уменьшается в пределах третьей последовательности кадров изображения.
19. Носитель данных по любому из пп. 16-18, в котором:
искусственное изображение объекта является первым искусственным изображением объекта;
модификация упомянутой по меньшей мере части фотографического изображения объекта представляет собой прогрессивную интерполяцию между вторым искусственным изображением объекта и первым искусственным изображением объекта,
при этом второе искусственное изображение объекта геометрически соответствует фотографическому изображению объекта.
20. Носитель информации по любому из пп. 16-19, в котором объектом является человеческое лицо.
21. Носитель данных по п. 19, в котором упомянутая по меньшей мере часть обособленного экземпляра объекта включает в себя рот, но исключает глаза человеческого лица.
22. Аудиовизуальный продукт, произведенный способом по любому из пп. 1-14.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/193,553 | 2021-05-26 | ||
US63/203,354 | 2021-07-19 | ||
US17/561,356 | 2021-12-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2023132864A true RU2023132864A (ru) | 2024-02-28 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021208122A1 (zh) | 基于深度学习的视频盲去噪方法及装置 | |
US11017586B2 (en) | 3D motion effect from a 2D image | |
US11875491B2 (en) | Method and system for image processing | |
US11741581B2 (en) | Training method for image processing model, image processing method, network device, and storage medium | |
JP4961800B2 (ja) | 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム | |
CN111667442A (zh) | 一种基于事件相机的高质量高帧率图像重建方法 | |
CN106063242B (zh) | 用于控制颤抖可见性的系统和方法 | |
CN111586409B (zh) | 插值帧的生成方法、装置、电子设备和存储介质 | |
JP4548520B2 (ja) | 係数生成装置および方法、画像生成装置および方法、並びにプログラム | |
CN112164011A (zh) | 基于自适应残差与递归交叉注意力的运动图像去模糊方法 | |
EP2629531A1 (en) | Method for converting 2d into 3d based on image motion information | |
CN112055249B (zh) | 一种视频插帧方法及装置 | |
CN114339030A (zh) | 一种基于自适应可分离卷积的网络直播视频稳像方法 | |
KR102242343B1 (ko) | 고해상도 동영상 프레임 율 고속 변환 방법 및 장치 | |
CN116894770A (zh) | 图像处理方法、图像处理设备和计算机程序 | |
CN114692733A (zh) | 端到端的抑制时域噪声放大的视频风格迁移方法、系统及存储介质 | |
US11948278B2 (en) | Image quality improvement method and image processing apparatus using the same | |
Yahia et al. | Frame interpolation using convolutional neural networks on 2d animation | |
RU2023132864A (ru) | Модификация объектов в фильме | |
Ercan et al. | Hypere2vid: Improving event-based video reconstruction via hypernetworks | |
Shaw et al. | Hdr reconstruction from bracketed exposures and events | |
JP2021057824A5 (ru) | ||
TW536918B (en) | Method to increase the temporal resolution of continuous image series | |
CN114554248B (zh) | 一种基于神经网络的视频插帧方法 | |
EP4344227A1 (en) | Video frame interpolation method and apparatus, and device |