JP7794530B2 - ビデオ生成方法及び機器 - Google Patents
ビデオ生成方法及び機器Info
- Publication number
- JP7794530B2 JP7794530B2 JP2024538088A JP2024538088A JP7794530B2 JP 7794530 B2 JP7794530 B2 JP 7794530B2 JP 2024538088 A JP2024538088 A JP 2024538088A JP 2024538088 A JP2024538088 A JP 2024538088A JP 7794530 B2 JP7794530 B2 JP 7794530B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- feature
- image feature
- features
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4023—Scaling of whole images or parts thereof, e.g. expanding or contracting based on decimating pixels or lines of pixels; based on inserting pixels or lines of pixels
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/2625—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects for obtaining an image which is composed of images from a temporal image sequence, e.g. for a stroboscopic effect
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/222—Studio circuitry; Studio devices; Studio equipment
- H04N5/262—Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
- H04N5/2621—Cameras specially adapted for the electronic generation of special effects during image pickup, e.g. digital cameras, camcorders, video cameras having integrated special effects capability
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Television Systems (AREA)
Description
第1の画像において、第1の画像特徴を抽出するステップと、
前記第1の画像特徴及び第2の画像の画像特徴である第2の画像特徴に基づき、非線形補間によって複数の中間画像特徴を得るステップと、
前記第1の画像特徴、前記第2の画像特徴及び前記複数の中間画像特徴に基づき、画像生成モデルによって画像を再構成し、前記第1の画像から前記第2の画像に漸進的に変化する過程を示すためのターゲットビデオを生成するステップとを含む。
複数のトレーニング画像及び画像生成モデルによって、前記画像生成モデルの特徴空間に基づいて画像特徴を調整する偏差を学習するためのニューラルネットワークをトレーニングするステップを含み、
前記ニューラルネットワークの一回のトレーニング過程は、
第1のトレーニング画像の画像特徴及び第2のトレーニング画像の画像特徴に基づき、ターゲット画像特徴を生成するステップと、
前記特徴空間に基づき、前記ターゲット画像特徴を初期調整するステップと、
前記ニューラルネットワークによって前記初期調整に対応するターゲット偏差を学習し、且つ前記ターゲット偏差に基づき、初期調整されたターゲット画像特徴を再び調整するステップと、
前記ターゲット偏差、再び調整されたターゲット画像特徴、前記第1のトレーニング画像及び前記第2のトレーニング画像に基づき、前記ニューラルネットワークのモデルパラメータを調整するステップとを含む。
第1の画像において、第1の画像特徴を抽出するための抽出ユニットと、
前記第1の画像特徴及び第2の画像の画像特徴である第2の画像特徴に基づき、非線形補間によって複数の中間画像特徴を得るための補間ユニットと、
前記第1の画像特徴、前記第2の画像特徴及び前記複数の中間画像特徴に基づき、画像生成モデルによって画像を再構成し、前記第1の画像から前記第2の画像に漸進的に変化する過程を示すためのターゲットビデオを生成するためのビデオ生成ユニットとを備える。
複数のトレーニング画像及び画像生成モデルによって、前記画像生成モデルの特徴空間に基づいて画像特徴を調整する偏差を学習するためのニューラルネットワークをトレーニングするためのトレーニングユニットを備え、
前記ニューラルネットワークの一回のトレーニング過程は、
第1のトレーニング画像の画像特徴及び第2のトレーニング画像の画像特徴に基づき、ターゲット画像特徴を生成するステップと、
前記特徴空間に基づき、前記ターゲット画像特徴を初期調整するステップと、
前記ニューラルネットワークによって前記初期調整に対応するターゲット偏差を学習し、且つ前記ターゲット偏差に基づき、初期調整されたターゲット画像特徴を再び調整するステップと、
前記ターゲット偏差、再び調整されたターゲット画像特徴、前記第1のトレーニング画像及び前記第2のトレーニング画像に基づき、前記ニューラルネットワークのモデルパラメータを調整するステップとを含む。
前記メモリは、コンピュータ実行命令を記憶し、
前記少なくとも1つのプロセッサは、前記メモリに記憶されたコンピュータ実行命令を実行することで、前記少なくとも1つのプロセッサに第1の態様又は第1の態様の様々な可能な設計に記載のビデオ生成方法を実行させ、又は、前記少なくとも1つのプロセッサに第2の態様又は第2の態様の様々な可能な設計に記載のモデル決定方法を実行させる。
前記メモリはコンピュータ実行命令を記憶し、
前記少なくとも1つのプロセッサは前記メモリに記憶されているコンピュータ実行命令を実行することにより、前記少なくとも1つのプロセッサに第1の態様又は第1の態様の様々な可能な設計に記載のビデオ生成方法を実行させ、又は、前記少なくとも1つのプロセッサに第2の態様又は第2の態様の様々な可能な設計に記載のモデル決定方法を実行させる。
Claims (12)
- ビデオ生成方法であって、
第1の画像において、第1の画像特徴を抽出するステップと、
前記第1の画像特徴及び第2の画像の画像特徴である第2の画像特徴に基づき、非線形補間によって複数の中間画像特徴を得るステップであって、前記第1の画像特徴は、前記第1の画像を符号化した後に得た画像特徴であり、前記第2の画像特徴は、前記第2の画像を符号化した後に得た画像特徴であるステップと、
前記第1の画像特徴、前記第2の画像特徴及び前記複数の中間画像特徴に基づき、画像生成モデルによって画像を再構成し、前記第1の画像から前記第2の画像に漸進的に変化する過程を示すためのターゲットビデオを生成するステップとを含み、
前記第1の画像特徴及び第2の画像特徴に基づき、非線形補間によって複数の中間画像特徴を得る前記ステップは、
前記第1の画像特徴及び前記第2の画像特徴に基づき、特徴融合処理を行い、第3の画像特徴を生成するステップと、
順に前記画像生成モデルの特徴空間と、前記特徴空間に基づいて画像特徴を調整する偏差を学習するためのニューラルネットワークとに基づき、前記第3の画像特徴を調整するステップであって、前記画像生成モデルの特徴空間は、前記第3の画像特徴を1回目に調整するための特徴サンプルを含み、それにより、1回目に調整された第3の画像特徴を前記特徴サンプルに接近させ、前記ニューラルネットワークは前記1回目に調整された第3の画像特徴を2回目に調整して、調整された第3の画像特徴を得るステップと、
前記第1の画像特徴、前記第2の画像特徴及び調整された第3の画像特徴に基づき、非線形補間を行い、前記複数の中間画像特徴を得るステップとを含む、ビデオ生成方法。 - 順に前記画像生成モデルの特徴空間と、前記特徴空間に基づいて画像特徴を調整する偏差を学習するためのニューラルネットワークとに基づき、前記第3の画像特徴を調整する前記ステップは、
前記特徴空間における平均画像特徴を取得するステップと、
前記平均画像特徴に基づき、前記第3の画像特徴を初期調整するステップと、
前記第1の画像特徴及び前記第2の画像特徴を、前記ニューラルネットワークに入力し、前記初期調整された偏差を反映する前記ニューラルネットワークの出力データを得るステップと、
前記出力データに基づき、初期調整された第3の画像特徴を再び調整するステップとを含む、請求項1に記載のビデオ生成方法。 - 前記平均画像特徴に基づき、前記第3の画像特徴を初期調整する前記ステップは、
前記第3の画像特徴及び前記平均画像特徴の平均値を決定するステップと、
前記初期調整された第3の画像特徴が前記平均値であることを決定するステップとを含む、請求項2に記載のビデオ生成方法。 - 前記ニューラルネットワークは規則性制約及び類似度制約のトレーニングによって得られ、前記規則性制約は、前記ニューラルネットワークに基づいて調整された画像特徴と前記特徴空間に基づいて調整された画像特徴との間の差異を最小化することに用いられ、前記類似度制約は、前記ニューラルネットワークに基づいて調整された画像特徴と第1のトレーニング画像の画像特徴、第2のトレーニング画像の画像特徴との間の差異を最小化することに用いられる、請求項1~3のいずれか一項に記載のビデオ生成方法。
- 前記第1の画像特徴、前記第2の画像特徴及び調整された第3の画像特徴に基づき、非線形補間を行い、前記複数の中間画像特徴を得る前記ステップは、
前記第1の画像特徴、前記第2の画像特徴及び前記第3の画像特徴に基づき、三次スプライン補間によって補間曲線を得るステップと、
前記補間曲線においてサンプリングし、前記複数の中間画像特徴を得るステップとを含む、請求項1~3のいずれか一項に記載のビデオ生成方法。 - 前記画像生成モデルはStyleGANモデル又はStyleGAN2モデルである、請求項1~3のいずれか一項に記載のビデオ生成方法。
- 請求項1に記載のビデオ生成方法であって、
複数のトレーニング画像及び前記画像生成モデルに基づき、前記ニューラルネットワークをトレーニングするステップを更に含み、
前記ニューラルネットワークの一回のトレーニング過程は、
第1のトレーニング画像の画像特徴及び第2のトレーニング画像の画像特徴に基づき、ターゲット画像特徴を生成するステップと、
前記画像生成モデルの特徴空間に基づき、前記ターゲット画像特徴を1回目に調整するステップと、
前記ニューラルネットワークによって前記1回目の調整に対応するターゲット偏差を学習し、且つ前記ターゲット偏差に基づき、1回目に調整されたターゲット画像特徴を2回目に調整するステップと、
前記ターゲット偏差、2回目に調整されたターゲット画像特徴、前記第1のトレーニング画像及び前記第2のトレーニング画像に基づき、前記ニューラルネットワークのモデルパラメータを調整するステップとを含む、ビデオ生成方法。 - 前記ターゲット偏差、2回目に調整されたターゲット画像特徴、前記第1のトレーニング画像及び前記第2のトレーニング画像に基づき、前記ニューラルネットワークのモデルパラメータを調整する前記ステップは、
規則性制約及び類似度制約によって、前記ニューラルネットワークのターゲット最適化関数を決定するステップと、
前記ターゲット最適化関数、前記ターゲット偏差、前記2回目に調整されたターゲット画像特徴、前記第1のトレーニング画像及び前記第2のトレーニング画像に基づき、前記ニューラルネットワークのモデルパラメータを調整するステップとを含み、
前記規則性制約は、前記2回目に調整されたターゲット画像特徴と前記1回目に調整されたターゲット画像特徴との間の差異を最小化することに用いられ、前記類似度制約は、前記2回目に調整されたターゲット画像特徴と前記第1のトレーニング画像の画像特徴、前記第2のトレーニング画像の画像特徴との間の差異を最小化することに用いられることを特徴とする、請求項7に記載のビデオ生成方法。 - ビデオ生成機器であって、
第1の画像において、第1の画像特徴を抽出するための抽出ユニットと、
前記第1の画像特徴及び第2の画像の画像特徴である第2の画像特徴に基づき、非線形補間によって複数の中間画像特徴を得る補間ユニットであって、前記第1の画像特徴は、前記第1の画像を符号化した後に得た画像特徴であり、前記第2の画像特徴は、前記第2の画像を符号化した後に得た画像特徴である補間ユニットと、
前記第1の画像特徴、前記第2の画像特徴及び前記複数の中間画像特徴に基づき、画像生成モデルによって画像を再構成し、前記第1の画像から前記第2の画像に漸進的に変化する過程を示すためのターゲットビデオを生成するためのビデオ生成ユニットとを備え、
前記抽出ユニットは、さらに
前記第1の画像特徴及び前記第2の画像特徴に基づき、特徴融合処理を行い、第3の画像特徴を生成することと、
順に前記画像生成モデルの特徴空間と、前記特徴空間に基づいて画像特徴を調整する偏差を学習するためのニューラルネットワークとに基づき、前記第3の画像特徴を調整することであって、前記画像生成モデルの特徴空間は、前記第3の画像特徴を1回目に調整するための特徴サンプルを含み、それにより、1回目に調整された第3の画像特徴を前記特徴サンプルに接近させ、前記ニューラルネットワークは前記1回目に調整された第3の画像特徴を2回目に調整して、調整された第3の画像特徴を得ることと、
前記第1の画像特徴、前記第2の画像特徴及び調整された第3の画像特徴に基づき、非線形補間を行い、前記複数の中間画像特徴を得ることとに用いられる、ビデオ生成機器。 - 少なくとも1つのプロセッサとメモリとを備える電子機器であって、
前記メモリは、コンピュータ実行命令を記憶し、
前記少なくとも1つのプロセッサは、前記メモリに記憶されたコンピュータ実行命令を実行することで、前記少なくとも1つのプロセッサに請求項1~3又は7~8のいずれか一項に記載のビデオ生成方法を実行させる、電子機器。 - コンピュータ実行命令が記憶され、プロセッサが前記コンピュータ実行命令を実行すると、請求項1~3又は7~8のいずれか一項に記載のビデオ生成方法を実現する、コンピュータ読み取り可能な記憶媒体。
- プロセッサに実行されると、請求項1~3又は7~8のいずれか一項に記載のビデオ生成方法を実現する、コンピュータプログラム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111609441.8A CN114255169A (zh) | 2021-12-24 | 2021-12-24 | 视频生成方法及设备 |
| CN202111609441.8 | 2021-12-24 | ||
| PCT/SG2022/050927 WO2023121571A2 (zh) | 2021-12-24 | 2022-12-22 | 视频生成方法及设备 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025500976A JP2025500976A (ja) | 2025-01-15 |
| JP7794530B2 true JP7794530B2 (ja) | 2026-01-06 |
Family
ID=80797847
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024538088A Active JP7794530B2 (ja) | 2021-12-24 | 2022-12-22 | ビデオ生成方法及び機器 |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US20250054271A1 (ja) |
| EP (1) | EP4435724A4 (ja) |
| JP (1) | JP7794530B2 (ja) |
| CN (1) | CN114255169A (ja) |
| WO (1) | WO2023121571A2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117036180A (zh) * | 2022-10-13 | 2023-11-10 | 腾讯科技(深圳)有限公司 | 图像优化方法、装置、电子设备、介质和程序产品 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109905624A (zh) | 2019-03-01 | 2019-06-18 | 北京大学深圳研究生院 | 一种视频帧插值方法、装置及设备 |
| US20190228273A1 (en) | 2018-01-25 | 2019-07-25 | Adobe Inc. | Identifying parameter image adjustments using image variation and sequential processing |
| CN111654723A (zh) | 2020-05-14 | 2020-09-11 | 北京百度网讯科技有限公司 | 视频质量提升方法、装置、电子设备和存储介质 |
| US20210279840A1 (en) | 2020-03-05 | 2021-09-09 | Zhixiang Chi | Systems and methods for multi-frame video frame interpolation |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN106998437B (zh) * | 2017-03-31 | 2020-07-31 | 武汉斗鱼网络科技有限公司 | 一种重建视频图像的方法及装置 |
| CN107341841B (zh) * | 2017-07-26 | 2020-11-27 | 厦门美图之家科技有限公司 | 一种渐变动画的生成方法及计算设备 |
| WO2019136591A1 (zh) * | 2018-01-09 | 2019-07-18 | 深圳大学 | 基于弱监督时空级联神经网络的显著目标检测方法及系统 |
| CN110366029B (zh) * | 2019-07-04 | 2021-08-24 | 中国科学院深圳先进技术研究院 | 一种视频间插入图像帧的方法、系统及电子设备 |
| CN112634429B (zh) * | 2019-10-09 | 2022-12-09 | 四川大学 | 基于混合深度生成模型的岩心三维图像重建方法 |
| CN110830848B (zh) * | 2019-11-04 | 2021-12-07 | 上海眼控科技股份有限公司 | 图像插值方法、装置、计算机设备和存储介质 |
| US11238650B2 (en) * | 2020-03-13 | 2022-02-01 | Nvidia Corporation | Self-supervised single-view 3D reconstruction via semantic consistency |
| WO2021184153A1 (zh) * | 2020-03-16 | 2021-09-23 | 阿里巴巴集团控股有限公司 | 摘要视频的生成方法、装置和服务器 |
| CN111667401B (zh) * | 2020-06-08 | 2022-11-29 | 武汉理工大学 | 多层次渐变图像风格迁移方法及系统 |
| CN112200739B (zh) * | 2020-09-30 | 2024-11-15 | 北京大米科技有限公司 | 一种视频处理的方法、装置、可读存储介质和电子设备 |
| CN113365110B (zh) * | 2021-07-14 | 2023-01-31 | 北京百度网讯科技有限公司 | 模型训练、视频插帧方法,装置,设备以及存储介质 |
-
2021
- 2021-12-24 CN CN202111609441.8A patent/CN114255169A/zh active Pending
-
2022
- 2022-12-22 JP JP2024538088A patent/JP7794530B2/ja active Active
- 2022-12-22 WO PCT/SG2022/050927 patent/WO2023121571A2/zh not_active Ceased
- 2022-12-22 EP EP22912123.1A patent/EP4435724A4/en active Pending
- 2022-12-22 US US18/723,150 patent/US20250054271A1/en active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20190228273A1 (en) | 2018-01-25 | 2019-07-25 | Adobe Inc. | Identifying parameter image adjustments using image variation and sequential processing |
| CN109905624A (zh) | 2019-03-01 | 2019-06-18 | 北京大学深圳研究生院 | 一种视频帧插值方法、装置及设备 |
| US20210279840A1 (en) | 2020-03-05 | 2021-09-09 | Zhixiang Chi | Systems and methods for multi-frame video frame interpolation |
| CN111654723A (zh) | 2020-05-14 | 2020-09-11 | 北京百度网讯科技有限公司 | 视频质量提升方法、装置、电子设备和存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP4435724A2 (en) | 2024-09-25 |
| US20250054271A1 (en) | 2025-02-13 |
| WO2023121571A3 (zh) | 2023-09-21 |
| WO2023121571A2 (zh) | 2023-06-29 |
| JP2025500976A (ja) | 2025-01-15 |
| EP4435724A4 (en) | 2025-03-26 |
| CN114255169A (zh) | 2022-03-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110413812B (zh) | 神经网络模型的训练方法、装置、电子设备及存储介质 | |
| WO2022005611A1 (en) | Image super-resolution reconstructing | |
| CN114582329B (zh) | 语音识别方法、装置、计算机可读介质及电子设备 | |
| CN111968647B (zh) | 语音识别方法、装置、介质及电子设备 | |
| CN110009101B (zh) | 用于生成量化神经网络的方法和装置 | |
| CN110298851B (zh) | 人体分割神经网络的训练方法及设备 | |
| CN112070888B (zh) | 图像生成方法、装置、设备和计算机可读介质 | |
| US20240386640A1 (en) | Method, apparatus, device and storage medium for generating character style profile image | |
| US20240037349A1 (en) | Model training method and apparatus, machine translation method and apparatus, and device and storage medium | |
| CN112330788B (zh) | 图像处理方法、装置、可读介质及电子设备 | |
| CN112752118B (zh) | 视频生成方法、装置、设备及存储介质 | |
| CN117319705A (zh) | 视频生成方法、装置、介质及电子设备 | |
| US20240046955A1 (en) | Voice extraction method and apparatus, and electronic device | |
| CN112348910B (zh) | 获取图像的方法、装置、设备和计算机可读介质 | |
| CN114495901B (zh) | 语音合成方法、装置、存储介质及电子设备 | |
| JP7794530B2 (ja) | ビデオ生成方法及び機器 | |
| CN111402133A (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
| CN110717467A (zh) | 头部姿势的估计方法、装置、设备及存储介质 | |
| CN112488947B (zh) | 模型训练和图像处理方法、装置、设备和计算机可读介质 | |
| CN111680754B (zh) | 图像分类方法、装置、电子设备及计算机可读存储介质 | |
| CN118945415A (zh) | 一种视频生成方法、装置、电子设备、计算机可读介质 | |
| CN111626044B (zh) | 文本生成方法、装置、电子设备及计算机可读存储介质 | |
| CN119649801A (zh) | 用于训练音频处理模型的方法、装置、设备和存储介质 | |
| CN116188256A (zh) | 超分图像处理方法、装置、设备及介质 | |
| US20250086758A1 (en) | Image processing method and device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240621 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240621 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250520 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250820 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20251118 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20251212 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7794530 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |