KR102584484B1 - 발화 합성 영상 생성 장치 및 방법 - Google Patents
발화 합성 영상 생성 장치 및 방법 Download PDFInfo
- Publication number
- KR102584484B1 KR102584484B1 KR1020220019074A KR20220019074A KR102584484B1 KR 102584484 B1 KR102584484 B1 KR 102584484B1 KR 1020220019074 A KR1020220019074 A KR 1020220019074A KR 20220019074 A KR20220019074 A KR 20220019074A KR 102584484 B1 KR102584484 B1 KR 102584484B1
- Authority
- KR
- South Korea
- Prior art keywords
- geometric transformation
- image
- local
- global
- prediction unit
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 230000009466 transformation Effects 0.000 claims abstract description 423
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 57
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 57
- 238000010801 machine learning Methods 0.000 claims abstract description 20
- 238000009826 distribution Methods 0.000 claims description 40
- 238000013528 artificial neural network Methods 0.000 claims description 35
- 238000000844 transformation Methods 0.000 claims description 35
- 230000008569 process Effects 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 6
- 230000001815 facial effect Effects 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 3
- 230000003287 optical effect Effects 0.000 description 35
- 239000011159 matrix material Substances 0.000 description 22
- 238000010586 diagram Methods 0.000 description 10
- 210000003128 head Anatomy 0.000 description 9
- 210000004709 eyebrow Anatomy 0.000 description 8
- 239000000284 extract Substances 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000004886 head movement Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000193 eyeblink Effects 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/10—Transforming into visible information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/205—3D [Three Dimensional] animation driven by audio data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G06T5/001—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/269—Analysis of motion using gradient-based methods
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/055—Time compression or expansion for synchronising with other signals, e.g. video signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
Description
도 2는 본 발명의 다른 실시예에 따른 발화 합성 영상 생성 장치의 구성을 나타낸 블록도
도 3은 본 발명의 일 실시예에서 순차 음성 신호로부터 인물의 전역적 기하 변환을 추정하기 위한 구성을 나타낸 도면
도 4는 본 발명의 또 다른 실시예에 따른 발화 합성 영상 생성 장치의 구성을 나타낸 블록도
도 5는 예시적인 실시예들에서 사용되기에 적합한 컴퓨팅 장치를 포함하는 컴퓨팅 환경을 예시하여 설명하기 위한 블록도
102 : 제1 전역적 기하 변환 예측부
104 : 제1 지역적 기하 변환 예측부
106 : 기하 변환 조합부
108 : 광학 흐름 예측부
110 : 영상 생성부
112 : 제2 지역적 기하 변환 예측부
114 : 제2 전역적 기하 변환 예측부
Claims (16)
- 머신 러닝 기반의 발화 합성 영상 생성 장치로서,
동일 인물이 포함된 소스 이미지 및 타겟 이미지를 각각 입력 받고, 상기 소스 이미지 및 상기 타겟 이미지에 기반하여 상기 소스 이미지 및 상기 타겟 이미지 사이의 상기 인물의 전역적 움직임에 대한 전역적 기하 변환을 예측하도록 학습되는 제1 전역적 기하 변환 예측부;
기 설정된 입력 데이터에 기반하여 상기 소스 이미지 및 상기 타겟 이미지 사이의 상기 인물의 지역적 움직임에 대한 지역적 기하 변환을 예측하도록 학습되는 지역적 기하 변환 예측부;
상기 전역적 기하 변환 및 상기 지역적 기하 변환을 조합하여 상기 인물의 전체 움직임에 대한 전체 움직임 기하 변환을 산출하는 기하 변환 조합부; 및
상기 소스 이미지 및 상기 전체 움직임 기하 변환에 기반하여 상기 타겟 이미지를 복원하도록 학습되는 영상 생성부를 포함하고,
상기 제1 전역적 기하 변환 예측부는,
상기 소스 이미지에 기반하여 기 설정된 기준 확률 분포에서 소스 이미지 히트맵으로의 기하 변환을 추출하고, 상기 타겟 이미지에 기반하여 기 설정된 기준 확률 분포에서 타겟 이미지 히트맵으로의 기하 변환을 추출하며, 상기 기준 확률 분포에서 소스 이미지 히트맵으로의 기하 변환 및 상기 기준 확률 분포에서 타겟 이미지 히트맵으로의 기하 변환에 기반하여 상기 전역적 기하 변환을 산출하는, 발화 합성 영상 생성 장치.
- 청구항 1에 있어서,
상기 전역적 움직임은, 상기 인물의 기 설정된 임계량 이상의 움직임이고,
상기 지역적 움직임은, 상기 인물의 발화 시 얼굴 움직임인, 발화 합성 영상 생성 장치.
- 삭제
- 청구항 2에 있어서,
상기 소스 이미지 히트맵은, 상기 소스 이미지에서 각 픽셀이 상기 인물의 전역적 움직임과 관련된 픽셀인지에 대한 이미지 공간 상의 확률 분포맵이고,
상기 타겟 이미지 히트맵은, 상기 타겟 이미지에서 각 픽셀이 상기 인물의 전역적 움직임과 관련된 픽셀인지에 대한 이미지 공간 상의 확률 분포맵인, 발화 합성 영상 생성 장치.
- 청구항 2에 있어서,
상기 지역적 기하 변환 예측부는,
기 설정된 입력 데이터에 기반하여 상기 소스 이미지 및 상기 타겟 이미지 사이의 상기 인물의 지역적 발화 움직임에 대한 제1 지역적 기하 변환을 예측하도록 학습되는 제1 지역적 기하 변환 예측부를 포함하며,
상기 지역적 발화 움직임은, 상기 인물의 지역적 움직임 중 발화와 관련된 움직임인, 발화 합성 영상 생성 장치.
- 청구항 5에 있어서,
상기 제1 지역적 기하 변환 예측부는,
상기 소스 이미지 및 상기 타겟 이미지를 각각 입력 받고, 상기 소스 이미지 및 상기 타겟 이미지에 기반하여 상기 제1 지역적 기하 변환을 예측하도록 학습되는, 발화 합성 영상 생성 장치.
- 청구항 6에 있어서,
상기 제1 지역적 기하 변환 예측부는,
상기 소스 이미지로부터 상기 인물의 지역적 발화 움직임에 대한 복수 개의 기하 변환인 소스 지역적 기하 변환을 추정하고, 상기 타겟 이미지로부터 상기 인물의 지역적 발화 움직임에 대한 복수 개의 기하 변환인 타겟 지역적 기하 변환을 추정하며, 상기 소스 지역적 기하 변환 및 상기 타겟 지역적 기하 변환에 기반하여 상기 제1 지역적 기하 변환을 산출하는, 발화 합성 영상 생성 장치.
- 청구항 5에 있어서,
상기 지역적 기하 변환 예측부는,
기 설정된 입력 데이터에 기반하여 상기 소스 이미지 및 상기 타겟 이미지 사이의 상기 인물의 지역적 비발화 움직임에 대한 제2 지역적 기하 변환을 예측하도록 학습되는 제2 지역적 기하 변환 예측부를 더 포함하며,
상기 지역적 비발화 움직임은, 상기 인물의 지역적 움직임 중 발화와 관련되지 않은 움직임인, 발화 합성 영상 생성 장치.
- 청구항 8에 있어서,
상기 제2 지역적 기하 변환 예측부는,
상기 소스 이미지에서 상기 인물의 발화와 관련되지 않은 움직임만을 포함하는 소스 부분 이미지 및 상기 타겟 이미지에서 상기 인물의 발화와 관련되지 않은 움직임만을 포함하는 타겟 부분 이미지를 각각 입력 받고, 상기 소스 부분 이미지 및 상기 타겟 부분 이미지에 기반하여 상기 제2 지역적 기하 변환을 예측하도록 학습되는, 발화 합성 영상 생성 장치.
- 청구항 9에 있어서,
상기 제2 지역적 기하 변환 예측부는,
상기 소스 부분 이미지로부터 상기 인물의 지역적 비발화 움직임에 대한 복수 개의 기하 변환인 소스 부분 기하 변환을 추정하고, 상기 타겟 부분 이미지로부터 상기 인물의 지역적 비발화 움직임에 대한 복수 개의 기하 변환인 타겟 부분 기하 변환을 추정하며, 상기 소스 부분 기하 변환 및 상기 타겟 부분 기하 변환에 기반하여 상기 제2 지역적 기하 변환을 산출하는, 발화 합성 영상 생성 장치.
- 청구항 8에 있어서,
상기 기하 변환 조합부는,
상기 제1 지역적 기하 변환과 상기 제2 지역적 기하 변환을 조합하여 전체 지역적 기하 변환을 산출하고, 상기 전체 지역적 기하 변환과 상기 전역적 기하 변환을 조합하여 상기 전체 움직임 기하 변환을 산출하는, 발화 합성 영상 생성 장치.
- 청구항 1에 있어서,
상기 제1 전역적 기하 변환 예측부는,
n(n은 2 이상의 자연수)개의 프레임을 가지는 영상이 입력되는 경우, 기 설정된 기준 확률 분포에서 상기 영상 중 임의의 i(i∈{1, 2,..., n})번째 프레임 히트맵으로의 기하 변환을 각각 산출하고, 상기 기준 확률 분포에서 i번째 프레임 히트맵으로의 기하 변환에 기반하여 상기 영상 중 인접한 두 프레임 사이의 전역적 기하 변환을 산출하는, 발화 합성 영상 생성 장치.
- 청구항 12에 있어서,
상기 발화 합성 영상 생성 장치는,
상기 n개의 프레임에 대응하는 순차 음성 신호를 입력 받고, 상기 순차 음성 신호로부터 상기 영상 중 인접한 두 프레임 사이의 전역적 기하 변환을 예측하도록 학습되는 제2 전역적 기하 변환 예측부를 더 포함하는, 발화 합성 영상 생성 장치.
- 청구항 13에 있어서,
상기 제2 전역적 기하 변환 예측부는,
상기 제2 전역적 기하 변환 예측부에서 예측된 상기 인접한 두 프레임 사이의 전역적 기하 변환과 상기 제1 전역적 기하 변환 예측부에서 산출한 상기 인접한 두 프레임 사이의 전역적 기하 변환 간의 차이가 최소화 되도록 인공 신경망의 파라미터를 조절하는, 발화 합성 영상 생성 장치.
- 청구항 14에 있어서,
발화 합성 영상 생성의 테스트 과정에서,
상기 제2 전역적 기하 변환 예측부는, 소정 인물의 순차 음성 신호를 입력 받고, 상기 순차 음성 신호로부터 상기 순차 음성 신호에 대응하는 영상의 인접하는 두 프레임 사이의 전역적 기하 변환을 산출하며, 상기 인접하는 두 프레임 사이의 전역적 기하 변환에 기반하여 기 설정된 타겟 프레임과 기 설정된 시작 프레임 사이의 전역적 기하 변환을 산출하고,
상기 지역적 기하 변환 예측부는, 상기 시작 프레임 및 상기 타겟 프레임을 각각 입력 받고, 상기 시작 프레임 및 상기 타겟 프레임에 기반하여 상기 타겟 프레임과 상기 시작 프레임 사이의 지역적 기하 변환을 산출하며,
상기 기하 변환 조합부는, 상기 전역적 기하 변환 및 상기 지역적 기하 변환을 조합하여 전체 움직임 기하 변환을 산출하고,
상기 영상 생성부는, 상기 시작 프레임 및 상기 전체 움직임 기하 변환을 입력 받고, 상기 시작 프레임 및 상기 전체 움직임 기하 변환으로부터 상기 타겟 프레임을 복원하여 생성하는, 발화 합성 영상 생성 장치.
- 하나 이상의 프로세서들, 및
상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되며 머신 러닝 기반의 발화 합성 영상 생성 방법으로서,
제1 전역적 기하 변환 예측부에서, 동일 인물이 포함된 소스 이미지 및 타겟 이미지를 각각 입력 받고, 상기 소스 이미지 및 상기 타겟 이미지에 기반하여 상기 소스 이미지 및 상기 타겟 이미지 사이의 상기 인물의 전역적 움직임에 대한 전역적 기하 변환을 예측하도록 학습되는 단계;
지역적 기하 변환 예측부에서, 기 설정된 입력 데이터에 기반하여 상기 소스 이미지 및 상기 타겟 이미지 사이의 상기 인물의 지역적 움직임에 대한 지역적 기하 변환을 예측하도록 학습되는 단계;
기하 변환 조합부에서, 상기 전역적 기하 변환 및 상기 지역적 기하 변환을 조합하여 상기 인물의 전체 움직임에 대한 전체 움직임 기하 변환을 산출하는 단계; 및
영상 생성부에서, 상기 소스 이미지 및 상기 전체 움직임 기하 변환에 기반하여 상기 타겟 이미지를 복원하도록 학습되는 단계를 포함하고,
상기 제1 전역적 기하 변환 예측부에서, 상기 소스 이미지에 기반하여 기 설정된 기준 확률 분포에서 소스 이미지 히트맵으로의 기하 변환을 추출하고, 상기 타겟 이미지에 기반하여 기 설정된 기준 확률 분포에서 타겟 이미지 히트맵으로의 기하 변환을 추출하며, 상기 기준 확률 분포에서 소스 이미지 히트맵으로의 기하 변환 및 상기 기준 확률 분포에서 타겟 이미지 히트맵으로의 기하 변환에 기반하여 상기 전역적 기하 변환을 산출하는, 발화 합성 영상 생성 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220019074A KR102584484B1 (ko) | 2022-02-14 | 2022-02-14 | 발화 합성 영상 생성 장치 및 방법 |
PCT/KR2022/003608 WO2023153554A1 (ko) | 2022-02-14 | 2022-03-15 | 발화 합성 영상 생성 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220019074A KR102584484B1 (ko) | 2022-02-14 | 2022-02-14 | 발화 합성 영상 생성 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230122421A KR20230122421A (ko) | 2023-08-22 |
KR102584484B1 true KR102584484B1 (ko) | 2023-10-04 |
Family
ID=87564462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220019074A KR102584484B1 (ko) | 2022-02-14 | 2022-02-14 | 발화 합성 영상 생성 장치 및 방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102584484B1 (ko) |
WO (1) | WO2023153554A1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200393943A1 (en) * | 2019-01-25 | 2020-12-17 | Google Llc | Image display with selective depiction of motion |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002031772A2 (en) * | 2000-10-13 | 2002-04-18 | Erdem Tanju A | Method for tracking motion of a face |
KR101177408B1 (ko) | 2010-09-16 | 2012-08-27 | 광운대학교 산학협력단 | 시청자의 시점에 따라 홀로그래픽 영상을 복원하는 다시점 기반 대화형 홀로그래픽 복원 장치 및 시스템 |
WO2018097590A1 (ko) * | 2016-11-22 | 2018-05-31 | 한국전자통신연구원 | 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체 |
KR102360839B1 (ko) * | 2019-06-21 | 2022-02-09 | 주식회사 딥브레인에이아이 | 머신 러닝 기반의 발화 동영상 생성 방법 및 장치 |
-
2022
- 2022-02-14 KR KR1020220019074A patent/KR102584484B1/ko active IP Right Grant
- 2022-03-15 WO PCT/KR2022/003608 patent/WO2023153554A1/ko active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200393943A1 (en) * | 2019-01-25 | 2020-12-17 | Google Llc | Image display with selective depiction of motion |
Non-Patent Citations (1)
Title |
---|
Lijuan Wang et al., ‘HIGH QUALITY LIP-SYNC ANIMATION FOR 3D PHOTO-REALISTIC TALKING HEAD’, ICASSP 2012, March 2012.* |
Also Published As
Publication number | Publication date |
---|---|
WO2023153554A1 (ko) | 2023-08-17 |
KR20230122421A (ko) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11775829B2 (en) | Generative adversarial neural network assisted video reconstruction | |
US11625613B2 (en) | Generative adversarial neural network assisted compression and broadcast | |
KR101558202B1 (ko) | 아바타를 이용한 애니메이션 생성 장치 및 방법 | |
KR102501773B1 (ko) | 랜드마크를 함께 생성하는 발화 동영상 생성 장치 및 방법 | |
KR102346755B1 (ko) | 음성 신호를 이용한 발화 동영상 생성 방법 및 장치 | |
KR102643604B1 (ko) | 발화 동영상 생성 방법 및 장치 | |
KR102437039B1 (ko) | 영상 생성을 위한 학습 장치 및 방법 | |
WO2021021554A1 (en) | Real time perspective correction on faces | |
CN112149651B (zh) | 一种基于深度学习的人脸表情识别方法、装置及设备 | |
KR102540763B1 (ko) | 머신 러닝 기반의 립싱크 영상 생성을 위한 학습 방법 및 이를 수행하기 위한 립싱크 영상 생성 장치 | |
CN111401101A (zh) | 基于人像的视频生成系统 | |
Rebol et al. | Real-time gesture animation generation from speech for virtual human interaction | |
KR102584485B1 (ko) | 발화 합성 영상 생성 장치 및 방법 | |
KR102540759B1 (ko) | 발화 합성 영상 생성 장치 및 방법 | |
CN118250529B (zh) | 一种语音驱动的2d数字人视频生成方法及可读存储介质 | |
KR102584484B1 (ko) | 발화 합성 영상 생성 장치 및 방법 | |
KR102612625B1 (ko) | 신경망 기반의 특징점 학습 장치 및 방법 | |
KR102540756B1 (ko) | 발화 합성 영상 생성 장치 및 방법 | |
Koumparoulis et al. | Audio-assisted image inpainting for talking faces | |
US20240013357A1 (en) | Recognition system, recognition method, program, learning method, trained model, distillation model and training data set generation method | |
KR102514580B1 (ko) | 영상 전환 방법, 장치 및 컴퓨터 프로그램 | |
KR102767122B1 (ko) | 영상 품질을 향상시킬 수 있는 영상 합성 장치 및 방법 | |
US20250005851A1 (en) | Generating face models based on image and audio data | |
KR102767128B1 (ko) | 영상 품질을 향상시킬 수 있는 영상 합성 장치 및 방법 | |
US20240378783A1 (en) | Image processing device, learning device, image processing method, learning method, image processing program, and learning program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20220214 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20230327 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20230919 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230925 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20230925 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |