KR102342526B1 - 비디오 컬러화 방법 및 장치 - Google Patents
비디오 컬러화 방법 및 장치 Download PDFInfo
- Publication number
- KR102342526B1 KR102342526B1 KR1020200024503A KR20200024503A KR102342526B1 KR 102342526 B1 KR102342526 B1 KR 102342526B1 KR 1020200024503 A KR1020200024503 A KR 1020200024503A KR 20200024503 A KR20200024503 A KR 20200024503A KR 102342526 B1 KR102342526 B1 KR 102342526B1
- Authority
- KR
- South Korea
- Prior art keywords
- screen
- global
- loss
- video
- colored
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000000605 extraction Methods 0.000 claims abstract description 66
- 238000013135 deep learning Methods 0.000 claims abstract description 33
- 230000003044 adaptive effect Effects 0.000 claims abstract description 25
- 230000006870 function Effects 0.000 claims abstract description 21
- 230000004927 fusion Effects 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims description 29
- 230000011218 segmentation Effects 0.000 claims description 27
- 238000013136 deep learning model Methods 0.000 claims description 17
- 230000002123 temporal effect Effects 0.000 claims description 11
- 230000006872 improvement Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 238000005056 compaction Methods 0.000 claims 2
- 238000012549 training Methods 0.000 description 46
- 238000010586 diagram Methods 0.000 description 16
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 8
- 239000003086 colorant Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000740 bleeding effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 201000003695 Alexia Diseases 0.000 description 1
- 241000752021 Alexia Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 206010013932 dyslexia Diseases 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/43—Conversion of monochrome picture signals to colour picture signals for colour picture display
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
본 실시예는, 다중 흑백 영상(multiple black-and-white image)을 획득하여, 다양한 손실(diverse loss)을 기반으로 사전에 트레이닝된 딥러닝(deep learning) 기반 추론 모델(inference model)에 입력한다. 특성 추출(feature extraction), 적응적 융합 변환(adaptive fusion transform: AFT) 및 특성 개선(feature enhancement) 기능을 포함하는 추론 모델이 컬러화된 비디오를 자동으로 생성하는 비디오 컬러화(video colorization) 장치 및 방법을 제공한다.
Description
도 2는 본 발명의 일 실시예에 따른 비디오 컬러화 장치의 구성요소인 추론 모델의 예시도이다.
도 3은 본 발명의 일 실시예에 따른 DB의 구성도이다.
도 4는 본 발명의 일 실시예에 따른 EH의 구성도이다.
도 5는 본 발명의 일 실시예에 따른 ALP 추출부의 구성도이다.
도 6은 본 발명의 일 실시예에 따른 AGP 추출부의 구성도이다.
도 7은 본 발명의 일 실시예에 따른 학습 모델의 예시도이다.
도 8은 본 발명의 일 실시예에 따른 구별기의 구성도이다.
도 9는 본 발명의 일 실시예에 따른 비디오 컬러화 방법의 순서도이다.
도 10은 본 발명의 일 실시예에 따른 학습 모델에 대한 학습방법의 순서도이다.
102: 밀집특성 추출부 103: 인코더
104: 병목부 105: 디코더
106: 특성개선부
111: 분할추출부 112: 전역특성 추출부
113: ALP 추출부 114: AGP 추출부
700: 학습 모델 701: 색상변환부
702: 제1 구별기 703: 제2 구별기
Claims (15)
- 비디오 컬러화 장치가 이용하는 비디오 컬러화 방법에 있어서,
복수의 흑백 영상(multiple black-and-white images) 중의 하나인 지정 화면(indicated frame)으로부터 분할추출 모델을 이용하여 분할 맵(segmentation map)을 추출하고, 사전에 트레이닝된 딥러닝(deep learning) 기반 ALP 추출부를 이용하여 상기 분할 맵으로부터 ALP(Adaptive Local Parameter)를 생성하는 과정;
상기 지정 화면으로부터 전역특성 추출 모델을 이용하여 전역특성 맵(global feature map)을 추출하고, 사전에 트레이닝된 딥러닝 기반 AGP 추출부를 이용하여 상기 전역특성 맵으로부터 AGP(Adaptive Global Parameter)를 생성하는 과정; 및
적응적 융합 변환(Adaptive Fusion Transform: AFT)에 기반하는, 사전에 트레이닝된 딥러닝 기반 추론 모델을 이용하여 상기 복수의 흑백 영상으로부터 컬러화된 화면(colorized frame)을 생성하는 과정
을 포함하되,
상기 ALP는, 상기 지정 화면의 컬러에 대한 국부적인 특성(local feature)이고,
상기 AGP는, 상기 지정 화면의 컬러에 대한 전역적인 특성(global feature)이며,
상기 AFT는, 상기 ALP 및 상기 AGP의 특성을 반영하여 상기 추론 모델의 내부에서 생성되는 중간 출력을 변환하는 것을 특징으로 하는 비디오 컬러화 방법. - 제1항에 있어서,
상기 AFT는,
상기 중간 출력으로부터 상기 ALP를 이용하여 상기 지정 화면의 국부적인 특성이 반영된 국부특성 개선화면을 생성하고, 상기 중간 출력으로부터 상기 AGP를 이용하여 상기 지정 화면의 전역적인 특성이 반영된 전역특성 개선화면을 생성하며, 상기 국부특성 개선화면과 상기 전역특성 개선화면을 적응적으로(adaptively) 가중합(weighted sum)함으로써 상기 국부적인 특성 및 상기 전역적인 특성을 융합(fusion)하는 것을 특징으로 하는 비디오 컬러화 방법. - 제1항에 있어서,
상기 추론 모델이 상기 컬러화된 화면을 생성하는 과정은,
상기 복수의 흑백 영상의 전역 특성을 융합한 밀집 특성(dense feature)을 생성하는 단계;
상기 밀집 특성을 인코더에 입력하고, 잔차 생성(residue generation) 기능을 이용하여, 잔차 및 인코더 출력을 생성하는 단계, 여기서, 인코더 출력은 상기 밀집 특성이 다운샘플링(down-sampling)되어 생성됨;
상기 잔차 생성 기능을 이용하여 상기 인코더 출력으로부터 병목(bottleneck) 출력을 생성하는 단계;
상기 잔차, 상기 병목 출력, 상기 ALP 및 상기 AGP를 디코더에 입력하여 상기 병목 출력이 업샘플링(up-sampling)된 디코더 출력을 생성하는 단계; 및
상기 디코더 출력의 특성을 개선하여 상기 컬러화된 화면을 생성하는 단계
를 포함하는 것을 특징으로 하는 비디오 컬러화 방법. - 제3항에 있어서,
상기 디코더는,
적어도 하나의 RUB(Residual Up Block)와 RSB(Residual Skip Block)의 짝(pair), 및 상기 RSB 각각의 후단에 상기 AFT를 수행하는 레이어를 포함하되,
상기 RUB는 입력에 대한 업샘플링을 수행하고, 상기 RSB는 스킵 경로를 이용하여 상기 인코더로부터 전달된 잔차와 상기 RUB의 출력을 결합하여 상기 중간 출력을 생성하는 것을 특징으로 하는 비디오 컬러화 방법. - 제1항에 있어서,
상기 분할추출 모델 및 상기 전역특성 추출 모델 각각은,
딥러닝 모델로 구현되되, 상기 추론 모델에 대한 학습을 수행하기 전에 기트레이닝되는(pre-trained) 것을 특징으로 하는 비디오 컬러화 방법. - 비디오 컬러화 장치가 수행하는 학습방법에 있어서,
딥러닝 기반 추론 모델인 생성기를 이용하여 복수의 흑백 영상(multiple black-and-white images)으로부터 컬러화된 화면(colorized frame)을 생성하는 과정;
딥러닝 기반 제1 구별기를 이용하여 상기 컬러화된 화면과 GT(Ground Truth) 화면을 구별하는 과정;
딥러닝 기반 제2 구별기를 이용하여 상기 컬러화된 화면이 포함된 복수의 컬러 영상(multiple color image)과 복수의 GT 컬러 영상 간의 시간적 일관성(temporal coherence)을 구별하는 과정;
상기 컬러화된 화면, 상기 GT 화면, 및 상기 복수의 GT 컬러 영상을 기반으로 생성되는 총손실(total loss)을 산정하는 과정, 여기서, 총손실은, 상기 생성기, 상기 제1 구별기, 및 상기 제2 구별기를 포함하는 GAN 구조에 따른 손실 항목, 및 상기 컬러화된 화면과 상기 GT 화면에 기반하는 놈(norm) 기반 손실 항목을 포함함; 및
상기 총손실에 포함된 손실 항목의 전부 또는 일부가 감소되는 방향으로 상기 생성기, 상기 제1 구별기 및 상기 제2 구별기 중 적어도 하나의 파라미터를 업데이트하는 과정
을 포함하는 것을 특징으로 하는 학습방법. - 제6항에 있어서,
상기 복수의 흑백 영상 중의 하나인 지정 화면(indicated frame)으로부터 분할추출 모델을 이용하여 분할 맵(segmentation map)을 추출하고, 딥러닝(deep learning) 기반 ALP 추출부를 이용하여 상기 분할 맵으로부터 상기 ALP를 생성하는 과정; 및
상기 지정 화면으로부터 전역특성 추출 모델을 이용하여 전역특성 맵(global feature map)을 추출하고, 딥러닝 기반 AGP 추출부를 이용하여 상기 전역특성 맵으로부터 상기 AGP를 생성하는 과정
을 더 포함하여,
상기 추론 모델은, ALP(Adaptive Local Parameter) 및 AGP(Adaptive Global Parameter)를 이용하는 적응적 융합 변환(Adaptive Fusion Transform: AFT)에 기반하여 동작하되,
상기 ALP는, 상기 지정 화면의 컬러에 대한 국부적인 특성(local feature)이고,
상기 AGP는, 상기 지정 화면의 컬러에 대한 전역적인 특성(global feature)이며,
상기 AFT는, 상기 ALP 및 상기 AGP의 특성을 반영하여 상기 추론 모델의 내부에서 생성되는 중간 출력을 변환하는 것을 특징으로 하는 학습방법. - 제7항에 있어서,
상기 총손실은,
상기 컬러화된 화면과 상기 GT 화면에 대한 상기 제1 구별기의 출력, 상기 복수의 컬러 영상과 상기 복수의 GT 컬러 영상에 대한 상기 제2 구별기의 출력, 및 상기 컬러화된 화면을 기반으로 생성되는 대립적 손실(adversarial loss);
상기 컬러화된 화면과 상기 GT 화면에 대하여 상기 제1 구별기가 생성하는 특성 맵(feature map) 간의 차이, 및 상기 복수의 컬러 영상과 상기 복수의 GT 컬러 영상에 대하여 상기 제2 구별기가 생성하는 특성 맵(feature map) 간의 차이에 기반하는 특성 매칭 손실(feature-matching loss); 및
상기 컬러화된 화면과 상기 GT 화면 간의 차이에 기반하는 재구성 손실(reconstruction loss)
을 포함하는 것을 특징으로 하는 학습방법. - 제8항에 있어서,
상기 총손실은,
상기 컬러화된 화면으로부터 생성되는 전역특성 맵과 상기 GT 화면으로부터 생성되는 전역특성 맵에 대한 평균 간의 차이, 및 상기 컬러화된 화면으로부터 생성되는 전역특성 맵과 상기 GT 화면으로부터 생성되는 전역특성 맵에 대한 표준편차의 간의 차이에 기반하는 스타일 손실(style loss);
상기 컬러화된 화면으로부터 생성되는 전역특성 맵이 정규화된 맵(normalized map), 및 상기 GT 화면으로부터 생성되는 전역특성 맵이 정규화된 맵 간의 차이에 기반하는 콘텐츠 손실(content loss); 및
상기 컬러화된 화면과 상기 GT 화면으로부터 생성되는 전역특성 맵 간의 차이에 기반하는 인지 손실(perceptual loss)
을 더 포함하는 것을 특징으로 하는 학습방법. - 제8항에 있어서,
상기 총손실은,
소벨 연산자(Sobel operator)를 이용하여 산정되는 경계 손실(edge loss)을 포함하되, 상기 경계 손실은 상기 컬러화된 화면과 상기 GT 화면의 경계 맵(edge map) 간의 차이에 기반하는 것을 특징으로 하는 학습방법. - 제7항에 있어서,
상기 분할추출 모델 및 상기 전역특성 추출 모델 각각은,
딥러닝 기반 신경망(neural network)으로 구현되고, 상기 비디오 컬러화 장치에 대한 학습을 수행하기 전에 기트레이닝되는(pre-trained) 것을 특징으로 하는 학습방법. - 삭제
- 제7항에 있어서,
상기 ALP 추출부 및 상기 AGP 추출부 각각은,
딥러닝 모델로 구현되고, 상기 생성기, 상기 제1 구별기 및 상기 제2 구별기와 함께 트레이닝되는 것을 특징으로 하는 학습방법. - 제1항 내지 제5항 중 어느 한 항에 따른 비디오 컬러화 방법이 포함하는 각 단계를 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터프로그램.
- 제6항 내지 제11항, 또는 제13 중 어느 한 항에 따른 비디오 컬러화 장치가 수행하는 학습방법이 포함하는 각 단계를 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터프로그램.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200024503A KR102342526B1 (ko) | 2020-02-27 | 2020-02-27 | 비디오 컬러화 방법 및 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200024503A KR102342526B1 (ko) | 2020-02-27 | 2020-02-27 | 비디오 컬러화 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210109719A KR20210109719A (ko) | 2021-09-07 |
KR102342526B1 true KR102342526B1 (ko) | 2021-12-23 |
Family
ID=77797012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200024503A KR102342526B1 (ko) | 2020-02-27 | 2020-02-27 | 비디오 컬러화 방법 및 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102342526B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024019337A1 (en) * | 2022-07-22 | 2024-01-25 | Samsung Electronics Co., Ltd. | Video enhancement method and apparatus |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116051385A (zh) * | 2021-10-28 | 2023-05-02 | 北京三星通信技术研究有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN115100435B (zh) * | 2022-07-21 | 2024-09-06 | 西北工业大学 | 基于有限数据多尺度目标学习的图像着色方法及其系统 |
KR102692855B1 (ko) * | 2023-06-05 | 2024-08-08 | 인하대학교 산학협력단 | 그래픽스 이미지의 효율적인 초해상도 학습을 위한 지식 증류 활용 방법 및 시스템 |
CN116823973B (zh) * | 2023-08-25 | 2023-11-21 | 湖南快乐阳光互动娱乐传媒有限公司 | 一种黑白视频上色方法、装置及计算机可读介质 |
CN119205941A (zh) * | 2024-11-27 | 2024-12-27 | 北京网藤科技有限公司 | 一种基于多域融合的图像重着色检测方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019117558A (ja) | 2017-12-27 | 2019-07-18 | 日本放送協会 | カラー情報推定モデル生成装置、画像カラー化装置およびそれらのプログラム |
JP2019153061A (ja) | 2018-03-02 | 2019-09-12 | キヤノン株式会社 | 画像処理装置、その制御方法、及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170017911A (ko) * | 2014-06-12 | 2017-02-15 | 톰슨 라이센싱 | 디지털 이미지들의 컬러 프로세싱을 위한 방법들 및 시스템들 |
-
2020
- 2020-02-27 KR KR1020200024503A patent/KR102342526B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019117558A (ja) | 2017-12-27 | 2019-07-18 | 日本放送協会 | カラー情報推定モデル生成装置、画像カラー化装置およびそれらのプログラム |
JP2019153061A (ja) | 2018-03-02 | 2019-09-12 | キヤノン株式会社 | 画像処理装置、その制御方法、及びプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024019337A1 (en) * | 2022-07-22 | 2024-01-25 | Samsung Electronics Co., Ltd. | Video enhancement method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
KR20210109719A (ko) | 2021-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102342526B1 (ko) | 비디오 컬러화 방법 및 장치 | |
US12182976B2 (en) | Image processing method, smart device, and computer readable storage medium | |
CN113066017B (zh) | 一种图像增强方法、模型训练方法及设备 | |
US9767596B2 (en) | Method and apparatus for processing depth image | |
CN109102462A (zh) | 一种基于深度学习的视频超分辨率重建方法 | |
US11908241B2 (en) | Method for correction of the eyes image using machine learning and method for machine learning | |
KR102493492B1 (ko) | 초해상도 모델의 메타 러닝을 통한 빠른 적응 방법 및 장치 | |
US12118810B2 (en) | Spatiotemporal recycling network | |
WO2021114870A1 (zh) | 视差估计系统、方法、电子设备及计算机可读存储介质 | |
US20240119697A1 (en) | Neural Semantic Fields for Generalizable Semantic Segmentation of 3D Scenes | |
Liu et al. | Bit-depth enhancement via convolutional neural network | |
CN106489169A (zh) | 用于放大图像的方法和装置 | |
Arulkumar et al. | Super resolution and demosaicing based self learning adaptive dictionary image denoising framework | |
Suárez et al. | Toward a Thermal Image-Like Representation. | |
Shabaninia et al. | High‐order Markov random field for single depth image super‐resolution | |
CN115049559A (zh) | 模型训练、人脸图像处理、人脸模型处理方法及装置、电子设备及可读存储介质 | |
US20230145498A1 (en) | Image reprojection and multi-image inpainting based on geometric depth parameters | |
US12169908B2 (en) | Two-dimensional (2D) feature database generation | |
Li et al. | A review of image colourisation | |
CN111008555B (zh) | 一种无人机图像弱小目标增强提取方法 | |
Gopalakrishnan et al. | A ‘deep’review of video super-resolution | |
KR20210098398A (ko) | 영상의 업샘플링 방법 및 장치 | |
Zini et al. | On the impact of rain over semantic segmentation of street scenes | |
CN118799692B (zh) | 基于深度学习的红外与可见光图像光照优化融合方法 | |
JP2016085694A (ja) | 画像処理装置及びその制御方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20200227 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210529 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20211015 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20211220 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20211220 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20240919 Start annual number: 4 End annual number: 4 |