KR20220124528A - 전자 장치에서 이미지의 압축 품질에 기반한 이미지 보정 방법 및 장치 - Google Patents
전자 장치에서 이미지의 압축 품질에 기반한 이미지 보정 방법 및 장치 Download PDFInfo
- Publication number
- KR20220124528A KR20220124528A KR1020210028305A KR20210028305A KR20220124528A KR 20220124528 A KR20220124528 A KR 20220124528A KR 1020210028305 A KR1020210028305 A KR 1020210028305A KR 20210028305 A KR20210028305 A KR 20210028305A KR 20220124528 A KR20220124528 A KR 20220124528A
- Authority
- KR
- South Korea
- Prior art keywords
- image
- electronic device
- compression quality
- compression
- processor
- Prior art date
Links
- 238000007906 compression Methods 0.000 title claims abstract description 348
- 230000006835 compression Effects 0.000 title claims abstract description 348
- 238000000034 method Methods 0.000 title claims abstract description 90
- 238000012545 processing Methods 0.000 claims abstract description 55
- 238000003702 image correction Methods 0.000 claims abstract description 52
- 230000008569 process Effects 0.000 claims abstract description 17
- 238000012937 correction Methods 0.000 claims description 90
- 238000012805 post-processing Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 description 54
- 238000013528 artificial neural network Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 20
- 238000000605 extraction Methods 0.000 description 18
- 230000006872 improvement Effects 0.000 description 16
- 238000013527 convolutional neural network Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 238000003708 edge detection Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000013145 classification model Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000003796 beauty Effects 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 244000240602 cacao Species 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000446 fuel Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003155 kinesthetic effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G06T5/001—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04842—Selection of displayed objects or displayed text elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
- G06F3/04845—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour
-
- G06K9/6267—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/60—Image enhancement or restoration using machine learning, e.g. neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
- G06V10/993—Evaluation of the quality of the acquired pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2203/00—Indexing scheme relating to G06F3/00 - G06F3/048
- G06F2203/048—Indexing scheme relating to G06F3/048
- G06F2203/04806—Zoom, i.e. interaction techniques or interactors for controlling the zooming operation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- User Interface Of Digital Computer (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
본 개시의 다양한 실시예들은 전자 장치에서 압축 이미지의 압축 품질을 분류하고, 압축 품질에 대응하게 학습된 노이즈 제거 모델에 기반하여 압축 이미지의 압축 아티팩트를 제거하여 이미지 보정을 처리하는 방법 및 장치에 관하여 개시한다. 다양한 실시예들에 따른 전자 장치는, 디스플레이 모듈, 메모리, 및 프로세서를 포함하고, 상기 프로세서는, 상기 디스플레이 모듈을 통해 적어도 하나의 이미지를 포함하는 화면을 표시하고, 상기 적어도 하나의 이미지의 압축 품질을 결정하고, 결정된 압축 품질에 대응하게 학습된 노이즈 제거 모델을 선택하고, 선택된 노이즈 제거 모델에 기반하여 이미지 보정을 처리하고, 및 보정된 이미지를 상기 디스플레이 모듈을 통해 표시하도록 할 수 있다. 다양한 실시예들이 가능하다.
Description
본 개시의 다양한 실시예들은 전자 장치에서 이미지를 보정하는 방법 및 장치에 관하여 개시한다.
전자 장치는 기능이 다양화됨에 따라, 예를 들어, 사진이나 동영상의 촬영, 음악이나 동영상 파일의 재생, 게임, 방송 수신, 또는 통화(call) 기능과 같은 복합적인 기능들을 갖춘 멀티미디어 기기(multimedia player) 형태로 구현되고 있다. 이러한 전자 장치는 디스플레이(display)를 구비하며, 디스플레이에 기반하여 기능들에 관련된 화면을 표시할 수 있다.
전자 장치는, 전자 장치에 저장된 이미지 또는 외부 장치(예: 서버 및/또는 다른 전자 장치)로부터 획득된 이미지를 디스플레이를 통해 표시할 수 있다. 최근에는, 전자 장치는 디스플레이의 해상도 증가 및/또는 물리적인 크기(예: 디스플레이의 화면 크기)의 증가에 따라, 전자 장치에서도 고화질의 이미지가 요구되고 있고, 그에 따른 이미지의 품질 향상에 대한 필요가 제기되고 있다. 예를 들면, 전자 장치 또는 외부 장치에 의해 제공되는 이미지에 대한 이미지 품질(image quality)의 중요도 증가하고 있다.
한편, 외부 장치에서 제공하는 이미지는 압축되어 전송될 수 있다. 예를 들면, 이미지는 클라우드 환경의 스토리지를 절약하고 이미지 전송의 지연을 최소화하기 위해서, 일정 압축 품질(또는 압축률)로 압축되어 제공될 수 있다. 이러한 경우, 원본 영상의 압축 방법 정보(예: 해상도 정보) 및 압출 품질 정보(예: 압축 비트레이트 정보)가 소실되어, 영상표시장치에서, 원본 영상의 압축 방법 정보 및 압축 품질 정보와 관련된 영상의 퀄리티 판단이 어려워져, 원본 영상에 알맞은 화질 세팅을 하는 것이 어려워졌으며, 특히, 영상표시장치 내의 화질 알고리즘의 최대 성능을 구현하는 것이 어려워졌다.
하지만, 이미지 압축은, 예를 들면, 이미지에 압축 아티팩트(compression artifact)가 발생할 수 있다. 예를 들면, 이미지 압축에서는 적어도 하나의 아티팩트(예: ringing artifacts(또는 mosquito artifacts), blocking artifacts, blur artifacts, color distortion, 및/또는 texture deviation)가 발생할 수 있다. 일반적으로, 압축 아티팩트는 이미지의 압축 품질(또는 압축률)이 높을수록 보다 많이 발생할 수 있다. 따라서, 외부 장치(예: 컨텐츠 서버 또는 다른 외부 장치와 같은 서비스 제공자)에서는, 이미지를 전자 장치로 제공할 때, 이미지 크기를 최대한 압축하면서도 사용자 눈에는 아티팩트가 최소한으로 보일 수 있도록 하는 이슈가 제기될 수 있다. 또한, 최근에는 전자 장치에 대화면의 디스플레이를 지원함에 따라, 기존의 작은 화면에 최적화되어 아티팩트가 숨겨진 이미지가, 큰 화면에서 확대 제공됨에 따라 사용자에 의해 쉽게 노출될 수 있다. 예를 들면, 작은 화면에서 식별되지 않던 아티팩트가 큰 화면에서 확대되어 사용자에 의해 식별될 수 있고, 사용자에게 이미지 품질의 저하로 인식될 수 있다.
다양한 실시예들에서는, 전자 장치에서 이미지의 아티팩트를 빠르게 분석하고 이를 정확하게 개선할 수 있는 방법 및 장치에 관하여 개시한다.
다양한 실시예들에서는, 전자 장치에서 주어진 이미지의 압축 품질에 적합한 이미지 처리를 수행할 수 있는 방법 및 장치에 관하여 개시한다.
다양한 실시예들에서는, 전자 장치에서 주어진 이미지에 대해, 이미지가 압축된 압축 품질에 적합한 이미지 보정을 통해, 최적의 이미지(예: 원본 품질의 이미지)를 제공할 수 있는 방법 및 장치에 관하여 개시한다.
다양한 실시예들에서는, 전자 장치에서 이미지의 압축 품질 별로 노이즈 제거 모델을 학습하고, 이미지가 주어질 때, 주어진 이미지의 압축 품질에 대응하게 학습된 노이즈 제거 모델에 기반하여 이미지를 보정할 수 있는 방법 및 장치에 관하여 개시한다.
다양한 실시예들에서는, 전자 장치가 이미지를 제공할 때, 주어진 이미지에서 손실 압축에 따른 아티팩트를 제거하여 원본 품질의 이미지로 복구하여 제공함으로써, 사용자에게 최적 품질의 이미지를 제공할 수 있는 방법 및 장치에 관하여 개시한다.
다양한 실시예들에서는, 전자 장치에서 이미지의 압축 품질에 기반한 이미지 보정 시, 사용자 의도를 반영하여 이미지 보정을 수행할 수 있는 방법 및 장치에 관하여 개시한다.
다양한 실시예들에서는, 전자 장치에서 이미지의 압축 품질에 기반한 이미지 보정 시, 다양한 상황을 복합적으로 고려하여 이미지 보정을 수행할 수 있는 방법 및 장치에 관하여 개시한다.
본 개시의 실시예에 따른 전자 장치는, 디스플레이 모듈, 메모리, 및 상기 디스플레이 모듈 및 상기 메모리와 작동적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 상기 디스플레이 모듈을 통해 적어도 하나의 이미지를 포함하는 화면을 표시하고, 상기 적어도 하나의 이미지의 압축 품질을 결정하고, 결정된 압축 품질에 대응하게 학습된 노이즈 제거 모델을 선택하고, 선택된 노이즈 제거 모델에 기반하여 이미지 보정을 처리하고, 및 보정된 이미지를 상기 디스플레이 모듈을 통해 표시하도록 할 수 있다.
본 개시의 실시예에 따른 전자 장치의 동작 방법은, 디스플레이 모듈을 통해 적어도 하나의 이미지를 포함하는 화면을 표시하는 동작, 상기 적어도 하나의 이미지의 압축 품질을 결정하는 동작, 결정된 압축 품질에 대응하게 학습된 노이즈 제거 모델을 선택하는 동작, 선택된 노이즈 제거 모델에 기반하여 이미지 보정을 처리하는 동작, 및 보정된 이미지를 상기 디스플레이 모듈을 통해 표시하는 동작을 포함할 수 있다.
상기와 같은 과제를 해결하기 위하여 본 개시의 다양한 실시예들에서는, 상기 방법을 프로세서에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체를 포함할 수 있다.
본 개시의 적용 가능성의 추가적인 범위는 이하의 상세한 설명으로부터 명백해질 것이다. 그러나 본 개시의 사상 및 범위 내에서 다양한 변경 및 수정은 당업자에게 명확하게 이해될 수 있으므로, 상세한 설명 및 본 개시의 바람직한 실시예와 같은 특정 실시예는 단지 예시로 주어진 것으로 이해되어야 한다.
다양한 실시예들에 따른 전자 장치 및 그의 동작 방법에 따르면, 전자 장치에서 이미지를 제공할 때, 심층 신경망(DNN, deep neural network)을 이용하여 이미지의 원본 품질 연산을 정확하게 처리할 수 있다. 다양한 실시예들에 따르면, 전자 장치에서 주어진 이미지의 압축 품질에 대응하게 학습된 노이즈 제거 모델에 기반하여 이미지의 압축 아티팩트를 제거하고 원본 품질에 가까운 이미지를 제공함에 따라, 압축 이미지의 품질을 높일 수 있다.
다양한 실시예들에 따르면, 전자 장치는 압축 이미지에 기반하여 외부로부터 빠르게 이미지를 수신하여 사용자에게 제공하면서, 동시에 압축 이미지에서 아티팩트가 없는 깨끗한 이미지를 사용자에게 제공할 수 있다.
다양한 실시예들에 따르면, 전자 장치는 사용자의 의도(예: 취향)에 대응하게 이미지의 아티팩트 제거 강도(예: 보정 강도)를 조절할 수 있도록 지원하여, 사용자의 이미지 보정에 편의성 및 효율성을 증대할 수 있다.
다양한 실시예들에 따르면, 서비스 제공자에서는 이미지를 더 빠르게 전송할 수 있도록 압축률을 높일 수 있으며, 동시에 양질의 이미지를 제공할 수 있다. 다양한 실시예들에 따르면, 서비스 제공자(예: 포털 사이트, 메시징 어플리케이션)로부터 네트워크를 통해 전송되는 저 화질의 이미지를 개선하여 제공할 수 있다.
이 외에, 본 문서를 통해 직접적 또는 간접적으로 파악되는 다양한 효과들이 제공될 수 있다.
도면 설명과 관련하여, 동일 또는 유사한 구성 요소에 대해서는 동일 또는 유사한 참조 부호가 사용될 수 있다.
도 1은 다양한 실시예들에 따른 네트워크 환경 내의 전자 장치의 블록도이다.
도 2는 다양한 실시예들에 따른 전자 장치의 구성을 개략적으로 도시하는 도면이다.
도 3은 다양한 실시예들에 따른 전자 장치의 동작 방법을 도시하는 흐름도이다.
도 4는 다양한 실시예들에 따른 전자 장치에서 이미지 보정의 예를 도시하는 도면이다.
도 5는 다양한 실시예들에 따른 전자 장치에서 이미지 보정을 위한 학습, 분류 및 제거 동작의 예를 도시하는 흐름도이다.
도 6은 일 실시예에 따라 이미지의 압축 품질의 일반성을 설명하기 위해 도시하는 도면이다.
도 7은 다양한 실시예들에 따른 전자 장치의 동작 방법을 도시하는 흐름도이다.
도 8은 다양한 실시예들에 따른 전자 장치에서 사용자와 상호작용에 기반하여 후처리 보정을 제공하기 위한 사용자 인터페이스 및 그 동작 예를 도시하는 도면이다.
도 9는 다양한 실시예들에 따른 전자 장치에서 사용자와 상호작용에 기반하여 후처리 보정을 제공하기 위한 사용자 인터페이스 및 그 동작 예를 도시하는 도면이다.
도 10은 다양한 실시예들에 따른 전자 장치에서 사용자와 상호작용에 기반하여 후처리 보정을 제공하기 위한 사용자 인터페이스 및 그 동작 예를 도시하는 도면이다.
도 11은 다양한 실시예들에 따른 전자 장치에서 이미지 보정을 처리하는 동작 예를 도시하는 도면이다.
도 12a 및 도 12b는 다양한 실시예들에 따른 전자 장치에서 이미지 보정을 처리하는 동작 예를 도시하는 도면들이다.
도 13은 다양한 실시예들에 따른 전자 장치에서 사용자 의도에 기반한 이미지 처리를 위한 사용자 인터페이스 및 그 동작 예를 설명하기 위한 도면이다.
도 14는 다양한 실시예들에 따른 전자 장치에서 학습하는 동작 예를 도시하는 도면이다.
도 15는 다양한 실시예들에 따른 전자 장치에서 압축 품질을 분류하는 동작 방법을 도시하는 흐름도이다.
도 16은 다양한 실시예들에 따른 전자 장치에서 아티팩트를 제거하는 동작 방법을 도시하는 흐름도이다.
도 17은 다양한 실시예들에 따른 전자 장치에서 압축 품질을 보정하는 동작 방법을 도시하는 흐름도이다.
도 1은 다양한 실시예들에 따른 네트워크 환경 내의 전자 장치의 블록도이다.
도 2는 다양한 실시예들에 따른 전자 장치의 구성을 개략적으로 도시하는 도면이다.
도 3은 다양한 실시예들에 따른 전자 장치의 동작 방법을 도시하는 흐름도이다.
도 4는 다양한 실시예들에 따른 전자 장치에서 이미지 보정의 예를 도시하는 도면이다.
도 5는 다양한 실시예들에 따른 전자 장치에서 이미지 보정을 위한 학습, 분류 및 제거 동작의 예를 도시하는 흐름도이다.
도 6은 일 실시예에 따라 이미지의 압축 품질의 일반성을 설명하기 위해 도시하는 도면이다.
도 7은 다양한 실시예들에 따른 전자 장치의 동작 방법을 도시하는 흐름도이다.
도 8은 다양한 실시예들에 따른 전자 장치에서 사용자와 상호작용에 기반하여 후처리 보정을 제공하기 위한 사용자 인터페이스 및 그 동작 예를 도시하는 도면이다.
도 9는 다양한 실시예들에 따른 전자 장치에서 사용자와 상호작용에 기반하여 후처리 보정을 제공하기 위한 사용자 인터페이스 및 그 동작 예를 도시하는 도면이다.
도 10은 다양한 실시예들에 따른 전자 장치에서 사용자와 상호작용에 기반하여 후처리 보정을 제공하기 위한 사용자 인터페이스 및 그 동작 예를 도시하는 도면이다.
도 11은 다양한 실시예들에 따른 전자 장치에서 이미지 보정을 처리하는 동작 예를 도시하는 도면이다.
도 12a 및 도 12b는 다양한 실시예들에 따른 전자 장치에서 이미지 보정을 처리하는 동작 예를 도시하는 도면들이다.
도 13은 다양한 실시예들에 따른 전자 장치에서 사용자 의도에 기반한 이미지 처리를 위한 사용자 인터페이스 및 그 동작 예를 설명하기 위한 도면이다.
도 14는 다양한 실시예들에 따른 전자 장치에서 학습하는 동작 예를 도시하는 도면이다.
도 15는 다양한 실시예들에 따른 전자 장치에서 압축 품질을 분류하는 동작 방법을 도시하는 흐름도이다.
도 16은 다양한 실시예들에 따른 전자 장치에서 아티팩트를 제거하는 동작 방법을 도시하는 흐름도이다.
도 17은 다양한 실시예들에 따른 전자 장치에서 압축 품질을 보정하는 동작 방법을 도시하는 흐름도이다.
도 1은 다양한 실시예들에 따른 네트워크 환경(100) 내의 전자 장치(101)의 블록도이다.
도 1을 참조하면, 네트워크 환경(100)에서 전자 장치(101)는 제1 네트워크(198)(예: 근거리 무선 통신 네트워크)를 통하여 전자 장치(102)와 통신하거나, 또는 제2 네트워크(199)(예: 원거리 무선 통신 네트워크)를 통하여 전자 장치(104) 또는 서버(108) 중 적어도 하나와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 서버(108)를 통하여 전자 장치(104)와 통신할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 프로세서(120), 메모리(130), 입력 모듈(150), 음향 출력 모듈(155), 디스플레이 모듈(160), 오디오 모듈(170), 센서 모듈(176), 인터페이스(177), 연결 단자(178), 햅틱 모듈(179), 카메라 모듈(180), 전력 관리 모듈(188), 배터리(189), 통신 모듈(190), 가입자 식별 모듈(196), 또는 안테나 모듈(197)을 포함할 수 있다. 어떤 실시예에서는, 전자 장치(101)에는, 이 구성요소들 중 적어도 하나(예: 연결 단자(178))가 생략되거나, 하나 이상의 다른 구성요소가 추가될 수 있다. 어떤 실시예에서는, 이 구성요소들 중 일부들(예: 센서 모듈(176), 카메라 모듈(180), 또는 안테나 모듈(197))은 하나의 구성요소(예: 디스플레이 모듈(160))로 통합될 수 있다.
프로세서(120)는, 예를 들면, 소프트웨어(예: 프로그램(140))를 실행하여 프로세서(120)에 연결된 전자 장치(101)의 적어도 하나의 다른 구성요소(예: 하드웨어 또는 소프트웨어 구성요소)를 제어할 수 있고, 다양한 데이터 처리 또는 연산을 수행할 수 있다. 일 실시예에 따르면, 데이터 처리 또는 연산의 적어도 일부로서, 프로세서(120)는 다른 구성요소(예: 센서 모듈(176) 또는 통신 모듈(190))로부터 수신된 명령 또는 데이터를 휘발성 메모리(132)에 저장하고, 휘발성 메모리(132)에 저장된 명령 또는 데이터를 처리하고, 결과 데이터를 비휘발성 메모리(134)에 저장할 수 있다. 일 실시예에 따르면, 프로세서(120)는 메인 프로세서(121)(예: 중앙 처리 장치(CPU, central processing unit) 또는 어플리케이션 프로세서(AP, application processor)) 또는 이와는 독립적으로 또는 함께 운영 가능한 보조 프로세서(123)(예: 그래픽 처리 장치(GPU, graphic processing unit), 신경망 처리 장치(NPU, neural processing unit), 이미지 시그널 프로세서(ISP, image signal processor), 센서 허브 프로세서(sensor hub processor), 또는 커뮤니케이션 프로세서(CP, communication processor))를 포함할 수 있다. 예를 들어, 전자 장치(101)가 메인 프로세서(121) 및 보조 프로세서(123)를 포함하는 경우, 보조 프로세서(123)는 메인 프로세서(121)보다 저전력을 사용하거나, 지정된 기능에 특화되도록 설정될 수 있다. 보조 프로세서(123)는 메인 프로세서(121)와 별개로, 또는 그 일부로서 구현될 수 있다.
보조 프로세서(123)는, 예를 들면, 메인 프로세서(121)가 인액티브(inactive)(예: 슬립(sleep)) 상태에 있는 동안 메인 프로세서(121)를 대신하여, 또는 메인 프로세서(121)가 액티브(예: 어플리케이션 실행) 상태에 있는 동안 메인 프로세서(121)와 함께, 전자 장치(101)의 구성요소들 중 적어도 하나의 구성요소(예: 디스플레이 모듈(160), 센서 모듈(176), 또는 통신 모듈(190))와 관련된 기능 또는 상태들의 적어도 일부를 제어할 수 있다. 일 실시예에 따르면, 보조 프로세서(123)(예: 이미지 시그널 프로세서 또는 커뮤니케이션 프로세서)는 기능적으로 관련 있는 다른 구성요소(예: 카메라 모듈(180) 또는 통신 모듈(190))의 일부로서 구현될 수 있다. 일 실시예에 따르면, 보조 프로세서(123)(예: 신경망 처리 장치)는 인공지능 모델의 처리에 특화된 하드웨어 구조를 포함할 수 있다. 인공지능 모델은 기계 학습을 통해 생성될 수 있다. 이러한 학습은, 예를 들어, 인공지능 모델이 수행되는 전자 장치(101) 자체에서 수행될 수 있고, 별도의 서버(예: 서버(108))를 통해 수행될 수도 있다. 학습 알고리즘은, 예를 들어, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning)을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은, 복수의 인공 신경망 레이어들을 포함할 수 있다. 인공 신경망은 심층 신경망(DNN: deep neural network), CNN(convolutional neural network), RNN(recurrent neural network), RBM(restricted boltzmann machine), DBN(deep belief network), BRDNN(bidirectional recurrent deep neural network), 심층 Q-네트워크(deep Q-networks) 또는 상기 중 둘 이상의 조합 중 하나일 수 있으나, 전술한 예에 한정되지 않는다. 인공지능 모델은 하드웨어 구조 이외에, 추가적으로 또는 대체적으로, 소프트웨어 구조를 포함할 수 있다.
메모리(130)는, 전자 장치(101)의 적어도 하나의 구성요소(예: 프로세서(120) 또는 센서 모듈(176))에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 소프트웨어(예: 프로그램(140)) 및, 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 메모리(130)는, 휘발성 메모리(132) 또는 비휘발성 메모리(134)를 포함할 수 있다.
프로그램(140)은 메모리(130)에 소프트웨어로서 저장될 수 있으며, 예를 들면, 운영 체제(OS, operating system)(142), 미들 웨어(middleware)(144) 또는 어플리케이션(146)을 포함할 수 있다.
입력 모듈(150)은, 전자 장치(101)의 구성요소(예: 프로세서(120))에 사용될 명령 또는 데이터를 전자 장치(101)의 외부(예: 사용자)로부터 수신할 수 있다. 입력 모듈(150)은, 예를 들면, 마이크, 마우스, 키보드, 키(예: 버튼), 또는 디지털 펜(예: 스타일러스 펜)을 포함할 수 있다.
음향 출력 모듈(155)은 음향 신호를 전자 장치(101)의 외부로 출력할 수 있다. 음향 출력 모듈(155)은, 예를 들면, 스피커 또는 리시버를 포함할 수 있다. 스피커는 멀티미디어 재생 또는 녹음 재생과 같이 일반적인 용도로 사용될 수 있다. 리시버는 착신 전화를 수신하기 위해 사용될 수 있다. 일 실시예에 따르면, 리시버는 스피커와 별개로, 또는 그 일부로서 구현될 수 있다.
디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 정보를 시각적으로 제공할 수 있다. 디스플레이 모듈(160)은, 예를 들면, 디스플레이, 홀로그램 장치, 또는 프로젝터 및 해당 장치를 제어하기 위한 제어 회로를 포함할 수 있다. 일 실시예에 따르면, 디스플레이 모듈(160)은 터치를 감지하도록 설정된 터치 센서, 또는 상기 터치에 의해 발생되는 힘의 세기를 측정하도록 설정된 압력 센서를 포함할 수 있다.
오디오 모듈(170)은 소리를 전기 신호로 변환시키거나, 반대로 전기 신호를 소리로 변환시킬 수 있다. 일 실시예에 따르면, 오디오 모듈(170)은, 입력 모듈(150)을 통해 소리를 획득하거나, 음향 출력 모듈(155), 또는 전자 장치(101)와 직접 또는 무선으로 연결된 외부 전자 장치(예: 전자 장치(102))(예: 스피커 또는 헤드폰)를 통해 소리를 출력할 수 있다.
센서 모듈(176)은 전자 장치(101)의 작동 상태(예: 전력 또는 온도), 또는 외부의 환경 상태(예: 사용자 상태)를 감지하고, 감지된 상태에 대응하는 전기 신호 또는 데이터 값을 생성할 수 있다. 일 실시예에 따르면, 센서 모듈(176)은, 예를 들면, 제스처 센서, 자이로 센서, 기압 센서, 마그네틱 센서, 가속도 센서, 그립 센서, 근접 센서, 컬러 센서, IR(infrared) 센서, 생체 센서, 온도 센서, 습도 센서, 또는 조도 센서를 포함할 수 있다.
인터페이스(177)는 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 직접 또는 무선으로 연결되기 위해 사용될 수 있는 하나 이상의 지정된 프로토콜들을 지원할 수 있다. 일 실시예에 따르면, 인터페이스(177)는, 예를 들면, HDMI(high definition multimedia interface), USB(universal serial bus) 인터페이스, SD(secure digital) 카드 인터페이스, 또는 오디오 인터페이스를 포함할 수 있다.
연결 단자(178)는, 그를 통해서 전자 장치(101)가 외부 전자 장치(예: 전자 장치(102))와 물리적으로 연결될 수 있는 커넥터를 포함할 수 있다. 일 실시예에 따르면, 연결 단자(178)는, 예를 들면, HDMI 커넥터, USB 커넥터, SD 카드 커넥터, 또는 오디오 커넥터(예: 헤드폰 커넥터)를 포함할 수 있다.
햅틱 모듈(179)은 전기적 신호를 사용자가 촉각 또는 운동 감각을 통해서 인지할 수 있는 기계적인 자극(예: 진동 또는 움직임) 또는 전기적인 자극으로 변환할 수 있다. 일 실시예에 따르면, 햅틱 모듈(179)은, 예를 들면, 모터, 압전 소자, 또는 전기 자극 장치를 포함할 수 있다.
카메라 모듈(180)은 정지 영상 및 동영상을 촬영할 수 있다. 일 실시예에 따르면, 카메라 모듈(180)은 하나 이상의 렌즈들, 이미지 센서들, 이미지 시그널 프로세서들, 또는 플래시들을 포함할 수 있다.
전력 관리 모듈(188)은 전자 장치(101)에 공급되는 전력을 관리할 수 있다. 일 실시예에 따르면, 전력 관리 모듈(188)은, 예를 들면, PMIC(power management integrated circuit)의 적어도 일부로서 구현될 수 있다.
배터리(189)는 전자 장치(101)의 적어도 하나의 구성요소에 전력을 공급할 수 있다. 일 실시예에 따르면, 배터리(189)는, 예를 들면, 재충전 불가능한 1차 전지, 재충전 가능한 2차 전지 또는 연료 전지를 포함할 수 있다.
통신 모듈(190)은 전자 장치(101)와 외부 전자 장치(예: 전자 장치(102), 전자 장치(104), 또는 서버(108)) 간의 직접(예: 유선) 통신 채널 또는 무선 통신 채널의 수립, 및 수립된 통신 채널을 통한 통신 수행을 지원할 수 있다. 통신 모듈(190)은 프로세서(120)(예: 어플리케이션 프로세서)와 독립적으로 운영되고, 직접(예: 유선) 통신 또는 무선 통신을 지원하는 하나 이상의 커뮤니케이션 프로세서를 포함할 수 있다. 일 실시예에 따르면, 통신 모듈(190)은 무선 통신 모듈(192)(예: 셀룰러 통신 모듈, 근거리 무선 통신 모듈, 또는 GNSS(global navigation satellite system) 통신 모듈) 또는 유선 통신 모듈(194)(예: LAN(local area network) 통신 모듈, 또는 전력선 통신 모듈)을 포함할 수 있다. 이들 통신 모듈 중 해당하는 통신 모듈은 제1 네트워크(198)(예: 블루투스, WiFi(wireless fidelity) direct 또는 IrDA(infrared data association)와 같은 근거리 통신 네트워크) 또는 제2 네트워크(199)(예: 레거시 셀룰러 네트워크, 5G 네트워크, 차세대 통신 네트워크, 인터넷, 또는 컴퓨터 네트워크(예: LAN 또는 WAN(wide area network))와 같은 원거리 통신 네트워크)를 통하여 외부의 전자 장치(104)와 통신할 수 있다. 이런 여러 종류의 통신 모듈들은 하나의 구성요소(예: 단일 칩)로 통합되거나, 또는 서로 별도의 복수의 구성요소들(예: 복수 칩들)로 구현될 수 있다. 무선 통신 모듈(192)은 가입자 식별 모듈(196)에 저장된 가입자 정보(예: 국제 모바일 가입자 식별자(IMSI))를 이용하여 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크 내에서 전자 장치(101)를 확인 또는 인증할 수 있다.
무선 통신 모듈(192)은 4G 네트워크 이후의 5G 네트워크 및 차세대 통신 기술, 예를 들어, NR 접속 기술(new radio access technology)을 지원할 수 있다. NR 접속 기술은 고용량 데이터의 고속 전송(eMBB, enhanced mobile broadband), 단말 전력 최소화와 다수 단말의 접속(mMTC, massive machine type communications), 또는 고신뢰도와 저지연(URLLC, ultra-reliable and low-latency communications)을 지원할 수 있다. 무선 통신 모듈(192)은, 예를 들어, 높은 데이터 전송률 달성을 위해, 고주파 대역(예: mmWave 대역)을 지원할 수 있다. 무선 통신 모듈(192)은 고주파 대역에서의 성능 확보를 위한 다양한 기술들, 예를 들어, 빔포밍(beamforming), 거대 배열 다중 입출력(massive MIMO(multiple-input and multiple-output)), 전차원 다중입출력(FD-MIMO, full dimensional MIMO), 어레이 안테나(array antenna), 아날로그 빔형성(analog beam-forming), 또는 대규모 안테나(large scale antenna)와 같은 기술들을 지원할 수 있다. 무선 통신 모듈(192)은 전자 장치(101), 외부 전자 장치(예: 전자 장치(104)) 또는 네트워크 시스템(예: 제2 네트워크(199))에 규정되는 다양한 요구사항을 지원할 수 있다. 일 실시예에 따르면, 무선 통신 모듈(192)은 eMBB 실현을 위한 Peak data rate(예: 20Gbps 이상), mMTC 실현을 위한 손실 Coverage(예: 164dB 이하), 또는 URLLC 실현을 위한 U-plane latency(예: 다운링크(DL) 및 업링크(UL) 각각 0.5ms 이하, 또는 라운드 트립 1ms 이하)를 지원할 수 있다.
안테나 모듈(197)은 신호 또는 전력을 외부(예: 외부의 전자 장치)로 송신하거나 외부로부터 수신할 수 있다. 일 실시예에 따르면, 안테나 모듈(197)은 서브스트레이트(예: PCB) 위에 형성된 도전체 또는 도전성 패턴으로 이루어진 방사체를 포함하는 안테나를 포함할 수 있다. 일 실시예에 따르면, 안테나 모듈(197)은 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다. 이런 경우, 제1 네트워크(198) 또는 제2 네트워크(199)와 같은 통신 네트워크에서 사용되는 통신 방식에 적합한 적어도 하나의 안테나가, 예를 들면, 통신 모듈(190)에 의하여 상기 복수의 안테나들로부터 선택될 수 있다. 신호 또는 전력은 상기 선택된 적어도 하나의 안테나를 통하여 통신 모듈(190)과 외부의 전자 장치 간에 송신되거나 수신될 수 있다. 어떤 실시예에 따르면, 방사체 이외에 다른 부품(예: RFIC(radio frequency integrated circuit))이 추가로 안테나 모듈(197)의 일부로 형성될 수 있다.
다양한 실시예들에 따르면, 안테나 모듈(197)은 mmWave 안테나 모듈을 형성할 수 있다. 일 실시예에 따르면, mmWave 안테나 모듈은 인쇄 회로 기판, 상기 인쇄 회로 기판의 제1 면(예: 아래 면)에 또는 그에 인접하여 배치되고 지정된 고주파 대역(예: mmWave 대역)을 지원할 수 있는 RFIC, 및 상기 인쇄 회로 기판의 제2 면(예: 윗 면 또는 측 면)에 또는 그에 인접하여 배치되고 상기 지정된 고주파 대역의 신호를 송신 또는 수신할 수 있는 복수의 안테나들(예: 어레이 안테나)을 포함할 수 있다.
상기 구성요소들 중 적어도 일부는 주변 기기들간 통신 방식(예: 버스, GPIO(general purpose input and output), SPI(serial peripheral interface), 또는 MIPI(mobile industry processor interface))을 통해 서로 연결되고 신호(예: 명령 또는 데이터)를 상호간에 교환할 수 있다.
일 실시예에 따르면, 명령 또는 데이터는 제2 네트워크(199)에 연결된 서버(108)를 통해서 전자 장치(101)와 외부의 전자 장치(104)간에 송신 또는 수신될 수 있다. 외부의 전자 장치(102, 또는 104) 각각은 전자 장치(101)와 동일한 또는 다른 종류의 장치일 수 있다. 일 실시예에 따르면, 전자 장치(101)에서 실행되는 동작들의 전부 또는 일부는 외부의 전자 장치들(102, 104, 또는 108) 중 하나 이상의 외부의 전자 장치들에서 실행될 수 있다. 예를 들면, 전자 장치(101)가 어떤 기능이나 서비스를 자동으로, 또는 사용자 또는 다른 장치로부터의 요청에 반응하여 수행해야 할 경우에, 전자 장치(101)는 기능 또는 서비스를 자체적으로 실행시키는 대신에 또는 추가적으로, 하나 이상의 외부의 전자 장치들에게 그 기능 또는 그 서비스의 적어도 일부를 수행하라고 요청할 수 있다. 상기 요청을 수신한 하나 이상의 외부의 전자 장치들은 요청된 기능 또는 서비스의 적어도 일부, 또는 상기 요청과 관련된 추가 기능 또는 서비스를 실행하고, 그 실행의 결과를 전자 장치(101)로 전달할 수 있다. 전자 장치(101)는 상기 결과를, 그대로 또는 추가적으로 처리하여, 상기 요청에 대한 응답의 적어도 일부로서 제공할 수 있다. 이를 위하여, 예를 들면, 클라우드 컴퓨팅, 분산 컴퓨팅, 모바일 에지 컴퓨팅(MEC, mobile edge computing), 또는 클라이언트-서버 컴퓨팅 기술이 이용될 수 있다. 전자 장치(101)는, 예를 들어, 분산 컴퓨팅 또는 모바일 에지 컴퓨팅을 이용하여 초저지연 서비스를 제공할 수 있다. 다른 실시예에 있어서, 외부의 전자 장치(104)는 IoT(internet of things) 기기를 포함할 수 있다. 서버(108)는 기계 학습 및/또는 신경망을 이용한 지능형 서버일 수 있다. 일 실시예에 따르면, 외부의 전자 장치(104) 또는 서버(108)는 제2 네트워크(199) 내에 포함될 수 있다. 전자 장치(101)는 5G 통신 기술 및 IoT 관련 기술을 기반으로 지능형 서비스(예: 스마트 홈, 스마트 시티, 스마트 카, 또는 헬스 케어)에 적용될 수 있다.
본 문서에 개시된 다양한 실시예들에 따른 전자 장치는 다양한 형태의 장치가 될 수 있다. 전자 장치는, 예를 들면, 휴대용 통신 장치(예: 스마트폰), 컴퓨터 장치, 휴대용 멀티미디어 장치, 휴대용 의료 기기, 카메라, 웨어러블 장치, 또는 가전 장치를 포함할 수 있다. 본 문서의 실시예에 따른 전자 장치는 전술한 기기들에 한정되지 않는다.
본 문서의 다양한 실시예들 및 이에 사용된 용어들은 본 문서에 기재된 기술적 특징들을 특정한 실시예들로 한정하려는 것이 아니며, 해당 실시예의 다양한 변경, 균등물, 또는 대체물을 포함하는 것으로 이해되어야 한다. 도면의 설명과 관련하여, 유사한 또는 관련된 구성요소에 대해서는 유사한 참조 부호가 사용될 수 있다. 아이템에 대응하는 명사의 단수 형은 관련된 문맥상 명백하게 다르게 지시하지 않는 한, 상기 아이템 한 개 또는 복수 개를 포함할 수 있다. 본 문서에서, "A 또는 B", "A 및 B 중 적어도 하나", "A 또는 B 중 적어도 하나", "A, B 또는 C", "A, B 및 C 중 적어도 하나", 및 "A, B, 또는 C 중 적어도 하나"와 같은 문구들 각각은 그 문구들 중 해당하는 문구에 함께 나열된 항목들 중 어느 하나, 또는 그들의 모든 가능한 조합을 포함할 수 있다. "제1", "제2", 또는 "첫째" 또는 "둘째"와 같은 용어들은 단순히 해당 구성요소를 다른 해당 구성요소와 구분하기 위해 사용될 수 있으며, 해당 구성요소들을 다른 측면(예: 중요성 또는 순서)에서 한정하지 않는다. 어떤(예: 제1) 구성요소가 다른(예: 제2) 구성요소에, "기능적으로" 또는 "통신적으로"라는 용어와 함께 또는 이런 용어 없이, "커플드" 또는 "커넥티드"라고 언급된 경우, 그것은 상기 어떤 구성요소가 상기 다른 구성요소에 직접적으로(예: 유선으로), 무선으로, 또는 제3 구성요소를 통하여 연결될 수 있다는 것을 의미한다.
본 문서의 다양한 실시예들에서 사용된 용어 "모듈"은 하드웨어, 소프트웨어 또는 펌웨어로 구현된 유닛을 포함할 수 있으며, 예를 들면, 로직, 논리 블록, 부품, 또는 회로와 같은 용어와 상호 호환적으로 사용될 수 있다. 모듈은, 일체로 구성된 부품 또는 하나 또는 그 이상의 기능을 수행하는, 상기 부품의 최소 단위 또는 그 일부가 될 수 있다. 예를 들면, 일 실시예에 따르면, 모듈은 ASIC(application-specific integrated circuit)의 형태로 구현될 수 있다.
본 문서의 다양한 실시예들은 기기(machine)(예: 전자 장치(101)) 의해 읽을 수 있는 저장 매체(storage medium)(예: 내장 메모리(136) 또는 외장 메모리(138))에 저장된 하나 이상의 명령어들을 포함하는 소프트웨어(예: 프로그램(140))로서 구현될 수 있다. 예를 들면, 기기(예: 전자 장치(101))의 프로세서(예: 프로세서(120))는, 저장 매체로부터 저장된 하나 이상의 명령어들 중 적어도 하나의 명령을 호출하고, 그것을 실행할 수 있다. 이것은 기기가 상기 호출된 적어도 하나의 명령어에 따라 적어도 하나의 기능을 수행하도록 운영되는 것을 가능하게 한다. 상기 하나 이상의 명령어들은 컴파일러에 의해 생성된 코드 또는 인터프리터에 의해 실행될 수 있는 코드를 포함할 수 있다. 기기로 읽을 수 있는 저장 매체는, 비일시적(non-transitory) 저장 매체의 형태로 제공될 수 있다. 여기서, ‘비일시적’은 저장 매체가 실재(tangible)하는 장치이고, 신호(signal)(예: 전자기파)를 포함하지 않는다는 것을 의미할 뿐이며, 이 용어는 데이터가 저장 매체에 반영구적으로 저장되는 경우와 임시적으로 저장되는 경우를 구분하지 않는다.
일 실시예에 따르면, 본 문서에 개시된 다양한 실시예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory(CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두 개의 사용자 장치들(예: 스마트 폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.
다양한 실시예들에 따르면, 상기 기술한 구성요소들의 각각의 구성요소(예: 모듈 또는 프로그램)는 단수 또는 복수의 개체를 포함할 수 있으며, 복수의 개체 중 일부는 다른 구성요소에 분리 배치될 수도 있다. 다양한 실시예들에 따르면, 전술한 해당 구성요소들 중 하나 이상의 구성요소들 또는 동작들이 생략되거나, 또는 하나 이상의 다른 구성요소들 또는 동작들이 추가될 수 있다. 대체적으로 또는 추가적으로, 복수의 구성요소들(예: 모듈 또는 프로그램)은 하나의 구성요소로 통합될 수 있다. 이런 경우, 통합된 구성요소는 상기 복수의 구성요소들 각각의 구성요소의 하나 이상의 기능들을 상기 통합 이전에 상기 복수의 구성요소들 중 해당 구성요소에 의해 수행되는 것과 동일 또는 유사하게 수행할 수 있다. 다양한 실시예들에 따르면, 모듈, 프로그램 또는 다른 구성요소에 의해 수행되는 동작들은 순차적으로, 병렬적으로, 반복적으로, 또는 휴리스틱(heuristic)하게 실행되거나, 상기 동작들 중 하나 이상이 다른 순서로 실행되거나, 생략되거나, 또는 하나 이상의 다른 동작들이 추가될 수 있다.
도 2는 다양한 실시예들에 따른 전자 장치의 구성을 개략적으로 도시하는 도면이다.
도 2를 참조하면, 일 실시예에 따르면 전자 장치(101)는 통신 모듈(190), 디스플레이 모듈(160), 프로세서(120), 및 메모리(130)를 포함할 수 있다.
일 실시예에 따라, 통신 모듈(190)은 레거시 네트워크(예: 3G 네트워크 및/또는 4G 네트워크), 5G 네트워크, OOB(out of band) 및/또는 차세대 통신 기술(예: NR(new radio) 기술)을 지원할 수 있다. 일 실시예에 따르면, 통신 모듈(190)은 도 1에 예시한 바와 같은 무선 통신 모듈(192)에 대응할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 통신 모듈(190)을 이용하여 네트워크를 통해 외부 장치(예: 도 1의 서버(201) 및/또는 다른 전자 장치(102, 104))와 통신을 수행할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 통신 모듈(190)을 통해 외부 장치로부터 이미지 및/또는 이미지를 포함하는 컨텐츠(예: 웹 페이지)를 수신할 수 있다.
일 실시예에 따라, 디스플레이 모듈(160)은 전자 장치(101)의 외부(예: 사용자)로 다양한 정보를 시각적으로 제공할 수 있다. 일 실시예에 따라, 디스플레이 모듈(160)은 터치 감지 회로(또는 터치 센서)(미도시), 터치의 세기를 측정할 수 있는 압력 센서 및/또는 자기장 방식의 스타일러스 펜을 검출하는 터치 패널(예: 디지타이저)을 포함할 수 있다. 일 실시예에 따르면, 디스플레이 모듈(160)은 터치 감지 회로, 압력 센서 및/또는 터치 패널에 기반하여 디스플레이 모듈(160)의 특정 위치에 대한 신호(예: 전압, 광량, 저항, 전자기 신호 및/또는 전하량)의 변화를 측정함으로써 터치 입력 및/또는 호버링 입력(또는 근접 입력)을 감지할 수 있다. 일 실시예에 따르면, 디스플레이 모듈(160)은 액정 표시 장치(LCD, liquid crystal display), OLED(organic light emitted diode), AMOLED(active matrix organic light emitted diode)로 구성될 수 있다. 어떤 실시예에 따르면, 디스플레이 모듈(160)은 플렉서블 디스플레이(flexible display)로 구성될 수 있다.
일 실시예에 따르면, 디스플레이 모듈(160)은 프로세서(120)의 제어 하에, 이미지 및/또는 이미지를 포함하는 컨텐츠를 시각적으로 제공할 수 있다. 일 실시예에 따르면, 디스플레이 모듈(160)은 표시된 적어도 하나의 이미지에 대응하는 이미지 처리(image processing)(예: 이미지 보정)와 관련된 다양한 정보(예: 사용자 인터페이스)를 표시할 수 있다.
일 실시예에 따라, 메모리(130)는 도 1을 참조한 설명 부분에서 설명한 바와 같은 메모리(130)에 대응할 수 있다. 일 실시예에 따르면, 메모리(130)는 전자 장치(101)에 의해 사용되는 다양한 데이터를 저장할 수 있다. 데이터는, 예를 들어, 어플리케이션(예: 도 1의 프로그램(140)), 및 이와 관련된 명령에 대한 입력 데이터 또는 출력 데이터를 포함할 수 있다. 일 실시예에 따라, 메모리(130)는 실행 시에, 프로세서(120)가 동작하도록 하는 인스트럭션들(instructions)을 저장할 수 있다. 예를 들면, 어플리케이션은 메모리(130) 상에 소프트웨어(예: 도 1의 프로그램(140))로서 저장될 수 있고, 프로세서(120)에 의해 실행 가능할 수 있다. 일 실시예에 따라, 어플리케이션은 전자 장치(101)에서 이미지 보정을 이용할 수 있는 어플리케이션일 수 있다.
일 실시예에 따르면, 메모리(130)는 프로세서(120)에 의하여 수행될 수 있는, 압축 품질 별 이미지 보정을 처리하는 기능(또는 동작)과 관련된 적어도 하나의 모듈을 저장할 수 있다. 예를 들면, 메모리(130)는 이미지 처리 모듈(210), 성능 식별 모듈(220), 노이즈 제거 모듈(230), 모델 선택 모듈(240), 압축 품질 분류 모듈(250), 샘플 패치 추출 모듈(260) 및/또는 사용자 입력 처리 모듈(270) 중 적어도 일부를 소프트웨어 형태(또는 인스트럭션 형태)로 포함할 수 있다.
일 실시예에 따라, 프로세서(120)는 전자 장치(101)에서 이미지 보정을 처리하기 위한 관련된 동작을 제어할 수 있다. 일 실시예에 따르면, 프로세서(120)는 전자 장치(101)의 메모리(130)에 저장된 이미지 및/또는 외부 장치로부터 수신된 이미지에 관련된 압축 품질을 식별하고, 압축 품질에 기반하여 이미지 보정을 처리하는 것과 관련된 동작을 제어할 수 있다. 일 실시예에 따르면, 프로세서(120)는 디스플레이 모듈(160)을 통해 적어도 하나의 이미지를 포함하는 화면을 표시하도록 디스플레이 모듈(160)을 제어할 수 있다. 일 실시예에 따르면, 프로세서(120)는 이미지를 표시할 때, 또는 이미지를 표시하는 동안 주어진 이미지의 압축 품질(예: 압축률)을 결정(또는 분류)할 수 있다. 일 실시예에 따르면, 프로세서(120)는 메모리(130)에 저장된 다양한 압축 품질 별로 학습된(또는 모델링된) 다양한 노이즈 제거 모델(230)(또는 디노이징 모델(denoising model), 디노이저(denoiser) 또는 아티팩트 제거기(artifact reducer)) 중, 주어진 이미지의 압축 품질에 대응하게 학습된 노이즈 제거 모델을 선택할 수 있다. 일 실시예에 따르면, 프로세서(120)는 선택된 노이즈 제거 모델(230)에 기반하여 이미지 보정을 처리(예: 압축 이미지에서 압축 아티팩트를 제거하여 원본 품질의 이미지로 복구)하고, 보정된 이미지를 디스플레이 모듈(160)을 통해 표시할 수 있다.
일 실시예에 따르면, 프로세서(120)는 압축 품질 별 이미지 보정을 처리하기 적어도 하나의 모듈을 포함할 수 있다. 예를 들면, 프로세서(120)는 압축 품질 별 노이즈 제거 모델(230)을 학습할 수 있고, 학습하는 결과에 기반하여 압출 품질 별 노이즈 제거 모델(230)을 갱신 및 관리할 수 있다. 일 실시예에 따르면, 프로세서(120)는 주어진 이미지로부터 압축 품질을 분류하고, 압축 품질에 대응하는 노이즈 제거 모델(230)을 이용하여 이미지 보정을 처리할 수 있다.
다양한 실시예들에 따른, 프로세서(120)는 상기의 기능 외에 전자 장치(101)의 통상적인 기능과 관련된 각종 동작을 제어할 수 있다. 예를 들면, 프로세서(120)는 특정 어플리케이션 실행 시 그의 운영 및 화면 표시를 제어할 수 있다. 다른 예를 들면, 프로세서(120)는 터치 기반 또는 근접 기반의 입력 인터페이스에서 지원하는 다양한 터치 이벤트 또는 근접 이벤트 입력에 대응하는 입력신호를 수신하고, 그에 따른 기능 운영을 제어할 수 있다.
일 실시예에 따라, 이미지 처리 모듈(210), 성능 식별 모듈(220), 노이즈 제거 모듈(230), 모델 선택 모듈(240), 압축 품질 분류 모듈(250), 샘플 패치 추출 모듈(260) 및/또는 사용자 입력 처리 모듈(270) 중 적어도 일부는 하드웨어 모듈(예: 회로(circuitry))로 프로세서(120)에 포함되거나, 및/또는 프로세서(120)에 의해 실행될 수 있는 하나 이상의 인스트럭션들을 포함하는 소프트웨어로서 구현될 수 있다. 예를 들면, 프로세서(120)에서 수행하는 동작들은, 메모리(130)에 저장되고, 실행 시에, 프로세서(120)가 동작하도록 하는 인스트럭션들에 의해 실행될 수 있다.
일 실시예에 따라, 이미지 처리 모듈(210)은, 이미지 인코더(image encoder) 및 이미지 디코더(image decoder)를 포함할 수 있다. 일 실시예에 따르면, 이미지 처리 모듈(210)은, 이미지 인코더를 통해, 이미지에 대한 인코딩(encoding)을 처리할 수 있다. 예를 들면, 이미지 처리 모듈(210)은, 이미지 인코더를 이용하여, 이미지 인코딩을 통해 이미지를 지정된 압축률(또는 압축 레벨) 및 지정된 포맷(예: mpeg, jpeg, gif, 및/또는 png)의 파일로 압축할 수 있다. 일 실시예에 따르면, 이미지 처리 모듈(210)은, 이미지 디코더를 통해, 지정된 인코딩으로 압축된 이미지에 대한 디코딩(decoding)을 처리할 수 있다. 예를 들면, 이미지 처리 모듈(210)은, 이미지 디코더를 이용하여, 인코딩으로 압축된 이미지 파일의 압축을 해제하여, 이미지를 복구(또는 복원)할 수 있다.
일 실시예에 따라, 성능 식별 모듈(220)은, 전자 장치(101)에서 노이즈 제거 모델(230)(또는 디노이징 모델, 디노이저 또는 아티팩트 제거기) 학습 시 노이즈 제거 모델(230)의 성능을 식별할 수 있다. 일 실시예에 따르면, 성능 식별 모듈(220)은 노이즈 제거 모델(230)의 성능 식별을 위해, 원본 이미지와 보정(또는 개선) 이미지를 비교할 수 있다. 예를 들면, 성능 식별 모듈(220)은 원본 이미지와 보정 이미지 간의 최대 신호대 잡음비(PSNR, peak signal-to-noise ratio)를 비교하여, 이미지 압축에서 화질 손실 정보를 평가할 수 있다. 예를 들면, 성능 식별 모듈(220)은 손실이 적을수록 노이즈 제거 모델(230)의 성능이 좋은 것으로 판단할 수 있다.
일 실시예에 따라, 노이즈 제거 모델(230)은, 디노이징 모델, 디노이저 또는 아티팩트 제거기를 포함할 수 있다. 일 실시예에 따라, 노이즈 제거 모델(230)은, 예를 들면, 이미지 처리 모듈(210)(예: 이미지 디코더)의 후처리(post-processing) 필터(filter)로 사용될 모델을 나타낼 수 있다. 일 실시예에 따르면, 노이즈 제거 모델(230)은, 이미지에 관련된 다양한 압축 품질(또는 압축률 또는 압축 레벨) 별로 복수 개(예: n개, n은 2 이상의 자연수)를 포함할 수 있다. 일 실시예에 따르면, 노이즈 제거 모델(230)은 전자 장치(101)에서 다양한 압축 품질로 압축된 이미지를 이용하여, 다양한 압축 품질에 각각 대응하는 복수 개의 노이즈 제거 모델(230)이 학습되어, 메모리(130)에 저장될 수 있다.
일 실시예에 따라, 모델 선택 모듈(240)은, 적어도 하나의 지정된 조건(criteria)에 기반하여, 주어진 이미지의 이미지 보정(예: 압축 품질에 기반한 압축 아티팩트 제거)에 적용하기 최적의 노이즈 제거 모델(230)을 선택할 수 있다. 일 실시예에 따르면, 모델 선택 모듈(240)은 노이즈 제거 모델(230) 선택 시에, 압축 품질, 사용자 의도(또는 선호도 또는 취향), 이미지를 제공하는 서비스 또는 어플리케이션의 종류 및/또는 실제 이미지가 표시될 디스플레이 모듈(160)의 물리적 크기(예: 디스플레이 모듈(160)의 화면 크기) 중 적어도 하나를 고려하여, 다른 보정 강도 적용(또는 설정)을 위한 노이즈 제거 모델(230)을 선택할 수 있다. 일 실시예에 따라, 노이즈 제거 모델(230)의 모델 선택 동작과 관련하여 후술하는 도면들을 참조하여 설명된다.
일 실시예에 따라, 압축 품질 분류 모듈(250)은, n 단계(예: 13 단계, 16 단계, 50 단계, 또는 100 단계)로 압축 품질(compression quality)을 구분하는 모듈을 나타낼 수 있다. 예를 들면, 압축 품질 분류 모듈(250)은 이미지에 관련된 n개의 압축 품질(또는 압축률 또는 압축 레벨)에 대응하여 n개의 압축 품질을 분류할 수 있다. 일 실시예에 따르면, 압축 품질 분류 모듈(250)은 서비스 또는 어플리케이션에 기반하여 다양한 단계(예: 13 단계, 16 단계, 50 단계, 또는 100 단계)로 설정 가능할 수 있다. 예를 들면, 압축 품질 분류 모듈(250)은 제1 어플리케이션(예: 이미지 편집 어플리케이션)은 X 단계(예: 16 단계)로 설정할 수 있고, 제2 어플리케이션(예: 갤러리 어플리케이션)은 Y 단계(예: 100 단계)로 설정할 수 있다. 일 실시예에 따르면, 압축 품질 모듈(250)의 입력은, 예를 들면, 16x16 패치의 크기를 갖는 이미지일 수 있다. 일 실시예에 따라, 패치는 이미지의 압축 품질을 이해할 수 있는 최소한의 이미지 단위를 의미할 수 있다. 예를 들어, 이미지를 압축하는 압축 방법이 8x8 블록 단위로 이미지를 분할하여 압축하는 경우, 패치는 8x8 블록뿐만 아니라, 8x8 블록의 주변 관계를 포함할 수 있는 좀 더 큰 영역의 10x10 블록을 패치로 설정할 수 있다. 본 개시에서는, 예를 들면, 8x8 블록의 주변 블록의 중심까지 포함할 수 있도록 주변 블록의 약 4 픽셀(pixel)을 추가하여 16x16 크기의 영역을 패치의 크기로 정의할 수 있다. 일 실시예에 따라, 압축 품질 분류 모듈(250)의 압축 품질 분류 동작과 관련하여 후술하는 도면들을 참조하여 설명된다.
일 실시예에 따라, 샘플 패치 추출 모듈(260)은, 이미지의 압축 품질을 구분하기 위해서 m개의 패치(예: 16x16 patch)를 추출하는 모듈을 나타낼 수 있다. 일 실시예에 따르면, 샘플 패치 추출 모듈(260)(예: sample patch extractor)은, 주어진 이미지로부터, 예를 들면, 약 256개의 16x16 패치를 균등하게 추출하고, 추출된 256개의 16x16 패치 각각에 대해서 분류 및 통합을 수행하여 이미지에 대한 최종 품질(Q)을 예측할 수 있다. 일 실시예에 따르면, 샘플 패치 추출 모듈(260)은 주어진 이미지에서, 전체 영역이 아닌 일부 영역을 분석함으로써 분류 속도를 향상시킬 수 있다.
어떤 실시예에 따르면, 샘플 패치 추출 모듈(260)은, 주어진 이미지로부터, 패치 단위로 복수 개의 영역들을 균등하게 추출하고, 추출된 영역들의 에지(edge) 성분을 분석하여 이미지에 대한 최종 품질(Q)을 예측할 수도 있다. 예를 들면, 샘플 패치 추출 모듈(260)은, 다양한 에지 검출(edge detection) 방식에 기반하여, 추출된 영역들의 에지 성분(예: 이미지의 밝기가 낮은 값에서 높은 값으로, 또는 그 반대로 변하는 지점에 존재하는 부분 또는 윤곽선)을 분석하고, 에지 성분이 지정된 임계 값 이하인 경우, 해당 영역을 평균 또는 중간(median) 값 계산에서 제외하여, 보다 높은 압축 분류가 가능하도록 할 수도 있다. 일 실시예에서, 에지 검출 방식은, 예를 들면, 소벨(Sobel) 에지 추출, 프리윗(Prewitt) 에지 추출, 로버츠(Roberts) 에지 추출, 컴퍼스(Compass) 에지 추출, 2차 미분과 라플라시안(Laplacian) 에지 추출, 캐니(Canny) 에지 추출, 및/또는 라인(line) 에지 추출과 같은 다양한 에지 추출 알고리즘을 이용할 수 있다. 예를 들면, 에지 검출에 의한 분류는 압축 아티팩트(또는 노이즈)의 패턴의 경우 에지 성분 주위에서 보다 두드러지게 나타날 수 있으며, 민무늬(예: 아무 패턴이 없는 솔리드 컬러 패치(solid color patch))에 의한 오분류 방지에 유리할 수 있다.
일 실시예에 따라, 샘플 패치 추출 모듈(260)의 이미지로부터 샘플 패치를 추출하여 이들을 분류 및 통합하는 동작과 관련하여 후술하는 도면들을 참조하여 설명된다.
일 실시예에 따라, 사용자 입력 처리 모듈(270)은, 사용자의 의도(또는 선호도 또는 취향(를 파악하기 위한 사용자 입력을 처리하는 모듈을 나타낼 수 있다. 일 실시예에 따르면, 사용자 입력 처리 모듈(270)은 디스플레이 모듈(160)을 통해 사용자의 선호도를 파악하기 위해 표시된 디노이즈된(예: 압축 아티팩트가 제거된) 이미지들에 대한 사용자 입력을 수신하고, 수신된 사용자 입력에 따라 선택된 이미지의 보정 강도에 대한 정보를 모델 선택 모듈(240)에 제공할 수 있다. 일 실시예에 따라, 사용자 입력 처리 모듈(270)의 사용자의 의도를 반영하는 동작과 관련하여 후술하는 도면들을 참조하여 설명된다.
본 개시에서 설명되는 다양한 실시예들은 소프트웨어(software), 하드웨어(hardware) 또는 이들의 조합된 것을 이용하여 컴퓨터(computer) 또는 이와 유사한 장치로 읽을 수 있는 기록 매체 내에서 구현될 수 있다. 하드웨어적인 구현에 의하면, 다양한 실시예들에서 설명되는 동작들은 ASICs(Application Specific Integrated Circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays), 프로세서(processors), 제어기(controllers), 마이크로 컨트롤러(micro-controllers), 마이크로프로세서(microprocessors), 및/또는 기타 기능 수행을 위한 전기적인 유닛(unit) 중 적어도 하나를 이용하여 구현될 수 있다.
다양한 실시예들에서, 기록 매체는 디스플레이 모듈(160)을 통해 적어도 하나의 이미지를 포함하는 화면을 표시하는 동작, 적어도 하나의 이미지의 압축 품질을 결정하는 동작, 결정된 압축 품질에 대응하게 학습된 노이즈 제거 모델을 선택하는 동작, 선택된 노이즈 제거 모델에 기반하여 이미지 보정을 처리하는 동작, 및 보정된 이미지를, 디스플레이 모듈(160)을 통해, 표시하는 동작을 실행시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체를 포함할 수 있다.
본 개시의 다양한 실시예들에 따른 전자 장치(101)는, 디스플레이 모듈(160), 메모리(130) 및 상기 디스플레이 모듈(160) 및 상기 메모리(130)와 작동적으로 연결된 프로세서(120)를 포함하고, 상기 프로세서(120)는, 상기 디스플레이 모듈(160)을 통해 적어도 하나의 이미지를 포함하는 화면을 표시하고, 상기 적어도 하나의 이미지의 압축 품질을 결정하고, 결정된 압축 품질에 대응하게 학습된 노이즈 제거 모델(230)을 선택하고, 선택된 노이즈 제거 모델에 기반하여 이미지 보정을 처리하고, 및 보정된 이미지를 상기 디스플레이 모듈(160)을 통해 표시할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 적어도 하나의 이미지는, 지정된 압축 품질로 압축된 압축 이미지인 것을 특징으로 할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 적어도 하나의 이미지의 패치(patch) 단위로 압축 품질을 분류할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 이미지에서 상기 패치 단위로 복수 개의 영역들을 균등하게 추출하고, 추출된 영역들의 압축 품질의 평균 또는 중간(median) 값에 기반하여 상기 이미지의 압축 품질을 분류할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 추출된 영역들에 기반하여 에지 성분을 분석하고, 상기 에지 성분이 지정된 임계 값 이하인 영역에 대해, 상기 평균 또는 상기 중간 값을 위한 계산에서 제외할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 적어도 하나의 이미지를 제공하는 어플리케이션 또는 서비스의 종류에 기반하여 압축 품질을 분류할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 이미지를 제공하는 어플리케이션 또는 서비스의 종류를 식별하고, 상기 어플리케이션 또는 서비스의 종류에 기반하여 대응하는 지정된 압축 품질을 식별하고, 상기 지정된 압축 품질에 기반하여 상기 이미지의 압축 품질을 분류할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 다양한 압축 품질 별로 미리 학습된 복수의 노이즈 제거 모델(230)을 상기 메모리(130)에 저장하고, 상기 복수의 노이즈 제거 모델(230) 중 상기 이미지의 압축 품질의 분류에 대응하게 학습된 노이즈 제거 모델을 선택할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 사용자 선호도, 이미지를 제공하는 서비스 또는 어플리케이션의 종류 및/또는 상기 디스플레이 모듈의 화면 크기 중 적어도 하나를 추가 고려하여, 상기 노이즈 제거 모델을 선택할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 선택된 노이즈 제거 모델에 대응하는 보정 강도에 따라 상기 이미지에서 압축 아티팩트를 제거하고, 상기 이미지를 압축 이전의 원본 이미지로 복구할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 이미지 보정 시에, 상기 이미지 보정에 관련된 정보 및 사용자 의도 확인을 위해 사용자와 상호작용할 수 있는 사용자 인터페이스를 제공할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 사용자 인터페이스에 기반하여 사용자 입력을 수신하고, 상기 사용자 입력에 기반하여 상기 보정된 이미지의 후처리를 수행할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 상기 화면을 표시할 때, 컨텐츠 실행에 기반하여, 상기 이미지에 대응하는 외부 장치로부터 상기 이미지를 임시 다운로드 하고, 임시 다운로드된 이미지를 분류된 압축 품질에 따라 학습된 노이즈 제거 모델에 기반하여 압축 아티팩트가 제거된 보정 이미지를 제공할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 프로세서(120)는, 적어도 하나의 이미지를 포함하는 컨텐츠 실행에 기반하여 대응하는 화면을 표시하고, 상기 화면에서 사용자의 이미지 선택에 기반하여, 사용자에 의해 선택된 이미지를 일정 비율로 확대하여 제공하고, 상기 선택된 이미지를 표시할 때, 상기 선택된 이미지의 압축 품질을 분류하고 그 결과를 팝업 메시지를 통해 제공할 수 있다.
이하에서는 다양한 실시예들의 전자 장치(101)의 동작 방법에 대해서 상세하게 설명한다. 다양한 실시예들에 따라, 이하에서 설명하는 전자 장치(101)에서 수행하는 동작들은, 전자 장치(101)의 적어도 하나의 프로세싱 회로(processing circuitry)를 포함하는 프로세서(예: 도 1 또는 도 2의 프로세서(120))에 의해 실행될 수 있다. 일 실시예에 따라, 전자 장치(101)에서 수행하는 동작들은, 메모리(130)에 저장되고, 실행 시에, 프로세서(120)가 동작하도록 하는 인스트럭션들에 의해 실행될 수 있다.
도 3은 다양한 실시예들에 따른 전자 장치의 동작 방법을 도시하는 흐름도이다.
도 3을 참조하면, 동작 301에서, 전자 장치(101)의 프로세서(120)는 이미지를 포함하는 화면을 표시할 수 있다. 일 실시예에 따르면, 프로세서(120)는 이미지 및/또는 이미지를 포함하는 컨텐츠를 디스플레이 모듈(160)을 통해 시각적으로 제공할 수 있다. 일 실시예에 따르면, 프로세서(120)는 사용자 입력에 기반하여, 전자 장치(101)의 메모리(130)에 저장된 이미지 및/또는 외부 장치로부터 수신된 이미지를 포함하는 화면을 표시하도록 디스플레이 모듈(160)을 제어할 수 있다. 일 실시예에 따라, 이미지는 지정된 압축 품질(또는 압축률 또는 압축 레벨)로 압축된 압축 이미지를 나타낼 수 있다.
동작 303에서, 프로세서(120)는 이미지에 관련된 압축 품질을 결정할 수 있다. 일 실시예에 따르면, 프로세서(120)는 주어진 적어도 하나의 이미지에 대한 압축 품질(예: 압축률)을 각각 분류할 수 있다.
일 실시예에 따르면, 프로세서(120)는 압축 품질을 분류할 때, 주어진 이미지의 전체 영역이 아닌 압축 패치(예: 8x8 픽셀(pixel), 16x16 픽셀 또는 64x64 픽셀) 단위로, 지정된 m개(예: 약 256개)의 패치를 균등하게 추출하여 분석할 수 있다. 이를 통해, 프로세서(120)는 주어진 이미지에서 패치 단위로 압축하는 코덱의 특성을 그대로 확인할 수 있고, 이미지 전체를 확률적으로 고르게 확인할 수 있다. 어떤 실시예에 따르면, 프로세서(120)는 압축 품질을 분류할 때, 주어진 이미지로부터, 복수 개(예: 지정된 m개)의 패치를 균등하게 추출하고, 추출된 패치의 에지 성분을 분석할 수 있다. 예를 들면, 프로세서(120)는 다양한 에지 검출 방식에 기반하여, 추출된 패치들의 에지 성분을 분석하여, 에지 성분이 지정된 임계 값 이하인 패치에 대해, 평균 또는 중간 값 계산에서 제외하여, 압축 품질을 분류할 수 있다.
다양한 실시예들에 따르면, 프로세서(120)는 주어진 이미지를 패치 단위(예: 8x8 패치 단위, 16x16 패치 단위 또는 64x64 패치 단위)로 분류 학습 및 예측을 통해 압축 품질을 결정할 수 있다. 예를 들면, 이미지의 압축은, 패치 단위로 이루어질 수 있으므로, 8x8 패치 단위, 16x16 패치 단위 또는 최대로 64x64(예: HEVC의 경우) 패치 단위로 분류가 가능할 수 있다. 이를 통해, 프로세서(120)는 압축이 발생하는 단위인 해당 패치에 집중하여, 전체적인 이미지 특성에 의한 계산 오류를 방지할 수 있다. 또한, 프로세서(120)는 압축 품질을 결정하기 위한 연산의 입력 이미지(input image)의 크기가 작으므로, 기존의 풀링 레이어(pooling layer)를 사용하여 불필요하게 수용 영역(receptive field)을 넓히고 정확성이 떨어질 수 있는 동작을 회피할 수 있다.
일 실시예에 따르면, 프로세서(120)는 이미지의 특성상 압축률을 명확히 반영하지 못하는 영역(예: 이미지에서 검은색 부분의 경우 압축 여부에 관계 없이 비슷한 특성을 가지는 영역)이 발생할 수 있으므로, 이를 고려하여, 이미지의 다양한 영역을 균등하게 추출하여(예: 약 256개의 패치를 균등하게 추출), 추출된 영역들의 각 압축 품질(또는 점수)들의 평균 또는 중간(median) 값을 이용하여 분류할 수 있다.
일 실시예에 따르면, 프로세서(120)는 추출된 영역들의 각 압축 품질(또는 점수)들의 평균 또는 중간 값을 계산할 때, 추출된 영역들의 에지 성분을 분석하여, 에지 성분이 지정된 임계 값 이하인 영역에 대해, 평균 또는 중간 값 계산에서 제외할 수도 있다. 예를 들면, 에지 검출에 의한 분류는 압축 아티팩트(또는 노이즈)의 패턴의 경우 에지 성분 주위에서 보다 두드러지게 나타날 수 있으며, 민무늬(예: 아무 패턴이 없는 솔리드 컬러 패치(solid color patch))에 의한 오분류 방지에 유리할 수 있다.
일 실시예에 따르면, 프로세서(120)는 압축 품질을 분류할 때, 주어진 이미지를 제공하는 서비스(또는 어플리케이션)의 종류에 기반하여 압축 품질을 분류할 수도 있다. 예를 들면, 각 서비스(예: 메신저 서비스, 포털 서비스)(또는 어플리케이션)는 클라우드 환경의 스토리지를 절약하고, 이미지 전송의 지연을 최소화하기 위해 각자 고유한(또는 지정된) 압축 품질로 이미지를 전자 장치(101)에 제공할 수 있다. 예를 들면, 아래 <표 1>은 각 서비스(또는 어플리케이션)에서 제공하는 JPEG 압축 품질의 예를 나타낼 수 있다. <표 1>에서, 압축 품질의 수치가 높을수록 좋은 품질을 의미할 수 있다. 일 실시예에 따르면, 프로세서(120)는 전자 장치(101)에서 주어진 이미지를 제공(또는 실행)하는 서비스(또는 어플리케이션)의 종류를 식별하고, 서비스의 종류에 기반하여 대응하는 압축 품질을 분류할 수 있다.
서비스 종류 |
제1 서비스 (예: Messenger) |
제2 서비스 (예: Youtube Thumbnail) |
제3 서비스 (예: Kakao Talk) |
제4 서비스 (예: Google Photo) |
압축 품질 |
약 70 | 약 70 | 약 90: Standard 약 95: High |
약 85, 약 80, 약 70, 약 60 (이미지에 따라 가변적으로 적용) |
동작 305에서, 프로세서(120)는 압축 품질에 대응하게 학습된 모델(예: 노이즈 제거 모델 또는 디노이징 모델)을 선택할 수 있다. 예를 들면, 프로세서(120)는 이미지를 제공하는 서비스(또는 어플리케이션)에서 사용하는 압축 품질을 사전에 파악하고, 전자 장치(101)에서 해당 서비스(또는 어플리케이션)을 사용 시에, 해당 압축 품질로 학습된 디노이징 모델을 사용할 수 있다.
일 실시예에 따르면, 프로세서(120)는 메모리(130)에 다양한 압축 품질 별로 미리 학습된 복수의 노이즈 제거 모델(230) 중, 이미지의 압축 품질에 대응하게 학습된 노이즈 제거 모델을 선택할 수 있다. 일 실시예에 따르면, 프로세서(120)는 주어진 이미지에 대해, 제1 압축 품질로 분류하는 경우 제1 압축 품질의 분류에 대응하는 제1 노이즈 제거 모델을 선택할 수 있고, 제2 압축 품질로 분류하는 경우 제2 압축 품질의 분류에 대응하는 제2 노이즈 제거 모델을 선택할 수 있고, 제3 압축 품질로 분류하는 경우 제3 압축 품질의 분류에 대응하는 제3 노이즈 제거 모델을 선택할 수 있다. 어떤 실시예에 따르면, 프로세서(120)는 압축 품질에 대응하게 학습된 노이즈 제거 모델 선택 시, 사용자 의도(또는 선호도 또는 취향), 이미지를 제공하는 서비스 또는 어플리케이션의 종류 및/또는 실제 이미지가 표시될 디스플레이 모듈(160)의 물리적 크기(예: 디스플레이 모듈(160)의 화면 크기) 중 적어도 하나를 더 고려하여, 노이즈 제거 모델을 선택할 수도 있다.
동작 307에서, 프로세서(120)는 선택된 모델에 기반하여 이미지 처리를 수행할 수 있다. 일 실시예에 따르면, 프로세서(120)는 복수의 노이즈 제거 모델(230) 중, 이미지의 압축 품질에 기반하여 선택된 노이즈 제거 모델을 이용하여 이미지 보정을 처리할 수 있다. 일 실시예에 따르면, 프로세서(120)는 선택된 노이즈 제거 모델에 대응하는 보정 강도에 따라 주어진 이미지에서 압축 아티팩트(또는 노이즈)를 제거하여 주어진 이미지(예: 압축 이미지)를 압축 이전의 원본 이미지로 복구할 수 있다.
동작 309에서, 프로세서(120)는 보정된 이미지를 표시할 수 있다. 일 실시예에 따르면, 프로세서(120)는 주어진 적어도 하나의 이미지가 대응하는 노이즈 제거 모델에 기반하여 보정된 상태를 표시하도록 디스플레이 모듈(160)을 제어할 수 있다. 어떤 실시예에 따르면, 동작 309의 보정된 이미지 표시 동작은, 보정된 이미지를 전송하거나 저장하는 동작을 포함하거나, 또는 보정된 이미지를 전송하거나 저장하는 동작으로 대체할 수도 있다.
도 4는 다양한 실시예들에 따른 전자 장치에서 이미지 보정의 예를 도시하는 도면이다.
도 4에 도시한 바와 같이, 예시 화면 <401>은, 압축 품질에 따른 이미지 보정 전의 압축 이미지(410)(예: 주어진 이미지)가 제공되는 예를 나타낼 수 있고, 예시 화면 <403>은, 압축 품질에 따른 이미지 보정 후의 보정 이미지(420)(예: 복구 이미지)가 제공되는 예를 나타낼 수 있다.
일 실시예에 따라, 도 4의 예시에서, 예시 화면 <401>은 주어진 이미지(예: 지정된 압축 품질로 압축된 압축 이미지(410))의 압축 품질이, 예를 들면, JPEG 품질 레벨(quality level)(예: 약 80)인 것을 예로 나타낼 수 있다. 일 실시예에 따라, 도 4의 예시에서, 예시 화면 <403>은 전자 장치(101)가 주어진 이미지(410)에서 JPEG 품질 레벨(예: 약 80)인 것을 분류(classification)(또는 예측)하고, 분류된 압축 품질(예: 품질 레벨: 약 80)에 대응하게 학습된 개선 알고리즘(예: 노이즈 제거 모델)을 적용(예: 이미지 보정)한 예를 나타낼 수 있다.
일 실시예에 따르면, 전자 장치(101)로 제공되는 이미지는 대부분 일정 압축 품질(또는 압축률)로 압축되어 전송되며, 전자 장치(101)는 외부 장치(또는 네트워크)로부터 압축 이미지를 수신할 수 있다. 이러한 압축 이미지는, 예시 화면 <401>에 예시한 바와 같이, 압축 품질에 따라 고유한 아티팩트(artifacts)(예: 예시 화면 <401>에서 엘리먼트 430 부분)가 발생할 수 있다. 예를 들면, 이미지는, 압축 품질(예: 비트레이트(bit rate))를 낮추기 위해서 다양한 샘플링(예: chroma subsampling), 블록 크기(block size), 및/또는 근사화(예: 이산코사인변환(DCT, discrete cosine transform) 계수 근사화(coefficient quantization))와 같은 다양한 방법들이 사용될 수 있고, 압축 코덱에 따라 추가로 더 다양한 압축 품질 조절 방법(예: 비트레이트 조절 방법)으로 압축될 수 있다.
다양한 실시예들에 따르면, 전자 장치(101)는 다양한 압축 품질로 이루어진 학습 데이터(예: 다양한 압축 품질 별 이미지들)에서 해당 압축 품질에 나타나는 특유의 아티팩트(또는 노이즈)들의 패턴을 학습하고, 이를 제거하는 복수 개의 모델(예: 노이즈 제거 모델)을 심층 신경망(deep neural network)을 통해 학습할 수 있다. 일 실시예에서, 심층 신경망은 입력층(input layer)과 출력층(output layer) 사이에 다중의 은닉층(hidden layer)을 포함하는 인공 신경망(ANN, artificial neural network))을 나타낼 수 있다. 일 실시예에 따르면, 심층 신경망은 다중의 은닉층을 포함하여 다양한 비선형적 관계를 학습할 수 있으며, 딥 러닝(deep learning)의 핵심 모델로 활용되고 있다. 일 실시예에 따르면, 심층 신경망은 알고리즘에 따라 비지도 학습 방법(unsupervised learning)을 기반으로 하는 심층 신뢰 신경망(DBN, deep belief network) 및 심층 오토인코더(deep autoencoder)와, 이미지와 같은 2차원 데이터 처리를 위한 합성곱 신경망(CNN, convolutional neural network), 및/또는 시계열 데이터 처리를 위한 순환 신경망(RNN, recurrent neural network)을 포함할 수 있다.
이에 따라, 다양한 실시예들에서는, 다양한 압축 품질 별로 최적화된 노이즈 제거 모델을 매칭할 수 있고, 압축 품질에 대응하는 노이즈 제거 모델을 적용하여 아티팩트(또는 노이즈)(예: 엘리먼트 430)를 제거할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 학습 데이터를 통해서 압축 품질에 따른 아티팩트를 분류할 수 있고, 아티팩트의 패턴을 자동적으로 분석하여, 해당 압축 품질에 대응하는 특유의 아티팩트까지 제거할 수 있다.
일 실시예에 따르면, 전자 장치(101)는 주어지 이미지(예: 예시 화면 <401>의 압축 이미지(410))에 대해 압축 품질을 파악하고, 해당 압축 품질의 아티팩트(또는 노이즈)에 맞게 학습된 노이즈 제거 모델을 적용하여, 사용자에게 아티팩트가 제거된 이미지(예: 예시 화면 <403>의 복구 이미지(420))를 제공할 수 있다.
도 5는 다양한 실시예들에 따른 전자 장치에서 이미지 보정을 위한 학습, 분류 및 제거 동작의 예를 도시하는 흐름도이다.
도 5를 참조하면, 동작 501에서, 전자 장치(101)의 프로세서(120)는 복수 개 클래스(class)의 압축 품질로 구성된 데이터세트(dataset)를 생성할 수 있다. 일 실시예에 따르면, 프로세서(120)는 n개 클래스의 압축 품질로 구성된 데이터세트를 생성할 수 있다. 예를 들면, 전자 장치(101)에서 머신 러닝(machine learning) 모델을 만들기 위해서, 이미지의 데이터세트가 필요할 수 있다. 일 실시예에서, 이미지의 데이터세트는, 예를 들면, 도 2의 이미지 처리 모듈(210)(예: 이미지 인코더)을 사용하여 준비할 수 있다. 예를 들면, 프로세서(120)는 이미지 인코더의 품질(quality) 옵션을 n개의 클래스로 다양하게 설정하여, n개의 품질의 압축 이미지를 준비할 수 있다. 일 예로, JPEG 포맷의 인코딩이 구현된 라이브러리 어플리케이션은 인코딩 품질(encoding quality)을, 예를 들면, 1에서 100까지의 100개의 압축 단계를 제공할 수 있고, 이미지 편집 어플리케이션은 인코딩 품질을, 예를 들면, 1에서 13까지의 13개의 압축 단계를 제공할 수 있다.
일 실시예에 따르면, 프로세서(120)는 데이터세트에 기반하여, 예를 들면, 도 2의 압축 품질 분류 모듈(250)(예: compression quality classifier)을 학습할 수 있다. 일 실시예에 따르면, 프로세서(120)는 다양한 품질로 압축된 이미지를 “입력 X”로 하고, 각 압축 이미지를 생성할 때 사용한 품질을 “Ground Truth 출력 Y”(예: 라벨(label) 또는 표지)로 설정할 수 있다.
일 실시예에 따르면, 프로세서(120)는, 예를 들면, 도 2의 노이즈 제거 모델(230)(예: artifact reducer)을 학습할 수 있다. 일 실시예에 따르면, 프로세서(120)는 다양한 품질로 압축된 이미지를 “입력 X”로 하고, 원본 이미지를 “Ground Truth 출력 Y”로 설정할 수 있다. 일 실시예에 따라, 노이즈 제거 모델(230)은 압축 품질 분류 모듈(250)과 다르게 라벨이 정수가 아닌 이미지를 나타낼 수 있다.
동작 503에서, 프로세서(120)는 압축 품질의 클래스를 분류할 수 있다. 일 실시예에 따르면, 프로세서(120)는 압축 품질의 클래스를 분류하기 위한 학습(learning)을 수행할 수 있다. 일 실시예에 따라, 프로세서(120)는 압축 품질의 클래스를 분류하기 위한 방법으로 다양한 머신 러닝 방법을 이용할 수 있으며, 예를 들면, CNN(convolutional neural network)으로 압축 품질 분류 모듈(250)을 구현할 수 있다. 예를 들면, 프로세서(120)는 CNN 모델을 동작 501에서 생성한 데이터세트 상에서 다양한 압축 이미지 품질을 이미지 처리 모듈(210)(예: 이미지 디코더)로 디코딩한 데이터로 훈련하여, 전자 장치(101) 상에서의 임의의 이미지가 주어졌을 때 해당 이미지의 압축 품질을 예측하도록 할 수 있다. 일 실시예에 따른 머신 러닝 방법은 CNN 모델에 한정하지 않으며, 압축 품질의 분류 및 개선을 위해 이용될 수 있는 다양한 머신 러닝 방법을 이용할 수 있다. 예를 들면, 머신 러닝 방법으로, 심층 신뢰 신경망(DBN), 심층 오토인코더(deep autoencoder), 합성곱 신경망(CNN), 및/또는 순환 신경망(RNN)과 같은 다양한 모신 러닝 방법을 포함할 수 있다.
일 실시예에 따르면, 프로세서(120)는 이미지에 대한 압축 품질을 예측(inference)할 수 있다. 일 실시예에 따르면, 프로세서(120)는 전자 장치(101)에서 압축 품질의 클래스를 분류를 수행할 때, 이미지의 모든 패치(patch)들을 모두 체크(check)하지 않고, 예를 들면, 도 2의 샘플 패치 추출 모듈(260)(예: sample patch extractor)을 이용하여, 예를 들면, 약 256개의 16x16 패치를 균등하게 추출하고, 추출된 256개 각각에 대해서 분류 및 통합하여 이미지에 대한 최종 품질 Q를 예측할 수 있다. 일 실시예에 따르면, 프로세서(120)는 추출된 영역들에 기반한 최종 품질 Q를 예측할 때, 추출된 영역들의 에지 성분을 분석하여, 에지 성분이 지정된 임계 값 이하인 영역에 대해, 평균 또는 중간 값 계산에서 제외하고 최종 품질 Q를 예측할 수도 있다. 다양한 실시예들에 따르면, 프로세서(120)는 이미지의 전체가 아닌 일부를 분석함으로써 분류 속도를 급격하게 향상할 수 있다.
동작 505에서, 프로세서(120)는 압축 품질에 대응하게 학습된 노이즈 제거 모델 적용에 기반하여 아티팩트를 제거할 수 있다. 일 실시예에 따르면, 프로세서(120)는 주어진 이미지에 대해, 해당 압축 품질에 대응하게 학습된 개선 강도(denoising strength)를 적용하여 아티팩트(artifacts)를 제거할 수 있다. 일 실시예에 따르면, 프로세서(120)는 압축 품질에 대응하는 노이즈 제거 모델을 결정하기 위한 학습을 수행할 수 있다. 일 실시예에 따르면, 프로세서(120)는 압축 품질의 분류 개수와 같이, 예를 들면, n개의 노이즈 제거 모델(230)을 생성할 수 있다. 어떤 실시예에 따르면, 프로세서(120)는 노이즈 제거 모델(230)의 개수를 줄이기 위해서, 예를 들면, n개보다 적은 개수로 근사화(quantization)하여 노이즈 제거 모델(230)을 생성할 수도 있다. 일 예로, 프로세서(120)는 약 100개의 압축 품질 중에서, 예를 들면, 약 8개의 품질(예: 압축 품질 20, 30, 40, 50, 60, 70, 80, 및 90)로 근사화할 수 있다. 일 실시예에 따르면, 프로세서(120)는 근사화를 통해 생성된 압축 이미지가 원본 이미지로 8x8 패치 단위로 보정될 수 있도록 학습 모델을 생성할 수 있다. 일 실시예에 따르면, 프로세서(120)는 입력 크기를 16x16 픽셀(pixel) 크기를 갖는 패치로 설정하여 주위의 블록의 적어도 일부 영역을 같이 고려하도록 할 수도 있다. 예를 들면, 프로세서(120)는 특정 블록의 주변 블록과 질감 및/또는 색감이 급격하게 변하는 것을 방지할 수 있다.
일 실시예에 따르면, 프로세서(120)는 압축 품질 분류 모듈(250)을 통해서 예측된 품질(예: 최종 품질 Q)에 기반하여 적절한 노이즈 제거 모델(230)을 결정하고, 결정된 노이즈 제거 모델(230)을 이미지 보정에 적용하여, 이미지의 손실 압축에 따른 압축 아티팩트를 제거할 수 있다.
도 6은 일 실시예에 따라 이미지의 압축 품질의 일반성을 설명하기 위해 도시하는 도면이다.
일 실시예에 따라, 전술한 바와 같이, 예를 들면, 1에서 100까지의 압축 품질의 수치는 이미지 인코더, 어플리케이션, 및/또는 서비스에 따라서 실제적인 압축률)(또는 근사화 단계 크기(quantization step size 및/또는 서브샘플링(subsampling) 개수)이 다를 수 있다. 하지만, 이미지 인코더의 종류에 따라, 압축 품질을 나타내는 수치가 다르더라도 하나의 이미지 인코더에서 최고의 압축률과 최적의 압축률 사이의 품질을 균등하게 학습하는 경우, 결과적으로, 도 6에 예시한 바와 같이, 어느 한 포인트(point)에서 다른 이미지 인코더의 압축 품질과 비슷한 포인트가 존재할 수 있으며, 그에 맞는 화질 개선이 이루어질 수 있다.
일 실시예에 따라, 도 6의 예시는, 다른 압축 품질의 단계를 제공하는 제1 어플리케이션(예: 갤러리 어플리케이션)과 제2 어플리케이션(예: 이미지 편집 어플리케이션)의 예를 나타낼 수 있다. 일 실시예에 따라, 다른 압축 품질의 단계를 제공하는 방법으로, DCT 계수를 Quantization의 단계를 다르게 하는 방법 및/또는 Chroma 영역의 서브샘플링을 다르게 하는 방법을 포함할 수 있다. 예를 들면, 도 6의 예시에서는, 1에서 100까지의 100 단계의 JPEG 품질을 제공하는 제1 이미지 인코더(예: 제1 어플리케이션(예: 갤러리 어플리케이션)에 적용된 인코더)에서 학습한 압축 품질 분류 모듈(250)을, 예를 들면, 0에서 12까지의 13 단계의 품질을 제공하는 제2 이미지 인코더(예: 제2 어플리케이션(예: 이미지 편집 어플리케이션)에 적용된 인코더)로 생성된 이미지에 적용하여 수치를 비교한 결과를 나타낼 수 있다.
일 실시예에 따라, 상기 비교에 기반하여, 제1 이미지 인코더로 생성된 제1 이미지(예: 품질 1 ~ 100)가 제2 이미지 인코더에서 생성된 제2 이미지(예: 품질 0 ~ 12) 사이에 상관관계(correlation)(또는 연관성)가 있는지 확인할 수 있다. 예를 들면, 제1 이미지와 제2 이미지 사이에 상관관계가 있는 경우에, 하나의 이미지 인코더(예: JPEG encoder)에서만 품질을 측정하여 대응하는 노이즈 제거 모델(230)을 생성할 수 있다.
일 실시예에 따라, 도 6을 참조하면, 도 6에서 세로 축(예: Y 축)은 제1 이미지 인코더의 1에서 100까지의 100 단계의 품질을 나타낼 수 있고, 가로 축(예: X 축)은 제2 이미지 인코더의 0에서 12까지의 13 단계의 품질을 나타낼 수 있다. 일 실시예에 따라, 도 6에서 엘리먼트 610의 그래프는 최대 신호대 잡음비(PSNR, peak signal-to-noise ratio) 변화를 나타낼 수 있고, 엘리먼트 620의 그래프는 품질 변화를 나타낼 수 있다.
도 6을 참조하여, 비교 결과를 살펴보면, 그래프(620)로 예시한 바와 같이, 제2 이미지 인코더의 품질이 0에서 12로 증가할 때, 제1 이미지 인코더에서 학습한 압축 품질 분류 모듈(250)의 측정값도 약 17에서 약 99까지 비례하여 증가하는 것을 확인할 수 있다. 예를 들면, 서로 다른 두 개의 인코더들의 다른 레벨의 품질 간에 상관관계가 존재할 수 있다. 도 6의 실험을 통해 확인한 바와 같이, 하나의 인코더(예: JPEG encoder)에서 학습을 하더라도, 다양한 다른 인코더도 지원이 가능하다는 것을 알 수 있다.
이상에서와 같이, 전자 장치(101) 및/또는 외부 장치(예: 서버 또는 다른 전자 장치)로부터 제공되는 이미지는, 압축 품질에 따라 고유한 아티팩트(또는 노이즈)가 발생할 수 있다. 예를 들면, 이미지는 압축 품질 정보(예: 비트레이트 정보)를 낮추기 위해서 다양한 샘플링(예: chroma subsampling), 블록 크기(block size), 및/또는 근사화(예: DCT coefficient quantization) 방법들이 사용되고 있고, 압축 코덱에 따라 추가로 더 다양한 압축 품질 조절 방법(예: 비트레이트 조절 방법)이 사용될 수 있다.
다양한 실시예들에서는 다양한 압축 품질로 이루어진 학습 데이터(예: 다양한 압축 품질 별 이미지)에서 해당 압축 품질에 나타나는 특유의 아트팩트(또는 노이즈)의 패턴을 학습하고, 이를 제거하는 복수 개의 노이즈 제거 모델을 심층 신경망을 통해 학습할 수 있다. 이에 따라, 다양한 실시예들에 따른 전자 장치(101)는, 예를 들면, 종래의 블러(Blur) 필터 강도에 따른 노이즈 개선보다 더 해당 압축 품질에 최적화된 아티팩트 제거가 가능할 수 있다. 다양한 실시예들에 따른 전자 장치(101)는 학습 데이터를 통해서 압축 품질에 따른 아티팩트를 분류할 수 있고, 아티팩트의 패턴을 분석하여, 해당 압축 품질에 대응하는 특유의 아티팩트까지 제거할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 학습한 압축 품질 분류 모듈(250)을 이용하여, 미리 학습된 복수 개의 노이즈 제거 모델 중에 주어진 이미지의 압축 품질에 가장 맞는 하나의 노이즈 제거 모델을 선택할 수 있다.
일 실시예에 따르면, 전자 장치(101)는 복수 개(예: n개)의 노이즈 제거 모델을 이용하여 새로운 보정 강도를 제안할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 각 압축 품질에 맞게 학습한 노이즈 제거 모델을 적용할 수 있다. 어떤 실시예에 따르면, 전자 장치(101)는 심층 신경망의 최적화 이슈 및/또는 상황에 따라 노이즈 제거 모델을 적용할 수도 있다. 예를 들면, 다양한 실시예들에 따른 전자 장치(101)는 가장 비슷한 압축 품질의 클래스 상에서 학습한 근사화된 노이즈 제거 모델을 사용함으로써, 다양한 압축 품질 별 아티팩트를 한번에 아우를 수 있는 새로운 보정 강도를 제안할 수 있다. 예를 들면, 새로운 보정 강도의 수치는 다양한 압축 품질에서 학습한 노이즈 제거 모델의 인덱스(index)가 될 수 있다. 다양한 실시예들에 따른 전자 장치(101)는 노이즈 제거 모델의 인덱스에 기반하여 하나의 값으로 새로운 보정 강도를 설정할 수 있다.
다양한 실시예들에 따르면, 전자 장치(101)는 압축 품질이 상이한 이미지를 특정 해당 압축 품질의 클래스(class)로 이름 붙여 학습 데이터를 생성할 수 있다. 다양한 실시예들에 따르면, 전자 장치(101)는 학습 데이터에서 해당 압축 품질의 압축 레벨(또는 수준)을 분류하는 방법을 학습할 뿐만 아니라, 대응하는 아티팩트를 제거하는 방법까지 다양한 노이즈 제거 모델로 학습할 수 있다. 이를 기반으로, 전자 장치(101)는 특정 이미지가 주어졌을 때, 해당 압축 품질에 맞는 압축 제거 방법을 적용할 수 있다. 또한, 전자 장치(101)는 다양한 압축 제거 방법의 클래스나 인덱스(index)를 사용하여 복잡한 파라미터로 표현되던 노이즈 보정 강도를 근사화 하여 표현할 수 있다.
다양한 실시예들에 따르면, 전자 장치(101)는 압축 레벨(예: 압축 품질(예: 비트레이트))를 낮추어 가면서 취득한 학습 데이터의 각 압축 레벨에만 나타날 수 있는 고유의 아티팩트를 해결할 수 있다. 예를 들면, 전자 장치(101)는 해당 압축 레벨을 전용으로(specifically) 학습하여 해당 압축 레벨에서 보일 수 있는 압축 아티팩트들을 확인하고 역으로 보정할 수 있다.
다양한 실시예들에 따르면, 전자 장치(101)는 낮은 보정 강도(예: 압축 레벨)에서 보정 학습을 수행한 심층 신경망을, 다른 보정 강도의 이미지에 적용하여 획득되는 뷰티(beauty) 효과 및/또는 엣지 보존 스무딩(edge preserving smoothing)(예: 강한 엣지를 유지하면서 잡티를 없애는) 효과를 제공할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 각각의 다른 압축 보정 강도에서 원본으로 보정하는 모델을 다른 강도에 적용함으로써, 인핸스 처리 강도를 높일 수 있다. 다양한 실시예들에 따르면, 전자 장치(101)에서 압축 레벨을 낮추어 가면서 취득한 학습 데이터에서 원본으로 복구하는 심층 신경망을 복수(multiple) 개 학습하는 것에 의해 보정 강도를 조절할 수 있다. 아울러, 다양한 실시예들에 따르면, 전자 장치(101)는 이미지 보정 시에, 사용자나 다양한 상황에 맞게 보정 강도를 다시 재조정할 수 있도록 지원할 수 있다.
다양한 실시예들에 따르면, 다양한 압축 품질(예: 노이즈 레벨) 별로 정확하게 학습된 노이즈 제거 모델을 이용하여, 보다 최적화된 이미지 보정을 제공할 수 있다. 다양한 실시예들에 따르면, 전술한 바와 같이, 새로운 보정 강도에 더하여, 다양한 상황을 복합적으로 고려하여 아티팩트 제거 수준을 결정하도록 할 수 있다. 다양한 실시예들에서는, 사용자의 특성(예: 사용자 선호도), 이미지를 표시하는 전자 장치(101)의 특성(예: 디스플레이 모듈(160)의 화면 크기), 및/또는 이미지가 표시되는 상황(context)(예: 어플리케이션(또는 서비스)의 특성)을 고려하여, 보다 최적화된 노이즈 제거 모델을 결정 및 아티팩트 제거를 수행할 수 있다.
일 실시예에 따르면, 전자 장치(101)에 의해 결정된 노이즈 제거 모델 적용에 따른 아티팩트가 제거된 이미지(예: 보정된(또는 개선된) 이미지)가 사용자의 취향, 전자 장치(101)의 환경, 및/또는 서비스의 목적에 따라서 사용자에게 시각적으로 최적이 아닐 수 있다. 예를 들면, 사용자는 자신의 얼굴이 그대로 노출되는 원본 이미지 보다는 자신의 얼굴의 잡티가 좀 더 사라져 보일 수 있는 좀 더 강한 보정을 원할 수도 있다. 다른 예를 들면, 같은 압축 품질이 있는 이미지라 하더라도 화면이 큰 전자 장치에서 표시되는 경우와 화면이 작은 전자 장치에서 표시되는 경우, 보정 강도를 다르게 할 필요가 있을 수 있다.
다양한 실시예들에서는, 사용자의 취향, 전자 장치(101)의 디스플레이 모듈(160)의 화면 크기(예: 대화면의 디스플레이 모듈(160)에서 이미지를 표시할 때 보다 강한 후처리가 필요할 수 있음), 및/또는 제공하는 서비스(예: 어플리케이션)에 맞는 후처리 적용 방법을 통해 적절한 보정 강도(또는 개선도)(improvement factor)가 선택될 수 있도록 제공할 수 있다. 다양한 실시예들에서는, 이미지만을 기반으로 고정된 후처리 개선 강도를 제공하는 것이 아니라, 다양한 조건에 맞추어 개선 강도를 추가 설정(조절)할 수 있도록 제공할 수 있다.
다양한 실시예들에 따르면, 전자 장치(101)는 전술한 바와 같이 전자 장치(101)에 의해 1차적으로 보정된 이미지에 대해, 사용자의 선호도(personalization), 전자 장치(101)의 화면 크기 및/또는 어플리케이션(또는 서비스)의 특성에 따라서 종합적으로 후처리 필터를 적용하여 후처리 개선 강도를 고정하지 않고 적응적으로 운영할 수 있다. 일 실시예에 따르면, 사용자가 선호하는 이미지는 사실과 가까운 이미지가 아닐 수 있다. 예를 들면, 사용자가 선호하는 이미지는 실제와 원본과 다르더라도, 사용자가 보기에 좋은 이미지일 수 있다. 이에, 다양한 실시예들에서는 압축 노이즈 보정 강도를 사용자의 취향(또는 의도), 이미지를 제공하는 서비스의 성격 및/또는 실제 이미지가 표시될 디스플레이 모듈(160)의 물리적 크기에 따라서 다른 보정 강도를 적용(또는 설정)하도록 제공할 수 있다.
이하에서는, 사용자의 취향에 맞는 후처리 적용 방법을 통해 적절한 보정 강도(또는 개선도)(improvement factor 또는 strength)가 선택될 수 있도록 하면서 자연스럽게 사용자에게 이미지 상태 및 개선 방법을 안내하는 동작 시나리오를 설명한다. 예를 들면, 전자 장치(101)는 사용자의 의도에 기반하여 추가적인 이미지 보정을 처리할 수 있다.
도 7은 다양한 실시예들에 따른 전자 장치의 동작 방법을 도시하는 흐름도이다.
도 7을 참조하면, 동작 701에서, 전자 장치(101)의 프로세서(120)는 노이즈 제거 모델에 기반하여 이미지를 처리할 수 있다. 일 실시예에 따르면, 프로세서(120)는 주어진 이미지(예: 압축 이미지)에서 압축 아티팩트(또는 노이즈)를 제거하여 원본 이미지로 복구할 수 있다.
동작 703에서, 프로세서(120)는 제1 보정된 이미지를 표시할 수 있다. 일 실시예에 따르면, 프로세서(120)는 노이즈 제거 모델 적용에 기반하여 압축 아티팩트가 제거된 원본 이미지(또는 복구 이미지)를 표시할 수 있다.
동작 705에서, 프로세서(120)는 후처리 보정과 관련된 사용자 인터페이스를 제공할 수 있다. 일 실시예에 따르면, 프로세서(120)는 제1 보정된 이미지를 표시할 때, 제1 보정된 이미지에 중첩하여 또는 팝업 윈도우를 통해, 사용자의 이미지 후처리 보정을 위한 사용자 인터페이스를 표시하도록 디스플레이 모듈(160)을 제어할 수 있다.
동작 707에서, 프로세서(120)는 사용자 입력을 수신할 수 있다. 일 실시예에 따르면, 프로세서(120)는 사용자 인터페이스에 기반하여, 후처리 보정에 적용될 옵션을 선택하는 사용자 입력을 감지할 수 있다.
동작 709에서, 프로세서(120)는 사용자 입력에 기반하여 이미지를 보정할 수 있다. 일 실시예에 따르면, 프로세서(120)는 사용자 입력에 대응하는 옵션에 기반하여 이미지를 보정할 수 있다.
동작 711에서, 프로세서(120)는 제2 보정된 이미지를 표시할 수 있다. 일 실시예에 따르면, 프로세서(120)는 제1 보정된 이미지에 사용자 입력에 대응하는 옵션에 따라 후처리 보정을 통해, 제1 보정된 이미지를 제2 보정된 이미지로 전환하여 표시하도록 디스플레이 모듈(160)을 제어할 수 있다.
도 8, 도 9 및 도 10은 다양한 실시예들에 따른 전자 장치에서 사용자 의도에 따른 이미지 보정을 처리하기 위한 사용자 인터페이스 및 그 동작 예를 도시하는 도면들이다.
도 8을 참조하면, 도 8은 전자 장치(101)의 전체 시스템에 사용자 의도에 따른 후처리 보정을 적용할 수 있는 설정의 예를 나타낼 수 있다. 일 실시예에 따르면, 전자 장치(101)는 도 8에 예시한 바와 같이, 이미지가 표시된 화면(810) 상에 압축 아티팩트(compression artifact)를 설정(예: 실행)할 수 있는 선택 메뉴(820)를 제공할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 선택 메뉴(820)를 통해 압축 아티팩트 설정이 활성화된 경우, 이미지에서 해당 아티팩트를 제거하는 강도를 원래 레벨과 상대적으로 다르게 조절할 수 있다. 어떤 실시예에 따르면, 전자 장치(101)는 이미지가 표시된 화면(810)에서 보정 강도(예: strength)에 따른 실제 이미지 보정에 관련된 정보(830)(또는 보정 강도)(예: strength: +20)를 함께 제공할 수도 있다.
도 9를 참조하면, 도 9는 전자 장치(101)에서 1차적으로 보정(예: 전처리 보정)된 이미지(예: 지정된 압축 품질에 따라 압축된 압축 이미지에서 압축 품질에 따른 압축 아티팩트가 제거되어 원본 이미지로 변환된 이미지)에 대해, 사용자 의도(또는 취향)에 따라서 이미지에 2차적으로 보정(예: 후처리 보정을 적용할 수 있는 설정의 예를 나타낼 수 있다. 일 실시예에 따르면, 전자 장치(101)는 도 9에 예시한 바와 같이, 이미지가 표시된 화면(910)의 지정된 영역(예: 화면 우측 상단 영역, 화면 중앙 영역, 화면 중앙 하단 영역, 또는 화면 좌측 상단 영역)을 통해 사용자에 의한 이미지 보정을 위한 지정된 조절 메뉴(920)를 제공할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 조절 메뉴(920)를 이용한 사용자 입력에 기반하여 조절 메뉴(920)에 관련된 지정된 이미지 보정을 처리할 수 있다.
일 실시예에 따르면, 전자 장치(101)는 1차적으로 보정된 이미지를 제공할 때, 1차적으로 보정된 이미지에 대한 보정 결과에 관한 정보(예: ‘이미지의 압축 품질이 60입니다. 추가 보정하시겠습니까?’와 같은 가이드 메시지)와 함께 조절 메뉴(920)를 제공할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 조절 메뉴(920)를 통해 사용자에 의해 보정 강도 조절할 수 있도록 가이드 할 수 있다.
도 10을 참조하면, 도 10은 전자 장치(101)에서 1차적으로 보정(예: 전처리 보정)된 이미지에 기반하여, 2차적으로 보정(예: 후처리 보정)된 복수 개의 샘플 이미지를 표시한 후, 사용자가 의도하는 이미지를 선택하도록 할 수 있는 설정의 예를 나타낼 수 있다.
일 실시예에 따르면, 전자 장치(101)는 보정을 위한 화면을 표시할 때, 사용자에게 압축 품질의 개선 정도를 뚜렷하게 보여주기 위해서 개선이 진행될 때, 얼굴 부분, 인물(예: 전신) 부분, 두드러진 부분(salient parts), 및/또는 개선 전후가 PSNR 상으로 가장 차이가 부분을 확대하여 제공할 수도 있다.
일 실시예에 따르면, 전자 장치(101)는 도 10에 예시한 바와 같이, 이미지(1010)의 압축 품질이 좋지 않다는 팝업 메시지(미도시)와 함께 다양한 강도로 개선된 이미지(1020, 1030, 1040)를 표시하고, 표시된 이미지(1020, 1030, 1040) 중에서, 사용자가 어느 하나를 선택하도록 할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 1차적으로 보정된 이미지(1010)(예: 압축 품질: 65)를 제공할 때, 1차적으로 보정된 이미지(1010)에 대한 보정 결과에 관한 정보(예: 이미지의 압축 품질이 60입니다. 추가 보정하시겠습니까?’와 같은 가이드 메시지)를 표시한 후, 사용자 입력에 응답하여, 도 10에 예시한 바와 같이 각각의 다른 보정 강도가 미리 적용된 이미지(1020, 1030, 1040)를 사용자에게 표시하고, 사용자에 의해 선택하도록 할 수 있다. 일 실시예에 따라, 전자 장치(101)는 제1 샘플 이미지(1020)(예: 압축 품질: -30), 제2 샘플 이미지(1030)(예: 압축 품질: 60) 및 제3 샘플 이미지(1040)(예: 압축 품질: +30)과 같이, 1차적으로 보정된 이미지(1010)에 기반하여, 1차적으로 보정된 이미지(1010)와 다른 보정 강도가 적용된 복수 개의 이미지(예: 2차적으로 보정된 이미지)를 사용자에게 제공할 수 있다.
다양한 실시예들에 따르면, 전자 장치(101)는 도 8, 도 9 및/또는 도 10에 예시한 바와 같이, 사용자 입력에 기반하여 사용자 의도에 따라 선택된(또는 설정된) 보정 레벨에 대해, 전자 장치(101)의 디폴트 설정으로 반영하여 관리할 수도 있다. 예를 들면, 전자 장치(101)는 다음 학습 및/또는 다음 보정 단계에서 사용자 의도가 반영된 보정 레벨을 추가 고려하여 이미지에 대한 보정을 처리하도록, 사용자 의도에 따라 선택된 보정 레벨을 관리할 수 있다. 예를 들면, 전자 장치(101)는 압축 품질에 따른 노이즈 제거 모델을 결정 시에, 해당 압축 품질에 대한 사용자 의도(또는 선호도)에 따라 설정된 히스토리를 참조하여, 보정 강도를 조절할 수 있다.
다양한 실시예들에 따르면, 전자 장치(101)는 도 8, 도 9 및/또는 도 10에 예시한 바와 같은 상황 외에, 다양한 상황(예: 어플리케이션 종류, 다른 사용자의 선호도, 및/또는 디스플레이 모듈(160)의 화면 크기)을 고려하여 보정 강도를 다르게 설정할 수 있다.
일 실시예에 따르면, 전자 장치(101)는 어플리케이션(또는 서비스)마다 다른 보정 강도를 설정할 수 있다. 일 실시예에 따르면, 이미지를 제공하는 각각의 어플리케이션(또는 서비스)는 다른 압축 품질의 이미지를 제공할 수 있다. 예를 들면, 특정 어플리케이션(예: 촬영 어플리케이션)에서는 강한 보정 강도를 적용하여 뷰티 효과를 주는 것이 필요할 수 있다. 다른 예를 들면, 다른 특정 어플리케이션(예: 뉴스 어플리케이션)에서는 강한 보정 효과를 줄 필요가 없을 수 있다. 따라서, 다양한 실시예들에서는, 어플리케이션(또는 서비스) 마다 다른 압축 품질(또는 압축 레벨)의 보정을 수행할 수 있다.
일 실시예에 따르면, 전자 장치(101)는 주어진 이미지에 대해서, 해당 이미지에 대한 다른 사용자들의 설정 값을 사용하여 다른 보정 강도를 설정할 수 있다. 예를 들면, 공인(예: 연애인)에 관련된 이미지는 여러 사이트에 걸쳐서 다양한 전자 장치에 전파될 수 있으며, 다양한 전자 장치의 다른 사용자들이 해당 이미지에 대한 보정 강도를 적용하여 설정한 다양한 샘플이 존재할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 주어진 이미지가 유명인(예: 연예인)과 같이 많은 다른 사용자에게 공통적으로 공유될 수 있는 이미지인 경우, 해당 이미지의 압축 아티팩트를 제거할 때, 다른 사용자들에 의해 미리 설정된 최적의 보정 레벨을 외부(예: 서버 또는 다른 전자 장치)로부터 획득하여, 보정을 수행할 수 있다.
일 실시예에 따르면, 전자 장치(101)는 이미지를 표시하는 디스플레이 모듈(160)의 화면 크기에 따라 차등적으로 다른 보정 강도를 설정할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 같은 압축 품질로 압축된 이미지에 대해, 화면 크기가 작은 전자 장치와 화면 크기가 큰 전자 장치에서 다른 보정 강도로 보정을 수행할 수 있다. 예를 들면, 전자 장치(101)는 디스플레이 모듈(160)의 화면 크기에 따라 다른 노이즈 제거 모델을 적용하여 다른 보정 강도로 보정을 수행할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 대화면의 디스플레이 모듈(160)에서 이미지를 표시할 때 보다 강한 보정 강도를 설정할 수 있다.
다양한 실시예들에 따르면, 전자 장치(101)는 주어진 이미지가 동영상(video)인 경우에는, 하나의 이미지에 보정 강도를 적용하는 방식이 아닌, 동영상의 연속된 이미지의 프레임(frame) 단위로 보정 강도를 설정할 수 있다. 예를 들면, 동영상의 경우 각각의 프레임 마다 압축 품질을 측정하는 것보다, 예를 들면, K 프레임(예: 3 프레임, 4 프레임 또는 5 프레임) 마다 한번씩 압축 품질을 측정하도록 하여, 전체 분류 동작 횟수를 줄일 수 있다. 어떤 실시예에 따르면, 전자 장치(101)는 동영상에서 화질이 변경되는 구간을 식별하고, 화질이 변경되는 구간에서 압축 품질을 측정하도록 하여, 전체 분류 동작 횟수를 줄일 수도 있다.
도 11은 다양한 실시예들에 따른 전자 장치에서 이미지 보정을 처리하는 동작 예를 도시하는 도면이다.
일 실시예에 따라, 도 11은 전자 장치(101)에서 이미지 또는 이미지를 포함하는 컨텐츠(예: 어플리케이션(예: 웹 페이지) 실행 화면)를 실행(예: 표시)할 때, 주어진 이미지(예: 표시되는 이미지)를 일괄적으로 선 보정 처리한 후 사용자에게 제공(예: 디스플레이 모듈(160)을 통해 표시)하는 예를 나타낼 수 있다.
도 11을 참조하면, 전자 장치(101)는 사용자 요청에 기반하여 복수 개의 이미지들(1110, 1120)을 포함하는 컨텐츠(예: 어플리케이션(예: 웹 페이지) 실행 화면)를 디스플레이 모듈(160)을 통해 표시할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 컨텐츠를 표시할 때, 컨텐츠 내에 포함된 모든 이미지(1110, 1120)를 식별(예: 추출)할 수 있고, 식별된 이미지(1110, 1120)에 대해, 일괄적으로 선 보정 처리할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 선 보정 처리된 이미지(1110, 1120)를 디스플레이 모듈(160)을 통해 표시할 수 있다.
일 실시예에 따르면, 도 11에 예시된 이미지(1110, 1120)는, 컨텐츠 실행에 기반하여, 대응하는 외부 장치(예: 컨텐츠 서버)로부터 전자 장치(101)에 임시 다운로드(예: 메모리(130)의 캐시(cache)에 저장)될 수 있고, 임시 다운로드된 이미지(1110, 1120)를 분류된 압축 품질에 따라 학습된 노이즈 제거 모델에 기반하여 압축 아티팩트가 제거된 보정된 이미지를 나타낼 수 있다.
도 12a 및 도 12b는 다양한 실시예들에 따른 전자 장치에서 이미지 보정을 처리하는 동작 예를 도시하는 도면들이다.
일 실시예에 따라, 도 12a 및 도 12b는 전자 장치(101)에서 이미지 또는 이미지를 포함하는 컨텐츠(예: 웹 페이지 어플리케이션)를 실행(예: 표시)하는 동안, 주어진 이미지(예: 사용자 선택에 따른 이미지)를 보정 처리한 후 사용자에게 제공(예: 디스플레이 모듈(160)을 통해 표시)하는 예를 나타낼 수 있다. 예를 들면, 도 12a 및 도 12b에서는 사용자가 이미지를 확인하는 과정에서 사용자 선택에 따른 이미지에 대해 압축 품질과 관련된 정보(예: 화질 알림)를 제공하고 사용자 입력에 기반하여 대응하는 압축 품질로 이미지를 보정하는 예를 나타낼 수 있다.
도 12a 및 도 12b를 참조하면, 예시 화면 <1201>은, 전자 장치(101)가 디스플레이 모듈(160)을 통해, 복수 개의 이미지(1210)를 포함하는 컨텐츠(예: 어플리케이션(예: 웹 페이지) 실행 화면)를 표시하는 예를 나타낼 수 있다.
예시 화면 <1203>은, 사용자가 표시된 이미지(1210) 중에서 어느 하나의 이미지(1220)를 선택하는 예를 나타낼 수 있다.
예시 화면 <1205>는, 전자 장치(101)가 사용자의 이미지(1210) 선택에 기반하여, 사용자에 의해 선택된 이미지(1210)(예: 주어진 이미지)를 일정 비율로 확대하여 제공하는 확대 화면(1230) 예를 나타낼 수 있다.
예시 화면 <1207>은, 전자 장치(101)가 주어진 이미지(1210)를 표시할 때, 주어진 이미지(1210)의 압축 품질을 분류하고 그 결과를 팝업 메시지(1240)를 통해 제공하는 예를 나타낼 수 있다. 일 실시예에 따르면, 전자 장치(101)는 사용자의 이미지(1210) 선택에 기반하여, 해당 이미지의 압축 품질을 결정하고, 결정된 압축 품질과 관련된 노이즈 제거 모델에 기반하여 해당 이미지(1210)의 압축 아티팩트를 식별할 수 있다. 일 실시예에 따르면, 전자 장치(101)는 식별하는 결과에 기반하여 압축 아티팩트에 관련된 정보(예: ‘압축 아티팩트가 30으로 심합니다. 제거하시겠습니까?’와 같은 메시지)를, 확대 화면(1230) 상에 팝업 메시지(1240)를 통해 제공할 수 있다. 예를 들면, 전자 장치(101)는 이미지(1210)의 압축 품질이 특정 임계치(threshold) 이하인 경우, 이를 사용자에게 통지하여 이미지에 대한 보정을 요청할 수 있다. 일 실시예에 따르면, 사용자는 팝업 메시지(1240)에 기반하여 사용자가 선택한 이미지(120)에 대한 보정 여부를 결정할 수 있다.
예시 화면 <1209>는, 팝업 메시지(1240)에 기반하여 사용자로부터 이미지 보정이 요청되는 경우, 예를 들면, 팝업 메시지(1240)를 통해 사용자로부터 압축 아티팩트 제거를 요청하는 승인 입력이 수신되는 경우의 화면 예를 나타낼 수 있다. 일 실시예에 따르면, 전자 장치(101)는, 예시 화면 <1207>에 예시한 바와 같이, 해당 이미지(1220)에 대해 아티팩트 제거를 위한 옵션 메뉴(1250)를 화면(1230)의 지정된 영역을 통해 제공할 수 있다. 일 실시예에 따라, 지정된 영역은, 화면 우측 하단, 화면 우측 상단, 화면 좌측 하단, 또는 화면 좌측 상단과 같이 이미지(1220)를 가리지 않는 에지 근접 영역일 수 있다. 일 실시예에 따라, 옵션 메뉴(1250)는 사용자가 압축 품질을 선택할 수 있도록 제공되는 복수 개의 옵션 객체(예: 압축 품질: -30, 압축 품질: 60, 및/또는 압축 품질: +30)와, 선택된 옵션에 기반하여 아티팩트 제거를 실행할 수 있는 실행 객체(예: Remove Artifacts)를 포함할 수 있다.
예시 화면 <1211>은, 사용자가 아티팩트 제거와 관련된 옵션 메뉴(1250)에서 어느 하나의 옵션 객체를 선택한 후, 아티팩트 제거를 실행하기 위한 실행 객체를 선택(1260)(예: 터치)하는 예를 나타낼 수 있다. 일 실시예에 따르면, 전자 장치(101)는 사용자 입력에 기반하여 사용자 선택에 따른 옵션(예: 압축 품질)에 기반하여 대응하는 노이즈 제거 모델을 적용하여 아티팩트를 제거할 수 있다. 어떤 실시예에 따르면, 전자 장치(101)는 옵션 메뉴(1250)를 통해 실행 객체가 선택되는 경우, 복수 개의 옵션에 대응하는 다른 보정 강도가 미리 적용된 복수 개의 이미지(예: 샘플 이미지)를 사용자에게 제공하고, 이들 중 적용하고자 하는 어느 하나의 이미지를 선택하고, 선택된 이미지의 압축 품질에 기반하여 아티팩트를 제거할 수도 있다. 이의 예가 도 13에 도시된다.
도 13은 다양한 실시예들에 따른 전자 장치에서 사용자 의도에 기반한 이미지 처리를 위한 사용자 인터페이스 및 그 동작 예를 설명하기 위한 도면이다.
일 실시예에 따르면, 도 13은, 예를 들어, 도 12b에서 사용자 입력에 기반하여, 사용자 선택에 따른 이미지(1220)에 대해 분류된 압축 품질에 각각 대응하게 학습된 노이즈 제거 모델에 기반하여 압축 아티팩트가 제거된 각각의 샘플 이미지의 다양한 예를 나타낼 수 있다.
도 13에 예시한 바와 같이, 전자 장치(101)는 각각의 다른 보정 강도가 적용된 이미지(1310, 1320, 1330)를 사용자에게 표시하고, 사용자에 의해 선택하도록 할 수 있다. 일 실시예에 따르면, 예시 화면 <1301>은 제1 보정 강도(예: 압축 품질: -30)이 적용된 제1 샘플 이미지(1310)를 나타낼 수 있고, 예시 화면 <1303>은 제2 보정 강도(예: 압축 품질: 60)이 적용된 제2 샘플 이미지(1320)를 나타낼 수 있고, 및 예시 화면 <1305>는 제3 보정 강도(예: 압축 품질: +30)가 적용된 제3 샘플 이미지(1330)를 나타낼 수 있다. 예를 들면, 전자 장치(101)는 주어진 이미지(1220)에 대해 각각 다른 보정 강도가 적용된 복수 개의 이미지(1310, 1320, 1330)를 사용자에게 제공할 수 있다.
일 실시예에 따르면, 전자 장치(101)는 보정 강도가 적용된 이미지(1310, 1320, 1330)를 제공할 때, 예를 들면, 보정을 위한 화면을 표시할 때, 사용자에게 압축 품질의 개선 정도를 뚜렷하게 보여주기 위해서, 얼굴 부분, 인물(예: 전신) 부분, 두드러진 부분, 및/또는 개선 전후가 PSNR 상으로 가장 차이가 부분을 확대하여 제공할 수도 있다. 예를 들면, 전자 장치(101)는 도 13에 예시한 바와 같이, 보정 시 개선 정도를 상세하게 확인할 수 있도록 대응하는 특징 부분을 기반으로 확대하여 화면 중앙에 배치하여 표시할 수 있다. 도시하지 않았으나, 전자 장치(101)는 이미지의 기존 크기를 그대로 표시할 수도 있음을 당업자는 용이하게 이해할 것이다.
도 14는 다양한 실시예들에 따른 전자 장치에서 학습하는 동작 예를 도시하는 도면이다.
일 실시예에 따라, 도 14에서는 전자 장치(101)에서 수행하는 사전 학습 동작의 예를 나타낼 수 있다. 어떤 실시예에 따르면, 도 14에 예시한 바와 같은 전자 장치(101)에서 수행하는 사전 학습 동작은, 예를 들면, 다른 환경(예: 개발자 워크스테이션 및/또는 클라우드 환경)에서 수행되고, 전자 장치(101)에서 다운로드 될 수도 있다.
도 14를 참조하면, 블록 1410에서, 전자 장치(101)의 프로세서(120)는 n개의 품질로 구성된 데이터세트를 생성할 수 있다. 일 실시예에 따르면, 프로세서(120)는 복수 개(예: n개) 클래스의 압축 품질로 구성된 데이터세트를 생성하기 위해, 이미지들의 채널을 N 단계로 서브샘플링(subsampling), 변환(transform) 및/또는 계수 근사화(coefficients quantization)를 수행할 수 있다.
블록 1420에서, 프로세서(120)는 압축 이미지에 기반하여 모델을 학습할 수 있다. 일 실시예에 따르면, 프로세서(120)는 압축 이미지에 대해 제1 학습(예: 블록 1430) 및 제2 학습(예: 블록 1440)을 수행할 수 있다. 일 실시예에 따라, 제1 학습(1430)은 대상 노이즈 제거 모델이 변환된 패치의 아티팩트들을 분석하여, 압축 품질을 알아낼 수 있도록 하는 학습을 나타낼 수 있다. 일 실시예에 따라, 제2 학습(1440)은 압축 이미지에 필터링을 실행하여, 압축 이미지가 원본 이미지와 유사해지도록 n개의 필터 가중치 셋을 획득할 수 있도록 하는 학습을 나타낼 수 있다. 일 실시예에 따라, 프로세서(120)는 제1 학습(1430)과 제2 학습(1440)을 병렬적으로, 순차적으로 또는 휴리스틱 하게 수행할 수 있다.
일 실시예에 따라, 프로세서(120)는 제1 학습(1430) 방법으로, 예를 들면, 압축 이미지의 아티팩트 분석에 기반하여, 아티팩트의 특성에 따른 품질 정보(예: 숫자)를 출력하도록 학습(블록 1431)할 수 있다. 일 실시예에 따르면, 프로세서(120)는 학습(블록 1431)에 따른 1개의 분류 모델을 생성(블록 1433)할 수 있다. 일 실시예에 따르면, 프로세서(120)는 제1 학습(1430)에 기반하여 생성하는 분류 모델을, 후술하는 도 15의 압축 품질을 분류하는 동작에 이용할 수 있다.
일 실시예에 따라, 프로세서(120)는 제2 학습(1440) 방법으로, 예를 들면, N개의 필터 가중치 셋을 학습(블록 1441)할 수 있다. 예를 들면, 프로세서(120)는 압축 이미지에 필터링을 수행하여, 압축 이미지가 원본 이미지와 유사해질 수 있도록 N개의 필터 가중치 셋을 학습할 수 있다. 일 실시예에 따르면, 프로세서(120)는 제2 학습(1441)에 따른 n개의 변형 모델(예: 1, 2, …, i, …, n)을 생성(블록 1443)할 수 있다. 일 실시예에 따르면, 프로세서(120)는 제2 학습(1440)에 기반하여 생성하는 n개의 변형 모델에 기반하여, 후술하는 압축 아티팩트 제거 동작에서 어느 하나의 변형 모델을 선택할 수 있다.
도 15는 다양한 실시예들에 따른 전자 장치에서 압축 품질을 분류하는 동작 방법을 도시하는 흐름도이다.
일 실시예에 따라, 도 15는 전자 장치(101)에서 수행하는 압축 품질을 분류하는 동작의 예를 나타낼 수 있다.
도 15를 참조하면, 동작 1501에서, 전자 장치(101)의 프로세서(120)는 이미지를 입력할 수 있다. 일 실시예에 따르면, 프로세서(120)는 개선할 압축 품질의 이미지를 학습 대상의 이미지로 입력할 수 있다.
동작 1503에서, 프로세서(120)는 이미지에서 균등한 간격으로 약 M개의 패치를 추출할 수 있다. 일 실시예에 따르면, 프로세서(120)는 입력된 이미지로부터, 예를 들면, 약 256개의 16x16 패치를 균등하게 추출할 수 있다.
동작 1505에서, 프로세서(120)는 분류 모델로 아티팩트를 분석하여 N 단계(예: 아티팩트의 특성에 따른 품질 정보(예: 숫자)) 중 하나의 압축 품질을 분류(또는 구분)할 수 있다. 일 실시예에 따르면, 프로세서(120)는 도 14에서 제1 학습(블록 1430)에 따라 생성된 분류 모델에 따라 대응하는 아티팩트를 분석하여, N 단계의 압축 품질 중 어느 하나의 압축 품질로 분류할 수 있다
동작 1507에서, 프로세서(120)는 M개의 패치에서 출력된 결과를 평균하여 이미지의 대표 품질(또는 최종 품질(Q))을 예측(또는 도출)할 수 있다. 일 실시예에 따르면, 프로세서(120)는 이미지에 대해 예측된 대표 품질을, 후술하는 압축 아티팩트 제거 동작에서 이미지에 대한 압축 품질의 입력으로 사용할 수 있다.
도 16은 다양한 실시예들에 따른 전자 장치에서 아티팩트를 제거하는 동작 방법을 도시하는 흐름도이다.
일 실시예에 따라, 도 16은 전자 장치(101)에서 분류된 압축 품질에 대응하게 아티팩트를 제거하는 동작의 예를 나타낼 수 있다.
도 16을 참조하면, 동작 1601에서, 전자 장치(101)의 프로세서(120)는 이미지를 입력할 수 있다. 일 실시예에 따르면, 프로세서(120)는 개선할 압축 품질의 이미지(예: 도 15의 학습 대상의 이미지)를 압축 아티팩트 제거 대상의 이미지로 입력할 수 있다.
동작 1603에서, 프로세서(120)는 예측된 대표 품질을 입력할 수 있다. 일 실시예에 따르면, 프로세서(120)는 도 15에서 예측된 대표 품질을 아티팩트 제거 대상의 이미지의 압축 품질로 입력할 수 있다.
동작 1605에서, 프로세서(120)는 대표 품질을 기반으로 N개의 변형 모델 중 하나를 선택할 수 있다. 일 실시예에 따르면, 프로세서(120)는 도 14에서 제2 학습(블록 1440)에 따라 생성된 n개의 변형 모델 중 대표 품질에 대응하는 변형 모델(예: translation model i)을 선택할 수 있다.
동작 1607에서, 프로세서(120)는 선택된 변형 모델(예: translation model i)의 필터링으로, 압축 이미지를 원본 품질의 이미지(예: 원본 이미지)로 복구할 수 있다.
도 17은 다양한 실시예들에 따른 전자 장치에서 압축 품질을 보정하는 동작 방법을 도시하는 흐름도이다.
일 실시예에 따라, 도 17은 전자 장치(101)에서 1차적으로 압축 품질이 보정된 이미지에 대해, 사용자의 입력에 기반하여 2차적으로 추가 보정하는 동작의 예를 나타낼 수 있다.
도 17을 참조하면, 동작 1701에서, 전자 장치(101)의 프로세서(120)는 보정 이미지를 표시할 수 있다. 일 실시예에 따르면, 프로세서(120)는 주어진 이미지(예: 압축 이미지)의 압축 품질에 대응하게 학습된 노이즈 제거 모델에 기반하여 보정된 보정 이미지를 디스플레이 모듈(160)을 통해 표시할 수 있다. 일 실시예에 따르면, 프로세서(120)는 보정 이미지를 제공할 때, 사용자 의도 확인을 위해 사용자와 상호작용할 수 있는 사용자 인터페이스를 함께 제공할 수도 있다.
동작 1703에서, 프로세서(120)는 사용자 입력을 수신할 수 있다. 일 실시예에 따르면, 프로세서(120)는 보정 이미지에 대해 사용자가 만족하는지 여부에 대한 사용자 입력을 수신할 수 있다. 예를 들면, 사용자는 지정된 사용자 인터페이스에 기반하여, 보정 이미지에 대한 승인 또는 거절을 선택할 수 있고, 프로세서(120)는 승인 또는 거절에 대한 사용자 입력을 수신할 수 있다.
동작 1705에서, 프로세서(120)는 사용자 입력에 기반하여 보정 승인 여부를 판단할 수 있다. 일 실시예에 따르면, 프로세서(120)는 사용자 입력이, 보정 이미지에 대해 승인하는지, 또는 보정 이미지에 대해 거절하는지 여부를 판단할 수 있다.
동작 1705에서, 프로세서(120)는 보정이 승인되는 경우(예: 동작 1705의 ‘예’), 동작 1715에서, 설정 품질(예: 압축 보정 레벨)을 저장할 수 있다. 일 실시예에 따르면, 프로세서(120)는 이미지의 압축 품질 및 이미지가 제공된(또는 실행 중인) 어플리케이션(또는 서비스)에 관한 정보를 해당 압축 품질에 대한 설정 품질로 저장할 수 있다.
동작 1705에서, 프로세서(120)는 보정이 승인되지 않는 경우(예: 동작 1705의 ‘아니오’), 동작 1707에서, 동일한 이미지에 대한 다른 사용자들의 설정 품질을 적용할 수 있다. 일 실시예에 따르면, 프로세서(120)는 주어진 이미지에 대해 다른 사용자에 의해 사전 설정된 설정 품질을 외부로부터 획득(예: 공유)할 수 있고, 획득된 설정 품질에 기반하여 주어진 이미지를 처리(예: 이미지 보정)하여 디스플레이 모듈(160)을 통해 표시할 수 있다. 일 실시예에 따르면, 프로세서(120)는 보정 이미지를 제공할 때, 사용자 의도 확인을 위해 사용자의 입력을 수신할 수 있는 사용자 인터페이스를 함께 제공할 수도 있다.
동작 1709에서, 프로세서(120)는 사용자 입력을 수신할 수 있다. 일 실시예에 따르면, 프로세서(120)는 다른 사용자의 설정 품질이 적용된 보정 이미지에 대해 사용자가 만족하는지 여부에 대한 사용자 입력을 수신할 수 있다. 예를 들면, 사용자는 지정된 사용자 인터페이스에 기반하여, 보정 이미지에 대한 승인 또는 거절을 선택할 수 있고, 프로세서(120)는 승인 또는 거절에 대한 사용자 입력을 수신할 수 있다.
동작 1711에서, 프로세서(120)는 사용자 입력에 기반하여 보정 승인 여부를 판단할 수 있다. 일 실시예에 따르면, 프로세서(120)는 사용자 입력이, 보정 이미지에 대해 승인하는지, 또는 보정 이미지에 대해 거절하는지 여부를 판단할 수 있다.
동작 1711에서, 프로세서(120)는 보정이 승인되는 경우(예: 동작 1711의 ‘예’), 동작 1715에서, 설정 품질을 저장할 수 있다. 일 실시예에 따르면, 프로세서(120)는 이미지의 압축 품질, 추가 적용된 설정 품질 및 이미지가 제공된 어플리케이션(또는 서비스)에 관한 정보를 해당 압축 품질에 대한 설정 품질로 저장할 수 있다. 예를 들면, 프로세서(120)는 다른 사용자의 압축 보정 레벨을 공유 받아, 해당 이미지에 대한 압축 보정 레벨을 설정할 수 있다.
동작 1711에서, 프로세서(120)는 보정이 승인되지 않는 경우(예: 동작 1711의 ‘아니오’), 동작 1713에서, 사용자의 명시적인 선택에 기반하여 설정 품질을 선택할 수 있다. 일 실시예에 따르면, 프로세서(120)는 보정 승인 거절되는 경우, 사용자가 이미지의 보정 강도를 직접 선택할 수 있는 사용자 인터페이스(예: 도 8 및/또는 도 9 참조)를 제공할 수 있다. 일 실시예에 따르면, 프로세서(120)는 지정된 사용자 인터페이스를 통해 사용자로부터 입력된 해당 이미지에 대한 보정 강도를 설정 품질로 선택할 수 있다.
동작 1715에서, 프로세서(120)는 설정 품질을 저장할 수 있다. 일 실시예에 따르면, 프로세서(120)는 이미지의 압축 품질, 사용자 입력에 따라 지정된 설정 품질 및 이미지가 제공된 어플리케이션(또는 서비스)에 관한 정보를 해당 압축 품질에 대한 설정 품질로 저장할 수 있다.
이상에서 살펴본 바와 같이, 다양한 실시예들에 따르면, 전자 장치(101)는 다양한 클래스의 압축 품질로 압축된 이미지(예: 압축 이미지)를 이용하여 압축 품질 분류 모듈(250) 및 압축 품질에 맞는 노이즈 제거 모델(230)을 학습하여 이미지 처리 모듈(210)(예: 압축 인코더)의 명시적인 지시 없이도 분류할 수 있고, 학습된 노이즈 제거 모델(230)에 기반하여 압축 품질 별 압축 아티팩트(예: 압축 아티팩트 제거 방법)을 결정하여 주어진 이미지에 대한 이미지 처리를 수행할 수 있다.
다양한 실시예들에 따르면, 전자 장치(101)는 노이즈 제거 모델(230)을 적용하는데 있어서, 사용자들의 선호도, 전자 장치(101)의 화면 크기, 및/또는 어플리케이션(또는 서비스)의 특성에 복합적으로 고려하여, 최종 노이즈 제거 모델을 선택할 수도 있다.
본 개시의 다양한 실시예들에 따른 전자 장치(101)에서 수행하는 동작 방법은, 디스플레이 모듈(160)을 통해 적어도 하나의 이미지를 포함하는 화면을 표시하는 동작, 상기 적어도 하나의 이미지의 압축 품질을 결정하는 동작, 결정된 압축 품질에 대응하게 학습된 노이즈 제거 모델을 선택하는 동작, 선택된 노이즈 제거 모델에 기반하여 이미지 보정을 처리하는 동작, 및 보정된 이미지를 상기 디스플레이 모듈을 통해 표시하는 동작을 포함할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 압축 품질을 결정하는 동작은, 상기 적어도 하나의 이미지의 패치(patch) 단위로 압축 품질을 분류하는 동작을 포함하고, 상기 적어도 하나의 이미지는, 지정된 압축 품질로 압축된 압축 이미지인 것을 특징으로 할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 분류하는 동작은, 상기 이미지에서 상기 패치 단위로 복수 개의 영역들을 균등하게 추출하는 동작, 추출된 영역들의 압축 품질의 평균 또는 중간(median) 값에 기반하여 상기 이미지의 압축 품질을 분류하는 동작을 포함할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 분류하는 동작은, 상기 추출된 영역들에 기반하여 에지 성분을 분석하는 동작, 상기 에지 성분이 지정된 임계 값 이하인 영역에 대해, 상기 평균 또는 상기 중간 값을 위한 계산에서 제외하는 동작을 포함할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 분류하는 동작은, 상기 적어도 하나의 이미지를 제공하는 어플리케이션 또는 서비스의 종류를 식별하는 동작, 상기 어플리케이션 또는 서비스의 종류에 기반하여 대응하는 지정된 압축 품질을 식별하는 동작, 상기 지정된 압축 품질에 기반하여 상기 이미지의 압축 품질을 분류하는 동작을 포함할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 노이즈 제거 모델을 선택하는 동작은, 다양한 압축 품질 별로 미리 학습된 복수의 노이즈 제거 모델을 상기 메모리에 저장하는 동작, 상기 복수의 노이즈 제거 모델 중 상기 이미지의 압축 품질의 분류에 대응하게 학습된 노이즈 제거 모델을 선택하는 동작을 포함하고, 사용자 선호도, 이미지를 제공하는 서비스 또는 어플리케이션의 종류 및/또는 상기 디스플레이 모듈의 화면 크기 중 적어도 하나를 추가 고려하여, 상기 노이즈 제거 모델을 선택할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 이미지 보정을 처리하는 동작은, 상기 선택된 노이즈 제거 모델에 대응하는 보정 강도에 따라 상기 이미지에서 압축 아티팩트를 제거하는 동작, 상기 이미지를 압축 이전의 원본 이미지로 복구하는 동작을 포함할 수 있다.
본 개시의 다양한 실시예들에 따르면, 상기 이미지 보정을 처리하는 동작은, 상기 이미지 보정 시에, 상기 이미지 보정에 관련된 정보 및 사용자 의도 확인을 위해 사용자와 상호작용할 수 있는 사용자 인터페이스를 제공하는 동작, 상기 사용자 인터페이스에 기반하여 사용자 입력을 수신하는 동작, 상기 사용자 입력에 기반하여 상기 보정된 이미지의 후처리를 수행하는 동작을 포함할 수 있다.
본 명세서와 도면에 개시된 본 개시의 다양한 실시예들은 본 개시의 기술 내용을 쉽게 설명하고 본 개시의 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며, 본 개시의 범위를 한정하고자 하는 것은 아니다. 따라서 본 개시의 범위는 여기에 개시된 실시예들 이외에도 본 개시의 기술적 사상을 바탕으로 도출되는 모든 변경 또는 변형된 형태가 본 개시의 범위에 포함되는 것으로 해석되어야 한다.
101: 전자 장치
120: 프로세서
130: 메모리
160: 디스플레이 모듈
210: 이미지 처리 모듈
220: 성능 식별 모듈
230: 노이즈 제거 모델
240: 모델 선택 모듈
250: 압축 품질 분류 모듈
260: 샘플 패치 추출 모듈
270: 사용자 입력 처리 모듈
120: 프로세서
130: 메모리
160: 디스플레이 모듈
210: 이미지 처리 모듈
220: 성능 식별 모듈
230: 노이즈 제거 모델
240: 모델 선택 모듈
250: 압축 품질 분류 모듈
260: 샘플 패치 추출 모듈
270: 사용자 입력 처리 모듈
Claims (20)
- 전자 장치에 있어서,
디스플레이 모듈;
메모리; 및
상기 디스플레이 모듈 및 상기 메모리와 작동적으로 연결된 프로세서를 포함하고, 상기 프로세서는,
상기 디스플레이 모듈을 통해 적어도 하나의 이미지를 포함하는 화면을 표시하고,
상기 적어도 하나의 이미지의 압축 품질을 결정하고,
결정된 압축 품질에 대응하게 학습된 노이즈 제거 모델을 선택하고,
선택된 노이즈 제거 모델에 기반하여 이미지 보정을 처리하고, 및
보정된 이미지를 상기 디스플레이 모듈을 통해 표시하도록 설정된 전자 장치.
- 제1항에 있어서, 상기 적어도 하나의 이미지는,
지정된 압축 품질로 압축된 압축 이미지인 것을 특징으로 하는 전자 장치.
- 제2항에 있어서, 상기 프로세서는,
상기 적어도 하나의 이미지의 패치(patch) 단위로 압축 품질을 분류하도록 설정된 전자 장치.
- 제3항에 있어서, 상기 프로세서는,
상기 이미지에서 상기 패치 단위로 복수 개의 영역들을 균등하게 추출하고,
추출된 영역들의 압축 품질의 평균 또는 중간(median) 값에 기반하여 상기 이미지의 압축 품질을 분류하도록 설정된 전자 장치.
- 제4항에 있어서, 상기 프로세서는,
상기 추출된 영역들에 기반하여 에지 성분을 분석하고,
상기 에지 성분이 지정된 임계 값 이하인 영역에 대해, 상기 평균 또는 상기 중간 값을 위한 계산에서 제외하도록 설정된 전자 장치.
- 제2항에 있어서, 상기 프로세서는,
상기 이미지를 제공하는 어플리케이션 또는 서비스의 종류를 식별하고,
상기 어플리케이션 또는 서비스의 종류에 기반하여 대응하는 지정된 압축 품질을 식별하고,
상기 지정된 압축 품질에 기반하여 상기 이미지의 압축 품질을 분류하도록 설정된 전자 장치.
- 제2항에 있어서, 상기 프로세서는,
다양한 압축 품질 별로 미리 학습된 복수의 노이즈 제거 모델을 상기 메모리에 저장하고,
상기 복수의 노이즈 제거 모델 중 상기 이미지의 압축 품질의 분류에 대응하게 학습된 노이즈 제거 모델을 선택하도록 설정된 전자 장치.
- 제7항에 있어서, 상기 프로세서는,
사용자 선호도, 이미지를 제공하는 서비스 또는 어플리케이션의 종류 및/또는 상기 디스플레이 모듈의 화면 크기 중 적어도 하나를 추가 고려하여, 상기 노이즈 제거 모델을 선택하도록 설정된 전자 장치.
- 제2항에 있어서, 상기 프로세서는,
상기 선택된 노이즈 제거 모델에 대응하는 보정 강도에 따라 상기 이미지에서 압축 아티팩트를 제거하고,
상기 이미지를 압축 이전의 원본 이미지로 복구하도록 설정된 전자 장치.
- 제2항에 있어서, 상기 프로세서는,
상기 이미지 보정 시에, 상기 이미지 보정에 관련된 정보 및 사용자 의도 확인을 위해 사용자와 상호작용할 수 있는 사용자 인터페이스를 제공하고,
상기 사용자 인터페이스에 기반하여 사용자 입력을 수신하고,
상기 사용자 입력에 기반하여 상기 보정된 이미지의 후처리를 수행하도록 설정된 전자 장치.
- 제2항에 있어서, 상기 프로세서는,
상기 화면을 표시할 때, 컨텐츠 실행에 기반하여, 상기 이미지에 대응하는 외부 장치로부터 상기 이미지를 임시 다운로드 하고,
임시 다운로드된 이미지를 분류된 압축 품질에 따라 학습된 노이즈 제거 모델에 기반하여 압축 아티팩트가 제거된 보정 이미지를 제공하도록 설정된 전자 장치.
- 제2항에 있어서, 상기 프로세서는,
적어도 하나의 이미지를 포함하는 컨텐츠 실행에 기반하여 대응하는 화면을 표시하고,
상기 화면에서 사용자의 이미지 선택에 기반하여, 사용자에 의해 선택된 이미지를 일정 비율로 확대하여 제공하고,
상기 선택된 이미지를 표시할 때, 상기 선택된 이미지의 압축 품질을 분류하고 그 결과를 팝업 메시지를 통해 제공하도록 설정된 전자 장치.
- 전자 장치의 동작 방법에 있어서,
디스플레이 모듈을 통해 적어도 하나의 이미지를 포함하는 화면을 표시하는 동작;
상기 적어도 하나의 이미지의 압축 품질을 결정하는 동작;
결정된 압축 품질에 대응하게 학습된 노이즈 제거 모델을 선택하는 동작;
선택된 노이즈 제거 모델에 기반하여 이미지 보정을 처리하는 동작; 및
보정된 이미지를 상기 디스플레이 모듈을 통해 표시하는 동작을 포함하는 방법.
- 제13항에 있어서, 상기 압축 품질을 결정하는 동작은,
상기 적어도 하나의 이미지의 패치(patch) 단위로 압축 품질을 분류하는 동작을 포함하고,
상기 적어도 하나의 이미지는, 지정된 압축 품질로 압축된 압축 이미지인 것을 특징으로 하는 방법.
- 제14항에 있어서, 상기 분류하는 동작은,
상기 이미지에서 상기 패치 단위로 복수 개의 영역들을 균등하게 추출하는 동작,
추출된 영역들의 압축 품질의 평균 또는 중간(median) 값에 기반하여 상기 이미지의 압축 품질을 분류하는 동작을 포함하는 방법.
- 제15항에 있어서, 상기 분류하는 동작은,
상기 추출된 영역들에 기반하여 에지 성분을 분석하는 동작,
상기 에지 성분이 지정된 임계 값 이하인 영역에 대해, 상기 평균 또는 상기 중간 값을 위한 계산에서 제외하는 동작을 포함하는 방법.
- 제14항에 있어서, 상기 분류하는 동작은,
상기 적어도 하나의 이미지를 제공하는 어플리케이션 또는 서비스의 종류를 식별하는 동작,
상기 어플리케이션 또는 서비스의 종류에 기반하여 대응하는 지정된 압축 품질을 식별하는 동작,
상기 지정된 압축 품질에 기반하여 상기 이미지의 압축 품질을 분류하는 동작을 포함하는 방법.
- 제14항에 있어서, 상기 노이즈 제거 모델을 선택하는 동작은,
다양한 압축 품질 별로 미리 학습된 복수의 노이즈 제거 모델을 상기 메모리에 저장하는 동작,
상기 복수의 노이즈 제거 모델 중 상기 이미지의 압축 품질의 분류에 대응하게 학습된 노이즈 제거 모델을 선택하는 동작을 포함하고,
사용자 선호도, 이미지를 제공하는 서비스 또는 어플리케이션의 종류 및/또는 상기 디스플레이 모듈의 화면 크기 중 적어도 하나를 추가 고려하여, 상기 노이즈 제거 모델을 선택하는 방법.
- 제14항에 있어서, 상기 이미지 보정을 처리하는 동작은,
상기 선택된 노이즈 제거 모델에 대응하는 보정 강도에 따라 상기 이미지에서 압축 아티팩트를 제거하는 동작,
상기 이미지를 압축 이전의 원본 이미지로 복구하는 동작을 포함하는 방법.
- 제14항에 있어서, 상기 이미지 보정을 처리하는 동작은,
상기 이미지 보정 시에, 상기 이미지 보정에 관련된 정보 및 사용자 의도 확인을 위해 사용자와 상호작용할 수 있는 사용자 인터페이스를 제공하는 동작,
상기 사용자 인터페이스에 기반하여 사용자 입력을 수신하는 동작,
상기 사용자 입력에 기반하여 상기 보정된 이미지의 후처리를 수행하는 동작을 포함하는 방법.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210028305A KR20220124528A (ko) | 2021-03-03 | 2021-03-03 | 전자 장치에서 이미지의 압축 품질에 기반한 이미지 보정 방법 및 장치 |
CN202180095128.9A CN116917930A (zh) | 2021-03-03 | 2021-11-08 | 在电子设备中基于图像压缩质量校正图像的方法和设备 |
EP21929305.7A EP4287110A4 (en) | 2021-03-03 | 2021-11-08 | METHOD AND DEVICE FOR IMAGE CORRECTION BASED ON THE COMPRESSION QUALITY OF AN IMAGE IN AN ELECTRONIC DEVICE |
PCT/KR2021/016121 WO2022186443A1 (ko) | 2021-03-03 | 2021-11-08 | 전자 장치에서 이미지의 압축 품질에 기반한 이미지 보정 방법 및 장치 |
US18/241,637 US20230419452A1 (en) | 2021-03-03 | 2023-09-01 | Method and device for correcting image on basis of compression quality of image in electronic device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210028305A KR20220124528A (ko) | 2021-03-03 | 2021-03-03 | 전자 장치에서 이미지의 압축 품질에 기반한 이미지 보정 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220124528A true KR20220124528A (ko) | 2022-09-14 |
Family
ID=83154300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210028305A KR20220124528A (ko) | 2021-03-03 | 2021-03-03 | 전자 장치에서 이미지의 압축 품질에 기반한 이미지 보정 방법 및 장치 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230419452A1 (ko) |
EP (1) | EP4287110A4 (ko) |
KR (1) | KR20220124528A (ko) |
CN (1) | CN116917930A (ko) |
WO (1) | WO2022186443A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024181738A1 (ko) * | 2023-02-28 | 2024-09-06 | 삼성전자 주식회사 | 영상 표시 방법 및 이를 지원하는 전자 장치 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115984314B (zh) * | 2022-11-25 | 2023-06-23 | 哈尔滨理工大学 | 一种基于计算全息二阶微分的图像边缘检测方法及系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101011134B1 (ko) * | 2004-06-07 | 2011-01-26 | 슬링 미디어 인코퍼레이티드 | 퍼스널 미디어 브로드캐스팅 시스템 |
KR102033078B1 (ko) * | 2017-10-30 | 2019-10-16 | 에스케이텔레콤 주식회사 | 화질 측정 기반 영상 처리방법 및 그 장치 |
KR102661826B1 (ko) * | 2018-02-27 | 2024-04-26 | 엘지전자 주식회사 | 신호 처리 장치 및 이를 구비하는 영상표시장치 |
KR102606200B1 (ko) * | 2018-03-06 | 2023-11-24 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
KR102246110B1 (ko) * | 2019-04-02 | 2021-04-29 | 삼성전자주식회사 | 영상 처리 장치 및 그 영상 처리 방법 |
KR20190104927A (ko) * | 2019-08-22 | 2019-09-11 | 엘지전자 주식회사 | 사진 영상 제공 장치 및 사진 영상 제공 방법 |
-
2021
- 2021-03-03 KR KR1020210028305A patent/KR20220124528A/ko unknown
- 2021-11-08 EP EP21929305.7A patent/EP4287110A4/en active Pending
- 2021-11-08 WO PCT/KR2021/016121 patent/WO2022186443A1/ko active Application Filing
- 2021-11-08 CN CN202180095128.9A patent/CN116917930A/zh active Pending
-
2023
- 2023-09-01 US US18/241,637 patent/US20230419452A1/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024181738A1 (ko) * | 2023-02-28 | 2024-09-06 | 삼성전자 주식회사 | 영상 표시 방법 및 이를 지원하는 전자 장치 |
Also Published As
Publication number | Publication date |
---|---|
US20230419452A1 (en) | 2023-12-28 |
EP4287110A4 (en) | 2024-07-10 |
EP4287110A1 (en) | 2023-12-06 |
WO2022186443A1 (ko) | 2022-09-09 |
CN116917930A (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230419452A1 (en) | Method and device for correcting image on basis of compression quality of image in electronic device | |
US11477383B2 (en) | Method for providing preview and electronic device for displaying preview | |
CN108234882B (zh) | 一种图像虚化方法及移动终端 | |
CN110363753B (zh) | 图像质量评估方法、装置及电子设备 | |
CN110933312B (zh) | 拍照控制方法及相关产品 | |
US11985358B2 (en) | Artifact removal method and apparatus based on machine learning, and method and apparatus for training artifact removal model based on machine learning | |
CN113706414A (zh) | 视频优化模型的训练方法和电子设备 | |
CN112084959B (zh) | 一种人群图像处理方法及装置 | |
US20180314916A1 (en) | Object detection with adaptive channel features | |
CN109544441B (zh) | 图像处理方法及装置、直播中的肤色处理方法及装置 | |
US20230274389A1 (en) | Method for providing image and electronic device for supporting same | |
CN115205164B (zh) | 图像处理模型的训练方法、视频处理方法、装置及设备 | |
CN110689478B (zh) | 图像风格化处理方法、装置、电子设备及可读介质 | |
KR20220129473A (ko) | 픽셀 수준 예측 작업을 위한 낮은 복잡도의 딥 가이디드 필터 디코더 | |
CN113538304B (zh) | 图像增强模型的训练方法及装置、图像增强方法及装置 | |
CN116847087A (zh) | 视频处理方法、装置、存储介质及电子设备 | |
CN116342940A (zh) | 图像审批方法、装置、介质及设备 | |
CN114882226A (zh) | 图像处理方法、智能终端及存储介质 | |
CN111698512B (zh) | 视频处理方法、装置、设备及存储介质 | |
EP4365825A1 (en) | Method and apparatus for predicting compression quality of image in electronic device | |
KR20230046913A (ko) | 전자 장치에서 이미지의 압축 품질 예측 방법 및 장치 | |
CN114119413A (zh) | 图像处理方法及装置、可读介质和移动终端 | |
CN118057962A (zh) | 用于预测电子装置中图像的压缩质量的方法和装置 | |
WO2023055112A1 (ko) | 전자 장치에서 이미지의 압축 품질 예측 방법 및 장치 | |
KR20220102087A (ko) | 미디어 데이터를 처리하는 전자 장치 및 방법 |