KR20210131221A - 이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램 - Google Patents

이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램 Download PDF

Info

Publication number
KR20210131221A
KR20210131221A KR1020210021968A KR20210021968A KR20210131221A KR 20210131221 A KR20210131221 A KR 20210131221A KR 1020210021968 A KR1020210021968 A KR 1020210021968A KR 20210021968 A KR20210021968 A KR 20210021968A KR 20210131221 A KR20210131221 A KR 20210131221A
Authority
KR
South Korea
Prior art keywords
image
processed
score value
rating
neural network
Prior art date
Application number
KR1020210021968A
Other languages
English (en)
Other versions
KR102583112B1 (ko
Inventor
샹 롱
핑 왕
지차오 저우
푸 리
동량 허
하오 순
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20210131221A publication Critical patent/KR20210131221A/ko
Application granted granted Critical
Publication of KR102583112B1 publication Critical patent/KR102583112B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06K9/62
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

본 출원은 이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램을 개시하는바, 컴퓨터 비전 기술분야에 관한 것이고. 구체적인 실시 방식은, 처리할 수치를 취득하는 단계 - 당해 처리할 수치는 처리할 이미지에 관련됨 - ; 및 품질 평점 모델을 이용하여 당해 처리할 수치를 처리하여 당해 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하는 단계 - 당해 처리할 이미지의 당해 목표 평점 분야에서의 점수 값은 당해 처리할 이미지의 이미지 품질에 관련됨 - 를 포함한다. 본 출원은 처리할 수치로부터 목표 평점 분야에서의, 이미지 품질을 특성화하는 점수 값을 취득할 수 있는바, 이로써 점수 값의 취득 형식을 풍부히 한다. 이 외에도, 품질 평점 모델을 이용하는 것은 점수 값을 취득하는 정확도를 향상시킬 수 있다.

Description

이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램{METHOD AND APPARATUS FOR PROCESSING IMAGE, ELECTRONIC DEVICE, STORAGE MEDIA AND PROGRAM}
본 출원의 실시예는 컴퓨터 기술분야에 관한 것으로, 구체적으로 컴퓨터 비전 기술분야에 관한 것이고, 특히, 이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램에 관한 것이다.
인터넷 기술의 발전에 따라, 다양한 인터넷 플랫폼이 차차 흥해지고 있는데, 예를 들면 영상 사이트 및 라이브 스트리밍 플랫폼 등이 있다. 녹화방송 영상 또는 라이브 스트리밍을 시청할 때, 이미지의 품질은 사용자의 시청감에 매우 직접적으로 영향을 줄 수 있다. 예를 들면, 보다 높은 이미지 품질은 사용자가 보다 좋은 관람 경험을 획득하는 데 유용할 수 있는바, 이미지의 품질이 보다 낮은 경우, 사용자가 시청을 포기하게 할 수 있다.
사용자가 이미지에 대한 평가는 주관적인 평가인바, 따라서 서로 다른 사용자가 같은 이미지에 대한 품질 평가는 서로 다를 수 있다.
이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램이 제공된다.
첫 번째 측면에 따르면, 이미지를 처리하는 방법이 제공되는바, 처리할 수치를 취득하는 단계 - 상기 처리할 수치는 처리할 이미지에 관련됨 - ; 및 품질 평점 모델을 이용하여 상기 처리할 수치를 처리하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하는 단계 - 상기 처리할 이미지의 상기 목표 평점 분야에서의 점수 값은 상기 처리할 이미지의 이미지 품질에 관련됨 - 를 포함한다.
두 번째 측면에 따르면, 이미지를 처리하는 장치가 제공되는바, 처리할 수치를 취득하도록 구성되는 취득 유닛 - 상기 처리할 수치는 처리할 이미지에 관련됨 - ; 및 품질 평점 모델을 이용하여 상기 처리할 수치를 처리하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하도록 구성되는 생성 유닛 - 상기 처리할 이미지의 상기 목표 평점 분야에서의 점수 값은 상기 처리할 이미지의 이미지 품질에 관련됨 - 을 포함한다.
세 번째 측면에 따르면, 전자 기기가 제공되는바, 하나 또는 복수의 프로세서; 및 하나 또는 복수의 프로그램을 저장하는 저장 장치를 포함하고, 하나 또는 복수의 프로그램이 하나 또는 복수의 프로세서에 의해 실행되는 경우, 하나 또는 복수의 프로세서에 의해 이미지를 처리하는 방법 중의 어느 한 실시예에 따른 방법이 구현되도록 한다.
네 번째 측면에 따르면, 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독가능 저장 매체가 제공되는바, 당해 프로그램이 프로세서에 의해 실행되는 경우, 이미지를 처리하는 방법 중의 어느 한 실시예에 따른 방법이 구현되도록 한다.
다섯 번째 측면에 따르면, 매체에 저장된 컴퓨터 프로그램이 제공되는바, 당해 프로그램이 프로세서에 의해 실행되는 경우, 이미지를 처리하는 방법 중의 어느 한 실시예에 따른 방법이 구현된다.
본 출원의 방안에 따르면, 처리할 수치로부터 목표 평점 분야에서의, 이미지 품질을 특성화하는 점수 값을 취득할 수 있는바, 이로써 점수 값의 취득 형식을 풍부히 한다. 이 외에도, 품질 평점 모델을 이용하는 것은 점수 값을 취득하는 정확도를 향상시킬 수 있다.
아래의 첨부도면을 참조한 비한정적 실시예에 대한 상세 설명을 읽어보면, 본 출원의 다른 특징, 목적 및 이점이 더 분명해질 것이다.
도 1은 본 출원의 일부 실시예가 응용될 수 있는 예시적인 시스템 아키텍처 도면이다.
도 2는 본 출원에 따른 이미지를 처리하는 방법의 일 실시예의 흐름도이다.
도 3은 본 출원에 따른 이미지를 처리하는 방법의 일 응용 시나리오의 개략도이다.
도 4는 본 출원에 따른 이미지를 처리하는 방법의 다른 실시예의 흐름도이다.
도 5는 본 출원에 따른 이미지를 처리하는 장치의 일 실시예의 구조 개략도이다.
도 6은 본 출원의 실시예의 이미지를 처리하는 방법을 구현하는 전자 기기의 블록도이다.
아래 첨부 도면을 결부하여 본 출원의 시범적 실시예를 설명하고자 하는데, 여기서는 이해를 돕고자 본 출원의 실시예의 다양한 세부사항을 포함하나 이를 단지 시범적인 것으로 간주하여야 한다. 따라서, 당업자라면, 여기서 서술한 실시예는 본 출원의 범위 및 사상에 위배되지 않으면서 다양한 변경 및 수정이 가능하다는 것을 인지하여야 한다. 마찬가지로, 명확함과 간결함을 위해, 아래 서술에서는 공지된 기능 및 구조에 대한 서술을 생략하기로 한다.
부연하면, 상충되지 않은 한, 본 출원의 실시예 및 실시예의 특징은 상호 조합될 수 있다. 아래 첨부도면을 참조하면서 실시예를 결부하여 본 출원을 상세히 설명하고자 한다.
도 1은 본 출원의 이미지를 처리하는 방법 또는 이미지를 처리하는 장치의 실시예를 응용할 수 있는 예시적인 시스템 아키텍처(100)를 도시한다.
도 1에 도시한 바와 같이, 시스템 아키텍처(100)는 단말기기(101, 102, 103), 네트워크(104) 및 서버(105)를 포함할 수 있다. 네트워크(104)는 단말기기(101, 102, 103)와 서버(105) 사이에서 통신 링크를 제공하는 매체로 사용된다. 네트워크(104)는 다양한 연결 유형, 예를 들면 유선, 무선 통신 링크 또는 광섬유 케이블 등을 포함할 수 있다.
사용자는 단말기기(101, 102, 103)를 사용하여 네트워크(104)를 통해 서버(105)와 인터랙션함으로써 메세지 등을 수신 또는 송신할 수 있다. 단말기기(101, 102, 103)에는 다양한 통신 클라이언트 애플리케이션, 예를 들면 영상 애플리케이션, 라이브 스트리밍 애플리케이션, 인스턴트 메시징 툴, 메일 클라이언트, 소셜 플랫폼 소프트웨어 등이 설치되어 있을 수 있다.
여기서의 단말기기(101, 102, 103)는 하드웨어일 수도 있고 소프트웨어일 수도 있다. 단말기기(101, 102, 103)가 하드웨어인 경우에는 표시 스크린을 가지는 다양한 전자 기기일 수 있는바, 스마트폰, 태블릿 컴퓨터, 전자책 뷰어 기기, 휴대용 랩톱 컴퓨터 및 데스크톱 컴퓨터 등을 포함하나 이에 한정되지 않는다. 단말기기(101, 102, 103)가 소프트웨어인 경우에는 이상 나열한 전자 기기에 설치될 수 있다. 이는 복수의 소프트웨어 또는 소프트웨어 모듈(예를 들면 분산 서비스를 제공하는 복수의 소프트웨어 또는 소프트웨어 모듈)로 구현될 수도 있고 단일 소프트웨어 또는 소프트웨어 모듈로 구현될 수도 있다. 여기서는 구체적으로 한정하지 않는다.
서버(105)는 다양한 서비스를 제공하는 서버일 수 있는바, 예를 들면 단말기기(101, 102, 103)에 지원을 제공하는 백스테이지 서버이다. 백스테이지 서버는 수신된 처리할 수치에 대해 분석 등의 처리를 수행하고 처리 결과(예를 들면 처리할 이미지의 목표 평점 분야에서의 점수 값)를 단말기기에 피드백할 수 있다.
부연하면, 본 출원의 실시예에 의해 제공되는 이미지를 처리하는 방법은 서버(105) 또는 단말기기(101, 102, 103)에 의해 실행될 수 있고, 상응하게, 이미지를 처리하는 장치는 서버(105) 또는 단말기기(101, 102, 103)에 설치될 수 있다.
도 1에서의 단말기기, 네트워크 및 서버의 수는 단지 예시적인 것임을 이해하여야 한다. 구현의 필요에 따라, 임의 수의 단말기기, 네트워크 및 서버를 가질 수 있다.
계속하여 도 2를 참조하면, 본 출원에 따른 이미지를 처리하는 방법의 일 실시예의 흐름(200)을 도시한다. 당해 이미지를 처리하는 방법은, 하기 단계를 포함한다.
단계201, 처리할 수치를 취득한다, 여기서, 처리할 수치는 처리할 이미지에 관련된다.
본 실시예에서, 이미지를 처리하는 방법을 수행하는 수행 주체(예를 들면 도 1에 도시한 서버 또는 단말기기)는 처리할 수치를 취득할 수 있다. 구체적으로, 처리할 수치는 처리할 이미지에 관련된다. 예를 들면 처리할 수치는 처리할 이미지에 기반하여 생성할 수 있는바, 예를 들면 사전설정된 처리할 이미지와 처리할 수치의 대응관계(예컨대 사전설정 모델 또는 사전설정 대응관계표)를 이용하여 당해 처리할 이미지에 대응되는 처리할 수치를 생성할 수 있다. 이 외에도, 처리할 수치는 처리할 이미지의 속성 값, 예를 들면 선명도일 수도 있다. 본 출원에서의 이미지는 영상 중의 어느 한 영상 프레임일 수도 있고 비영상 프레임, 즉, 하나의 이미지일 수도 있다.
실천에 있어서, 상술한 수행 주체는 직접 로컬로부터 또는 다른 전자 기기로부터 상술한 처리할 수치를 취득할 수도 있고, 우선, 처리할 이미지를 취득하고 처리할 이미지를 이용하여 처리할 수치를 실시간으로 생성할 수도 있다.
단계202, 품질 평점 모델을 이용하여 처리할 수치를 처리하여 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성한다, 여기서, 처리할 이미지의 목표 평점 분야에서의 점수 값은 처리할 이미지의 이미지 품질에 관련된다.
본 실시예에서, 상술한 수행 주체는 품질 평점 모델을 이용하여 처리할 수치를 처리하여 품질 평점 모델에 의해 출력된 점수 값을 얻을 수 있다. 실천에 있어서 상술한 수행 주체는 처리할 수치를 품질 평점 모델에 입력하여 점수 값을 생성할 수 있다. 이 외에도, 상술한 수행 주체는 품질 평점 모델을 이용하여 처리할 수치를 취득한 다음, 계속하여 품질 평점 모델을 이용하여 당해 처리할 수치를 처리할 수도 있다.
상술한 점수 값은 상술한 처리할 이미지의 목표 평점 분야에서의, 즉, 목표 분야(domain)에서의 점수 값이다. 품질 평점 모델은 이미지에 대하여 이미지 품질에 관련되는 점수 값을 생성하는 모델이다. 동일한 평점 분야에서, 이미지의 점수 값이 높을수록 이미지 품질이 더 좋다는 것을 나타낸다. 이미지의 품질 영향 요소는 적어도 하나, 예를 들면 선명도를 포함할 수 있고, 이 외에도, 미관 정도, 목표와 배경의 명암비 및/또는 밝기 등을 더 포함할 수 있다. 이미지의 이미지 품질의 점수 값은 당해 이미지의 하나 또는 복수의 품질 영향 요소의 영향을 받는다. 각 평점 분야의 점수 값은 모두 그에 대응되는 값의 범위를 가질 수 있고, 서로 다른 평점 분야의 점수 값의 값의 범위는 같거나 또는 서로 다를 수 있다. 이미지의 이미지 품질이 사전설정된 품질 범위 내에 있을 경우, 서로 다른 평점 분야에서, 당해 이미지의 점수 값에 대한 당해 이미지의 품질 영향 요소의 영향은 서로 다르다. 여기서의 사전설정 품질 범위는 비(非)양질인 이미지 품질, 비(非)저질인 이미지 품질 및 일반 이미지 품질일 수 있다.
예를 들면, 3개의 이미지A, B, C가 있는데, 이러한 3개의 이미지의 선명도는 순차로 증가하고, 각각 매우 흐릿한 영상, 조금 흐릿한 영상 및 선명한 영상이다. 제1 평점 분야의 값의 범위는 0점 내지 100점이고, 3개의 이미지의 점수 값은 각각 1점, 2점 및 8점이다. 제2 평점 분야의 값의 범위는 0점 내지 10점이고, 3개의 이미지의 점수 값은 각각 10점, 50점 및 80점이다. 제1 평점 분야에서 선명도가 점수 값에 대한 영향은 제2 평점 분야에서 선명도가 점수 값에 대한 영향보다 크다.
실천에 있어서, 품질 평점 모델은 다양한, 처리할 이미지를 특성화하는 처리할 수치와 당해 이미지의 점수 값 간의 대응관계일 수 있는바, 예를 들면 함수, 심층 신경망, 예를 들면 합성곱 신경망 등일 수 있다.
본 출원의 상술한 실시예에 의해 제공되는 방법은 처리할 수치로부터 목표 평점 분야에서의, 이미지 품질을 특성화하는 점수 값을 취득할 수 있는바, 이로써 점수 값의 취득 형식을 풍부히 한다. 이 외에도, 품질 평점 모델을 이용하는바, 점수 값을 생성하는 정확도를 향상시킬 수 있다.
본 실시예의 일부 대안적인 구현방식에서, 처리할 수치는 처리할 이미지의 오리지널 평점 분야에서의 점수 값이고, 단계202는 처리할 이미지의 오리지널 평점 분야에서의 점수 값을 품질 평점 모델에 입력하여 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻는 단계 - 여기서, 품질 평점 모델은 단조 신경망이고 단조 신경망 내의 은닉 유닛의 수량은 사전설정 역치보다 작음 - 를 포함할 수 있다.
이러한 대안적인 구현방식에서, 상술한 수행 주체는 처리할 이미지의 오리지널 평점 분야에서의 점수 값을 취득하고 당해 점수 값을 품질 평점 모델에 입력하여 품질 평점 모델에 의해 출력된 점수 값을 얻을 수 있다. 여기에서 출력된 점수 값은 처리할 이미지의 목표 평점 분야에서의 점수 값이다. 오리지널 평점 분야와 목표 평점 분야는 임의의 2개의 서로 다른 평점 분야일 수 있는바, 상술한 품질 평점 모델은 오리지널 평점 분야의 점수 값으로부터 목표 평점 분야의 점수 값을 생성할 수 있다. 은닉 유닛(hidden unit)은 단조 신경망(monotonic neural networks)에서 입력 유닛과 출력 유닛 이외의 유닛일 수 있는바, 예를 들면 완전 연결층일 수 있다. 예를 들면, 상술한 단조 신경망 내의 완전 연결층의 수량은 통상의 단조 신경망 내 완전 연결층의 수량보다 작을 수 있는바, 예를 들면 통상의 단조 신경망에 3개의 완전 연결층이 존재하는 경우, 상술한 단조 신경망은 하나의 또는 2개의 완전 연결층만 보유할 수 있다.
구체적으로, 품질 평점 모델은 단조 신경망일 수 있고, 이 외에도, 단조증가 함수일 수도 있다. 단조 신경망의 출력과 입력은 단조증가 관계일 수 있다. 예를 들면, 단조 신경망은 무제약 단조 신경망(unconstrained monotonic neural networks)일 수 있다.
대안으로, 상술한 단조 신경망은 하기 단계를 포함한다. 복수의 훈련 샘플을 취득하는 단계로서, 여기서, 복수의 훈련 샘플 중의 훈련 샘플은 이미지의 오리지널 평점 분야에서의 점수 값 및 당해 이미지의 목표 평점 분야에서의 참조 점수 값을 포함하고; 다음은, 훈련 샘플 내의 이미지의 오리지널 평점 분야에서의 점수 값을 초기 단조 신경망에 입력하여 초기 단조 신경망에 의해 출력된, 당해 이미지의 목표 평점 분야에서의 예측 점수 값을 얻는 단계이고; 그 다음은, 당해 예측 점수 값 및 상술한 훈련 샘플 내의 참조 점수 값을 사전설정된 손실 함수에 입력하여 손실 값을 얻고 당해 손실 값을 이용하여 훈련하여 - 예를 들면 단조 신경망에서 역전파를 수행하여 - 훈련된 상술한 단조 신경망을 얻는 단계이다. 당해 훈련 과정의 수행 주체는 상술한 수행 주체일 수도 있고 다른 전자 기기일 수도 있다. 초기 단조 신경망은 훈련할 단조 신경망을 가리킨다.
상술한 수행 주체 또는 다른 전자 기기는 훈련 샘플을 통해 오리지널 평점 분야의 점수 값과 목표 평점 분야의 점수 값 간의 단조성을 구현하고, 동시에 생성된 목표 평점 분야의 점수 값의 정확도를 향상시킨다.
이러한 구현방식은 품질 평점 모델을 이용하여 이미지의 하나의 평점 분야에서의 점수 값으로부터 당해 이미지의 다른 평점 분야에서의 점수 값을 직접 생성할 수 있는바, 서로 다른 평점 분야 간의 점수 값의 전환을 구현할 수 있다. 이러한 구현방식은 대량의 목표 평점 분야의 샘플을 취득할 필요 없이 단조 신경망을 학습하여 얻을 수 있는바, 학습 효율을 향상시킨다. 이 외에도, 단조 신경망은 보다 적은 은닉 유닛을 적용하는바, 단조 신경망의 효율을 향상시킬 수 있다.
계속하여 도 3을 참조하면, 도 3은 본 실시예에 따른 이미지를 처리하는 방법의 응용 시나리오의 일 개략도이다. 도 3의 응용 시나리오에서, 수행 주체(301)는 처리할 수치(302)를 취득하는바, 여기서, 처리할 수치는 처리할 이미지에 관련되는바, 예를 들면 처리할 수치는 처리할 이미지에 기반하여 생성된다. 수행 주체(301)는 품질 평점 모델(303)을 이용하여 처리할 수치(302)를 처리하여 처리할 이미지의 목표 평점 분야에서의 점수 값(304)을 생성하는바, 여기서, 처리할 이미지의 목표 평점 분야에서의 점수 값은 처리할 이미지의 이미지 품질에 관련된다.
도 4를 나아가 참조하면, 이는 이미지를 처리하는 방법의 일 실시예의 흐름(400)을 도시한다. 품질 평점 모델은 평점 네트워크 및 단조 신경망을 포함할 수 있다. 당해 흐름(400)은 하기 단계를 포함한다.
단계401, 처리할 이미지를 평점 네트워크에 입력하여 평점 네트워크로부터 출력된, 처리할 이미지의 초기 점수 값을 얻는다.
본 실시예에서, 이미지를 처리하는 방법을 수행하는 수행 주체(예를 들면 도 1에 도시한 서버 또는 단말기기)는 처리할 이미지를 평점 네트워크에 입력하여 상술한 처리할 이미지의 초기 점수 값을 얻을 수 있다. 당해 초기 점수 값은 상술한 평점 네트워크에 의해 출력된다.
여기서의 평점 네트워크는 이미지에 의해 이미지에 관련되는 수치를 생성 가능한 임의의 심층 신경망일 수 있는바, 예를 들면 합성곱 신경망, 잔차 신경망 등이 있다. 구체적으로, 여기서의 초기 점수 값은 어느 한 평점 분야의 점수 값이 아니라 단지 어느 한 평점 분야의 점수 값을 생성하기 위한 과정값일 뿐이다.
단계402, 초기 점수 값을 단조 신경망에 입력하여 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻되, 여기서, 단조 신경망 내의 은닉 유닛의 수량은 사전설정 역치보다 작다.
본 실시예에서, 상술한 수행 주체는 상술한 초기 점수 값을 단조 신경망에 입력하여 상술한 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻을 수 있다. 여기서 얻은 점수 값은 당해 단조 신경망에 의해 출력된다. 당해 단조 신경망은 처리할 이미지의 초기 점수 값으로부터 당해 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻을 수 있다.
당해 품질 평점 모델의 훈련 샘플은 이미지 및 목표 분야 라벨에 대응되는 분야에서의 당해 이미지의 참조 점수 값을 포함한다. 구체적으로, 훈련 단계는 하기 과정을 포함할 수 있다. 훈련 샘플 내의 이미지를 초기 품질 평점 모델 내의 평점 네트워크에 입력하여 당해 평점 네트워크에 의해 출력된 초기 점수 값을 획득한다. 초기 점수 값을 초기 품질 평점 모델 내의 단조 신경망에 입력하여 당해 단조 신경망에 의해 출력된, 당해 이미지의 목표 평점 분야에서의 점수 값을 얻는다. 다음, 당해 점수 값 및 참조 점수 값을 사전설정된 손실 함수에 입력하여 손실 값을 얻고 당해 손실 값을 이용하여 초기 품질 평점 모델을 훈련시키는바, 예를 들면 역전파를 수행하는바, 이로써 훈련된 초기 품질 평점 모델을 얻는다.
당해 훈련 단계는 상술한 수행 주체 또는 다른 전자 기기에 의해 수행될 수 있다. 이에 따라, 상술한 수행 주체 또는 다른 전자 기기는 평점 네트워크 및 단조 신경망을 이용하여 조인트 훈련을 수행하여 목표 평점 분야에서의 점수 값을 정확하게 결정 가능한 품질 평가 모델을 훈련하여 얻을 수 있다.
본 실시예는 평점 네트워크 및 단조 신경망 양자를 이용하여 처리할 이미지의 목표 평점 분야에서의 정확한 점수 값을 생성할 수 있다.
본 실시예의 일부 대안적인 구현방식에서, 품질 평점 모델은 적어도 2개의 단조 신경망을 포함하고 적어도 2개의 단조 신경망 중 서로 다른 단조 신경망에 대응되는 평점 분야는 서로 다르고, 단계402는 초기 점수 값을 적어도 2개의 단조 신경망에 입력하여 적어도 2개의 단조 신경망 중의 각 단조 신경망에 의해 각각 출력된, 처리할 이미지의 당해 단조 신경망에 대응되는 평점 분야에서의 점수 값을 얻는 단계를 포함할 수 있다.
이러한 대안적인 구현방식에서, 품질 평점 모델에 포함되는 단조 신경망의 수량은 적어도 2개이다. 상술한 수행 주체는 초기 점수 값을 상술한 적어도 2개의 단조 신경망에 입력하여 상술한 적어도 2개의 단조 신경망 중 각 단조 신경망에 의해 출력된 점수 값을 얻는다. 목표 평점 분야의 수량은 적어도 2개이고, 출력된 각 점수 값은 하나의 목표 평점 분야에 대응된다.
이러한 구현방식은 복수의 단조 신경망을 결합한 품질 평가 모델을 이용하여 이미지의 복수의 평점 분야에서의 점수 값을 효율적으로 생성할 수 있다.
본 실시예의 일부 대안적인 구현방식에서, 상술한 방법은, 훈련 샘플 집합을 취득하는 단계 - 여기서, 훈련 샘플 집합 내의 훈련 샘플은 샘플 이미지 및 샘플 이미지의 지정 평점 분야에서의 참조 점수 값을 포함하고 지정 평점 분야는 목표 평점 분야와는 서로 다른 평점 분야임 - ; 샘플 이미지를 평점 네트워크에 입력하여 샘플 이미지의 초기 점수 값을 얻는 단계; 샘플 이미지의 초기 점수 값을 훈련할 단조 신경망에 입력하여 샘플 이미지의 지정 평점 분야에서의 예측 점수 값을 얻는 단계; 및 참조 점수 값 및 예측 점수 값에 기반하여 예측 점수 값의 손실 값을 결정하고 손실 값을 이용하여 훈련할 단조 신경망을 훈련하여 훈련된 단조 신경망을 얻는 단계를 더 포함할 수 있다.
이러한 대안적인 구현방식에서, 상술한 수행 주체는 훈련할 단조 신경망을 단독으로 훈련할 수 있는바, 즉, 평점 네트워크에 의해 출력된 초기 점수 값을 이용하여 단조 신경망을 훈련할 수 있다. 참조 점수 값은 샘플 이미지의 상술한 지정 평점 분야에서의 실제 수치로 간주될 수 있다. 구체적으로, 상술한 수행 주체는 참조 점수 값 및 예측 점수 값을 사전설정된 손실 함수에 입력하여 손실 값을 얻을 수 있다. 그리고 당해 손실 값을 이용하여 훈련할 수 있는바, 예를 들면 상술한 단조 신경망에서 역전파를 수행함으로써 훈련된 단조 신경망을 얻을 수 있다.
상술한 수행 주체 또는 다른 전자 기기는 이러한 구현방식에서의 훈련 방식으로 임의 지정 평점 분야의 점수 값을 생성 가능한 단조 신경망을 효율적으로 훈련해낼 수 있다.
나아가 도 5를 참조하면, 상술한 각 도면에 도시한 방법에 대한 구현으로 본 출원은 이미지를 처리하는 장치의 일 실시예를 제공하는바, 당해 장치 실시예는 도 2에 도시한 방법 실시예에 대응되고, 아래 기재한 특징 외에, 당해 장치 실시예는 도 2에 도시한 방법 실시예와 같은 또는 상응한 특징 또는 효과를 더 포함할 수 있다. 당해 장치는 구체적으로 다양한 전자 기기에 응용될 수 있다.
도 5에 도시한 바와 같이, 본 실시예의 이미지를 처리하는 장치(500)는 취득 유닛(501) 및 생성 유닛(502)을 포함한다. 여기서, 취득 유닛(501)은 처리할 수치를 취득하도록 구성되되, 처리할 수치는 처리할 이미지에 관련되고; 생성 유닛(502)은 품질 평점 모델을 이용하여 처리할 수치를 처리하여 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하도록 구성되되, 처리할 이미지의 목표 평점 분야에서의 점수 값은 처리할 이미지의 이미지 품질에 관련된다.
본 실시예에서, 이미지를 처리하는 장치(500)의 취득 유닛(501) 및 생성 유닛(502)의 구체적인 처리 및 이에 따른 기술 효과는 각각 도 2에 대응되는 실시예에서의 단계201 및 단계202의 관련 설명을 참조할 수 있는바, 이에 대한 상세한 설명은 생략하기로 한다.
본 실시예의 일부 대안적인 구현방식에서, 처리할 수치는 처리할 이미지의 오리지널 평점 분야에서의 점수 값이고, 생성 유닛은 나아가, 품질 평점 모델을 이용하여 처리할 수치를 처리하여 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하는 것을 하기와 같은 방식인, 처리할 이미지의 오리지널 평점 분야에서의 점수 값을 품질 평점 모델에 입력하여 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻는 것 - 여기서, 품질 평점 모델은 단조 신경망이고 단조 신경망 내의 은닉 유닛의 수량은 사전설정 역치보다 작음 - 으로 수행하도록 구성된다.
본 실시예의 일부 대안적인 구현방식에서, 품질 평점 모델은 평점 네트워크 및 단조 신경망을 포함하고, 취득 유닛은 나아가, 처리할 수치를 취득하는 것을 하기와 같은 방식인, 처리할 이미지를 평점 네트워크에 입력하여 평점 네트워크로부터 출력된, 처리할 이미지의 초기 점수 값을 얻는 것으로 수행하도록 구성되고, 생성 유닛은 나아가, 품질 평점 모델을 이용하여 처리할 수치를 처리하여 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하는 것을 하기와 같은 방식인, 초기 점수 값을 단조 신경망에 입력하여 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻는 것 - 여기서, 단조 신경망 내의 은닉 유닛의 수량은 사전설정 역치보다 작음 - 으로 수행하도록 구성된다.
본 실시예의 일부 대안적인 구현방식에서, 품질 평점 모델은 적어도 2개의 단조 신경망을 포함하고 적어도 2개의 단조 신경망 중 서로 다른 단조 신경망에 대응되는 평점 분야는 서로 다르고, 생성 유닛은 나아가, 초기 점수 값을 단조 신경망에 입력하여 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻는 것을 하기와 같은 방식인, 초기 점수 값을 적어도 2개의 단조 신경망에 입력하여 적어도 2개의 단조 신경망 중의 각 단조 신경망에 의해 각각 출력된, 처리할 이미지의 당해 단조 신경망에 대응되는 평점 분야에서의 점수 값을 얻는 것으로 수행하도록 구성된다.
본 실시예의 일부 대안적인 구현방식에서, 장치는 훈련 샘플 집합을 취득하도록 구성되는 샘플 취득 유닛 - 여기서, 훈련 샘플 집합 내의 훈련 샘플은 샘플 이미지 및 샘플 이미지의 지정 평점 분야에서의 참조 점수 값을 포함하고 지정 평점 분야는 목표 평점 분야와는 서로 다른 평점 분야임 - ; 샘플 이미지를 평점 네트워크에 입력하여 샘플 이미지의 초기 점수 값을 얻도록 구성되는 입력 유닛; 샘플 이미지의 초기 점수 값을 훈련할 단조 신경망에 입력하여 샘플 이미지의 지정 평점 분야에서의 예측 점수 값을 얻도록 구성되는 예측 유닛; 및 참조 점수 값 및 예측 점수 값에 기반하여 예측 점수 값의 손실 값을 결정하고 손실 값을 이용하여 훈련할 단조 신경망을 훈련하여 훈련된 단조 신경망을 얻도록 구성되는 결정 유닛을 더 포함한다.
본 출원의 실시예에 따르면, 본 출원은 전자 기기 및 판독가능 저장 매체를 더 제공한다. 도 6에 도시한 바는, 본 출원의 실시예의 이미지를 처리하는 방법에 따른 전자 기기의 블록도이다. 전자 기기는 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크벤치, 개인용 디지털 보조기, 서버, 블레이드 서버, 대형 컴퓨터 및 다른 적합한 컴퓨터와 같은 다양한 형식의 디지털 컴퓨터를 가리키고자 하는 것이다. 전자 기기는 또한, 개인용 디지털 보조기, 셀룰러 폰, 스마트폰, 웨어러블 기기 및 다른 이와 유사한 컴퓨팅 기기와 같은 다양한 형식의 이동 장치를 가리킬 수 있다. 본 명세서에서 제시하는 부품, 이들의 연결과 관계 및 이들의 기능은 단지 예시일 뿐, 본 명세서에서 서술한 및/또는 청구하는 본 출원의 구현을 한정하고자 하는 것이 아니다.
도 6에 도시한 바와 같이, 당해 전자 기기는 하나 또는 복수의 프로세서(601), 메모리(602)를 포함하고, 각 부품을 연결하는 인터페이스는 고속 인터페이스와 저속 인터페이스를 포함한다. 각 부품은 서로 다른 버스를 이용하여 서로 연결되고 공통 메인보드에 장착되거나 또는 필요에 따라 다른 방식으로 장착될 수 있다. 프로세서는 전자 기기 내에서 실행되는 명령을 처리할 수 있는바, 메모리에 저장되어 외부 입력/출력 장치(인터페이스에 커플링된 표시 기기와 같은)에 GUI의 그래픽 정보를 표시하기 위한 명령이 포함된다. 다른 실시 방식에서, 필요하다면 복수의 프로세서 및/또는 복수의 버스를 복수의 메모리와 함께 사용할 수 있다. 마찬가지로, 복수의 전자 기기를 연결할 수 있고, 각 기기는 (예를 들어 서버 어레이, 한 그룹의 블레이드 서버 또는 멀티프로세서 시스템으로서) 일부 필요한 조작을 제공할 수 있다. 도 6은 프로세서(601)를 예로 든다.
메모리(602)가 바로 본 출원에 의해 제공되는 비일시적 컴퓨터 판독가능 저장 매체이다. 여기서, 메모리에는 적어도 하나의 프로세서에 의해 실행될 수 있는 명령이 저장되어 있는바, 적어도 하나의 프로세서에 의해 본 출원에 의해 제공되는 이미지를 처리하는 방법이 수행되도록 한다. 본 출원의 비일시적 컴퓨터 판독가능 저장 매체는 컴퓨터 명령을 저장하고, 당해 컴퓨터 명령은 컴퓨터에 의해 본 출원에 의해 제공되는 이미지를 처리하는 방법이 수행되도록 한다.
메모리(602)는 비일시적 컴퓨터 판독 가능 저장 매체로서, 본 출원의 실시예의 이미지를 처리하는 방법에 대응되는 프로그램 명령/모듈(예를 들면, 첨부 도면5에 도시한 취득 유닛(501) 및 생성 유닛(502))과 같은 비일시적 소프트웨어 프로그램, 비일시적 컴퓨터 실행가능 프로그램 및 모듈을 저장할 수 있다. 프로세서(601)는 메모리(602)에 저장되는 비일시적 소프트웨어 프로그램, 명령 및 모듈을 실행함으로써 서버의 다양한 기능 응용 및 데이터 처리를 실행하는바, 즉 상술한 방법 실시예에서의 이미지를 처리하는 방법을 구현한다.
메모리(602)는 프로그램 저장 영역과 데이터 저장 영역을 포함할 수 있는바, 여기서, 프로그램 저장 영역은 운영 체제, 적어도 하나의 기능에 있어서 필요한 응용 프로그램을 저장할 수 있고, 데이터 저장 영역은 이미지를 처리하는 전자 기기의 사용에 따라 생성되는 데이터 등을 저장할 수 있다. 이 외에도, 메모리(602)는 고속 랜덤 액세스 메모리를 포함할 수도 있고, 비일시적 메모리, 예를 들어 적어도 하나의 자기 디스크 저장 디바이스, 플래시 메모리 디바이스 또는 다른 비일시적 고체 상태 저장 디바이스를 더 포함할 수도 있다. 일부 실시에서, 메모리(602)는 대안적으로 프로세서(601) 대비 원격 설치되는 메모리를 포함하는바, 이러한 원격 메모리는 네트워크를 통해 이미지를 처리하는 전자 기기에 연결된다. 상술한 네트워크의 실제 예는 인터넷, 기업 내부 네트워크, 근거리 통신망, 이동 통신 네트워크 및 이들의 조합을 포함하나 이에 한정되지 않는다.
이미지를 처리하는 방법의 전자 기기는 입력 장치(603)와 출력 장치(604)를 더 포함할 수 있다. 프로세서(601), 메모리(602), 입력 장치(603) 및 출력 장치(604)는 버스 또는 다른 방식으로 연결될 수 있고, 도 6은 버스에 의한 연결을 예로 든다.
입력 장치(603)는 입력되는 숫자 또는 문자(character) 정보를 수신하고, 이미지를 처리하는 전자 기기의 사용자 설정 및 기능 제어에 관련되는 키 신호 입력을 발생시킬 수 있는바, 예를 들면 터치 스크린, 숫자 키패드, 마우스, 트랙패드, 터치패드, 포인팅 스틱, 하나 또는 복수의 마우스 버튼, 트랙볼, 조종 스틱 등의 입력 장치가 있다. 출력 장치(604)는 표시 기기, 보조 조명장치(예를 들어 LED) 및 촉각 피드백 장치(예를 들어 진동 모터) 등을 포함할 수 있다. 당해 표시 기기는 액정 디스플레이(LCD), 발광 다이오드(LED) 디스플레이 및 플라즈마 디스플레이를 포함할 수 있으나 이에 한정되지 않는다. 일부 실시 방식에서 표시 기기는 터치 스크린일 수 있다.
여기서 서술하는 시스템과 기술의 다양한 실시 방식은 디지털 전자회로 시스템, 집적회로 시스템, 주문형ASIC(주문형 집적회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어 및/또는 이들의 조합에서 구현될 수 있다. 이러한 다양한 실시 방식은 하나 또는 복수의 컴퓨터 프로그램에서 실시되는 것을 포함할 수 있고, 당해 하나 또는 복수의 컴퓨터 프로그램은 적어도 하나의 프로그램가능 프로세서를 포함하는 프로그램가능 시스템에서 실행되거나 및/또는 해석될 수 있고, 당해 프로그램가능 프로세서는 전용의 또는 범용의 프로그램가능 프로세서일 수 있고, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터와 명령을 수신하고 데이터와 명령을 당해 저장 시스템, 당해 적어도 하나의 입력 장치 및 당해 적어도 하나의 출력 장치로 전송할 수 있다.
이러한 컴퓨팅 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션 또는 코드로 지칭되기도 함)은 프로그램가능 프로세서의 기계 명령을 포함하며, 고급 절차 프로그래밍 언어 및/또는 객체지향 프로그래밍 언어, 및/또는 어셈블리어/기계어를 이용하여 이러한 컴퓨팅 프로그램을 실시할 수 있다. 본 명세서에서 사용한 바와 같이, 용어 '기계 판독가능 매체'와 '컴퓨터 판독가능 매체'는 기계 명령 및/또는 데이터를 프로그램가능 프로세서에 제공하기 위한 임의의 컴퓨터 프로그램 제품, 기기, 및/또는 장치(예를 들면 자기 디스크, 광 디스크, 메모리, 프로그램가능 논리 장치(PLD))를 가리키는바, 이는 기계 판독가능 신호로서의 기계 명령을 수신하는 기계 판독가능 매체를 포함한다. 용어 '기계 판독가능 신호'는 기계 명령 및/또는 데이터를 프로그램 가능 프로세서에 제공하기 위한 임의의 신호를 가리킨다.
사용자와의 인터랙션을 제공하기 위해, 여기서 서술하는 시스템과 기술을 컴퓨터에서 실시할 수 있는바, 당해 컴퓨터는 사용자한테 정보를 표시하기 위한 표시 장치(예를 들면 음극선관(CRT) 또는 액정 디스플레이(LCD) 모니터) 및 키보드와 포인팅 장치(예를 들면 마우스 또는 트랙볼)를 구비하고, 사용자는 당해 키보드와 당해 포인팅 장치를 통해 입력을 컴퓨터에 제공할 수 있다. 다른 종류의 장치 또한 사용자와의 인터랙션을 제공하는 데 사용될 수 있는바, 예를 들면 사용자한테 제공되는 피드백은 임의 형식의 감각 피드백(예를 들어 시각 피드백, 청각 피드백 또는 촉각 피드백)일 수 있고, 임의 형식(소리 입력, 음성 입력 또는 촉각 입력을 포함함)으로 사용자로부터의 입력이 수신될 수 있다.
여기서 서술하는 시스템과 기술을 백스테이지 부품을 포함하는 컴퓨팅 시스템(예를 들면 데이터 서버로서), 미들웨어 부품을 포함하는 컴퓨팅 시스템(예를 들면 애플리케이션 서버), 프론트엔드 부품을 포함하는 컴퓨팅 시스템(예를 들면 그래픽 사용자 인터페이스 또는 네트워크 브라우저를 구비하는 사용자 컴퓨터가 있고, 사용자는 당해 그래픽 사용자 인터페이스 또는 당해 네트워크 브라우저를 통해 여기서 서술하는 시스템 및 기술의 실시 방식과 인터랙션할 수 있음), 또는 이러한 백그라운드 부품, 미들웨어 부품 또는 프런트 엔드 부품의 임의 조합을 포함하는 컴퓨팅 시스템에서 실시할 수 있다. 임의 형식 또는 매체의 디지털 데이터 통신(예를 들면 통신 네트워크)으로 시스템의 부품을 서로 연결시킬 수 있다. 통신 네트워크의 예시는 근거리 통신망(LAN), 광대역 통신망(WAN) 및 인터넷을 포함한다.
컴퓨터 시스템은 클라이언트와 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 멀리 떨어져 있고, 통상적으로 통신 네트워크를 통해 인터랙션한다. 상응한 컴퓨터에서 실행되고 서로 클라이언트-서버 관계를 가지는 컴퓨터 프로그램에 의해 클라이언트와 서버의 관계가 발생한다.
첨부도면 중의 흐름도 및 블록도는 본 출원의 다양한 실시예에 따른 시스템, 방법 및 컴퓨터 프로그램 제품의 실시될 수 있는 체계 아키텍처, 기능 및 조작을 도시한다. 이러한 점에서, 흐름도 또는 블록도 중의 각 블록은 하나의 모듈, 프로그램 세그먼트, 또는 코드의 일부분을 나타낼 수 있고, 당해 모듈, 프로그램 세그먼트, 또는 코드의 일부분은 규정된 논리 기능을 구현하는 하나 또는 복수의 실행가능한 명령을 포함한다. 치환으로 하는 일부 구현에서, 블록 내에 표기된 기능은 첨부도면에서 표기한 것과는 다른 순서로 발생할 수도 있다는 점을 유의하여야 한다. 예를 들면, 2개의 연속되게 표시된 블록은 사실상 기본적으로 병렬로 수행될 수도 있고, 이들은 때로는 상반되는 순서로 수행될 수도 있는바, 이는 관련되는 기능에 따라 결정된다. 블록도 및/또는 흐름도 중의 각 블록, 및 블록도 및/또는 흐름도 중의 블록의 조합은, 규정된 기능 또는 조작을 수행하는 전용의, 하드웨어 기반의 시스템을 사용하여 구현하거나, 또는 전용의 하드웨어와 컴퓨터 명령의 조합을 사용하여 구현할 수 있다는 점도 유의하여야 한다.
본 출원에서 설명한 실시예에 관련되는 유닛은 소프트웨어의 방식으로 구현될 수도 있고 하드웨어의 방식으로 구현될 수도 있다. 설명한 유닛은 프로세서에 설치될 수도 있는바, 예를 들면, 취득 유닛 및 생성 유닛을 포함하는 프로세서로 서술될 수 있다. 여기서, 이러한 유닛의 명칭은 어떠한 경우에도 당해 유닛 자체에 대한 한정이 되지 않는바, 예를 들면, 취득 유닛은 또한 "처리할 수치를 취득하는 유닛"으로 서술될 수 있다.
다른 측면으로, 본 출원은 컴퓨터 판독가능 매체를 더 제공하는바, 당해 컴퓨터 판독가능 매체는 상술한 실시예에서 설명한 장치에 포함될 수도 있고 당해 장치에 설치되지 않은 채 단독으로 존재할 수도 있다. 상술한 컴퓨터 판독가능 매체에는 하나 또는 복수의 프로그램이 탑재되어 있고, 상술한 하나 또는 복수의 프로그램이 당해 장치에 의해 실행되는 경우, 당해 장치가, 처리할 수치를 취득하고 -여기서, 처리할 수치는 처리할 이미지에 관련됨 - ; 품질 평점 모델을 이용하여 처리할 수치를 처리하여 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하도록 하는바, 여기서, 처리할 이미지의 목표 평점 분야에서의 점수 값은 처리할 이미지의 이미지 품질에 관련된다.
상술한 설명은 단지 본 출원의 바람직한 실시예 및 운용된 기술 원리에 대한 설명일 뿐이다. 당업자라면, 본 출원에 관련되는 발명의 범위는, 상술한 기술 특징의 특정 조합으로 이루어지는 기술 방안에 한정되지 않으며, 동시에, 상술한 발명 사상을 벗어나지 않으면서 상술한 기술 특징 또는 그 등가 특징을 임의로 조합하여 구성하는 다른 기술 방안도 포함하여야 한다는 것을 이해하여야 한다. 예를 들면 상술한 특징을 본 출원에서 개시한(그러나 이에 한정되지 않음) 유사 기능을 가지는 기술 특징과 상호 치환하여 형성하는 기술 방안이 있다.

Claims (13)

  1. 이미지를 처리하는 방법으로서,
    처리할 수치를 취득하는 단계 - 상기 처리할 수치는 처리할 이미지에 관련됨 - ; 및
    품질 평점 모델을 이용하여 상기 처리할 수치를 처리하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하는 단계 - 상기 처리할 이미지의 상기 목표 평점 분야에서의 점수 값은 상기 처리할 이미지의 이미지 품질에 관련됨 - 를 포함하는 이미지를 처리하는 방법.
  2. 제1항에 있어서,
    상기 처리할 수치는 상기 처리할 이미지의 오리지널 평점 분야에서의 점수 값이고,
    상기 품질 평점 모델을 이용하여 상기 처리할 수치를 처리하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하는 단계는,
    상기 처리할 이미지의 오리지널 평점 분야에서의 점수 값을 상기 품질 평점 모델에 입력하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻는 단계 - 상기 품질 평점 모델은 단조 신경망이고 상기 단조 신경망 내의 은닉 유닛의 수량은 사전설정 역치보다 작음 - 를 포함하는 이미지를 처리하는 방법.
  3. 제1항에 있어서,
    상기 품질 평점 모델은 평점 네트워크 및 단조 신경망을 포함하고,
    상기 처리할 수치를 취득하는 단계는,
    상기 처리할 이미지를 상기 평점 네트워크에 입력하여 상기 평점 네트워크로부터 출력된, 상기 처리할 이미지의 초기 점수 값을 얻는 단계를 포함하고
    상기 품질 평점 모델을 이용하여 상기 처리할 수치를 처리하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하는 단계는,
    상기 초기 점수 값을 상기 단조 신경망에 입력하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻는 단계 - 상기 단조 신경망 내의 은닉 유닛의 수량은 사전설정 역치보다 작음 - 를 포함하는 이미지를 처리하는 방법.
  4. 제3항에 있어서,
    상기 품질 평점 모델은 적어도 2개의 단조 신경망을 포함하고 상기 적어도 2개의 단조 신경망 중 서로 다른 단조 신경망에 대응되는 평점 분야는 서로 다르고,
    상기 초기 점수 값을 상기 단조 신경망에 입력하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻는 단계는,
    상기 초기 점수 값을 상기 적어도 2개의 단조 신경망에 입력하여 상기 적어도 2개의 단조 신경망 중의 각 단조 신경망으로부터 각각 출력된, 상기 처리할 이미지의 당해 단조 신경망에 대응되는 평점 분야에서의 점수 값을 얻는 단계를 포함하는 이미지를 처리하는 방법.
  5. 제3항에 있어서,
    상기 방법은
    훈련 샘플 집합을 취득하는 단계 - 상기 훈련 샘플 집합 내의 훈련 샘플은 샘플 이미지 및 상기 샘플 이미지의 지정 평점 분야에서의 참조 점수 값을 포함하고 상기 지정 평점 분야는 상기 목표 평점 분야와는 서로 다른 평점 분야임 - ;
    상기 샘플 이미지를 상기 평점 네트워크에 입력하여 상기 샘플 이미지의 초기 점수 값을 얻는 단계;
    상기 샘플 이미지의 초기 점수 값을 훈련할 단조 신경망에 입력하여 상기 샘플 이미지의 지정 평점 분야에서의 예측 점수 값을 얻는 단계; 및
    상기 참조 점수 값 및 상기 예측 점수 값에 기반하여 상기 예측 점수 값의 손실 값을 결정하고 상기 손실 값을 이용하여 상기 훈련할 단조 신경망을 훈련하여 훈련된 단조 신경망을 얻는 단계를 더 포함하는 이미지를 처리하는 방법.
  6. 이미지를 처리하는 장치로서,
    처리할 수치를 취득하도록 구성되는 취득 유닛 - 상기 처리할 수치는 처리할 이미지에 관련됨 - ; 및
    품질 평점 모델을 이용하여 상기 처리할 수치를 처리하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하도록 구성되는 생성 유닛 - 상기 처리할 이미지의 상기 목표 평점 분야에서의 점수 값은 상기 처리할 이미지의 이미지 품질에 관련됨 - 을 포함하는 이미지를 처리하는 장치.
  7. 제6항에 있어서,
    상기 처리할 수치는 상기 처리할 이미지의 오리지널 평점 분야에서의 점수 값이고,
    상기 생성 유닛은 나아가,
    상기 품질 평점 모델을 이용하여 상기 처리할 수치를 처리하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하는 것을 하기와 같은 방식인,
    상기 처리할 이미지의 오리지널 평점 분야에서의 점수 값을 상기 품질 평점 모델에 입력하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻는 것 - 상기 품질 평점 모델은 단조 신경망이고 상기 단조 신경망 내의 은닉 유닛의 수량은 사전설정 역치보다 작음 - 으로 수행하도록 구성되는 이미지를 처리하는 장치.
  8. 제6항에 있어서,
    상기 품질 평점 모델은 평점 네트워크 및 단조 신경망을 포함하고,
    상기 취득 유닛은 나아가,
    상기 처리할 수치를 취득하는 것을 하기와 같은 방식인,
    상기 처리할 이미지를 상기 평점 네트워크에 입력하여 상기 평점 네트워크로부터 출력된, 상기 처리할 이미지의 초기 점수 값을 얻는 것으로 수행하도록 구성되고,
    상기 생성 유닛은 나아가,
    상기 품질 평점 모델을 이용하여 상기 처리할 수치를 처리하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 생성하는 것을 하기와 같은 방식인,
    상기 초기 점수 값을 상기 단조 신경망에 입력하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻는 것 - 상기 단조 신경망 내의 은닉 유닛의 수량은 사전설정 역치보다 작음 - 으로 수행하도록 구성되는 이미지를 처리하는 장치.
  9. 제8항에 있어서,
    상기 품질 평점 모델은 적어도 2개의 단조 신경망을 포함하고 상기 적어도 2개의 단조 신경망 중 서로 다른 단조 신경망에 대응되는 평점 분야는 서로 다르고,
    상기 생성 유닛은 나아가,
    상기 초기 점수 값을 상기 단조 신경망에 입력하여 상기 처리할 이미지의 목표 평점 분야에서의 점수 값을 얻는 것을 하기와 같은 방식인,
    상기 초기 점수 값을 상기 적어도 2개의 단조 신경망에 입력하여 상기 적어도 2개의 단조 신경망 중의 각 단조 신경망으로부터 각각 출력된, 상기 처리할 이미지의 당해 단조 신경망에 대응되는 평점 분야에서의 점수 값을 얻는 것으로 수행하도록 구성되는 이미지를 처리하는 장치.
  10. 제8항에 있어서,
    상기 장치는
    훈련 샘플 집합을 취득하도록 구성되는 샘플 취득 유닛 - 상기 훈련 샘플 집합 내의 훈련 샘플은 샘플 이미지 및 상기 샘플 이미지의 지정 평점 분야에서의 참조 점수 값을 포함하고 상기 지정 평점 분야는 상기 목표 평점 분야와는 서로 다른 평점 분야임 - ;
    상기 샘플 이미지를 상기 평점 네트워크에 입력하여 상기 샘플 이미지의 초기 점수 값을 얻도록 구성되는 입력 유닛;
    상기 샘플 이미지의 초기 점수 값을 훈련할 단조 신경망에 입력하여 상기 샘플 이미지의 지정 평점 분야에서의 예측 점수 값을 얻도록 구성되는 예측 유닛; 및
    상기 참조 점수 값 및 상기 예측 점수 값에 기반하여 상기 예측 점수 값의 손실 값을 결정하고 상기 손실 값을 이용하여 상기 훈련할 단조 신경망을 훈련하여 훈련된 단조 신경망을 얻도록 구성되는 결정 유닛을 더 포함하는 이미지를 처리하는 장치.
  11. 전자 기기로서,
    하나 또는 복수의 프로세서; 및
    하나 또는 복수의 프로그램을 저장하는 저장 장치를 포함하고,
    상기 하나 또는 복수의 프로그램이 상기 하나 또는 복수의 프로세서에 의해 실행되는 경우, 상기 하나 또는 복수의 프로세서에 의해 제1항 내지 제5항 중 어느 한 항의 방법이 구현되도록 하는 전자 기기.
  12. 컴퓨터 프로그램이 저장되어 있는 컴퓨터 판독가능 저장 매체로서,
    당해 프로그램이 프로세서에 의해 실행되는 경우, 제1항 내지 제5항 중 어느 한 항의 방법이 구현되는 컴퓨터 판독가능 저장 매체.
  13. 매체에 저장된 컴퓨터 프로그램으로서,
    당해 프로그램이 프로세서에 의해 실행되는 경우, 제1항 내지 제5항 중 어느 한 항의 방법이 구현되는 매체에 저장된 컴퓨터 프로그램.
KR1020210021968A 2020-04-23 2021-02-18 이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램 KR102583112B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010325574.1A CN111524123B (zh) 2020-04-23 2020-04-23 用于处理图像的方法和装置
CN202010325574.1 2020-04-23

Publications (2)

Publication Number Publication Date
KR20210131221A true KR20210131221A (ko) 2021-11-02
KR102583112B1 KR102583112B1 (ko) 2023-09-27

Family

ID=71903086

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210021968A KR102583112B1 (ko) 2020-04-23 2021-02-18 이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램

Country Status (5)

Country Link
US (1) US11734809B2 (ko)
EP (1) EP3901905B1 (ko)
JP (1) JP2021174532A (ko)
KR (1) KR102583112B1 (ko)
CN (1) CN111524123B (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11640556B2 (en) * 2020-01-28 2023-05-02 Microsoft Technology Licensing, Llc Rapid adjustment evaluation for slow-scoring machine learning models

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014056442A (ja) * 2012-09-12 2014-03-27 Samsung R&D Institute Japan Co Ltd 画質推定装置、画質推定方法および画質推定プログラム
JP2018516412A (ja) * 2015-06-05 2018-06-21 ソニー株式会社 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7512286B2 (en) 2003-10-27 2009-03-31 Hewlett-Packard Development Company, L.P. Assessing image quality
US8370282B1 (en) * 2009-07-22 2013-02-05 Google Inc. Image quality measures
US20110052023A1 (en) * 2009-08-28 2011-03-03 International Business Machines Corporation Reconstruction of Images Using Sparse Representation
WO2013148566A1 (en) * 2012-03-26 2013-10-03 Viewdle, Inc. Image blur detection
US9158981B2 (en) * 2012-03-26 2015-10-13 The Procter & Gamble Company Method and system for evaluating the quality of a rendered image
US9025910B2 (en) * 2012-12-13 2015-05-05 Futurewei Technologies, Inc. Image retargeting quality assessment
KR102091136B1 (ko) * 2013-07-02 2020-03-19 삼성전자주식회사 영상 화질 개선 방법, 장치 및 기록 매체
CN105225222B (zh) * 2014-06-26 2021-06-15 西门子公司 对不同图像集的感知视觉质量的自动评估
CN106503614B (zh) * 2016-09-14 2020-01-17 厦门黑镜科技有限公司 一种照片获取方法及装置
KR102440329B1 (ko) * 2016-10-24 2022-09-02 삼성에스디에스 주식회사 영상 선택 방법 및 그 장치
CN108234870B (zh) * 2017-12-27 2019-10-11 Oppo广东移动通信有限公司 图像处理方法、装置、终端及存储介质
CN109903221B (zh) * 2018-04-04 2023-08-22 华为技术有限公司 图像超分方法及装置
CN110634116B (zh) * 2018-05-30 2022-04-05 杭州海康威视数字技术股份有限公司 一种面部图像评分方法及摄像机
US11087142B2 (en) * 2018-09-13 2021-08-10 Nec Corporation Recognizing fine-grained objects in surveillance camera images
CN109840903A (zh) * 2019-01-23 2019-06-04 南京信息工程大学 基于独立成分分析的无参考图像质量评价方法
CN110766658B (zh) * 2019-09-23 2022-06-14 华中科技大学 一种无参考激光干扰图像质量评价方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014056442A (ja) * 2012-09-12 2014-03-27 Samsung R&D Institute Japan Co Ltd 画質推定装置、画質推定方法および画質推定プログラム
JP2018516412A (ja) * 2015-06-05 2018-06-21 ソニー株式会社 畳み込みニューラルネットワークに基づいたフルリファレンス画像品質評価方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Image Quality Calculator", Apps on Google Play, 2019* *
Sebastian Bosse ET AL:"A deep neural network for image quality assessment", 2016 IEEE International Conference on Image Processing (ICIP)* *
Yu Liu ET AL:"Quality Aware Network for Set to Set Recognition", Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017, pp. 5790-5799* *

Also Published As

Publication number Publication date
JP2021174532A (ja) 2021-11-01
EP3901905A1 (en) 2021-10-27
US11734809B2 (en) 2023-08-22
US20210334950A1 (en) 2021-10-28
EP3901905B1 (en) 2023-01-18
CN111524123B (zh) 2023-08-08
CN111524123A (zh) 2020-08-11
KR102583112B1 (ko) 2023-09-27

Similar Documents

Publication Publication Date Title
JP7127106B2 (ja) 質問応答処理、言語モデルの訓練方法、装置、機器および記憶媒体
KR102484617B1 (ko) 이종 그래프 노드를 표현하는 모델 생성 방법, 장치, 전자 기기, 저장 매체 및 프로그램
KR102534721B1 (ko) 모델을 트레이닝하는 방법, 장치, 기기 및 저장 매체
US11748895B2 (en) Method and apparatus for processing video frame
US20210200947A1 (en) Event argument extraction method and apparatus and electronic device
US11637986B2 (en) Method and apparatus for interpolating frame to video, and electronic device
KR20210040316A (ko) 사용자 상호작용 정보 처리모델 생성방법, 사용자 상호작용 정보 처리방법 및 프로그램
KR102451197B1 (ko) 영상 프레임 처리 방법 및 장치, 전자 기기, 저장 매체 그리고 프로그램
US11768873B2 (en) Method, apparatus, electronic device and readable storage medium for classifying video
US20220019747A1 (en) Method for information processing in user conversation, electronic device and storage medium thereof
US20220101642A1 (en) Method for character recognition, electronic device, and storage medium
CN111241838B (zh) 文本实体的语义关系处理方法、装置及设备
JP7267379B2 (ja) 画像処理方法、事前トレーニングモデルのトレーニング方法、装置及び電子機器
KR102583112B1 (ko) 이미지를 처리하는 방법, 장치, 전자 기기, 저장 매체 및 프로그램
CN112100530B (zh) 网页分类方法、装置、电子设备及存储介质
CN113113017B (zh) 音频的处理方法和装置
CN112508830B (zh) 图像处理模型的训练方法、装置、设备及存储介质
CN113360797B (zh) 信息处理方法、装置、设备、存储介质及计算机程序产品
CN117979122A (zh) 视频生成方法、装置、计算机设备及介质
CN117785165A (zh) 基于大模型的图表生成方法、装置及电子设备

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right