KR102642866B1 - 이미지 인식 방법, 장치, 전자 기기 및 매체 - Google Patents

이미지 인식 방법, 장치, 전자 기기 및 매체 Download PDF

Info

Publication number
KR102642866B1
KR102642866B1 KR1020210022182A KR20210022182A KR102642866B1 KR 102642866 B1 KR102642866 B1 KR 102642866B1 KR 1020210022182 A KR1020210022182 A KR 1020210022182A KR 20210022182 A KR20210022182 A KR 20210022182A KR 102642866 B1 KR102642866 B1 KR 102642866B1
Authority
KR
South Korea
Prior art keywords
image
target
recognition
target front
server side
Prior art date
Application number
KR1020210022182A
Other languages
English (en)
Other versions
KR20210106914A (ko
Inventor
미아오 장
춘 왕
Original Assignee
베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. filed Critical 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디.
Publication of KR20210106914A publication Critical patent/KR20210106914A/ko
Application granted granted Critical
Publication of KR102642866B1 publication Critical patent/KR102642866B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Human Computer Interaction (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • User Interface Of Digital Computer (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

본 출원은 이미지 처리 분야에 관한 이미지 인식 방법, 장치, 전자 기기 및 매체를 개시한다. 구체적인 구현 방안은, 클라이언트 측으로부터 인식 대상 이미지를 수신하고, 인식 대상 이미지가 뒷모습 이미지인 지를 확정하고, 인식 대상 이미지가 뒷모습 이미지인 것으로 확정될 경우, 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정하고, 특징 정보에 따라 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하고, 클라이언트 측에서 대상 정면 이미지를 나타내도록 대상 정면 이미지를 클라이언트 측에 전송한다. 본 출원은, 사용자에 의해 송신되는 인식 대상 이미지가 뒷모습 이미지인 지를 확정하고, 뒷모습 이미지일 경우, 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정하고, 특징 정보에 따라 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하고, 최종으로 대상 정면 이미지를 클라이언트 측에 전송하여 사용자에게 제공함으로써, 인식 결과의 정보량을 증가시키고, 사용자의 사용 경험을 향상시키는 기술적 효과를 실현한다.

Description

이미지 인식 방법, 장치, 전자 기기 및 매체{IMAGE RECOGNITION METHOD AND APPARATUS, ELECTRONIC DEVICE, AND MEDIUM}
본 출원의 실시예는 컴퓨터 기술에 관한 것으로, 특히는 이미지 처리 기술에 관한 것이며, 구체적으로 이미지 인식 방법, 장치, 전자 기기 및 매체에 관한 것이다.
기존의 이미지 검색 기술은 키워드를 입력하는 형식을 통해 인터넷에서 관련된 이미지 자원을 검색하는 것이다. 기술이 발전됨에 따라, 최신의 이미지 인식 기술은, 사용자가 이미지를 업로드하거나 이미지의 url 주소를 입력함으로써 인터넷에서 해당 이미지와 유사한 기타 이미지 자원을 검색하는 것을 실현할 수 있을 뿐만 아니라, 해당 이미지와 관련된 정보를 찾을 수도 있다.
그러나, 사용자가 인물의 뒷모습 이미지를 업로드하여 인식을 진행하는 경우에는, 인물의 뒷모습에 포함되는 정보량이 상대적으로 적어, 사용자의 인식 요구를 만족시킬 수 없는 문제점이 존재한다.
본 출원의 실시예는 이미지 인식 방법, 장치, 전자 기기 및 매체를 제공하여, 인식 결과의 정보량을 증가시키고, 사용자의 사용 경험을 향상시킨다.
제1 양태에 있어서, 본 출원의 실시예는 서버 측에 적용되는 이미지 인식 방법을 제공하며, 상기 방법은, 클라이언트 측으로부터 인식 대상 이미지를 수신하고, 상기 인식 대상 이미지가 뒷모습 이미지인 지를 확정하는 단계; 상기 인식 대상 이미지가 뒷모습 이미지인 것으로 확정될 경우, 상기 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정하는 단계; 및 상기 특징 정보에 따라 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하고, 상기 클라이언트 측에서 상기 대상 정면 이미지를 표시하도록 상기 대상 정면 이미지를 상기 클라이언트 측에 전송하는 단계를 포함한다.
상술한 출원 중의 일 실시예는, 사용자로부터 송신된 인식 대상 이미지가 뒷모습 이미지인 지를 확정하고, 뒷모습 이미지일 경우, 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정하고, 특징 정보에 따라 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하고, 최종으로 대상 정면 이미지를 클라이언트 측에 전송하여 사용자에게 표시함으로써, 인식 결과의 정보량을 증가시키고, 사용자의 사용 경험을 향상시키는 기술적 효과를 실현하는 장점 또는 유익한 효과를 구비한다.
선택적으로, 상기 방법은, 상기 인식 대상 이미지에 대해 인식을 진행하여 상기 인식 대상 이미지의 인식 결과 정보를 확정하고, 상기 클라이언트 측에서 상기 인식 대상 이미지의 인식 결과 정보를 나타내도록 상기 인식 대상 이미지의 인식 결과 정보를 상기 클라이언트 측에 전송하는 단계를 더 포함한다.
상술한 출원 중의 일 실시예는, 인식 대상 이미지에 대해 인식을 진행하여 인식 대상 이미지의 인식 결과 정보를 확정하고, 클라이언트 측에 전송하여 클라이언트 측에서 사용자에게 인식 대상 이미지의 인식 결과 정보를 나타내게 하여, 사용자가 인식 대상 이미지에 관련된 정보를 획득할 수 있으므로, 인식 대상 이미지에 대해 인식을 진행하는 기술적 효과를 실현하는 장점 또는 유익한 효과를 구비한다.
선택적으로, 상기 특징 정보에 따라 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하는 단계는, 상기 특징 정보를 이미지 라이브러리 중의 각 후보 정면 이미지의 적어도 하나의 차원에서의 특징 정보와 매칭을 진행하고, 매칭이 성공된 특징 정보에 대응되는 후보 정면 이미지를 대상 정면 이미지로 하는 단계를 포함하되, 차원은 피부 색상, 체형, 헤어 스타일, 의상 및 정경 중의 적어도 하나를 포함한다.
상술한 출원 중의 일 실시예는, 인식 대상 이미지의 특징 정보를 이미지 라이브러리 중의 각 후보 정면 이미지의 적어도 하나의 차원에서의 특징 정보에 대해 매칭을 진행하고, 매칭이 성공된 특징 정보에 대응되는 후보 정면 이미지를 대상 정면 이미지로 이용함으로써, 인식 대상 이미지의 특징 정보에 따라 이미지 라이브러리로부터 인식 대상 이미지에 대응되는 대상 정면 이미지를 확정하는 기술적 효과를 실현하여, 후속적으로 당해 대상 정면 이미지를 클라이언트 측에 전송하여 사용자에게 제공하기 위한 기초를 확립하는 장점 또는 유익한 효과를 구비한다.
선택적으로, 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정한 후, 상기 방법은, 상기 대상 정면 이미지에 대해 인식을 진행하여 상기 대상 정면 이미지의 관련 인식 결과 정보를 확정 및 획득하고, 상기 클라이언트 측에서 상기 대상 정면 이미지의 관련 인식 결과 정보를 표시하도록 상기 대상 정면 이미지의 관련 인식 결과 정보를 상기 클라이언트 측에 전송하는 단계를 더 포함한다.
상술한 출원 중의 일 실시예는, 대상 정면 이미지에 대해 인식을 진행하여 대상 정면 이미지의 인식 결과 정보를 확정하고, 클라이언트 측에 전송하여 클라이언트 측에서 사용자에게 대상 정면 이미지의 인식 결과 정보를 제공하는 단계를 더 포함한다.
제2 양태에 있어서, 본 출원의 실시예는 클라이언트 측에 적용되는 이미지 인식 방법을 제공하며, 상기 방법은, 인식 대상 이미지를 서버 측에 송신하여, 상기 서버 측에서 상기 인식 대상 이미지에 따라 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하도록 하는 단계; 및 상기 서버 측으로부터 상기 대상 정면 이미지를 수신하고, 시각화 영역에서 상기 대상 정면 이미지를 표시하는 단계를 포함한다.
상술한 출원 중의 일 실시예는, 인식 대상 이미지를 상기 서버 측에 송신하여, 상기 서버 측으로부터 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정시키고, 상기 서버 측에서 송신되는 대상 정면 이미지를 획득하고, 시각화 영역에서 대상 정면 이미지를 표시함으로써, 인식 결과의 정보량을 증가시키고, 사용자의 사용 경험을 향상시키는 기술적 효과를 실현하는 장점 또는 유익한 효과를 구비한다.
선택적으로, 상기 서버 측에서 송신되는 대상 정면 이미지를 획득하기 전에, 상기 방법은, 상기 서버 측으로부터 상기 인식 대상 이미지의 인식 결과 정보를 수신하고, 상기 시각화 영역에서 상기 인식 대상 이미지의 인식 결과 정보를 표시하는 단계를 더 포함한다.
상술한 출원 중의 일 실시예는, 상기 서버 측에서 송신되는 인식 대상 이미지의 인식 결과 정보를 획득하고, 시각화 영역에서 인식 대상 이미지의 인식 결과 정보를 표시하여, 사용자에게 클라이언트 측을 통해 시각화 영역에서 인식 대상 이미지의 인식 결과 정보를 열람시킬 수 있으므로, 사용자가 인식 대상 이미지에 대해 인식을 진행하는 기술적 효과를 만족시키는 장점 또는 유익한 효과를 구비한다.
선택적으로, 상기 시각화 영역에서 상기 대상 정면 이미지를 나타내는 단계는, 상기 시각화 영역 중의 전환 버튼에 대한 사용자의 터치 조작이 검출되면, 상기 서버 측으로부터 상기 대상 정면 이미지를 수신하고, 상기 시각화 영역에서 상기 인식 대상 이미지를 동영상 전환 형식으로 상기 대상 정면 이미지로 전환시켜 표시하는 단계를 포함한다.
상술한 출원 중의 일 실시예는, 사용자가 전환 버튼을 터치한 후, 상기 서버 측에서 송신되는 대상 정면 이미지를 획득하고, 시각화 영역에서 인식 대상 이미지를 동영상 전환 형식으로 상기 대상 정면 이미지로 전환시켜 나타냄으로써, 인식 결과와 상호 작용으로부터 사용자의 사용 경험을 향상시키는 장점 또는 유익한 효과를 구비한다.
선택적으로, 상기 방법은, 서버 측에서 송신된 상기 대상 정면 이미지의 인식 결과 정보를 획득하고, 상기 시각화 영역에서 상기 대상 정면 이미지의 인식 결과 정보를 표시하는 단계를 더 포함한다.
상술한 출원 중의 일 실시예는, 서버 측에서 송신되는 대상 정면 이미지의 인식 결과 정보를 획득하고, 시각화 영역에서 상기 대상 정면 이미지의 인식 결과 정보를 표시함으로써, 사용자에게 클라이언트 측을 통해 시각화 영역에서 대상 정면 이미지의 인식 결과 정보를 열람시킬 수 있으므로, 사용자는 인식 대상 이미지의 인식 결과 정보를 획득할 수 있을 뿐만 아니라, 인식 대상 이미지에 대응되는 대상 정면 이미지의 인식 결과 정보를 획득할 수도 있어, 인식 결과의 정보량을 증가시키고, 사용자의 사용 경험을 향상시키는 기술적 효과를 실현하는 장점 또는 유익한 효과를 구비한다.
제3 양태에 있어서, 본 출원의 실시예는 서버 측에 설치되는 이미지 인식 장치를 더 개시하며, 해당 장치는, 클라이언트 측으로부터 인식 대상 이미지를 수신하고, 상기 인식 대상 이미지가 뒷모습 이미지인 지를 확정하도록 구성되는 인식 대상 이미지 획득 모듈; 상기 인식 대상 이미지가 뒷모습 이미지인 것으로 확정될 경우, 상기 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정하도록 구성되는 특징 정보 확정 모듈; 및 상기 특징 정보에 따라 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하고, 상기 클라이언트 측에서 상기 대상 정면 이미지를 나타내도록 상기 대상 정면 이미지를 상기 클라이언트 측에 전송하도록 구성되는 대상 정면 이미지 확정 모듈;을 포함한다.
제4 양태에 있어서, 본 출원의 실시예는 클라이언트 측에 설치되는 이미지 인식 장치를 더 개시하며, 해당 장치는, 서버 측에서 사용자에 의해 업로드된 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하도록, 상기 인식 대상 이미지를 상기 서버 측에 송신하도록 구성되는 인식 대상 이미지 송신 모듈과, 상기 서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 시각화 영역에서 상기 대상 정면 이미지를 나타내도록 구성되는 대상 정면 이미지 표시 모듈;을 포함한다.
제5 양태에 있어서, 본 출원의 실시예는 전자 기기를 더 개시하며, 해당 전자 기기는, 적어도 하나의 프로세서와, 상기 적어도 하나의 프로세서에 통신 연결되는 메모리 장치를 포함하되, 상기 메모리 장치에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되고, 상기 명령어이 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 본 출원의 임의의 실시예의 이미지 인식 방법을 실행할 수 있도록 구성된다.
제6 양태에 있어서, 본 출원의 실시예는 컴퓨터 명령어가 저장되는 비 일시적 컴퓨터 판독 가능한 저장 매체를 더 개시하며, 상기 컴퓨터 명령어는 상기 컴퓨터로 본 출원의 임의의 실시예의 이미지 인식 방법을 실행하도록 구성된다.
제7 양태에 있어서, 본 출원의 실시예는 매체에 저장된 컴퓨터 프로그램을 더 개시하며, 상기 컴퓨터 프로그램이 프로세서에 의해 실행될 경우 본 출원의 임의의 실시예의 이미지 인식 방법을 구현하도록 구성된다.
상술한 선택 가능한 방식이 구비하는 기타의 효과는 아래에 구체적인 실시예를 결부하여 설명을 진행하고자 한다.
첨부된 도면은 당해 방안을 보다 잘 이해시키기 위한 것이며, 본 출원에 대한 한정을 구성하지 않는다.
도 1a는 실시예 1에 따른 이미지 인식 결과의 예시를 보여주는 도면이다.
도 1b는 실시예 1에 따른 이미지 인식 방법의 흐름도이다.
도 1c는 인식 대상 이미지의 차원 정보를 보여주는 예시적인 도면이다.
도 2a는 실시예 2에 따른 이미지 인식 방법의 흐름도이다.
도 2b는 실시예 2에 따른 대상 정면 이미지의 개략도이다.
도 3a는 실시예 3에 따른 이미지 인식 방법의 흐름도이다.
도 3b는 인식 대상 이미지 업로드 페이지의 개략도이다.
도 4a는 실시예 4에 따른 이미지 인식 방법의 흐름도이다.
도 4b는 실시예 4에 따른 전환 버튼의 개략도이다.
도 4c 동영상 전환으로 대상 정면 이미지를 나타내는 예시적인 도면이다.
도 5는 실시예 5에 따른 이미지 인식 장치의 블록도를 도시한 도면이다.
도 6은 실시예 6에 따른 이미지 인식 장치의 블록도이다.
도 7은 이미지 인식을 수행하는 전자 기기의 블록도이다.
아래에 첨부된 도면을 결부하여 본 출원의 시범적인 실시예에 대해 설명을 진행하되, 이해를 돕기 위해 본 출원의 실시예의 각종의 세부 사항을 포함하며, 이는 단지 시범적인 것으로 시인되어야 한다. 따라서, 본 출원의 범위 및 사상을 위배하지 않고서, 여기서 설명되는 실시예에 대해 각종의 변화 및 수정을 진행할 수 있음을 당해 기술분야에서 통상의 지식을 가진자는 자명할 것이다. 마찬가지로, 명확하고 간결함을 위하여, 공지의 기능 및 구조에 대한 설명은 아래의 설명으로부터 생략된다.
도 1a는 실시예 1에 따른 이미지 인식 결과의 예시를 보여주는 도면이다.
현재의 인식 기술에 있어서, 사용자가 인물의 뒷모습 이미지를 업로드하여 인식을 진행한 후, 획득되는 것은 모두 인물의 뒷모습에 관련된 정보일 수 있다. 도 1a를 참조하면, 100은 사용자가 업로드하는 뒷모습 이미지를 나타내고, 101은 해당 사람의 뒵모습에 관련된 정보를 나타낸다.
도 1b는 실시예 1에 따른 이미지 인식 방법의 흐름도이다.
본 실시예는 사용자가 송신 뒷모습 이미지에 대응되는 정면 이미지를 열람하고자는 경우에 적용되고, 해당 방법은 서버 측에 적용될 수 있으며, 본 출원의 실시예에서 제공하는 서버 측에 설치되는 이미지 인식 장치에 의해 실행될 수 있으며, 해당 장치는 소프트웨어 및/또는 하드웨어를 이용하는 방식으로 구현할 수 있다. 도 1b에 도시된 바와 같이, 해당 방법은 아래와 같은 단계들을 포함할 수 있다.
단계(S101)에서, 장치는 클라이언트 측으로부터 인식 대상 이미지를 수신하고, 상기 인식 대상 이미지가 뒷모습 이미지인 지를 확정할 수 있다.
여기서, 서버 측은 VC++ 또는 delphi 등으로 프로그래밍하는 것을 포함하나, 이에 한정되지 않으며, 바람직하게, socket 인터페이스를 이용하여 클라이언트 측으로부터 송신된 데이터를 수신한다. 인식 대상 이미지의 포맷은 RAW 포맷, BMP 포맷, JPEG 포맷 및 PNG 포맷 등을 포함하나, 이에 한정되지 않는다. 뒷모습 이미지는 실제 인물의 뒷모습 이미지, 애니메이션 인물의 뒷모습 이미지, 영화 인물의 뒷모습 이미지 또는 동물 뒷모습 이미지 등을 포함하나, 이에 한정되지 않는다.
구체적으로, 서버 측에서 사용자로부터 송신된 인식 대상 이미지를 획득한 후, 먼저 기설정된 대상 검출 알고리즘에 따라 인식 대상 이미지 중의 물체가 대상 물체인 지를 확정하되, 대상 물체는 인물 또는 동물 등을 포함하고, 대상 검출 알고리즘은 YOLO 알고리즘, R-CNN 알고리즘 또는 Fast-RCNN 알고리즘 등을 포함하나, 이에 한정되지 않는다.
인식 대상 이미지 중의 물체가 대상 물체인 것으로 확정되면, 상기 인식 대상 이미지에 대해 특징 검출을 진행하여, 인식 대상 이미지에 대상 특징이 포함되는 지를 확정하되, 대상 특징은 눈, 입, 코, 눈썹, 치아 또는 동공 등을 포함하나, 이에 한정되지 않는다. 인식 대상 이미지에 대상 특징이 포함되지 않는 것이 확정되면, 인식 대상 이미지가 뒷모습 이미지인 것으로 확정하고, 상응하게, 인식 대상 이미지에 대상 특징이 포함되는 것이 확정되면, 인식 대상 이미지가 뒷모습 이미지가 아닌 것으로 확정한다.
클라이언트 측으로부터 인식 대상 이미지를 수신하고, 인식 대상 이미지가 뒷모습 이미지인 지를 확정하고, 후속적으로 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정하기 위한 기초를 확립함으로써, 인식 대상 이미지에 대한 모든 특징 정보를 확정하지 않도록 하여 과도한 계산량을 초래하는 문제를 방지할 수 있다.
단계(S102)에서, 장치는 상기 인식 대상 이미지가 뒷모습 이미지인 것으로 확정될 경우, 상기 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정할 수 있다.
여기서, 상기 차원은 피부 색상, 체형, 헤어 스타일, 의상 및 정경 중의 적어도 하나를 포함하나, 이에 한정되지 않는다. 각 차원은 또 상이한 특징 정보를 포함하며, 예시적으로, "피부 색상" 차원은 뽀얀색, 밀색 또는 검은색 등의 특징 정보를 포함하나, 이에 한정 되지 않으며, "체형" 차원은 마른편, 중등, 살찐편 또는 살찐 등의 특징 정보를 포함하나, 이에 한정되지 않으며, "헤어 스타일" 차원은 단발머리, 중장발 머리, 장발 머리 등의 특징 정보를 포함하나, 이에 한정되지 않으며, "의상" 차원은 짧은 치마, 긴 치마, 조끼 또는 재킷 등의 특징 정보를 포함하나, 이에 한정되지 않으며, "정경" 차원은 해변가, 백사장, 지하철 또는 사무실 등의 특징 정보를 포함하나, 이에 한정되지 않는다.
구체적으로, 서버 측에서 인식 대상 이미지를 사전에 구축된 특징 정보 인식 모델에 입력하여, 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 획득하되, 특징 정보 인식 모델은 신경망 모델로서, 이는 트레이닝 샘플 이미지로서 대량의 뒷모습 이미지를 획득하고, 수작업 방식으로 각 트레이닝 샘플 이미지에 대해 특징 정보 표식을 진행하여, 각 트레이닝 샘플 이미지의 적어도 하나의 차원에서의 특징 정보를 획득하고, 최종적으로 각 트레이닝 샘플 이미지와 대응되는 특징 정보에 대해 트레이닝을 진행하여, 특징 정보 인식 모델을 획득하는 방식으로 구축된다.
도 1c는 인식 대상 이미지의 차원 정보를 보여주는 예시적인 도면이다.
도 1c를 참조하면, 102는 인식 대상 이미지이고, 103은 해당 인식 대상 이미지의 차원 정보이다.
인식 대상 이미지가 뒷모습 이미지인 것으로 확정될 경우, 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정하고, 후속적으로 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하기 위해 데이터 기초를 확립함으로써, 최종적으로 인식 대상 이미지에 대응되는 대상 정면 이미지를 확정하는 것이 순조롭게 완료될 수 있도록 보장한다.
단계(S103)에서, 장치는 상기 특징 정보에 따라 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하고, 상기 클라이언트 측에서 상기 대상 정면 이미지를 표시하도록 상기 대상 정면 이미지를 상기 클라이언트 측에 전송한다.
구체적으로, 서버 측에서 상기 특징 정보에 따라 이미지 라이브러리로부터 조회를 진행하여, 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정한다. 여기서, 이미지 라이브러리에는 수많은 온라인 커뮤니티, 인터넷 포럼 및 웹 페이지로부터 크롤링한 정면 이미지 및 특징 정보 인식 모델을 통해 확정한 각 정면 이미지에 대응되는 특징 정보가 포함되고, 각 정면 이미지 및 대응되는 특징 정보는 이미지 라이브러리에서 관련되게 저장되고, 저장 형식은 KV 키-값 쌍 형식을 포함하되, 키-값 Key는 정면 이미지이고, 데이터 값 Value은 특징 정보이다. 대상 정면 이미지가 확정된 후, 서버 측에서 해당 대상 정면 이미지를 클라이언트 측에 전송하여, 클라이언트 측에서 해당 대상 정면 이미지를 스크린 상의 기설정된 시각화 영역에 표시하여 사용자가 관람하도록 한다.
특징 정보에 따라 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하고, 클라이언트 측에서 대상 정면 이미지를 나타내도록 대상 정면 이미지를 클라이언트 측에 전송시킴으로써, 인식 결과가 사용자에게 제공하는 서프라이즈를 증가시키고, 사용자의 사용 경험을 향상시킨다.
본 출원의 실시예에서 제공하는 기술적 방안은, 사용자로부터 송신된 인식 대상 이미지가 뒷모습 이미지인 지를 확정하고, 뒷모습 이미지일 경우, 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정하고, 특징 정보에 따라 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하고, 최종으로 대상 정면 이미지를 클라이언트 측에 전송하여 사용자에게 제공함으로써, 인식 결과의 정보량을 증가시키고, 사용자의 사용 경험을 향상시키는 기술적 효과를 실현한다.
도 2a는 실시예 2에 따른 이미지 인식 방법의 흐름도이다.
본 실시예는 상술한 실시예 1에 일 구체적인 구현 방식을 제공하며, 도 2a에 도시된 바와 같이, 해당 방법은 아래와 같은 단계들을 포함할 수 있다.
단계(S201)에서, 장치는 클라이언트 측으로부터 송신된 인식 대상 이미지를 획득하고, 상기 인식 대상 이미지에 대해 인식을 진행하여 상기 인식 대상 이미지의 인식 결과 정보를 획득하고, 상기 클라이언트 측에서 상기 인식 대상 이미지의 인식 결과 정보를 표시하도록 상기 인식 대상 이미지의 인식 결과 정보를 상기 클라이언트 측에 전송한다.
여기서, 기존의 인식 기술을 통해 인식 대상 이미지에 대해 인식을 진행하여 인식 대상 이미지의 인식 결과 정보를 획득한다.
구체적으로, 서버 측에서 사용자로부터 송신된 인식 대상 이미지를 획득한 후, 예컨대 SIFT 알고리즘, 지문 함수 알고리즘 또는 해시 함수 알고리즘 등의 기설정된 특징 추출 알고리즘에 따라 인식 대상 이미지에 대해 특징 추출을 진행하여 인식 대상 이미지의 이미지 특징을 획득하고, 이미지 특징에 대해 인코딩을 진행하여 인식 대상 이미지의 특징 코드를 획득하고 - 인코딩 방식은 원-핫 인코딩 또는 레이블 인코딩 등을 포함함 -, 최종적으로 특징 코드에 따라 이미지 라이브러리에서 전역 유사도 계산을 진행하고, 필요한 강인성(robustness)에 따라 임계값을 설정하며, 유사도가 해당 임계값보다 큰 이미지를 유사한 이미지로 이용하고, 유사한 이미지의 사전 저장된 관련 정보를 인식 대상 이미지의 인식 결과 정보로서 클라이언트 측에 전송하여, 클라이언트 측은 시각화 영역에서 사용자에게 상기 인식 대상 이미지의 인식 결과 정보를 제공하되, 인식 대상 이미지의 인식 결과 정보는 이미지 출처 정보, 인물의 의상 정보, 물체 정보 및 정경 정보(예컨대, 경치 명소) 등을 포함하나, 이에 한정되지 않는다.
인식 대상 이미지에 대해 인식을 진행하여 인식 대상 이미지의 인식 결과 정보를 확정하고, 클라이언트 측에 전송하여 클라이언트 측에서 사용자에게 인식 대상 이미지의 인식 결과 정보를 제공하여, 사용자가 인식 대상 이미지에 관련된 정보를 획득할 수 있으므로, 인식 대상 이미지에 대해 인식을 진행하는 기술적 효과를 실현한다.
단계(S202)에서, 장치는 상기 인식 대상 이미지가 뒷모습 이미지인 지를 확정하고, 상기 인식 대상 이미지가 뒷모습 이미지인 것으로 확정될 경우, 상기 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정한다.
단계(S203)에서, 장치는 상기 특징 정보를 이미지 라이브러리 중의 각 후보 정면 이미지의 적어도 하나의 차원에서의 특징 정보와 매칭을 진행하고, 매칭이 성공된 특징 정보에 대응되는 후보 정면 이미지를 대상 정면 이미지로 이용한다.
여기서, 차원은 피부 색상, 체형, 헤어 스타일, 의상 및 정경 중의 적어도 하나를 포함한다.
예시적으로, 인식 대상 이미지의 특징 정보가 "피부 색상: 뽀얀색", "체형: 중간", "헤어 스타일: 중장발", "의상: 백색 긴 치마" 및 "정경: 해변가"를 포함하고, 후보 정면 이미지A의 특징 정보가 "피부 색상: 뽀얀색", "체형: 중간", "헤어 스타일: 중장발", "의상: 백색 긴 치마" 및 "정경: 백사장"을 포함하는 것으로 가정하면, 인식 대상 이미지의 특징 정보 중의 "해변가"가 후보 정면 이미지A의 특징 정보 중의 "백사장"과 상이하므로, 후보 정면 이미지A는 인식 대상 이미지의 대상 정면 이미지가 아니다. 후보 정면 이미지B의 특징 정보가 "피부 색상: 뽀얀색", "체형: 중등", "헤어 스타일: 중장발", "의상: 백색 긴 치마" 및 "정경: 해변가"를 포함하는 것으로 가정하면, 인식 대상 이미지의 특징 정보가 후보 정면 이미지B의 특징 정보와 완전히 동일하고, 즉 매칭이 성공되며, 후보 정면 이미지B를 인식 대상 이미지의 대상 정면 이미지로 이용한다. 도 2b에 도시된 바와 같이, 도 2b는 실시예 2에 따른 대상 정면 이미지의 개략도이고, 여기서, 200은 인식 대상 이미지를 나타내고, 201는 특징 정보가 매칭 실패한 후보 정면 이미지A를 나타내고, 202는 특징 정보가 매칭이 성공된 후보 정면 이미지B, 즉 대상 정면 이미지를 나타낸다.
단계(S204)에서, 장치는 상기 대상 정면 이미지에 대해 인식을 진행하여 상기 대상 정면 이미지의 인식 결과 정보를 획득하고, 상기 클라이언트 측에서 상기 대상 정면 이미지의 인식 결과 정보 및 대상 정면 이미지를 표시하도록, 상기 대상 정면 이미지의 인식 결과 정보 및 상기 대상 정면 이미지를 상기 클라이언트 측에 전송한다.
구체적으로, 서버 측에서 예컨대 SIFT 알고리즘, 지문 함수 알고리즘 또는 해시 함수 알고리즘 등의 기설정된 특징 추출 알고리즘에 따라 대상 정면 이미지에 대해 특징 추출을 진행하여 대상 정면 이미지의 이미지 특징을 획득하고, 이미지 특징에 대해 인코딩을 진행하여 대상 정면 이미지의 특징 코드를 획득하며 - 인코딩 방식은 원-핫 인코딩 또는 레이블 인코딩 등을 포함함 -, 최종적으로 특징 코드에 따라 이미지 라이브러리에서 전역 유사도 계산을 진행하고, 필요한 강인성에 따라 임계값을 설정하며, 유사도가 해당 임계값보다 큰 이미지를 유사한 이미지로 이용하고, 유사한 이미지의 사전 저장된 관련 정보를 대상 정면 이미지의 인식 결과 정보로 이용하며, 최종적으로 대상 정면 이미지의 인식 결과 정보 및 대상 정면 이미지를 클라이언트 측에 전송하여, 클라이언트 측은 시각화 영역에서 사용자에게 상기 대상 정면 이미지의 인식 결과 정보 및 대상 정면 이미지를 제공하며, 여기서, 대상 정면 이미지의 인식 결과 정보는 이미지 출처 정보, 인물의 의상 정보, 물체 정보 및 정경 정보(예컨대, 경치 명소) 등을 포함하나, 이에 한정되지 않는다.
본 출원의 실시예에서 제공하는 기술적 방안은, 상기 특징 정보를 이미지 라이브러리 중의 각 후보 정면 이미지의 적어도 하나의 차원에서의 특징 정보와 매칭을 진행하고, 매칭이 성공된 특징 정보에 대응되는 후보 정면 이미지를 대상 정면 이미지로 하고, 상기 대상 정면 이미지에 대해 인식을 진행하여 상기 대상 정면 이미지의 인식 결과 정보를 확정하고, 상기 클라이언트 측에서 상기 대상 정면 이미지의 인식 결과 정보 및 대상 정면 이미지를 표시하도록 상기 대상 정면 이미지의 인식 결과 정보 및 상기 대상 정면 이미지를 상기 클라이언트 측에 전송함으로써, 뒷모습 이미지에 의하여 정면 이미지를 나타내는 기술적 효과를 실현하여, 인식 결과가 인식 대상 이미지의 인식 결과 정보를 포함할 뿐만 아니라, 인식 대상 이미지에 대응되는 대상 정면 이미지의 인식 결과 정보를 포함하므로, 인식 결과의 정보량을 증가시키고, 사용자의 사용 경험을 향상시킨다.
도 3a는 실시예 3에 따른 이미지 인식 방법의 흐름도이다.
본 실시예는 사용자가 송신하는 뒷모습 이미지에 대응되는 정면 이미지를 열람하고자는 경우에 적용되고, 당해 방법은 클라이언트 측에 적용될 수 있으며, 본 출원의 실시예에서 제공하는 클라이언트 측에 설치되는 이미지 인식 장치에 의해 실행될 수 있으며, 해당 장치는 소프트웨어 및/또는 하드웨어를 이용하는 방식으로 구현할 수 있다. 도 3a에 도시된 바와 같이, 해당 방법은 아래와 같은 단계들을 포함할 수 있다.
단계(S301)에서, 장치는 인식 대상 이미지를 서버 측에 송신하여, 서버 측에서 상기 인식 대상 이미지에 따라 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하도록 할 수 있다.
여기서, 클라이언트 측은 단말기 상에 설치된 APP 또는 애플릿 등을 포함하나, 이에 한정되지 않는다.
구체적으로, 사용자는 클라이언트 측을 통해 인식 대상 이미지 업로드 페이지에 접속하고, 단말기에 저장된 인식 대상 이미지를 해당 업로드 웹 페이지를 통해 서버 측에 송신하되, 단말기는 예컨대 마트폰 또는 태블릿 PC 등의 이동 단말기와, 예컨대 개인용 컴퓨터 또는 일체형 컴퓨터 등의 고정 단말기를 포함한다.
도 3b는 인식 대상 이미지 업로드 페이지의 개략도이다.
도 3b를 참조하면, 300은 업로드 버튼을 나타내고, 사용자가 해당 업로드 버튼을 클릭한 후, 사용자는 인식 대상 이미지로서 단말기에 저장된 임의의 이미지를 선택하여 서버 측에 송신하여, 서버 측에서 상기 인식 대상 이미지에 따라 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하도록 한다.
단계(S302)에서, 장치는 서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 시각화 영역에서 상기 대상 정면 이미지를 표시할 수 있다.
여기서, 클라이언트 측에는 시각화 영역이 구비되고, 해당 시각화 영역에서는 사용자에게 정보를 나타낼 수 있으며, 이러한 정보는 이미지 정보, 문자 정보, 영상 정보 등을 포함한다.
구체적으로, 클라이언트 측은 서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 해당 대상 정면 이미지를 시각화 영역에 렌더링하여, 사용자가 시각화 영역에서 인식 대상 이미지에 대응되는 대상 정면 이미지를 직접적으로 관찰하게 할 수 있다.
본 출원의 실시예에서 제공하는 기술적 방안은, 인식 대상 이미지를 서버 측에 송신하고 서버 측에서 송신되는 인식 대상 이미지에 대응되는 대상 정면 이미지를 획득하며, 시각화 영역에서 상기 대상 정면 이미지를 나타냄으로써, 뒷모습 이미지에 따라 정면 이미지를 인식하는 기술적 효과, 인식 결과의 정보량을 증가시키고, 사용자의 사용 경험을 향상시키는 기술적 효과를 실현한다.
도 4a는 실시예 4에 따른 이미지 인식 방법의 흐름도이다.
본 실시예는 상술한 실시예 3의 구체적인 구현 방식을 제공하며, 도 4a에 도시된 바와 같이, 해당 방법은 아래와 같은 단계들을 포함할 수 있다.
단계(S401)에서, 장치는 인식 대상 이미지를 서버 측에 송신하고, 서버 측에서 송신된 상기 인식 대상 이미지의 인식 결과 정보를 획득하고, 상기 시각화 영역에서 상기 인식 대상 이미지의 인식 결과 정보를 표시할 수 있다.
단계(S402)에서, 장치는 시각화 영역 중의 전환 버튼에 대한 사용자의 터치 조작이 검출되면, 서버 측에서 송신된 상기 대상 정면 이미지의 인식 결과 정보 및 상기 대상 정면 이미지를 획득할 수 있다.
구체적으로, 사용자가 인식 대상 이미지를 클라이언트 측을 통해 서버 측에 송신한 후, 이때 클라이언트 측의 스크린 상의 시각화 영역에서 표시되는 것은 사용자가 업로드한 인식 대상 이미지이고, 클라이언트 측은 시각화 영역에서 전환 버튼을 사전에 설정하고, 사용자가 전환 버튼을 클릭한 후, 클라이언트 측에서 서버 측에 요청을 송신하여, 서버 측에서 클라이언트 측에 대상 정면 이미지의 인식 결과 정보 및 상기 대상 정면 이미지를 송신하도록 제어한다.
예시적으로, 도 4b는 실시예 4에 따른 전환 버튼의 개략도이고, 여기서, 400은 인식 대상 이미지를 나타내고, 401은 가이드 전환 버튼을 나타낸다.
단계(S403)에서, 장치는 상기 시각화 영역에서 상기 인식 대상 이미지를 동영상 전환 형식으로 상기 대상 정면 이미지로 전환시켜 표시하고, 상기 시각화 영역에서 상기 대상 정면 이미지의 인식 결과 정보를 표시할 수 있다.
구체적으로, 클라이언트 측은 시각화 영역에서 동영상 전환 형식으로 원래 표시되는 인식 대상 이미지를 전환시켜 대상 정면 이미지로 나타내되, 동영상 전환 형식은 부드럽게 페이드, 컷아웃, 디졸브 및 수평 루버 등을 포함하나, 이에 한정되지 않는다. 또한, 대상 정면 이미지의 사방에서 대상 정면 이미지의 인식 결과 정보를 나타낸다.
도 4c는 동영상 전환으로 대상 정면 이미지를 나타내는 예시적인 도면이다.
도 4c를 참조하면, 400은 인식 대상 이미지를 나타내고, 402는 대상 정면 이미지를 나타낸다.
본 출원의 실시예에서 제공하는 기술적 방안은, 사용자가 전환 버튼에 대해 터치 조작을 실시하면, 시각화 영역에서 동영상 전환 형식으로 인식 대상 이미지를 전환시켜 대상 정면 이미지로 나타내며, 시각화 영역에서 대상 정면 이미지의 인식 결과 정보를 나타냄으로써, 인식 결과의 정보량 및 인식 과정의 취미성을 증가시켜, 사용자의 사용 경험을 개선시킨다.
도 5는 실시예 5에 따른 이미지 인식 장치(50)의 블록도를 도시한 도면이다.
해당 장치(50)는 서버 측에 설치되고, 본 출원의 실시예 1 및 실시예 2 중의 임의의 하나에서 제공하는 일 이미지 인식 방법을 실행할 수 있으며, 방법 실행에 대응되는 기능 모듈 및 유익한 효과를 구비한다.
도 5에 도시된 바와 같이, 해당 장치(50)는, 클라이언트 측으로부터 송신된 인식 대상 이미지를 획득하고, 상기 인식 대상 이미지가 뒷모습 이미지인 지를 확정하도록 구성되는 인식 대상 이미지 획득 모듈(51)과, 상기 인식 대상 이미지가 뒷모습 이미지인 것으로 확정될 경우, 상기 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정하도록 구성되는 특징 정보 확정 모듈(52)과, 상기 특징 정보에 따라 상기 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하고, 상기 클라이언트 측에서 상기 대상 정면 이미지를 나타내도록 상기 대상 정면 이미지를 상기 클라이언트 측에 전송하도록 구성되는 대상 정면 이미지 확정 모듈(53)을 포함할 수 있다.
상술한 실시예를 기초로, 상기 장치는 인식 대상 이미지 인식 모듈을 더 포함하고, 이는 구체적으로, 상기 인식 대상 이미지를 인식하여, 상기 인식 대상 이미지의 인식 결과 정보를 확정하고, 상기 클라이언트 측에서 상기 인식 대상 이미지의 인식 결과 정보를 나타내도록 상기 인식 대상 이미지의 인식 결과 정보를 상기 클라이언트 측에 전송하도록 구성된다.
상술한 실시예를 기초로, 상기 대상 정면 이미지 확정 모듈(53)은 구체적으로, 상기 특징 정보를 이미지 라이브러리 중의 각 후보 정면 이미지의 적어도 하나의 차원에서의 특징 정보와 매칭을 진행하고, 매칭이 성공된 특징 정보에 대응되는 후보 정면 이미지를 대상 정면 이미지로 하도록 구성되되, 차원은 피부 색상, 체형, 헤어 스타일, 의상 및 정경 중의 적어도 하나를 포함한다.
상술한 실시예를 기초로, 상기 장치는 대상 정면 이미지 인식 모듈을 더 포함하고, 이는 구체적으로, 상기 대상 정면 이미지에 대해 인식을 진행하여 상기 대상 정면 이미지의 인식 결과 정보를 획득하고, 상기 클라이언트 측에세 상기 대상 정면 이미지의 인식 결과 정보를 나타내도록 상기 대상 정면 이미지의 인식 결과 정보를 상기 클라이언트 측에 전송하도록 구성된다.
본 출원의 실시예에서 제공하는 일 이미지 인식 장치(50)는, 본 출원의 실시예 1 내지 실시예 2 중의 임의의 하나에서 제공하는 일 이미지 인식 방법을 실행할 수 있으며, 방법 실행에 대응되는 기능 모듈 및 유익한 효과를 구비한다. 본 실시예에서 상세하게 설명되지 않은 기술적 세부 사항은 본 출원의 실시예 1 내지 실시예 2 중의 임의의 하나에서 제공하는 일 이미지 인식 방법을 참조할 수 있다.
도 6은 실시예 6에 따른 이미지 인식 장치(60)의 블록도이다.
해당 장치(60)는 클라이언트 측에 설치되고, 본 출원의 실시예 3 및 실시예 4 중의 임의의 하나에서 제공하는 일 이미지 인식 방법을 실행할 수 있으며, 방법 실행에 대응되는 기능 모듈 및 유익한 효과를 구비한다. 도 6에 도시된 바와 같이, 해당 장치(60)는, 서버 측에서 사용자에 의해 업로드된 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하도록, 상기 인식 대상 이미지를 서버 측에 송신하도록 구성되는 인식 대상 이미지 송신 모듈(61)과, 서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 시각화 영역에서 상기 대상 정면 이미지를 나타내도록 구성되는 대상 정면 이미지 표시 모듈(62)을 포함할 수 있다.
상술한 실시예를 기초로, 상기 장치는 제1 관련 정보 획득 모듈을 더 포함하며, 이는 구체적으로, 서버 측에서 송신된 상기 인식 대상 이미지의 인식 결과 정보를 획득하고, 상기 시각화 영역에서 상기 인식 대상 이미지의 인식 결과 정보를 나타내도록 구성된다.
상술한 실시예를 기초로, 상기 대상 정면 이미지 표시 모듈(62)은 구체적으로, 시각화 영역 중의 전환 버튼에 대한 사용자의 터치 조작이 검출되면, 서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 상기 시각화 영역에서 상기 인식 대상 이미지를 동영상 전환 형식으로 상기 대상 정면 이미지로 전환시켜 표시하도록 구성된다.
상술한 실시예를 기초로, 상기 장치는 제2 관련 정보 획득 모듈을 더 포함하며, 이는 구체적으로, 서버 측에서 송신된 상기 대상 정면 이미지의 인식 결과 정보를 획득하고, 상기 시각화 영역에서 상기 대상 정면 이미지의 인식 결과 정보를 나타내도록 구성된다.
본 출원의 실시예에서 제공하는 이미지 인식 장치(60)는, 본 출원의 실시예 3 내지 실시예 4 중의 임의의 하나에서 제공하는 이미지 인식 방법을 실행할 수 있으며, 방법 실행에 대응되는 기능 모듈 및 유익한 효과를 구비한다. 본 실시예에서 상세하게 설명되지 않은 기술적 세부 사항은 본 출원의 실시예 3 내지 실시예 4 중의 임의의 하나에서 제공하는 일 이미지 인식 방법을 참조할 수 있다.
본 출원의 실시예에 의하면, 본 출원은 전자 기기 및 판독 가능한 저장 매체를 더 제공한다.
도 7은 이미지 인식을 수행하는 전자 기기의 블록도이다.
전자 기기는 각종 형식의 디지털 컴퓨터, 예컨대 랩톱 컴퓨터, 데스크톱 컴퓨터, 워크 스테이션, 개인용 디지털 어시스턴트, 서버, 블레이드 서버, 메인 프레임 컴퓨터 및 기타 적합한 컴퓨터를 가리키고자 한다. 전자 기기는 각종 형식의 이동 장치, 예컨대, 개인 디지털 처리 장치, 휴대폰, 스마트 폰, 웨어러블 전자 기기 및 기타 유사한 컴퓨팅 장치를 가리킬 수도 있다. 본원에 도시된 부재, 이들의 연결 및 관계, 및 이들의 기능은 단지 예시적인 것이며, 본 원에 설명된 및/또는 요구되는 본 출원의 구현을 한정하고자 하지 않는다.
도 7에 도시된 바와 같이, 해당 전자 기기는, 하나 또는 다수의 프로세서(701), 메모리 장치(702), 및 고속 인터페이스와 저속 인터페이스를 포함하여 각 부재를 연결하기 위한 인터페이스를 포함한다. 각 부재는 상이한 버스라인을 이용하여 서로 연결되며, 공동 메인 보드에 장착되거나 수요에 따라 기타의 방식으로 장착될 수 있다. 프로세서는 전자 기기 내에서 실행되는 명령어에 대해 처리를 진행할 수 있으며, 메모리 장치에 또는 메모리 장치 상에 저장되어 외부 입력/출력 장치(예컨대, 인터페이스에 연결된 표지 전자 기기) 상에서 GUI를 나타내는 도형 정보의 명령어를 포함한다. 기타의 실시예에 있어서, 필요할 경우, 다수의 프로세서 및/또는 다수의 버스라인과 다수의 메모리 장치를 다수의 메모리 장치와 함께 사용할 수 있다. 마찬가지로, 다수의 전자 기기를 연결할 수 있으며, 각 전자 기기는 일부의 필요한 조작(예컨대, 서버 어레이, 일 그룹의 블레이드 서버, 또는 다중 프로세서 시스템)을 제공한다. 도 7에서는 하나의 프로세서(701)를 예로 든다.
메모리 장치(702)는 즉 본 출원에서 제공하는 비 일시적 컴퓨터 판독 가능한 저장 매체이다. 여기서, 상기 메모리 장치에는 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되어, 상기 적어도 하나의 프로세서로 본 출원에서 제공하는 이미지 인식 방법을 실행한다. 본 출원의 비 일시적 컴퓨터 판독 가능한 저장 매체는 컴퓨터 명령어를 저장하고, 해당 컴퓨터 명령어는 컴퓨터로 본 출원에서 제공하는 이미지 인식 방법을 실행시키도록 구성된다.
메모리 장치(702)는 비 일시적 컴퓨터 판독 가능한 저장 매체로서, 본 출원의 실시예 중의 이미지 인식 방법에 대응되는 프로그램 명령어/모듈(예컨대, 도 5에 도시된 인식 대상 이미지 획득 모듈(51), 특징 정보 확정 모듈(52) 및 대상 정면 이미지 확정 모듈(53), 또한 예컨대, 도 6에 도시된 인식 대상 이미지 송신 모듈(61) 및 대상 정면 이미지 표시 모듈(62))과 같은 비 일시적 소프트웨어 프로그램, 비 일시적 컴퓨터로 실행 가능한 프로그램 및 모듈을 저장하도록 구성될 수 있다. 프로세서(701)는 메모리 장치(702)에 저장된 비 일시적 소프트웨어 프로그램, 명령어 및 모듈을 운행시킴으로써, 서버의 각종의 기능 응용 및 데이터 처리를 실행하며, 즉, 상술한 방법 실시예 중의 이미지 인식 방법을 구현한다.
메모리 장치(702)는 프로그램 저장 구간 및 데이터 저장 구간을 포함할 수 있으며, 여기서, 프로그램 저장 구간은 운영 체제, 적어도 하나의 기능에 필요한 응용 프로그램을 저장할 수 있으며, 데이터 저장 구간은 이미지 인식의 전자 기기의 사용에 따라 구축되는 데이터 등을 저장할 수 있다. 또한, 메모리 장치(702)는 고속 랜덤 액세스 메모리 장치를 포함할 수 있으며, 비 일시적 메모리 장치, 예컨대, 적어도 하나의 자기 디스크 메모리 소자, 플래시 소자 또는 기타 비 일시적 솔리드 스테이트 메모리 소자를 더 포함할 수 있다. 일부의 실시예에 있어서, 메모리 장치(702)는 선택적으로 프로세서(701)에 대해 원격으로 설치된 메모리 장치를 포함하며, 이러한 원격 메모리 장치는 네트워크를 통해 이미지 인식의 전자 기기에 연결될 수 있다. 상술한 네트워크의 예시는 인터넷, 기업 인트라넷, 블록 체인 네트워크, 근거리 통신망, 이동 통신망 및 이들의 조합을 포함하나, 이에 한정되지 않는다.
이미지 인식 방법의 전자 기기는 입력 장치(703) 및 출력 장치(704)를 더 포함할 수 있다. 프로세서(701), 메모리 장치(702), 입력 장치(703) 및 출력 장치(704)는 버스라인 또는 기타의 방식으로 연결될 수 있으며, 도 7에서는 버스라인을 통해 연결되는 것을 예로 든다.
입력 장치(703)는 입력되는 디지털 또는 문자 정보를 수신하고, 이미지 인식의 전자 기기의 사용자 설정 및 기능 제어에 관련된 키 신호 입력를 발생할 수 있으며, 예컨대, 터치 스크린, 키패드, 마우스, 트랙 패드, 터치 패드, 지시 레버, 하나 또는 다수의 마우스 버튼, 트랙 볼, 조작 레버 등의 입력 장치이다. 출력 장치(704)는 표시 전자 기기, 보조 조명 장치(예컨대, LED) 및 터치 피드백 장치(예컨대, 진동 모터) 등을 포함할 수 있다. 해당 표시 전자 기기는 액정 표시 장치(LCD), 발광 다이오드(LED) 표시 장치 및 플라즈마 표시 장치를 포함할 수 있으나, 이에 한정되지 않는다. 일부의 실시예에 있어서, 표시 전자 기기는 터치 스크린일 수 있다.
본 원에 설명된 시스템 및 기술의 각종의 실시예는 디지털 전자 회로 시스템, 집적 회로 시스템, 특정 ASIC(특정 집적 회로), 컴퓨터 하드웨어, 펌웨어, 소프트웨어, 및/또는 이들의 조합에서 구현될 수 있다. 이러한 각종의 실시예는, 하나 또는 다수의 컴퓨터 프로그램에서 실시되는 것을 포함할 수 있고, 해당 하나 또는 다수의 컴퓨터 프로그램은 적어도 하나의 프로그래밍 가능한 프로세서를 포함하는 프로그래밍 가능한 시스템 상에서 실행 및/또는 해석될 수 있으며, 해당 프로그래밍 가능한 프로세서는 특정 또는 범용 프로그래밍 가능한 프로세서일 수 있으며, 저장 시스템, 적어도 하나의 입력 장치 및 적어도 하나의 출력 장치로부터 데이터 및 명령어를 수신할 수 있으며, 데이터 및 명령어는 해당 저장 시스템, 해당 적어도 하나의 입력 장치 및 해당 적어도 하나의 출력 장치에 전송된다.
이러한 컴퓨팅 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션, 또는 코드로도 지칭됨)은 프로그래밍 가능한 프로세서의 기계 명령어를 포함하고, 고급 공정 및/또는 객체 지향의 프로그래밍 언어 및/또는 편집/기계 언어를 이용하여 컴퓨팅 프로그램을 실시할 수 있다. 본 원에 사용되는 바와 같이, 용어 "기계 판독 가능한 매체" 및 "컴퓨터 판독 가능한 매체"는 기계 명령어 및/또는 데이터를 프로그래밍 가능한 프로세서에 제공하기 위한 임의의 검퓨터 프로그램 제품, 전자 기기 및/또는 장치(예컨대, 자기 디스크, 광학 디스크, 메모리 장치, 프로그래밍 가능한 논리 장치(PLD))를 가리키며, 기계 판독 가능한 신호인 기계 명령어를 수신하는 기계 판독 가능한 매체를 포함한다. 용어 "기계 판독 가능한 신호"는 기계 명령어 및/또는 데이터를 프로그래밍 가능한 프로세서에 제공하기 위한 임의의 신호를 가리킨다.
사용자와의 상호 작용을 제공하기 위하여, 컴퓨터 상에서 본 원에 설명된 시스템 및 기술을 실시할 수 있으며, 해당 컴퓨터는 사용자에게 정보를 나타내기 위한 표시 장치(예컨대, CRT(음극관) 또는 LCD(액정 표시 장치) 모니터), 및 키보드 및 지향 장치(예컨대, 마우스 또는 트랙볼)를 구비하며, 사용자는 해당 키보드 및 해당 지향 장치를 통해 입력을 컴퓨터에 제공할 수 있다. 기타 유형의 장치는 사용자와의 상호 작용을 제공하도록 더 구성될 수 있으며, 예를 들어, 사용자에게 제공하는 피드백은 임의의 형식의 감지 피드백(예컨대, 시각 피드백, 청각 피드백 또는 촉각 피드백)일 수 있으며, 임의의 형식(음향 입력, 음성 입력 또는 터치 입력)으로 사용자의 입력을 수신할 수 있다.
본 원에 설명된 시스템 및 기술은 백 엔드 부재를 포함하는 컴퓨팅 시스템(예컨대, 데이터 서버로서) 또는 중간 부재를 포함하는 컴퓨팅 시스템(예컨대, 응용 서버) 또는 프런트 엔드 부재를 포함하는 컴퓨팅 시스템(예컨대, 그래픽 사용자 인터페이스 또는 웹 브라우저를 구비하는 사용자 컴퓨터, 사용자는 해당 그래픽 사용자 인터페이스 또는 해당 웹 브라우저를 통해 본 원에 설명된 시스템 및 기술의 실시예를 통해 상호 작용을 진행할 수 있음) 또는 이러한 백 엔드 부재, 중간 부재 또는 프런트 엔드 부재를 포함하는 임의의 조합의 컴퓨팅 시스템에서 실시될 수 있다. 시스템의 부재는 임의의 형식 또는 매체의 디지털 데이터 통신(통신망)를 통해 서로 연결될 수 있다. 통신망의 예시는 근거리 통신망(LAN), 광역 통신망(WAN), 블록 체인 네트워크 및 인터넷을 포함한다.
컴퓨터 시스템은 클라이언트 측 및 서버를 포함할 수 있다. 클라이언트 측과 서버는 일반적으로 서로 멀리 떨어져 있으며, 통상적으로 통신망를 통해 상호 작용을 진행한다. 클라이언트 측과 서버의 관계는 상응한 컴퓨터 상에서 운행되고 서로 클라이언트 측-서버 관계를 구비하는 컴퓨터 프로그램을 통해 발생한다.
본 출원의 실시예의 기술적 방안에 의하면, 사용자로부터 송신된 인식 대상 이미지가 뒷모습 이미지인 지를 확정하고, 뒷모습 이미지일 경우, 인식 대상 이미지의 적어도 하나의 차원에서의 특징 정보를 확정하고, 특징 정보에 따라 인식 대상 이미지에 매칭되는 대상 정면 이미지를 확정하고, 최종으로 대상 정면 이미지를 클라이언트 측에 전송하여 사용자에게 제공함으로써, 인식 결과의 정보량을 증가시키고, 사용자의 사용 경험을 향상시키는 기술적 효과를 실현한다.
앞서 도시된 각종 형식의 흐름을 사용하거나, 단계에 대한 재 배열, 추가 또는 삭제를 진행할 수 있음을 이해하여야 한다. 예를 들어, 본 출원에 개시된 기술적 방안의 원하는 결과를 실현할 수만 있다면, 본 출원에 기재된 각 단계는 병렬로 실행될 수 있으며, 순차적으로 실행될 수도 있으며, 상이한 순서로 실행될 수도 있으며, 본 원에서 이에 대한 한정을 진행하지 않는다.
상술한 구체적은 실시예는 본 출원의 보호 범위에 대한 한정을 구성하지 않는다. 설계 요구 및 기타의 요소에 따라 각종의 수정, 조합, 서브 조합 및 대체를 진행할 수 있음을 당해 기술 분야의 당업자는 자명할 것이다. 본 출원의 사상 및 원칙 내에서 진행하는 임의의 수정, 균등한 대체 및 개선 등은 모두 본 출원의 보호 범위 내에 포함되어야 한다.

Claims (14)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 클라이언트 측 및 서버 측에 적용되는 이미지 인식 방법에 있어서,
    상기 클라이언트 측은,
    인식하고자는 이미지를 서버 측에 송신하여, 서버 측에서 상기 인식하고자는 이미지에 따라 상기 인식하고자는 이미지에 매칭되는 대상 정면 이미지를 확정하도록 하는 단계;
    서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 시각화 영역에서 상기 대상 정면 이미지를 나타내는 단계;를 포함하고,
    서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 시각화 영역에서 상기 대상 정면 이미지를 나타내는 단계는,
    시각화 영역 중의 전환 버튼에 대한 사용자의 터치 조작이 검출되면, 서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 상기 시각화 영역에서 상기 인식하고자는 이미지를 상기 대상 정면 이미지로 전환시켜 나타내는 단계;를 포함하고,
    상기 서버 측은,
    상기 인식하고자 하는 이미지가 대상 특징 - 상기 대상 특징은 눈, 입, 코, 눈썹, 치아 및 동공 중 적어도 하나를 포함함 - 을 포함하지 않는 것으로 확정한 것에 응답하여, 상기 이미지가 뒷모습 이미지인 것으로 확정하는 단계; 및
    상기 이미지가 뒷모습 이미지인 것으로 확정한 것에 응답하여, 상기 이미지의 적어도 하나의 차원에서의 특징 정보에 기초하여, 상기 이미지에 매칭되는 대상 정면 이미지를 확정하는 단계;를 포함하는 것을 특징으로 하는 이미지 인식 방법.
  7. 제6항에 있어서,
    서버 측에서 송신되는 상기 대상 정면 이미지를 획득하기 전에,
    서버 측에서 송신된 상기 인식하고자는 이미지의 인식 결과 정보를 획득하고, 상기 시각화 영역에서 상기 인식하고자는 이미지의 인식 결과 정보를 나타내는 단계를 더 포함하는 것을 특징으로 하는 이미지 인식 방법.
  8. 제6항에 있어서,
    서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 시각화 영역에서 상기 대상 정면 이미지를 나타내는 단계는,
    시각화 영역 중의 전환 버튼에 대한 사용자의 터치 조작이 검출되면, 서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 상기 시각화 영역에서 상기 인식하고자는 이미지를 동영상 전환 형식으로 상기 대상 정면 이미지로 전환시켜 나타내는 단계를 포함하는 것을 특징으로 하는 이미지 인식 방법.
  9. 제6항에 있어서,
    서버 측에서 송신된 상기 대상 정면 이미지의 인식 결과 정보를 획득하고, 상기 시각화 영역에서 상기 대상 정면 이미지의 인식 결과 정보를 나타내는 단계를 더 포함하는 것을 특징으로 하는 이미지 인식 방법.
  10. 삭제
  11. 클라이언트 측 및 서버 측에 설치되는 이미지 인식 장치에 있어서,
    클라이언트 측에 설치되고, 서버 측에서 사용자에 의해 업로드된 인식하고자는 이미지에 매칭되는 대상 정면 이미지를 확정하도록, 상기 인식하고자는 이미지를 서버 측에 송신하도록 구성되는 인식하고자는 이미지 송신 모듈과,
    클라이언트 측에 설치되고, 서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 시각화 영역에서 상기 대상 정면 이미지를 나타내도록 구성되는 대상 정면 이미지 표시 모듈과,
    서버 측에 설치되고, 상기 인식하고자 하는 이미지가 대상 특징 - 상기 대상 특징은 눈, 입, 코, 눈썹, 치아 및 동공 중 적어도 하나를 포함함 - 을 포함하지 않는 것으로 확정한 것에 응답하여, 상기 이미지가 뒷모습 이미지인 것으로 확정하고, 상기 이미지가 뒷모습 이미지인 것으로 확정한 것에 응답하여, 상기 이미지의 적어도 하나의 차원에서의 특징 정보에 기초하여, 상기 이미지에 매칭되는 대상 정면 이미지를 확정하는 대상 정면 이미지 확정 모듈을 포함하고,
    대상 정면 이미지 표시 모듈은 시각화 영역 중의 전환 버튼에 대한 사용자의 터치 조작이 검출되면, 서버 측에서 송신되는 상기 대상 정면 이미지를 획득하고, 상기 시각화 영역에서 상기 인식하고자는 이미지를 상기 대상 정면 이미지로 전환시켜 나타내도록 구성되는 것을 특징으로 하는 이미지 인식 장치.
  12. 전자 기기에 있어서,
    적어도 하나의 프로세서와,
    상기 적어도 하나의 프로세서에 통신 연결되는 메모리 장치를 포함하되,
    상기 메모리 장치에는 상기 적어도 하나의 프로세서에 의해 실행 가능한 명령어가 저장되고,
    상기 명령어가 상기 적어도 하나의 프로세서에 의해 실행되어, 상기 적어도 하나의 프로세서가 제6항 내지 제9항 중의 임의의 한 항의 이미지 인식 방법을 실행할 수 있도록 구성되는 것을 특징으로 하는 전자 기기.
  13. 컴퓨터 명령어가 저장된 비 일시적 컴퓨터 판독 가능한 저장 매체에 있어서,
    상기 컴퓨터 명령어는, 컴퓨터가 제6항 내지 제9항 중의 임의의 한 항의 이미지 인식 방법을 실행하도록 구성되는 것을 특징으로 하는 비 일시적 컴퓨터 판독 가능한 저장 매체.
  14. 비 일시적 컴퓨터 판독 가능한 저장 매체에 저장된 컴퓨터 프로그램으로서,
    상기 컴퓨터 프로그램이 프로세서에 의해 실행될 경우 제6항 내지 제9항 중의 임의의 한 항의 이미지 인식 방법을 구현하도록 하는 컴퓨터 프로그램.
KR1020210022182A 2020-02-21 2021-02-18 이미지 인식 방법, 장치, 전자 기기 및 매체 KR102642866B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010108757.8A CN111259183B (zh) 2020-02-21 2020-02-21 图像识图方法、装置、电子设备和介质
CN202010108757.8 2020-02-21

Publications (2)

Publication Number Publication Date
KR20210106914A KR20210106914A (ko) 2021-08-31
KR102642866B1 true KR102642866B1 (ko) 2024-03-04

Family

ID=70945713

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210022182A KR102642866B1 (ko) 2020-02-21 2021-02-18 이미지 인식 방법, 장치, 전자 기기 및 매체

Country Status (5)

Country Link
US (1) US11789997B2 (ko)
EP (1) EP3869393B1 (ko)
JP (1) JP7096302B2 (ko)
KR (1) KR102642866B1 (ko)
CN (1) CN111259183B (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111709922B (zh) * 2020-06-10 2023-07-04 北京百度网讯科技有限公司 图像质量比较方法、装置、设备以及存储介质
CN112115224B (zh) * 2020-09-24 2024-03-08 北京百度网讯科技有限公司 地图数据的辅助质检方法、装置、电子设备及存储介质
CN114155024A (zh) * 2021-11-30 2022-03-08 北京京东振世信息技术有限公司 确定目标物品的方法、装置、设备及介质
CN114741019A (zh) * 2022-03-31 2022-07-12 上海小度技术有限公司 数字藏品展示方法、装置、设备、存储介质及程序产品

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218373A (ja) * 2009-03-18 2010-09-30 Olympus Corp サーバシステム、端末装置、プログラム、情報記憶媒体及び画像検索方法
JP2014109864A (ja) * 2012-11-30 2014-06-12 Canon Marketing Japan Inc 情報処理装置、情報処理システム、その制御方法、及びプログラム
US20160188131A1 (en) * 2012-03-06 2016-06-30 Apple Inc. Fanning user interface controls for a media editing application
JP2016134921A (ja) 2015-01-19 2016-07-25 株式会社リコー 線形パノラマ画像連結のためのプレビュー画像取得ユーザインタフェース
JP2017062633A (ja) * 2015-09-24 2017-03-30 グローリー株式会社 画像照合装置及び画像照合方法
US20180295396A1 (en) 2017-04-06 2018-10-11 Burst, Inc. Techniques for creation of auto-montages for media content
JP2018190398A (ja) 2017-05-01 2018-11-29 株式会社リコー 誘導画像キャプチャユーザインタフェース
CN108933723A (zh) 2017-05-19 2018-12-04 腾讯科技(深圳)有限公司 消息展示方法、装置及终端
US20190200872A1 (en) 2017-12-31 2019-07-04 Google Llc Infant monitoring system with observation-based system control and feedback loops
JP2019159537A (ja) * 2018-03-09 2019-09-19 オムロン株式会社 画像検索装置、画像検索方法、電子機器及びその制御方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101820503B1 (ko) * 2011-03-10 2018-01-22 에스케이플래닛 주식회사 얼굴 인식 추론 기반 서비스 시스템, 그의 얼굴 인식 추론 방법 및 기록 매체
KR101983288B1 (ko) * 2012-11-22 2019-05-29 삼성전자주식회사 카메라 촬영 제어장치 및 방법
WO2014152574A1 (en) * 2013-03-14 2014-09-25 Kokopay, Inc. Electronic payment system operative with existing accounting software and existing remote deposit capture and mobile rdc software
US10475226B2 (en) * 2013-03-15 2019-11-12 Crayola Llc Coloring kit for capturing and animating two-dimensional colored creation
CN103605971B (zh) * 2013-12-04 2017-05-24 深圳市捷顺科技实业股份有限公司 一种捕获人脸图像的方法及装置
US9510196B2 (en) * 2014-03-17 2016-11-29 Qualcomm Incorporated Method and apparatus for authenticating a user on a mobile device
CN103984931B (zh) * 2014-05-27 2017-11-07 联想(北京)有限公司 一种信息处理方法及第一电子设备
CN106156578B (zh) * 2015-04-22 2020-02-14 深圳市腾讯计算机系统有限公司 身份验证方法和装置
US9860451B2 (en) * 2015-06-07 2018-01-02 Apple Inc. Devices and methods for capturing and interacting with enhanced digital images
KR20170091913A (ko) * 2016-02-02 2017-08-10 삼성전자주식회사 영상 서비스 제공 방법 및 장치
US10366144B2 (en) * 2016-04-01 2019-07-30 Ebay Inc. Analyzing and linking a set of images by identifying objects in each image to determine a primary image and a secondary image
CN106384087A (zh) * 2016-09-05 2017-02-08 大连理工大学 一种基于多层网络人体特征的身份识别方法
JP6262889B2 (ja) * 2017-01-12 2018-01-17 ヤフー株式会社 情報処理装置、情報処理方法及びプログラム
CN109784130B (zh) * 2017-11-15 2023-04-28 株式会社日立制作所 行人重识别方法及其装置和设备
CN109002761A (zh) * 2018-06-13 2018-12-14 中山大学新华学院 一种基于深度卷积神经网络的行人重识别监控系统
CN108960209B (zh) * 2018-08-09 2023-07-21 腾讯科技(深圳)有限公司 身份识别方法、装置及计算机可读存储介质
CN110069652A (zh) * 2018-08-30 2019-07-30 Oppo广东移动通信有限公司 提示方法、装置、存储介质及穿戴式设备
CN109492614A (zh) * 2018-11-29 2019-03-19 上海道枢信息技术有限公司 一种基于安防视频识别面部特征的方法及系统
CN109784243B (zh) * 2018-12-29 2021-07-09 网易(杭州)网络有限公司 身份确定方法及装置、神经网络训练方法及装置、介质
CN109829418B (zh) * 2019-01-28 2021-01-05 北京影谱科技股份有限公司 一种基于背影特征的打卡方法、装置和系统
CN110163082A (zh) * 2019-04-02 2019-08-23 腾讯科技(深圳)有限公司 一种图像识别网络模型训练方法、图像识别方法及装置
CN110136236B (zh) * 2019-05-17 2022-11-29 腾讯科技(深圳)有限公司 三维角色的个性化脸部显示方法、装置、设备及存储介质
CN110222789B (zh) * 2019-06-14 2023-05-26 腾讯科技(深圳)有限公司 图像识别方法及存储介质
CN110796079A (zh) * 2019-10-29 2020-02-14 深圳龙岗智能视听研究院 基于人脸深度特征和人体局部深度特征的多相机访客识别的方法及系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218373A (ja) * 2009-03-18 2010-09-30 Olympus Corp サーバシステム、端末装置、プログラム、情報記憶媒体及び画像検索方法
US20160188131A1 (en) * 2012-03-06 2016-06-30 Apple Inc. Fanning user interface controls for a media editing application
JP2014109864A (ja) * 2012-11-30 2014-06-12 Canon Marketing Japan Inc 情報処理装置、情報処理システム、その制御方法、及びプログラム
JP2016134921A (ja) 2015-01-19 2016-07-25 株式会社リコー 線形パノラマ画像連結のためのプレビュー画像取得ユーザインタフェース
JP2017062633A (ja) * 2015-09-24 2017-03-30 グローリー株式会社 画像照合装置及び画像照合方法
US20180295396A1 (en) 2017-04-06 2018-10-11 Burst, Inc. Techniques for creation of auto-montages for media content
JP2018190398A (ja) 2017-05-01 2018-11-29 株式会社リコー 誘導画像キャプチャユーザインタフェース
CN108933723A (zh) 2017-05-19 2018-12-04 腾讯科技(深圳)有限公司 消息展示方法、装置及终端
US20190200872A1 (en) 2017-12-31 2019-07-04 Google Llc Infant monitoring system with observation-based system control and feedback loops
JP2019159537A (ja) * 2018-03-09 2019-09-19 オムロン株式会社 画像検索装置、画像検索方法、電子機器及びその制御方法

Also Published As

Publication number Publication date
CN111259183B (zh) 2023-08-01
US11789997B2 (en) 2023-10-17
US20210264142A1 (en) 2021-08-26
JP2021136004A (ja) 2021-09-13
KR20210106914A (ko) 2021-08-31
EP3869393B1 (en) 2023-03-15
CN111259183A (zh) 2020-06-09
EP3869393A1 (en) 2021-08-25
JP7096302B2 (ja) 2022-07-05

Similar Documents

Publication Publication Date Title
KR102642866B1 (ko) 이미지 인식 방법, 장치, 전자 기기 및 매체
US11715259B2 (en) Method and apparatus for generating virtual avatar, device and storage medium
JP7135125B2 (ja) 近赤外画像の生成方法、近赤外画像の生成装置、生成ネットワークの訓練方法、生成ネットワークの訓練装置、電子機器、記憶媒体及びコンピュータプログラム
CN113963087B (zh) 图像处理方法、图像处理模型训练方法、装置及存储介质
CN113094550B (zh) 视频检索方法、装置、设备和介质
US20210365749A1 (en) Image data processing method and apparatus, electronic device, and storage medium
CN111860167B (zh) 人脸融合模型获取及人脸融合方法、装置及存储介质
CN111507355B (zh) 一种字符识别方法、装置、设备和存储介质
KR102552532B1 (ko) 이미지 렌더링 방법 및 장치
KR20210157878A (ko) 이미지 편집 모델 구축 방법 및 장치
US11568590B2 (en) Cartoonlization processing method for image, electronic device, and storage medium
EP4105791A2 (en) Method and apparatus for training, based on cross-modal information, document reading comprehension model
CN111158924B (zh) 内容分享方法、装置、电子设备及可读存储介质
KR102551835B1 (ko) 능동적 인터랙션 방법, 장치, 전자 기기 및 판독 가능 기록 매체
CN112487242A (zh) 用于识别视频的方法、装置、电子设备及可读存储介质
KR20210035787A (ko) 키포인트 위치결정 방법, 장치, 전자 기기, 저장 매체 및 프로그램
CN111539897A (zh) 用于生成图像转换模型的方法和装置
KR20210139203A (ko) 상품 안내 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램
CN112328088B (zh) 图像的呈现方法和装置
CN113867875A (zh) 标记对象的编辑及显示方法、装置、设备、存储介质
CN112464009A (zh) 用于生成配对图像的方法、装置、电子设备及存储介质
CN113542257B (zh) 视频处理方法、视频处理装置、电子设备和存储介质
CN113641439B (zh) 文本识别和展示方法、装置、电子设备和介质
CN112000828B (zh) 搜索表情图片的方法、装置、电子设备和可读存储介质
CN111385489B (zh) 一种短视频封面的制作方法、装置、设备和存储介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant