KR20220149503A - 이미지 촬영 방법 및 장치, 전자 기기 및 컴퓨터 판독 가능한 저장 매체 - Google Patents

이미지 촬영 방법 및 장치, 전자 기기 및 컴퓨터 판독 가능한 저장 매체 Download PDF

Info

Publication number
KR20220149503A
KR20220149503A KR1020227018878A KR20227018878A KR20220149503A KR 20220149503 A KR20220149503 A KR 20220149503A KR 1020227018878 A KR1020227018878 A KR 1020227018878A KR 20227018878 A KR20227018878 A KR 20227018878A KR 20220149503 A KR20220149503 A KR 20220149503A
Authority
KR
South Korea
Prior art keywords
pose
human body
image
recommended
scenario
Prior art date
Application number
KR1020227018878A
Other languages
English (en)
Inventor
웨이웨이 슈
강구이 후앙
동밍 시에
지아유안 왕
Original Assignee
상하이 센스타임 인텔리전트 테크놀로지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 상하이 센스타임 인텔리전트 테크놀로지 컴퍼니 리미티드 filed Critical 상하이 센스타임 인텔리전트 테크놀로지 컴퍼니 리미티드
Publication of KR20220149503A publication Critical patent/KR20220149503A/ko

Links

Images

Classifications

    • H04N5/23222
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • H04N23/632Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters for displaying or modifying preview images prior to image capturing, e.g. variety of image resolutions or capturing parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/64Computer-aided capture of images, e.g. transfer from script file into camera, check of taken image quality, advice or proposal for image composition or decision on when to take image
    • H04N5/23216
    • H04N5/23218
    • H04N5/23219
    • H04N5/232933
    • H04N5/232935

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

본 발명은 이미지 촬영 방법 및 장치, 전자 기기 및 컴퓨터 판독 가능한 저장 매체에 관한 것으로서, 상기 방법은, 촬영 인터페이스에 대응되는 시나리오 이미지를 획득하는 단계; 시나리오 이미지를 식별하여, 시나리오 이미지에 대응되는 시나리오 카테고리 및 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하는 단계; 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하여, 시나리오 이미지에서의 대상 및 대상의 진실 인체 포즈를 결정하는 단계; 촬영 인터페이스에서 진실 인체 포즈 및 추천 인체 포즈를 디스플레이하는 것을 통해, 대상이 추천 인체 포즈에 대해 포즈 조정을 수행하도록 안내하는 단계; 및 촬영 조건을 만족하는 경우, 대상의 촬영 이미지를 획득하는 단계를 포함한다. 본 발명의 실시예는 이미지 촬영 효과를 효과적으로 향상시키는 것을 구현할 수 있어, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하다.

Description

이미지 촬영 방법 및 장치, 전자 기기 및 컴퓨터 판독 가능한 저장 매체
[관련 출원에 대한 상호 참조]
본 발명은 출원 번호가 202110467998.6이고, 출원일이 2021년04월28일이며, 출원 명칭이 “이미지 촬영 방법 및 장치, 전자 기기 및 저장 매체”인 중국 특허 출원에 기반하여 제출한 것이며, 상기 중국 특허 출원의 우선권을 주장하는 바, 상기 중국 특허 출원의 모든 내용은 참조로서 본 출원에 인용된다.
본 발명은 컴퓨터 기술 분야에 관한 것으로서, 특히 이미지 촬영 방법 및 장치, 전자 기기 및 컴퓨터 판독 가능한 저장 매체에 관한 것이다.
촬상 기술의 발전에 따라, 사용자는 핸드폰, 태블릿 컴퓨터 등 이동 단말에서의 촬영 기능을 이용하여 사진을 찍을 수 있다. 사용자가 사진 촬영 기술이 부족하거나, 사용자가 렌즈 앞에서 지체가 부자연스럽고 사진 촬영 자세가 단일한 경우, 촬영하여 획득된 이미지가 사용자를 만족시키지 못할 수 있어, 촬영 체험이 저하된다.
본 발명의 실시예는 이미지 촬영 기술 방안을 제공한다.
본 발명의 일 측면에 따라, 이미지 촬영 방법을 제공하고, 상기 방법은, 촬영 인터페이스에 대응되는 시나리오 이미지를 획득하는 단계; 상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하는 단계; 상기 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하여, 상기 시나리오 이미지에서의 대상 및 상기 대상의 진실 인체 포즈를 결정하는 단계; 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하는 것을 통해, 상기 대상이 상기 추천 인체 포즈에 따라 포즈 조정을 수행하도록 안내하는 단계; 및 촬영 조건을 만족하는 경우, 상기 대상의 촬영 이미지를 획득하는 단계를 포함한다. 상기 방식을 통해, 이미지 촬영 효과가 효과적으로 향상되고, 사용자의 촬영 체험이 향상되며, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하다.
하나의 가능한 구현 방식에서, 상기 추천 인체 포즈는 싱글 포즈를 포함하고, 상기 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하는 단계는, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 싱글 포즈를 디스플레이하는 단계; 또는, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 진실 인체 포즈를 디스플레이하고, 상기 촬영 인터페이스의 제1 지정 영역에서 상기 싱글 포즈를 디스플레이하는 단계를 포함한다. 상기 방식을 통해, 대상이 싱글 포즈의 촬영을 완료하는 것을 효과적으로 안내할 수 있어, 촬영 체험이 향상되며, 또한 추천 인체 포즈가 고정적으로 디스플레이될 수 있고, 대상에 따라 디스플레이될 수 있어, 상이한 포즈 디스플레이 요구를 만족할 수 있다.
하나의 가능한 구현 방식에서, 상기 추천 인체 포즈는 다인 조합 포즈를 포함하고, 상기 방법은, 상기 시나리오 이미지 중 복수 개의 대상 사이의 상대적 위치 및 상기 다인 조합 포즈 중 각 포즈 사이의 상대적 위치에 따라, 상기 다인 조합 포즈로부터 각 대상에 대응되는 포즈를 각각 결정하는 단계를 더 포함하고; 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하는 단계는, 어느 하나의 대상의 경우, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 대상의 진실 인체 포즈 및 상기 대상에 대응되는 포즈를 디스플레이하는 단계; 또는, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 대상의 진실 인체 포즈를 디스플레이하고, 상기 촬영 인터페이스의 제2 지정 영역에서 상기 대상에 대응되는 포즈를 디스플레이하는 단계를 포함한다. 상기 방식을 통해, 복수 개의 대상이 다인 조합 포즈를 공동으로 완료하는 것을 효과적으로 안내할 수 있어, 촬영 체험이 향상되며, 또한 추천 인체 포즈가 고정적으로 디스플레이될 수 있고, 대상에 따라 디스플레이될 수 있어, 상이한 포즈 디스플레이 요구를 만족할 수 있다.
하나의 가능한 구현 방식에서, 상기 방법은, 상기 진실 인체 포즈의 제1 인체 키 포인트와, 상기 추천 인체 포즈의 제2 인체 키 포인트 사이의 키 포인트 쌍을 결정하는 단계; 및 상기 키 포인트 쌍의 제1 유사도를 계산하는 것을 통해, 상기 제1 인체 키 포인트로부터 상기 제1 유사도가 제1 기설정된 임계값보다 작은 제3 인체 키 포인트를 결정하는 단계를 더 포함하고; 상기 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하는 단계는, 상기 제3 인체 키 포인트가 위치한 영역을 강조 디스플레이하는 단계를 포함하며, 강조 디스플레이의 방식은 하이라이트, 굵게 하기 및 색상 변경 중 적어도 하나를 포함한다. 상기 방식을 통해, 디스플레이된 진실 인체 포즈 중 유사도가 낮은 인체 부위에 대해, 강조 디스플레이를 수행함으로써, 사용자가 포즈를 조정하는 것을 더욱 효과적으로 안내하여, 촬영 체험이 향상될 수 있다.
하나의 가능한 구현 방식에서, 상기 방법은, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 키 포인트 쌍의 제1 유사도에 따라, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도를 결정하는 단계 - 상기 키 포인트 쌍은 상기 진실 인체 포즈의 제1 인체 키 포인트 및 상기 추천 인체 포즈의 제2 인체 키 포인트에 따라 결정된 것임 - ; 및 상기 촬영 인터페이스에서 상기 제2 유사도를 디스플레이하는 단계를 더 포함한다. 상기 방식을 통해, 진실 인체 포즈와 추천 인체 포즈 사이의 전체적인 유사 정도를 디스플레이할 수 있어, 사용자가 전체적인 유사도에 따라 포즈를 조정하는 것을 효과적으로 안내하므로, 촬영 체험이 향상될 수 있다.
하나의 가능한 구현 방식에서, 상기 방법은, 상기 시나리오 이미지를 영역 추천 네트워크에 입력하여, 상기 시나리오 이미지의 사진 촬영 추천 영역을 획득하는 단계를 더 포함하고, 상기 사진 촬영 추천 영역은 상기 시나리오 이미지에서 사진 촬영을 추천하는 영역을 나타내기 위한 것이고, 상기 영역 추천 네트워크는 사진 촬영 영역을 태깅한 제1 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이며; 상기 시나리오 이미지의 사진 촬영 추천 영역을 획득한 후, 상기 방법은, 상기 촬영 인터페이스에서, 표지 심볼을 사용하여 상기 사진 촬영 추천 영역을 지시하는 단계; 상기 촬영 인터페이스의 상기 사진 촬영 추천 영역에서 상기 추천 인체 포즈를 디스플레이하는 단계 중 적어도 하나를 더 포함하며, 상기 사진 촬영 추천 영역은 상기 대상이 상기 사진 촬영 추천 영역에 따라 위치 조정을 수행하도록 안내하기 위한 것이다. 상기 방식을 통해, 대상에게 추천 시각 효과가 비교적 좋은 사진 촬영 영역을 추천할 수 있어, 대상이 위치를 조정하는 것을 효과적으로 안내하여 촬영 이미지의 시각 효과를 향상시킴으로써, 사용자 촬영 체험을 향상시킬 수 있다.
하나의 가능한 구현 방식에서, 상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하는 단계는, 포즈 추천 네트워크를 통해 상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하는 단계를 포함하고, 상기 포즈 추천 네트워크는 샘플 시나리오 카테고리 및 샘플 인체 포즈가 태깅된 제2 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이고, 상기 제2 샘플 세트는 대상이 업로드한 샘플 이미지를 포함한다. 상기 방식을 통해, 포즈 추천 네트워크가 고품질 이미지로부터 인체 포즈를 학습할 수 있도록 함으로써, 시나리오 이미지에 기반하여 고품질의 추천 인체 포즈를 효과적으로 출력할 수 있다.
하나의 가능한 구현 방식에서, 상기 추천 인체 포즈는 복수 개를 포함하고, 상기 방법은, 상기 촬영 인터페이스에서 복수 개의 추천 인체 포즈에 대응되는 포즈 맵을 디스플레이하는 단계; 및 상기 포즈 맵에 대한 선택 동작에 응답하여, 선택된 포즈 맵에 따라, 상기 선택된 포즈 맵에 대응되는 추천 인체 포즈를 결정하고 디스플레이하는 단계를 더 포함한다. 상기 방식을 통해, 사용자가 용이하게 상이한 추천 인체 포즈를 선택할 수 있어, 상이한 포즈 선호가 만족되고, 촬영 체험이 향상되며, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하다.
하나의 가능한 구현 방식에서, 상기 촬영 조건은, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도가 제2 기설정된 임계값보다 크거나 같은 것; 또는, 상기 촬영 인터페이스에서의 촬영 컨트롤러가 트리거링되는 것을 포함한다.
하나의 가능한 구현 방식에서, 상기 방법은, 상기 촬영 이미지를 처리하여, 처리된 촬영 이미지를 획득하는 단계를 더 포함하고, 상기 처리는, 상기 촬영 이미지에서의 대상에 대해 뷰티 처리를 수행하는 것 및 상기 촬영 이미지에 필터를 추가하는 것 중 적어도 하나를 포함하고; 상기 촬영 이미지에 필터를 추가하는 것은, 상기 추천 인체 포즈에 대응되는 추천 필터에 따라, 상기 촬영 이미지의 채도, 색온도 및 휘도 중 적어도 하나를 조정하는 것을 포함한다. 상기 방식을 통해, 촬영 이미지의 시각 효과가 더욱 고품질이 되도록 할 수 있어, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하여, 이미지 촬영 체험이 향상된다.
하나의 가능한 구현 방식에서, 상기 방법은 인공 지능 교육 플랫폼에 적용되고, 상기 인공 지능 교육 플랫폼은 지능형 하드웨어에 연결되며; 상기 인공 지능 교육 플랫폼은, 상기 이미지 촬영 방법을 구현하는 프로젝트 코드를 편집하고, 상기 프로젝트 코드를 상기 지능형 하드웨어에 송신하기 위한 것이고; 상기 지능형 하드웨어는, 시나리오 이미지를 수집하고 상기 프로젝트 코드를 작동하여, 작동 결과를 획득하고, 상기 작동 결과를 상기 인공 지능 교육 플랫폼에 송신하여, 상기 인공 지능 교육 플랫폼의 디스플레이 인터페이스에서 상기 작동 결과를 디스플레이하기 위한 것이다. 상기 방식을 통해, 사용자는 흥미로운 사례를 통해 학습할 수 있고, 인체 포즈 식별, 인체 키 포인트 검출 등 인공 지능 알고리즘을 학습할 수 있다.
본 발명의 일 측면에 따라, 이미지 촬영 장치를 제공하고, 상기 장치는, 촬영 인터페이스에 대응되는 시나리오 이미지를 획득하도록 구성된 획득부; 상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하도록 구성된 식별부; 상기 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하여, 상기 시나리오 이미지에서의 대상 및 상기 대상의 진실 인체 포즈를 결정하도록 구성된 검출부; 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하는 것을 통해, 상기 대상이 상기 추천 인체 포즈에 따라 포즈 조정을 수행하도록 안내하도록 구성된 디스플레이부; 및 촬영 조건을 만족하는 경우, 상기 대상의 촬영 이미지를 획득하도록 구성된 촬영부를 포함한다.
하나의 가능한 구현 방식에서, 상기 추천 인체 포즈는 싱글 포즈를 포함하고, 상기 디스플레이부는, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 싱글 포즈를 디스플레이하도록 구성된 제1 디스플레이 서브부; 또는, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 진실 인체 포즈를 디스플레이하고, 상기 촬영 인터페이스의 제1 지정 영역에서 상기 싱글 포즈를 디스플레이하도록 구성된 제2 디스플레이 서브부를 포함한다.
하나의 가능한 구현 방식에서, 상기 추천 인체 포즈는 다인 조합 포즈를 포함하고, 상기 장치는, 상기 시나리오 이미지 중 복수 개의 대상 사이의 상대적 위치 및 상기 다인 조합 포즈 중 각 포즈 사이의 상대적 위치에 따라, 상기 다인 조합 포즈로부터 각 대상에 대응되는 포즈를 각각 결정하도록 구성된 위치 결정부를 더 포함하고; 상기 디스플레이부는, 어느 하나의 대상의 경우, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 대상의 진실 인체 포즈 및 상기 대상에 대응되는 포즈를 디스플레이하도록 구성된 제3 디스플레이 서브부; 또는, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 대상의 진실 인체 포즈를 디스플레이하고, 상기 촬영 인터페이스의 제2 지정 영역에서 상기 대상에 대응되는 포즈를 디스플레이하도록 구성된 제4 디스플레이 서브부를 포함한다.
하나의 가능한 구현 방식에서, 상기 장치는, 상기 진실 인체 포즈의 제1 인체 키 포인트와, 상기 추천 인체 포즈의 제2 인체 키 포인트 사이의 키 포인트 쌍을 결정하도록 구성된 제1 결정부; 및 상기 키 포인트 쌍의 제1 유사도를 계산하는 것을 통해, 상기 제1 인체 키 포인트로부터 상기 제1 유사도가 제1 기설정된 임계값보다 작은 제3 인체 키 포인트를 결정하도록 구성된 제2 결정부를 더 포함하고; 상기 디스플레이부는, 상기 제3 인체 키 포인트가 위치한 영역을 강조 디스플레이하도록 구성된 강조 디스플레이 서브부를 포함하며, 강조 디스플레이의 방식은 하이라이트, 굵게 하기 및 색상 변경 중 적어도 하나를 포함한다.
하나의 가능한 구현 방식에서, 상기 장치는, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 키 포인트 쌍의 제1 유사도에 따라, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도를 결정하도록 구성된 제3 결정부 - 상기 키 포인트 쌍은 상기 진실 인체 포즈의 제1 인체 키 포인트 및 상기 추천 인체 포즈의 제2 인체 키 포인트에 따라 결정된 것임 - ; 및 상기 촬영 인터페이스에서 상기 제2 유사도를 디스플레이하도록 구성된 유사도 디스플레이부를 더 포함한다.
하나의 가능한 구현 방식에서, 상기 장치는, 상기 시나리오 이미지를 영역 추천 네트워크에 입력하여, 상기 시나리오 이미지의 사진 촬영 추천 영역을 획득하도록 구성된 영역 결정부를 더 포함하고, 상기 사진 촬영 추천 영역은 상기 시나리오 이미지에서 사진 촬영을 추천하는 영역을 나타내기 위한 것이고, 상기 영역 추천 네트워크는 사진 촬영 영역을 태깅한 제1 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이며; 상기 장치는, 상기 촬영 인터페이스에서, 표지 심볼을 사용하여 상기 사진 촬영 추천 영역을 지시하거나; 상기 촬영 인터페이스의 상기 사진 촬영 추천 영역에서 상기 추천 인체 포즈를 디스플레이하도록 구성된 영역 디스플레이부를 더 포함하며; 상기 사진 촬영 추천 영역은 상기 대상이 상기 사진 촬영 추천 영역에 따라 위치 조정을 수행하도록 안내하기 위한 것이다.
하나의 가능한 구현 방식에서, 상기 영역 디스플레이부는 또한, 상기 촬영 인터페이스에서, 표지 심볼을 사용하여 상기 사진 촬영 추천 영역을 지시하고; 상기 촬영 인터페이스의 상기 사진 촬영 추천 영역에서 상기 추천 인체 포즈를 디스플레이하도록 구성된다.
하나의 가능한 구현 방식에서, 상기 식별부는 또한, 포즈 추천 네트워크를 통해 상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하도록 구성되고, 상기 포즈 추천 네트워크는 샘플 시나리오 카테고리 및 샘플 인체 포즈가 태깅된 제2 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이고, 상기 제2 샘플 세트는 대상이 업로드한 샘플 이미지를 포함한다.
하나의 가능한 구현 방식에서, 상기 추천 인체 포즈는 복수 개를 포함하고, 상기 장치는, 상기 촬영 인터페이스에서 복수 개의 추천 인체 포즈에 대응되는 포즈 맵을 디스플레이하도록 구성된 포즈 맵 디스플레이부; 및 상기 포즈 맵에 대한 선택 동작에 응답하여, 선택된 포즈 맵에 따라, 상기 선택된 포즈 맵에 대응되는 추천 인체 포즈를 결정하고 디스플레이하도록 구성된 선택부를 더 포함한다.
하나의 가능한 구현 방식에서, 상기 촬영 조건은, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도가 제2 기설정된 임계값보다 크거나 같은 것; 또는, 상기 촬영 인터페이스에서의 촬영 컨트롤러가 트리거링되는 것을 포함한다.
하나의 가능한 구현 방식에서, 상기 장치는, 상기 촬영 이미지를 처리하여, 처리된 촬영 이미지를 획득하도록 구성된 처리부를 더 포함하고, 상기 처리는, 상기 촬영 이미지에서의 대상에 대해 뷰티 처리를 수행하는 것 및 상기 촬영 이미지에 필터를 추가하는 것 중 적어도 하나를 포함하고; 상기 촬영 이미지에 필터를 추가하는 것은, 상기 추천 인체 포즈에 대응되는 추천 필터에 따라, 상기 촬영 이미지의 채도, 색온도 및 휘도 중 적어도 하나를 조정하는 것을 포함한다.
하나의 가능한 구현 방식에서, 상기 장치는 인공 지능 교육 플랫폼에 적용되고, 상기 인공 지능 교육 플랫폼은 지능형 하드웨어에 연결되며; 상기 인공 지능 교육 플랫폼은, 상기 이미지 촬영 장치를 구현한 프로젝트 코드를 편집하고, 상기 프로젝트 코드를 상기 지능형 하드웨어에 송신하기 위한 것이며; 상기 지능형 하드웨어는, 시나리오 이미지를 수집하고 상기 프로젝트 코드를 작동하여, 작동 결과를 획득하고, 상기 작동 결과를 상기 인공 지능 교육 플랫폼에 송신하여, 상기 인공 지능 교육 플랫폼의 디스플레이 인터페이스에서 상기 작동 결과를 디스플레이하기 위한 것이다.
본 발명의 일 측면에 따라, 전자 기기를 제공하고, 상기 전자 기기는, 프로세서; 및 프로세서가 실행 가능한 명령어를 저장하도록 구성된 메모리를 포함하고; 상기 프로세서는 상기 메모리에 저장된 명령어를 호출하여, 상기 방법을 실행한다.
본 발명의 일 측면에 따라, 컴퓨터 판독 가능한 저장 매체를 제공하고, 상기 컴퓨터 판독 가능한 저장 매체는 컴퓨터 프로그램 명령어를 저장하고, 상기 컴퓨터 프로그램 명령어가 프로세서에 의해 실행될 경우 상기 방법을 구현한다.
본 발명의 일 측면에 따라, 컴퓨터 프로그램을 제공하고, 상기 컴퓨터 프로그램은 컴퓨터 판독 가능한 코드를 포함하며, 상기 컴퓨터 판독 가능한 코드가 전자 기기에서 작동되는 경우, 상기 전자 기기에서의 프로세서가 실행될 경우 상기 방법을 구현한다.
본 발명의 실시예에서, 시나리오 이미지의 시나리오 카테고리에 따라, 사용자에게 시나리오 카테고리에 대응되는 추천 인체 포즈를 추천할 수 있음으로써, 추천 인체 포즈가 시나리오 이미지에 매칭도록 할 수 있고, 또한 촬영 인터페이스에서 진실 인체 포즈 및 추천 인체 포즈를 디스플레이하는 것을 통해, 사용자가 디스플레이된 추천 인체 포즈에 따라 포즈 조정을 수행하도록 안내하거나 사용자가 디스플레이된 추천 인체 포즈에 따라 촬영 대상이 포즈 조정을 수행하는 것을 지도하는데 용이할 수 있어, 이미지 촬영 효과가 효과적으로 향상되고, 사용자의 촬영 체험이 향상되며, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하다.
이해해야 할 것은, 이상의 일반적인 설명 및 하기의 상세한 설명은 다만 예시적이고 해석적인 것이며, 본 발명을 한정하려는 것은 아니다. 아래에 첨부 도면에 따라 예시적 실시예를 상세하게 설명하므로, 본 발명의 다른 특징 및 측면이 더욱 명확해질 것이다.
여기서의 도면은 명세서에 병합되어 본 명세서의 일부분을 구성하며, 이러한 도면은 본 출원에 부합되는 실시예를 예시하여, 명세서와 함께 본 발명의 기술 방안을 설명하기 위한것이다.
도 1은 본 발명의 실시예에 따른 이미지 촬영 방법의 흐름도를 도시한다.
도 2는 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시한다.
도 3은 본 발명의 실시예에 따른 다인 조합 포즈의 예시도를 도시한다.
도 4는 본 발명의 실시예에 따른 진실 인체 포즈의 예시도를 도시한다.
도 5는 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시한다.
도 6은 본 발명의 실시예에 따른 시나리오 이미지의 예시도를 도시한다.
도 7은 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시한다.
도 8은 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시한다.
도 9는 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시한다.
도 10은 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시한다.
도 11a 및 도 11b는 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시한다.
도 12는 본 발명의 실시예에 따른 이미지 촬영 방법의 응용 예시도를 도시한다.
도 13은 본 발명의 실시예에 따른 이미지 촬영 장치의 블록도를 도시한다.
도 14는 본 발명의 실시예에 따른 전자 기기의 블록도를 도시한다.
이하, 도면을 참조하여 본 발명의 다양한 예시적인 실시예, 특징 및 측면을 상세하게 설명한다. 도면에서 동일한 도면 표기는 기능이 동일하거나 유사한 요소를 나타낸다. 실시예의 다양한 측면이 도면에 도시되어 있지만, 특별히 언급되지 않는 한, 도면을 반드시 비례에 따라 그릴 필요는 없다.
여기서 "예시적"이라는 특정한 단어는 "예, 실시예 또는 설명적인 것으로 사용됨"을 의미한다. 여기서 "예시적"으로 설명된 임의의 실시예는 다른 실시예보다 우수하거나 좋은 것으로 해석될 필요는 없다.
본 문에서 용어 “및/또는”은 다만 관련 대상의 관련 관계를 설명하기 위한 것이며, 세 가지의 관계가 존재함을 나타내며, 예컨대, A및/또는 B는, A가 단독적으로 존재하거나, A 및 B가 동시에 존재하거나, B가 단독적으로 존재하는 세 가지 상황을 나타낸다. 또한, 본 문에서 용어 "적어도 하나"는 복수 개에서의 어느 하나 또는 복수 개에서의 적어도 두 개의 임의의 조합을 의미하고, 예컨대, A, B, C 중 적어도 하나를 포함하는 것은, A, B 및 C로 구성된 조합에서 선택된 어느 하나 또는 복수 개의 요소를 포함하는 것을 나타낼 수 있다.
이해해야 할 것은, 본 발명의 청구범위, 명세서 및 도면에서의 용어 “제1”, “제2” 및 “제3”은 구별하여 설명하기 위한 것일 뿐, 특정된 순서를 설명하는 것이 아니며, 상대적 중요성을 나타내거나 암시하는 것으로 이해될 수도 없다. 본 발명의 명세서 및 청구범위에서 사용되는 용어 “포함”은 설명된 특징, 전체, 단계, 동작, 요소 및 컴포넌트 중 적어도 하나의 존재를 지시하지만, 하나 또는 복수 개의 다른 특징, 전체, 단계, 동작, 요소, 컴포넌트 및 이들의 세트 중 적어도 하나가 존재하거나 추가되는 것을 제외하지 않는다.
또한, 본 발명을 더욱 잘 설명하기 위해, 아래의 구체적인 실시형태에서 많은 세부사항들이 제공된다. 본 분야의 통상의 기술자는 일부 세부 사항이 없이도, 본 발명이 마찬가지로 실시될 수 있음을 이해해야 한다. 일부 실시예에서, 본 분야의 통상의 기술자에게 잘 알려진 방법, 수단, 요소 및 회로는 본 발명의 요지를 강조하기 위해, 상세히 설명되지 않는다.
도 1은 본 발명의 실시예에 따른 이미지 촬영 방법의 흐름도를 도시하고, 도 1에 도시된 바와 같이, 상기 이미지 촬영 방법은 아래와 같은 단계를 포함한다.
단계 S11에 있어서, 촬영 인터페이스에 대응되는 시나리오 이미지를 획득한다.
단계 S12에 있어서, 시나리오 이미지를 식별하여, 시나리오 이미지에 대응되는 시나리오 카테고리 및 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정한다.
단계 S13에 있어서, 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하여, 시나리오 이미지에서의 대상 및 대상의 진실 인체 포즈를 결정한다.
단계 S14에 있어서, 촬영 인터페이스에서 진실 인체 포즈 및 추천 인체 포즈를 디스플레이하여, 대상이 추천 인체 포즈에 대해 포즈 조정을 수행하도록 안내한다.
단계 S15에 있어서, 촬영 조건을 만족하는 경우, 대상의 촬영 이미지를 획득한다.
하나의 가능한 구현 방식에서, 상기 이미지 촬영 방법은 단말 기기에 의해 실행될 수 있고, 단말 기기는 사용자 기기(User Equipment, UE), 모바일 기기, 사용자 단말, 단말, 셀룰러 폰, 무선 전화, 개인용 정보 단말기(Personal Digital Assistant, PDA), 핸드 헬드 기기, 컴퓨팅 기기, 차량용 기기 및 웨어러블 기기 등일 수 있으며, 상기 방법은 프로세서가 메모리에 저장된 컴퓨터 판독 가능한 명령어를 호출하는 방식을 통해 구현될 수 있다. 본 발명의 실시예는 단말 기기의 타입에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 단말 기기에 상기 이미지 촬영 방법을 구현하는 애플리케이션 프로그램(Application, APP)이 배치되어 있음으로써, 사용자가 상기 애플리케이션 프로그램을 직접 사용하여, 이미지 촬영을 수행할 수 있으며; 상기 이미지 촬영 방법을 촬영 모드로 사용하여, 단말 기기 자체의 촬영 기능에 집적할수도 있음으로써, 사용자가 단말 기기의 촬영 기능을 사용할 경우, 상기 이미지 촬영 방법을 구현하는 촬영 모드를 선택하여, 이미지 촬영을 수행할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
이해해야 할 것은, 본 발명의 이미지 촬영 방법의 애플리케이션 프로그램을 가동하거나, 본 발명 중 이미지 촬영 방법을 구현하는 촬영 모드를 선택한 후, 단말 기기에 조립된 이미지 수집 기기(예컨대 웹캠), 또는 단말 기기에 연결된 이미지 수집기기를 통해, 실제 시나리오의 시나리오 이미지를 실시간 수집하여, 단말 기기의 촬영 인터페이스에서 디스플레이할 수 있다. 단계 S11에서, 촬영 인터페이스에 대응되는 시나리오 이미지를 획득하는 단계는, 이미지 수집 기기가 수집한 시나리오 이미지를 획득하는 단계이다.
도 2는 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시하고, 도 2에 도시된 바와 같이, 촬영 인터페이스에서 시나리오 이미지를 디스플레이할 수 있고, 촬영 인터페이스에서 촬영을 트리거링하기 위한 촬영 컨트롤(22), 촬영 이미지를 체크하기 위한 체크 컨트롤(21) 및 시나리오 이미지를 식별하는 것을 트리거링하기 위한 트리거링 컨트롤(23) 등을 제공할 수 있다.
설명해야 할 것은, 도 2에 도시된 촬영 인터페이스는 본 발명의 실시예에서 제공한 하나의 구현 방식이고, 이해해야 할 것은, 본 발명은 이에 한정되지 않으며, 본 분야의 통상의 기술자는 실제 요구에 따라 촬영 인터페이스에서의 기능 컨트롤을 설정할 수 있으며, 본 발명의 실시예에서 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 상기 이미지 촬영 방법은 서버에 의해 실행될 수 있으며, 서버는 독립적인 물리적 서버일 수 있고, 복수 개의 물리적 서버로 구성된 서버 클러스터 또는 분산 시스템일 수도 있으며, 또한 클라우드 서비스, 클라우드 데이터 베이스, 클라우드 컴퓨팅, 클라우드 함수, 클라우드 스토리지, 네트워크 서비스, 클라우드 통신, 미들웨어 서비스, 도메인 서비스, 안전 서비스, CDN 및 빅 데이터와 인공 지능 플랫폼 등 기초 클라우드 컴퓨팅 서비스를 제공하는 클라우드 서버 등일 수 있으며, 본 발명의 실시예는 서버의 타입에 대해 한정하지 않는다.
상기 이미지 촬영 방법이 서버에 의해 실행되는 경우, 단계 S11에서, 촬영 인터페이스에 대응되는 시나리오 이미지를 획득하는 단계는, 서버가 단말이 송신한 시나리오 이미지를 수신하는 단계이며, 여기서, 시나리오 이미지는 단말이 이미지 수집 기기를 통해 수집한 이미지이다.
하나의 가능한 구현 방식에서, 단계 S12에서, 도 2에 되시된 바와 같은 트리거링 컨트롤(23)을 트리거링하는 것을 통해, 시나리오 이미지를 식별하는 것을 트리거링할 수 있고; 사용자가 이미지 촬영 방법을 구현한 애플리케이션 프로그램을 가동하거나, 이미지 촬영 방법을 구현하는 촬영 모드를 선택한 후, 시나리오 이미지를 식별하는 것을 자동으로 트리거링할 수도 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 단계 S12에서, 시나리오 이미지를 식별하여, 시나리오 이미지에 대응되는 시나리오 카테고리 및 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하는 단계는, 시나리오 이미지를 식별하여, 시나리오 이미지에서의 시나리오 특징 및 대상 특징 중 적어도 하나를 획득하는 단계; 식별된 시나리오 특징 및 대상 특징 중 적어도 하나에 따라, 시나리오 이미지에 대응되는 시나리오 타입을 결정하는 단계; 및 기절성된 시나리오 타입과 추천 인체 포즈 사이의 대응 관계에 따라, 시나리오 타입에 대응되는 추천 인체 포즈를 결정하는 단계를 포함할 수 있다.
여기서, 시나리오 특징은 대상이 위치한 실제 시나리오의 시나리오 타입을 지시하기 위한 것일 수 있으며, 예컨대, 초원의 시나리오 특징은 잔디, 소 및 양 등을 포함할 수 있고; 실내의 시나리오 특징은 벽, 창문 등을 포함할 수 있으며; 식별된 시나리오 특징이 잔디, 소 및 양을 포함할 경우, 시나리오 이미지에 대응되는 시나리오 타입이 초원인 것을 획득할 수 있다.
하나의 가능한 구현 방식에서, 대상 특징은, 복장 특징, 형체 특징 및 성별 특징 등 중에서 적어도 하나를 포함할 수 있다. 여기서, 복장 특징은 대상의 옷차림을 지시할 수 있고, 형체 특징은 대상의 체형(예컨대 체형이 큰 것, 체형이 외소한 것)을 지시할 수 있으며, 성별 특징은 대상의 성별을 지시할 수 있다. 상기 방식을 통해, 시나리오 특징과 대상 특징을 결합하여 시나리오 타입을 결정할 수 있음으로써, 더욱 정확한 추천 인체 포즈를 획득할 수 있다.
예를 들면, 시나리오 특징이 실제 시나리오가 실내인 것으로 지시하고, 대상 특징이 대상의 옷차림이 “스웨터, 롱 팬츠, 핸드백”이고, 대상이 외소한 여성인 것으로 지시할 경우, 시나리오 카테고리는 “실내-외소한 -여성-옷차림 스웨터, 롱 팬츠, 핸드백”일 수 있음으로써, 이 시나리오 카테고리에 따라 대응되는 추천 인체 포즈를 결정할 수 있다.
여기서, 미리 훈련된 시나리오 식별 네트워크를 통해 시나리오 이미지를 식별하여, 시나리오 이미지에서의 시나리오 특징 및 대상 특징 중 적어도 하나를 획득할 수 있으며, 시나리오 식별 네트워크의 네트워크 타입, 네트워크 결과 및 훈련 방식에 대해, 본 발명의 실시예는 한정하지 않는다.
하나의 가능한 구현 방식에서, 식별된 시나리오 특징 및 대상 특징을 촬영 인터페이스에서 디스플레이할 수 있고, 예컨대, 라벨링하는 방식을 통해 시나리오 특징 및 대상 특징을 태깅하여, 이미지 촬영의 재미를 향상시킬 수 있다.
이해해야 할 것은, 상이한 시나리오 타입은 상이한 추천 인체 포즈에 대응될 수 있고, 시나리오 타입과 추천 인체 포즈의 대응 관계를 기설정할 수 있으며, 식별된 시나리오 특징에 따라 시나리오 타입을 결정한 후, 상기 대응 관계에 따라 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정할 수 있다.
하나의 가능한 구현 방식에서, 단계 S12에서, 미리 훈련된 포즈 추천 네트워크를 통해, 시나리오 이미지를 식별하여, 시나리오 이미지에 대응되는 시나리오 카테고리 및 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정할 수도 있다. 여기서, 포즈 추천 네트워크의 네트워크 타입, 네트워크 구조 및 훈련 방식 등에 대해, 본 발명의 실시예는 한정하지 않는다.
하나의 가능한 구현 방식에서, 셀프 모니터링 훈련 방식을 사용하여, 포즈 추천 네트워크를 훈련하여 상이한 시나리오 타입에서의 추천 인체 포즈를 학습하거나, 시나리오 타입과 추천 인체 포즈 사이의 대응 관계를 학습함으로써, 상기 포즈 추천 네트워크를 이용하여 시나리오 이미지에 기반하여 추천 인체 포즈를 직접 획득할 수 있다. 상기 방식을 통해, 상기 기절성된 시나리오 타입과 추천 인체 포즈 사이의 대응 관계에 따라 추천 인체 포즈를 결정하는 방식에 비해, 더욱 풍부한 시나리오 타입 및 추천 인체 포즈를 지능적으로 획득할 수 있고, 사용자에게 시나리오 이미지에 대응되는 추천 인체 포즈를 더욱 정확하게 추천할 수 있다.
하나의 가능한 구현 방식에서, 추천 인체 포즈는 상기 포즈 추천 네트워크가 샘플 이미지로부터 학습하여 획득한 인체 포즈를 포함할 수 있고, 예컨대 또한 사용자 (예컨대 기술 인원)가 수동으로 그린 인체 포즈를 포함할 수도 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 이해해야 할 것은, 추천 인체 포즈는 인체 골격(예컨대 인체 관절 포인트를 연결하여 획득된 골격)의 형태를 통해 나타낼 수 있고, 인체 윤곽의 형태를 통해 나타낼 수도 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
여기서, 샘플 이미지는 촬영 효과가 비교적 우수한 고품질 이미지일 수 있고, 고품질 이미지로부터 인체 포즈를 학습하여 사용자에게 추천하여, 대상이 고품질 이미지에서의 인체 포즈에 근접하는 것을 안내할 수 있음으로써, 비교적 좋은 촬영 효과를 획득하고, 사용자 촬영 체험이 향상된다.
하나의 가능한 구현 방식에서, 추천 인체 포즈는 싱글 포즈(예컨대 싱글 손 하트)를 포함할 수 있고, 다인 조합 포즈(예컨대 2 인 조합 손 하트)를 포함할 수도 있다. 이해해야 할 것은, 시나리오 카테고리에 대응되는 추천 인체 포즈는 적어도 하나의 싱글 포즈 및 적어도 하나의 다인 조합 포즈 중 적어도 하나를 포함할 수 있다. 도 3은 본 발명의 실시예에 따른 다인 조합 포즈의 예시도를 도시하고, 도 3에 도시된 바와 같이, 포즈(n)와 포즈(m)는 공동으로 “손 하트”의 포즈를 구성한다.
하나의 가능한 구현 방식에서, 시나리오 타입은 예컨대 적어도 풍경 타입, 실내 타입 및 실외 타입 등을 포함할 수 있고; 여기서, 풍경 타입은 비치 타입, 산수 타입, 초원 타입 및 호수 타입 등으로 나눌 수 있으며, 실내 타입은 반공실 타입, 회의실 타입 및 재택 타입 등으로 나눌 수 있고, 실외 타입은 스트리트 뷰 타입, 놀이터 타입 및 공원 타입 등으로 나눌 수 있다.
이해해야 할 것은, 시나리오 타입의 분류는 이에 한정되지 않으며, 실제에서, 본 분야의 통상의 기술자는 실제 요구에 따라 다양한 시나리오 타입을 미리 설정할 수 있고, 또는, 상기 포즈 추천 네트워크를 통해 시나리오 타입을 자가 학습할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 단계 S13에서, 임의의 기지의 인체 키 포인트 검출 방식을 사용할 수 있고, 예컨대 인체 키 포인트 검출 네트워크를 사용하여, 시나리오 이미지에 대해 인체 키 포인트 검출을 수행할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 여기서, 인체 키 포인트 검출 네트워크의 네트워크 타입, 네트워크 구조 및 훈련 방식에 대해, 본 발명의 실시예는 한정하지 않는다.
하나의 가능한 구현 방식에서, 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하는 단계는, 시나리오 이미지 중 대상의 인체 관절 부위 키 포인트(예컨대 20 개의 관절 부위의 인체 키 포인트)를 추출하는 단계를 포함할 수 있고, 여기서, 인체 관절 부위키 포인트의 개수 및 위치는 실제 요구에 따라 결정할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 검출된 인체 관절 부위키 포인트에 따라, 시나리오 이미지에서의 대상 및 대상의 복수 개의 인체 관절 부위키 포인트가 시나리오 이미지에서의 좌표값을 결정할 수 있음으로써; 좌표값에 기반하여, 복수 개의 인체 관절 부위키 포인트를 인체의 구조에 따라 연결하여, 대상의 인체 골격을 획득할 수 있고, 즉 대상의 진실 인체 포즈를 획득할 수 있다. 도 4는 본 발명의 실시예에 따른 진실 인체 포즈의 예시도를 도시하고, 도 4에 도시된 바와 같이, 20 개의 인체 관절 부위키 포인트를 연결하여, 대상의 진실 인체 포즈를 획득한다.
하나의 가능한 구현 방식에서, 단계 S13에서, 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하는 단계는, 시나리오 이미지 중 대상의 인체 윤곽에서의 윤곽 키 포인트를 추출하여, 대상의 인체 윤곽을 획득함으로써, 인체 윤곽으로 대상의 진실 인체 포즈를 나타내는 단계를 포함할 수 있다. 인체 포즈를 나타내는 방식에 대한 선택은, 실제 요구에 따라 결정할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
설명해야 할 것은, 상기 단계 S12와 단계 S13은 동시에 실행될 수 있고; 먼저 단계 S12를 실행한 다음, 단계 S13을 실행할 수도 있으며; 먼저 단계 S13을 실행한 다음, 단계 S12를 실행할 수도 있다. 구체적으로 단말 기기의 처리 능력, 상기 단말 기기의 자원 점유 상황 및 응용 과정 중 지연에 대한 한정 등 요소에 따라 설정할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 단계 S14에서, 촬영 인터페이스에서 진실 인체 포즈 및 추천 인체 포즈를 디스플레이하는 단계는, 촬영 인터페이스에서 추천 인체 포즈에 대응되는 인체 골격 및 진실 인체 포즈에 대응되는 인체 골격을 디스플레이하는 단계; 또는, 촬영 인터페이스에서 추천 인체 포즈에 대응되는 인체 윤곽 및 진실 인체 포즈에 대응되는 인체 윤곽을 디스플레이하는 단계를 포함할 수 있다. 즉, 촬영 인터페이스에서 인체 골격 또는 인체 윤곽의 형태를 사용하여, 진실 인체 포즈 및 추천 인체 포즈를 디스플레이할 수 있다. 상기 방식을 통해, 사용자가 디스플레이된 추천 인체 포즈에 따라 포즈 조정을 수행하도록 안내하여, 추천 인체 포즈와 유사도가 비교적 높은 상태에 도달함으로써, 비교적 좋은 촬영 효과를 획득할 수 있다.
도 5는 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시하고, 도 5에 도시된 바와 같이, 인체 골격의 형태에 기반하여, 대상의 진실 인체 포즈 및 추천 인체 포즈를 디스플레이할 수 있고; 하나의 가능한 구현 방식에서, 진실 인체 포즈 및 추천 인체 포즈에 대해 상이한 디스플레이 형태를 사용하여 디스플레이를 수행할 수 있으며; 예시적으로, 황색으로 추천 인체 포즈를 나타내고, 녹색으로 진실 인체 포즈를 나타내는 것과 같이 상이한 색상을 사용하여 대상의 진실 인체 포즈 및 추천 인체 포즈를 각각 나타낼 수 있다. 하나의 가능한 구현 방식에서, 도 5에 도시된 바와 같이, 촬영 인터페이스에서 안내 정보를 디스플레이 할 수 있으며, 예컨대 진실 인체 포즈와 추천 인체 포즈 사이의 유사도가 30%인 것 및 사용자가 포즈를 조정하는 것을 안내하는 프롬프트 어구 “다른 동작을 시도하시겠습니까? 최대한 노란색 선과 일치하도록 해주세요”를 디스플레이할 수 있다.
이해해야 할 것은, 도 5에 도시된 진실 인체 포즈 및 추천 인체 포즈의 표현 형태는, 본 발명의 실시예에서 제공한 하나의 구현 방식이고, 본 발명은 이에 대해 한정하지 않으며, 실제에서, 본 분야의 통상의 기술자는 실제 요구에 따라 색상, 선이 굵고 가늘 정도, 선 타입 및 영역 투명도 등과 같은 진실 인체 포즈와 추천 인체 포즈의 디스플레이 형태 및 안내 정보의 내용을 설정할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 단계 S15에서, 상기 이미지 촬영 방법이 단말 기기에 의해 실행되는 경우, 촬영 조건이 촬영 인터페이스에서의 촬영 컨트롤러가 트리거링되는 것을 포함하는 것은, 촬영자가 도 2, 도 4 및 도 5에 도시된 바와 같은 촬영 인터페이스에서의 촬영 컨트롤을 클릭하여 사진 촬영 동작을 트리거링하여, 대상의 촬영 이미지를 획득하고 로컬 앨범에 저장하여, 체크하는 것으로 이해할 수 있다.
본 발명의 실시예에서, 시나리오 이미지의 시나리오 카테고리에 따라, 사용자에게 시나리오 카테고리에 대응되는 추천 인체 포즈를 추천할 수 있음으로써, 추천 인체 포즈가 시나리오 이미지에 매칭된 것으로 할 수 있고, 또한 촬영 인터페이스에서 진실 인체 포즈 및 추천 인체 포즈를 디스플레이하는 것을 통해, 사용자가 디스플레이된 추천 인체 포즈에 따라 포즈 조정을 수행하도록 안내하거나 사용자가 디스플레이된 추천 인체 포즈에 따라 촬영 대상이 포즈 조정을 수행하는 것을 용이하게 지도할 수 있어, 이미지 촬영 효과가 효과적으로 향상되고, 사용자의 촬영 체험이 향상되며, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하다.
전술한 바왁 같이, 추천 인체 포즈는 싱글 포즈를 포함할 수 있고, 하나의 가능한 구현 방식에서, 단계 S14에서, 촬영 인터페이스에서 진실 인체 포즈 및 추천 인체 포즈를 디스플레이하는 단계는,
대상이 시나리오 이미지에서의 위치에 따라, 촬영 인터페이스에서 진실 인체 포즈 및 싱글 포즈를 디스플레이하는 단계; 또는,
대상이 시나리오 이미지에서의 위치에 따라, 촬영 인터페이스에서 진실 인체 포즈를 디스플레이하고, 촬영 인터페이스의 제1 지정 영역에서 싱글 포즈를 디스플레이하는 단계를 포함할 수 있다.
이해해야 할 것은, 시나리오 이미지는 하나 또는 복수 개의 대상을 포함할 수 있다. 상기 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하는 단계는, 시나리오 이미지에 대해 인체 검출을 수행하여, 시나리오 이미지에서의 대상 및 대상의 인체 영역을 획득함으로써; 인체 영역 내의 대상에 대해 인체 키 포인트 검출을 수행하는 단계를 포함할 수 있다. 이해해야 할 것은, 인체 검출을 수행하여 시나리오 이미지에 대상이 포함되는지 여부, 포함된 대상의 개수 및 대상이 시나리오 이미지에서의 위치(즉 인체 영역이 시나리오 이미지에서의 위치) 등 정보를 획득할 수 있다.
추천 인체 포즈가 싱글 포즈인 것의 경우, 시나리오 이미지에 하나의 대상이 포함될 경우, 직접 상기 하나의 대상의 위치에 따라, 상기 대상의 진실 인체 포즈를 디스플레이할 수 있고; 시나리오 이미지에 복수 개의 대상이 포함될 경우, 기절성된 선택 규칙에 따라, 복수 개의 대상으로부터 대상을 선택하고, 상기 선택된 대상의 위치에 따라, 상기 선택된 대상의 진실 인체 포즈를 디스플레이할 수 있다.
하나의 가능한 구현 방식에서, 기절성된 선택 규칙은, 예컨대 시나리오 이미지의 중간 위치의 대상을 선택하는 것, 또는 단말 기기와의 거리가 제일 가까운 대상을 선택하는 것 등을 포함할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 여기서, 비행 시간 법(Time of flight, TOF)과 같은 본 분야에서 기지의 기술을 사용하여 대상과 단말 기기 사이의 거리를 획득할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
전술한 바와 같이, 인체 골격 또는 인체 윤곽의 형태에 기반하여, 진실 인체 포즈 및 추천 인체 포즈를 나타낼 수 있다. 하나의 가능한 구현 방식에서, 대상이 시나리오 이미지에서의 위치는, 시나리오 이미지 중 대상의 인체 골격 또는 인체 윤곽에서의 인체 키 포인트의 위치 좌표를 포함할 수 있고; 시나리오 이미지 중 대상의 인체 영역의 위치를 포함할 수도 있으며, 여기서, 상기 인체 검출을 통해 상기 대상의 인체 영역을 획득할 수 있다.
이해해야 할 것은, 상기 인체 키 포인트 검출을 통해, 인체 키 포인트의 위치 좌표를 획득할 수 있음으로써, 인체 키 포인트의 위치 좌표에 따라, 촬영 인터페이스에서 진실 인체 포즈를 디스플레이할 수 있다. 상기 방식을 통해, 촬영 인터페이스에서의 진실 인체 포즈는 대상의 위치에 따라 디스플레이할 수 있다.
하나의 가능한 구현 방식에서, 추천 인체 포즈의 경우, 대상에 따르는 위치에서 디스플레이하는 것으로 설정할 수 있으며, 즉 대상이 시나리오 이미지에서의 위치에 따라 추천 인체 포즈를 디스플레이 할 수 있고; 촬영 인터페이스에서의 제1 지정 영역에서 상기 추천 인체 포즈를 디스플레이하도록 설정할 수도 있으며, 즉 추천 인체 포즈를 촬영 인터페이스의 특정된 기설정된 영역에서 고정적으로 디스플레이할 수 있다.
하나의 가능한 구현 방식에서, 대상이 시나리오 이미지에서의 위치에 따라, 촬영 인터페이스에서 싱글 포즈를 디스플레이하는 단계는, 시나리오 이미지 중 대상의 인체 영역의 위치에 따라, 촬영 인터페이스의 상기 인체 영역에서 싱글 포즈를 디스플레이하는 단계를 포함할 수 있다. 상기 방식을 통해, 추천 인체 포즈가 대상의 위치에 따라 디스플레이하는 것을 비교적 간편하게 구현할 수 있어, 대상이 싱글 포즈와 진실 인체 포즈를 비교하는 것을 안내하여, 포즈 조정을 수행하는 것이 용이하다.
하나의 가능한 구현 방식에서, 대상이 시나리오 이미지에서의 위치에 따라, 촬영 인터페이스에서 싱글 포즈를 디스플레이하는 단계는 또한, 진실 인체 포즈에서의 어느 하나의 인체 키 포인트(예컨대 경부 키 포인트)의 위치 좌표에 따라, 촬영 인터페이스에서 싱글 포즈를 디스플레이하는 단계를 포함할 수도 있다. 상기 방식은, 싱글 포즈에서의 어느 하나의 인체 키 포인트와 진실 인체 포즈에서의 대응되는 인체 키 포인트를 중합하는 것으로 이해할 수 있으며, 예컨대, 두 개의 포즈에서의 경부 키 포인트가 중합되는 것으로 설정하고, 이 기초 위에서 싱글 포즈를 디스플레이함으로써, 싱글 포즈가 대상의 위치에 따라 디스플레이하는 것을 구현할 수 있다. 상기 방식을 통해, 싱글 포즈가 비교적 정확하게 대상의 위치에 따라 디스플레이하는 것을 구현하여, 사용자가 용이하게 싱글 포즈와 진실 인체 포즈를 비교할 수 있다.
설명해야 할 것은, 촬영 인터페이스에서 싱글 포즈를 디스플레이 하는 방식은, 본 발명의 실시예에서 제공한 일부 구현 방식이고, 실제에서, 본 발명은 이에 한정되지 않으며, 대상이 시나리오 이미지에서의 위치에 따라 싱글 포즈를 디스플레이 하는 구현 방식이라면, 모두 본 발명의 보호 범위 내에
하나의 가능한 구현 방식에서, 촬영 인터페이스에서의 제1 지정 영역은, 실제 요구에 따라 설정할 수 있으며, 예컨대, 촬영 인터페이스의 중간 영역, 좌측 영역, 우측 영역 및 4 개의 꼭짓점 영역 등일 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 촬영 인터페이스의 제1 지정 영역에서 싱글 포즈를 디스플레이하는 것을 통해, 추천 인체 포즈를 촬영 인터페이스에서 고정적으로 디스플레이할 수 있어, 추천 인체 포즈를 그리는데 필요되는 연산 자원을 절약할 수 있다.
여기서, 제1 지정 영역의 범위 크기의 경우, 싱글 포즈가 제1 지정 영역 내에서의 디스플레이 크기는, 실제 요구에 따라 설정할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
본 발명의 실시예에서, 대상이 싱글 포즈의 촬영을 완료하는 것을 효과적으로 안내할 수 있어, 촬영 체험이 향상되며, 또한 추천 인체 포즈가 고정적으로 디스플레이될 수 있고, 대상에 따라 디스플레이할 수 있어, 상이한 포즈 디스플레이 요구를 만족할 수 있다.
전술한 바와 같이, 추천 인체 포즈는 다인 조합 포즈를 포함하고, 하나의 가능한 구현 방식에서, 상기 방법은,
시나리오 이미지 중 복수 개의 대상 사이의 상대적 위치 및 다인 조합 포즈 중 각 포즈 사이의 상대적 위치에 따라, 다인 조합 포즈에서 각 대상에 대응되는 포즈를 각각 결정하는 단계를 더 포함한다. 상기 방식을 통해, 시나리오 이미지 중 각 대상이 다인 조합 포즈에서 각각 대응되는 포즈를 효과적으로 결정할 수 있음으로써, 각 대상이 복수 개의 조합 포즈를 완료하는 것을 용이하게 안내할 수 있다.
전술한 바와 같이, 시나리오 이미지는 하나 또는 복수 개의 대상을 포함할 수 있다. 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하는 단계는, 시나리오 이미지에 대해 인체 검출을 수행하여, 시나리오 이미지에서의 대상 및 대상의 인체 영역을 획득함으로써; 인체 영역 내의 대상에 대해 인체 키 포인트 검출을 수행하는 단계를 포함할 수 있다. 이해해야 할 것은, 인체 검출을 수행하여 시나리오 이미지에 대상이 포함되는지 여부, 포함된 대상의 개수 및 대상이 시나리오 이미지에서의 위치(즉 인체 영역이 시나리오 이미지에서의 위치) 등 정보를 획득할 수 있다.
추천 인체 포즈가 다인 조합 포즈인 것의 경우, 하나의 가능한 구현 방식에서, 시나리오 이미지 중 대상의 개수가, 다인 조합 포즈를 구현하는데 필요한 대상의 개수보다 작은 경우, 예컨대 음성 또는 문자 등 형태를 통해, 다인 조합 포즈를 구현하는 인수가 부족함을 사용자에게 프롬프트함으로써, 촬영되는 대상의 개수를 증가하는 것을 안내할 수 있고; 또는 다인 조합 포즈로부터 시나리오 이미지 중 대상의 개수에 부합되는 인체 포즈를 선택하고, 선택된 인체 포즈에 기반하여 대상에 대응되는 포즈를 결정할 수 있다.
여기서, 다인 조합 포즈로부터 시나리오 이미지 중 대상의 개수에 부합되는 인체 포즈를 선택하는 것은, 예컨대, 대상의 개수에 부합되는 인체 포즈를 랜덤으로 선택할 수 있고, 기절성된 선택 전략에 따라, 대상의 개수에 부합되는 인체 포즈를 선택할 수도 있으며, 선택 전략은 예컨대 왼쪽으로부터 오른쪽으로, 위에서부터 아래로의 순서에 따라 선택하는 것을 포함할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
이해해야 할 것은, 선택된 인체 포즈가 하나인 경우, 선택된 인체 포즈를 대상에 대응되는 포즈로 사용할 수 있고; 선택된 인체 포즈가 복수 개인 경우, 복수 개의 선택된 인체 포즈 사이의 상대적 위치에 따라, 각 대상에 대응되는 포즈를 결정할 수 있다.
시나리오 이미지 중 대상의 개수가, 다인 조합 포즈를 구현하는데 필요한 대상의 개수보다 크거나 같을 경우, 시나리오 이미지 중 복수 개의 대상 사이의 상대적 위치 및 다인 조합 포즈 중 각 포즈 사이의 상대적 위치에 따라, 다인 조합 포즈로부터 각 대상에 대응되는 포즈를 각각 결정할 수 있다. 여기서, 상대적 위치는 예컨대 전후 위치, 좌우 위치, 상하 위치 등을 포함할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
예를 들면, 도 6은 본 발명의 실시예에 따른 시나리오 이미지의 예시도를 도시한다. 도 6에 도시된 바와 같이, 시나리오 이미지는 대상(A), 대상(B) 및 대상(C)을 포함하고, 현재의 추천 인체 포즈는 예컨대 도 3에 도시된 다인 조합 포즈(즉 “손 하트”포즈임)이다. 이때, 대상(A), 대상(B) 및 대상(C) 사이의 상대적 위치 및 다인 조합 포즈 중 포즈(m) 및 포즈(n) 사이의 상대적 위치에 따라, 대상(A) 및 대상(B)가 각각 포즈(m) 및 포즈(n)에 대응되는 것을 획득할 수 있고, 즉 대상(A)에 대응되는 포즈가 “포즈 m”이고, 대상 B에 대응되는 포즈가 “포즈 n”인 것을 결정할 수 있으며, 대상(A)와 대상(B) 사이의 상대적 위치가, 도 3에 도시된 다인 조합 포즈를 완료하는데 더욱 적합한 것으로 이해할 수 있다.
추천 인체 포즈가 다인 조합 포즈이고, 다인 조합 포즈로부터 각 대상에 대응되는 포즈를 각각 결정한 경우, 하나의 가능한 구현 방식에서, 단계 S14에서, 촬영 인터페이스에서 진실 인체 포즈 및 추천 인체 포즈를 디스플레이하는 단계는,
어느 하나의 대상의 경우, 대상이 시나리오 이미지에서의 위치에 따라, 촬영 인터페이스에서 대상의 진실 인체 포즈 및 대상에 대응되는 포즈를 디스플레이하는 단계; 또는, 대상이 시나리오 이미지에서의 위치에 따라, 촬영 인터페이스에서 대상의 진실 인체 포즈를 디스플레이하고, 촬영 인터페이스의 제2 지정 영역에서 대상에 대응되는 포즈를 디스플레이하는 단계를 포함한다.
여기서, 복수 개의 대상에서의 어느 하나의 대상의 경우, 상기 대상이 시나리오 이미지에서의 위치에 따라, 촬영 인터페이스에서 상기 대상의 진실 인체 포즈를 디스플레이하는 단계는, 상기 본 발명의 실시예에서 개시된 내용을 참조할 수 있다.
하나의 가능한 구현 방식에서, 복수 개의 대상에서의 어느 하나의 대상의 경우, 상기 대상이 시나리오 이미지에서의 위치에 따라, 촬영 인터페이스에서 상기 대상에 대응되는 포즈를 디스플레이하는 단계는, 상기 본 발명의 실시예에서 대상이 시나리오 이미지에서의 위치에 따라 촬영 인터페이스에서 싱글 포즈를 디스플레이하는 것을 구현하는 방식과 동일할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 상기 방식을 통해, 복수 개의 대상에서의 각 대상의 경우, 각 대상에 대응되는 포즈가 각 대상의 위치에 따라 디스플레이하는 것을 구현할 수 있음으로써, 각 대상이 각각에 대응되는 포즈와 진실 인체 포즈를 비교하는 것을 안내하여, 포즈 조정을 수행하는데 용이하다.
하나의 가능한 구현 방식에서, 촬영 인터페이스에서의 제2 지정 영역은, 실제 요구에 따라 설정할 수 있고, 예컨대, 촬영 인터페이스의 중간 영역, 좌측 영역, 우측 영역 및 4 개의 꼭짓점 영역 등일 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 촬영 인터페이스의 제2 지정 영역에서 대상에 대응되는 포즈를 디스플레이하는 것을 통해, 추천 인체 포즈를 촬영 인터페이스에서 고정적으로 디스플레이할 수 있어, 추천 인체 포즈를 그리는데 필요되는 연산 자원을 절약할 수 있다.
이해해야 할 것은, 제1 지정 영역과 제2 지정 영역은 상이할 수 있거나 동일할 수 있으며; 제2 지정 영역은 복수 개의 영역을 포함할 수 있고, 복수 개의 영역에서 다인 조합 포즈 중 각 포즈를 각각 디스플레이할 수 있으며; 제2 지정 영역은 하나의 영역을 포함할 수도 있고, 상기 하나의 영역 내에서 상기 다인 조합 포즈를 디스플레이할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 도 7은 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시하고, 도 7에 도시된 바와 같이, 제2 지정 영역에서 다인 조합 포즈를 디스플레이하고, 각 대상이 시나리오 이미지에서의 위치에 따라, 촬영 인터페이스에서 각 대상의 진실 인체 포즈를 디스플레이할 수 있다.
여기서, 제2 지정 영역의 범위 크기의 경우, 대응되는 포즈가 제2 지정 영역 내에서 디스플레이되는 크기는, 실제 요구에 따라 설정할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
본 발명의 실시예에서, 복수 개의 대상이 다인 조합 포즈를 공동으로 완료하는 것을 효과적으로 안내할 수 있어, 촬영 체험이 향상되고, 또한 추천 인체 포즈가 고정적으로 디스플레이할 수 있고, 대상에 따라 디스플레이할 수 있어, 상이한 포즈 디스플레이 요구를 만족할 수 있다.
대상이 포즈를 조정할 경우, 양팔의 포즈가 추천 인체 포즈에 접근(즉 유사도가 높음)하고, 양다리의 포즈가 추천 인체 포즈에 접근하지 않은 것(즉 유사도가 낮음)과 같이, 일부 인체 부위의 포즈가, 추천 인체 포즈에 접근하고, 일부 인체 부위의 포즈가 추천 인체 포즈에 접근하지 않은 경우를 고려하였다.
사용자가 포즈를 조정하는 것을 더욱 효과적으로 안내하기 위해, 디스플레이된 진실 인체 포즈 중 유사도가 낮은 인체 부위에 대해 강조 디스플레이를 수행할 수 있다. 하나의 가능한 구현 방식에서, 상기 방법은,
진실 인체 포즈의 제1 인체 키 포인트와, 추천 인체 포즈의 제2 인체 키 포인트 사이의 키 포인트 쌍을 결정하는 단계; 및 키 포인트 쌍의 제1 유사도를 계산하는 것을 통해, 제1 인체 키 포인트로부터 제1 유사도가 제1 기설정된 임계값보다 작은 제3 인체 키 포인트를 결정하는 단계를 더 포함하고;
여기서, 단계 S13에서, 촬영 인터페이스에서 진실 인체 포즈 및 추천 인체 포즈를 디스플레이하는 단계는,
제3 인체 키 포인트가 위치한 영역을 강조 디스플레이하는 단계를 포함하며, 여기서, 강조 디스플레이의 방식은 하이라이트, 굵게 하기 및 색상 변경 중 적어도 하나를 포함한다.
하나의 가능한 구현 방식에서, 용이하게 진실 인체 포즈와 추천 인체 포즈를 비교하기 위해, 진실 인체 포즈의 제1 인체 키 포인트와 추천 인체 포즈의 제2 인체 키 포인트는 대응될 수 있으며, 예컨대, 진실 인체 포즈의 제1 인체 키 포인트는 20 개의 인체 관절 부위키 포인트를 포함하고, 추천 인체 포즈의 제2 인체 키 포인트도 대응되게 20 개의 인체 관절 부위키 포인트를 포함한다. 이에 기반하여, 진실 인체 포즈의 제1 인체 키 포인트와 추천 인체 포즈의 제2 인체 키 포인트로부터, 키 포인트 쌍을 결정할 수 있으며, 예컨대, 제1 인체 키 포인트에서의 왼쪽 어깨 키 포인트와, 제2 인체 키 포인트에서의 왼쪽 어깨키 포인트는 한 쌍의 키 포인트 쌍이고, 20 개의 인체 관절 부위키 포인트로부터, 20 개의 키 포인트 쌍을 결정할 수 있다.
하나의 가능한 구현 방식에서, 진실 인체 포즈의 제1 인체 키 포인트는 식별자를 캐리할 수 있고, 추천 인체 포즈의 제2 인체 키 포인트도 식별자를 캐리할 수 있다. 이해해야 할 것은, 식별자는 인체의 상이한 관절 부위 또는 상이한 윤곽 위치에서의 키 포인트를 지시하기 위한 것일 수 있고, 두 개의 포즈가 캐리한 동일한/유사한 식별자를 통해, 진실 인체 포즈의 제1 인체 키 포인트와, 추천 인체 포즈의 제2 인체 키 포인트 사이의 키 포인트 쌍를 용이하게 결정할 수 있다.
설명해야 할 것은, 식별자를 통해 키 포인트 쌍을 결정하는 방식은, 본 발명의 실시예에서 공개한 하나의 구현 방식이고, 실제에서, 본 분야의 통상의 기술자는 임의의 기지의 방식을 사용하여, 제1 인체 키 포인트와 제2 인체 키 포인트 사이의 키 포인트 쌍을 결정할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 키 포인트 쌍의 제1 유사도는, 키 포인트 쌍 중 두 개의 키 포인트 사이의 거리(유크리드 거리, 코사인 거리 등)를 나타내기 위한 것일 수 있고, 거리의 편차를 나타내기 위한 것일 수도 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 여기서, 제1 유사도와 거리 또는 제1 유사도와 거리의 편차가 역상관되도록 설정할 수 있고, 즉, 거리 또는 거리의 편차가 작을 수록, 제1 유사도가 더욱 높다. 이해해야 할 것은, 키 포인트 쌍의 개수는, 제1 유사도의 개수와 일치하고, 즉 각 키 포인트 쌍은 각각의 제1 유사도에 각각 대응된다.
여기서, 거리의 편차는, 어느 하나의 키 포인트 쌍의 거리와, 모든 키 포인트 쌍의 거리의 편균값 사이의 차이값으로 이해할 수 있으며, 예컨대, 20 개의 키 포인트 쌍의 거리의 평균값이 X이고, 키 포인트 쌍(a)의 거리가 x일 경우, 키 포인트 쌍(a)의 거리의 편차는 “x-X”이며, 즉 “x-X”로 키 포인트 쌍(a)의 제1 유사도를 나타낼 수 있다.
하나의 가능한 구현 방식에서, 추천 인체 포즈의 디스플레이 방식에 따라, 즉 대상에 따라 디스플레이하거나 고정적으로 디스플레이하는 것에 따라 거리를 사용하여 제1 유사도를 나태낼지 또는 거리의 편차를 사용하여 제1 유사도를 나태낼지를 선택할 수 있다. 예컨대, 추천 인체 포즈가 대상에 따라 디스플레이되는 경우, 거리를 사용하여 제1 유사도를 나타낼 수 있고; 추천 인체 포즈가 촬영 인터페이스에서 고정적으로 디스플레이되는 경우, 거리의 편차를 사용하여 제1 유사도를 나타낼 수 있다.
이해해야 할 것은, 추천 인체 포즈가 촬영 인터페이스에서 고정적으로 디스플레이되는 경우, 대상이 시나리오 이미지에서의 위치가 변경될 수 있어, 거리를 사용하여 키 포인트 쌍의 제1 유사도를 정확하게 나태낼 수 없으며, 이는 어느 하나의 키 포인트 쌍의 거리가 먼 것이, 상기 키 포인트 쌍이 유사하지 않는 것을 의미하는 것이 아니라, 진실 인체 포즈 및 추천 인체 포즈의 전체 거리가 먼 원인일 수 있으며, 이때 거리의 편차를 사용하면, 각 키 포인트 쌍의 제1 유사도를 비교적 정확하게 반영할 수 있다.
하나의 가능한 구현 방식에서, 제1 기설정된 임계값은 실제 요구 및 제1 유사도의 계산 방식 등에 따라 결정할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 제1 유사도가 제1 기설정된 임계값보다 작은 것은, 상기 제1 유사도에 대응되는 키 포인트 쌍의 유사 정도가 낮은 것을 의미할 수 있고, 즉, 상기 키 포인트 쌍이 나태낸 인체 부위의 일부 포즈와 추천 인체 포즈의 유사도가 낮을 것을 의미할 수 있으며; 제1 유사도가 제1 기설정된 임계값보다 크거나 같은 것은, 상기 제1 유사도에 대응되는 키 포인트 쌍의 유사 정도가 높은 것을 의미할 수 있으며, 즉, 상기 키 포인트 쌍이 나타낸 인체 부위의 일부 포즈와 추천 인체 포즈의 유사도가 높은 것을 의미할 수 있다.
하나의 가능한 구현 방식에서, 키 포인트 쌍의 제1 유사도를 계산하는 것을 통해, 제1 인체 키 포인트로부터 제1 유사도가 제1 기설정된 임계값보다 작은 제3 인체 키 포인트를 결정하는 단계는, 키 포인트 쌍의 제1 유사도를 계산하는 것을 통해, 키 포인 쌍으로부터 제1 유사도가 제1 기설정된 임계값보다 작은 타깃 키 포인트 쌍을 결정하고, 타깃 키 포인트 쌍에서의 제1 인체 키 포인트를 제3 인체 키 포인트로 사용하는 단계, 즉 제1 인체 키 포인트로부터 제1 유사도가 제1 기설정된 임계값보다 작은 제3 인체 키 포인트를 결정하는 것을 구현하는 단계를 포함할 수 있다.
하나의 가능한 구현 방식에서, 제3 인체 키 포인트가 위치한 영역을 강조 디스플레이하는 것은, 상기 제3 인체 키 포인트가 촬영 인터페이스에서 점유한 영역을 강조 디스플레이하는 것으로 이해할 수 있다. 예를 들면, 도 4에 도시된 바와 같은 진실 인체 포즈에서 솔리드 원으로 인체 관절 부위를 나타내면, 솔리드 원이 점유한 영역이 제3 인체 키 포인트가 위치한 영역일 수 있다.
이해해야 할 것은, 강조 디스플레이의 방식이 하이라이트, 굵게 하기 및 색상 변경 중 적어도 하나를 포함하는 것은, 본 발명의 실시예에서 제공한 일부 구현 방식이고, 실제에서, 본 분야의 통상의 기술자 실제 요구에 따라 상이한 강조 디스플레이의 방식을 설계할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 여기서, 색상 변경은, 예컨대 녹색으로 디스플레이된 진실 인체 포즈에서의 제3 인체 키 포인트를 빨간 색으로 변경하는 것일 수 있고, 본 발명의 실시예는 이에 대해 한정하지 않는다.
도 8은 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시하고, 도 8에 도시된 바와 같이, 굵게 하기의 방식을 통해 유사도가 비교적 낮은 무릎 관절 부위의 키 포인트(80)를 나타낼 수 있고, 여기서, 또한 상기 무릎 관절 부위의 키 포인트(80)에 대응되는 연결선(81, 82)(즉 다리 부분을 나타내는 연결선)을 굵게 할 수도 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
본 발명의 실시예에서, 디스플레이된 진실 인체 포즈 중 유사도가 낮은 인체 부위에 대해, 강조 디스플레이를 수행함으로써, 사용자가 포즈를 조정하는 것을 더욱 효과적으로 안내하여, 촬영 체험이 향상될 수 있다.
전술한 바와 같이, 촬영 인터페이스에서 진실 인체 포즈와 추천 인체 포즈 사이의 유사도를 디스플레이하여, 대상이 포즈 조정을 수행하도록 안내할 수 있다. 하나의 가능한 구현 방식에서, 상기 방법은,
진실 인체 포즈와 추천 인체 포즈 사이의 키 포인트 쌍의 제1 유사도에 따라, 진실 인체 포즈와 추천 인체 포즈 사이의 제2 유사도를 결정하는 단계 - 키 포인트 쌍은 진실 인체 포즈의 제1 인체 키 포인트 및 추천 인체 포즈의 제2 인체 키 포인트에 따라 결정된 것임 - ; 및
촬영 인터페이스에서 제2 유사도를 디스플레이하는 단계를 더 포함한다.
여기서, 키 포인트 쌍의 결정 방식은, 상기 본 발명의 실시예를 참조할 수 있다.
전술한 바와 같이, 키 포인트 쌍의 제1 유사도는 키 포인트 쌍의 거리 또는 거리의 편차를 사용하여 나타낼 수 있다. 하나의 가능한 구현 방식에서, 키 포인트 쌍의 제1 유사도에 따라, 진실 인체 포즈와 추천 인체 포즈 사이의 제2 유사도를 결정하는 단계는, 모든 키 포인트 쌍의 거리의 누적값, 평균값, 분산 또는 표준차에 따라, 제2 유사도를 결정하는 단계를 포함할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
여기서, 거리의 누적값, 평균값, 분산 또는 표준차는, 제2 유사도와 역상관을 가질 수 있으며, 즉, 거리의 누적값, 평균값, 분산 또는 표준차 등이 작을 수록, 제2 유사도가 더욱 높은 것을 대표하고; 거리의 누적값, 평균값, 분산 또는 표준차 등이 클 수록, 제2 유사도가 더욱 낮은 것을 대표한다. 이해해야 할 것은, 제2 유사도는 진실 인체 포즈와 추천 인체 포즈 사이의 전체적인 유사 정도를 반영할 수 있다.
하나의 가능한 구현 방식에서, 대상이 용이하게 제2 유사도의 높고 낮음 이해하기 위해, 즉 용이하게 유사 정도의 높고 낮음을 이해하기 위해, 제2 유사도는 백분비 형태로 촬영 인터페이스에서 디스플레이될 수 있다. 이에 기반하여, 거리의 누적값, 평균값, 분산 또는 표준차와, 제2 유사도 사이에 맵핑 관계가 존재하는 것으로 설정함으로써, 상기 맵핑 관계에 따라, 거리의 누적값, 평균값, 분산 또는 표준차를, 백분비 형태의 제2 유사도로 맵핑할 수 있다.
여기서, 본 분야의 통상의 기술자는 임의의 기지의 방식을 사용하여, 거리의 누적값, 평균값, 분산 또는 표준차와, 제2 유사도 사이의 맵핑 관계를 설정할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 촬영 인터페이스에서 제2 유사도를 디스플레이하며, 예컨대 도 5 및 도 8에 되시된 방식을 통해, 제2 유사도를 디스플레이할 수 있다. 이해해야 할 것은, 본 분야의 통상의 기술자는 실제 요구에 따라 제2 유사도의 디스플레이 방식을 설계할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 뉴럴 네트워크를 통해 진실 인체 포즈와 추천 인체 포즈 사이의 제2 유사도를 획득할 수 있으며, 즉 진실 인체 포즈에 대응되는 제1 인체 키 포인트와 추천 인체 포즈에 대응되는 제2 인체 키 포인트를 뉴럴 네트워크에 입력하여, 제2 유사도를 출력할 수 있다. 여기서, 제1 인체 키 포인트 및 제2 인체 키 포인트는 벡터 또는 매트릭스의 형태로, 뉴럴 네트워크에 입력될 수 있다. 상기 뉴럴 네트워크의 네트워크 타입, 네트워크 구조 및 훈련 방식에 대해서, 본 발명의 실시예는 한정하지 않는다.
본 발명의 실시예에서, 진실 인체 포즈와 추천 인체 포즈 사이의 전체적인 유사 정도를 디스플레이할 수 있어, 사용자가 전체적인 유사도에 따라 포즈를 조정하는 것을 효과적으로 안내하므로, 촬영 체험이 향상된다.
전술한 바와 같이, 단계 S15에서, 촬영 조건을 만족하는 경우, 대상의 촬영 이미지를 획득한다. 하나의 가능한 구현 방식에서, 촬영 조건은 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도가 제2 기설정된 임계값보다 크거나 같은 것을 포함할 수 있다. 상기 방식을 통해, 진실 인체 포즈와 추천 인체 포즈의 유사도가 비교적 높은 경우, 촬영 동작을 자동으로 트리거링하여, 촬영 이미지를 획득하고 로컬 앨범에 저장하여, 대상이 체크하는 것을 구현할 수 있다.
하나의 가능한 구현 방식에서, 상기 이미지 촬영 방법이 서버에 의해 실행되는 경우, 서버는 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도가 제2 기설정된 임계값보다 작거나 같은 경우, 단말 기기에 촬영 명령어를 송신하고, 촬영 명령어를 통해 단말 기기가 촬영 동작을 수행하는 것을 트리거링하여, 촬영 이미지를 획득할 수 있다. 상기 이미지 촬영 방법이 단말 기기에 의해 실행되는 경우, 단말 기기는 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도가 제2 기설정된 임계값보다 크거나 같은 경우, 촬영 동작을 자동으로 트리거링하여, 촬영 이미지를 획득할 수 있다.
여기서, 제2 기설정된 임계값은, 실제 요구에 따라 설정할 수 있고, 예컨대, 80%로 설정할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 이해해야 할 것은, 촬영 조건은 촬영 인터페이스에서의 촬영 컨트롤러가 트리거링되는 것을 포함할 수도 있으며, 즉, 촬영자가 사진 촬영 동작을 수동으로 수행한다.
대상이 실제 시나리오에서의 스탠스가 비교적 좋거나, 또는 대상이 시나리오 이미지에서 위치한 위치가 비교적 적합한 경우, 구도가 더욱 조화롭고, 보기 좋은 것과 같은 촬영 이미지가 비교적 좋은 시각 효과를 표시할 수 있는 것을 고려하였다. 하나의 가능한 구현 방식에서, 상기 방법은,
시나리오 이미지를 영역 추천 네트워크에 입력하여, 시나리오 이미지의 사진 촬영 추천 영역을 획득하는 단계를 더 포함하고, 사진 촬영 추천 영역은 시나리오 이미지에서 사진 촬영을 추천하는 영역을 나타내기 위한 것이고, 영역 추천 네트워크는 사진 촬영 영역을 태깅하는 제1 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이며;
여기서, 시나리오 이미지의 사진 촬영 추천 영역을 획득한 후, 상기 방법은,
촬영 인터페이스에서, 표지 심볼을 사용하여 사진 촬영 추천 영역을 지시하는 단계; 및
촬영 인터페이스의 사진 촬영 추천 영역에서 추천 인체 포즈를 디스플레이하는 단계 중 적어도 하나를 더 포함하며, 사진 촬영 추천 영역은 대상이 사진 촬영 추천 영역에 따라 위치 조정을 수행하도록 안내하기 위한 것이다.
여기서, 영역 추천 네트워크는 콘볼루션 뉴럴 네트워크 등과 같은 기지의 뉴럴 네트워크를 사용할 수 있으며, 영역 추천 네트워크의 네트워크타입, 네트워크 구조 및 훈련 방식에 대해, 본 발명의 실시예는 한정하지 않는다.
하나의 가능한 구현 방식에서, 제1 샘플 세트의 샘플 이미지는 시각 효과가 비교적 우수한 이미지일 수 있다. 시각 효과가 비교적 우수한 제1 샘플 세트로부터 사진 촬영 추천 영역을 학습하는 것을 통해, 대상이 위치를 조정하여 촬영 이미지의 시각 효과를 향상시키는 것을 안내함으로써, 사용자 촬영 체험을 향상시킬 수 있다.
여기서, 제1 샘플 세트의 샘플 이미지 중 인체가 위치한 영역은, 태깅된 사진 촬영 영역일 수 있다. 이해해야 할 것은, 기지의 태깅 기술을 사용하여, 제1 샘플 세트의 샘플 이미지 중 인체 영역에 대한 태깅을 구현할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 사진 촬영 추천 영역을 지시하기 위한 표지 심볼은, 캐릭터 및 도형 중 적어도 하나의 임의의 형태로 촬영 인터페이스에서 디스플레이될 수 있음으로써, 사용자 대상이 사진 촬영 추천 영역에 따라 위치 조정을 수행하도록 안내할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 도 9는 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시하고, 도 9에 도시된 바와 같이, 도형 및 프롬프트 어구 “추천 스탠스” 등 형태를 통해 사진 촬영 추천 영역를 지시할 수 있다.
전술한 바와 같이, 추천 인체 포즈는 촬영 인터페이스의 지정 영역(상기 제1 지정 영역 또는 제2 지정 영역)에서 고정적으로 디스플레이될 수 있다. 하나의 가능한 구현 방식에서, 촬영 인터페이스의 사진 촬영 추천 영역에서 추천 인체 포즈를 디스플레이할 수 있고, 즉, 추천 인체 포즈를 사용하여 사진 촬영 추천 영역을 지시할 수 있다. 이해해야 할 것은, 상기 제1 지정 영역 또는 제2 지정 영역은 사진 촬영 추천 영역을 포함할 수 있다. 상기 방식을 통해, 대상이 사진 촬영 추천 영역에 따라 위치 조정을 수행하는 것을 효과적으로 안내할 수 있고, 대상이 용이하게 추천 인체 포즈에 따라 포즈 조정을 수행할 수 있다.
이해해야 할 것은, 표지 심볼 및 추천 인체 포즈를 동시에 사용하여 사진 촬영 추천 영역을 지시할 수 있고, 다만 표지 심볼 또는 추천 인체 포즈를 사용하여 사진 촬영 추천 영역을 지시할 수도 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 표지 심볼을 사용하여 사진 촬영 추천 영역을 지시하고, 검출된 시나리오 이미지 중 대상이 사진 촬영 추천 영역 내에 위치한 경우, 상기 표지 심볼을 검출할 수 있음으로써, 촬영 인터페이스가 더욱 간결할 수 있다. 여기서, 대상이 사진 촬영 추천 영역 내에 위치하는지 여부를 판단하는 것은, 시나리오 이미지 중 대상의 인체 영역의 위치에 따라 결정할 수 있고, 인체 키 포인트의 위치 좌표에 따라 결정할 수도 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
본 발명의 실시예에서, 대상에 추천 시각 효과가 비교적 좋은 사진 촬영 영역을 추천할 수 있어, 대상이 위치를 조정하는 것을 효과적으로 안내하여 촬영 이미지의 시각 효과를 향상시킴으로써, 사용자 촬영 체험을 향상시킬 수 있다.
전술한 바와 같이, 포즈 추천 네트워크를 통해 시나리오 이미지를 식별하여, 시나리오 이미지에 대응되는 시나리오 카테고리 및 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정할 수 있다. 하나의 가능한 구현 방식에서, 단계 S12에서, 시나리오 이미지를 식별하여, 시나리오 이미지에 대응되는 시나리오 카테고리 및 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하는 단계는,
포즈 추천 네트워크시나리오 이미지를 식별하는 것을 통해, 시나리오 이미지에 대응되는 시나리오 카테고리 및 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하는 단계를 포함하고, 여기서, 포즈 추천 네트워크는 태깅된 샘플 시나리오 카테고리 및 샘플 인체 포즈의 제2 샘플 세트를 훈련하여 획득된 뉴럴 네트워크이고, 제2 샘플 세트는 대상이 업로드한 샘플 이미지를 포함한다.
여기서, 포즈 추천 네트워크는 콘볼루션 뉴럴 네트워크, 잔차 뉴럴 네트워크 등 기지의 뉴럴 네트워크를 사용할 수 있다. 전술한 바와 같이, 포즈 추천 네트워크의 네트워크 타입, 네트워크 구조 및 훈련 방식 등에 대해서, 본 발명의 실시예는 한정하지 않는다.
전술한 바와 같이, 셀프 모니터링의 훈련 방식을 사용하여, 포즈 추천 네트워크가 상이한 시나리오 타입에서의 추천 인체 포즈를 학습할 수 있고, 즉, 시나리오 타입과 추천 인체 포즈 사이의 대응 관계를 학습함으로써, 상기 포즈 추천 네트워크를 이용하여 시나리오 이미지에 기반하여 추천 인체 포즈를 출력할 수 있다.
이해해야 할 것은, 제1 샘플 세트와 제2 샘플 세트는 동일한 샘플 세트일 수 있고, 상이한 샘플 세트일 수도 있으며, 제1 샘플 세트 및 제2 샘플 세트 중 샘플 이미지의 출처에 대해서, 본 발명의 실시예는 한정하지 않는다.
여기서, 기지의 태깅 기술을 사용하여, 제2 샘플 세트의 샘플 이미지 중 샘플 시나리오 카테고리 및 샘플 인체 포즈에 대한 태깅을 구현할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
하나의 가능한 구현 방식에서, 이미지 촬영 방법을 구현하는 애플리케이션 프로그램 또는 이미지 촬영 방법을 구현하는 촬영 모드에서 또한, 샘플 이미지를 업로드하기 위한 업로드 기능을 더 제공할 수 있고, 상기 샘플 이미지는 사용자가 이미 촬영한 이미지 중 효과가 비교적 좋은 이미지일 수 있다. 상기 방식을 통해, 포즈 추천 네트워크를 훈련하기 위한 제2 샘플 세트가 더욱 풍부해질 수 있어, 훈련하여 획득된 포즈 추천 네트워크가, 시나리오 이미지에 기반하여 더욱 정확하게 추천 인체 포즈를 출력할 수 있다.
이해해야 할 것은, 사용자가 업로드한 샘플 이미지는 사용자가 그랜팅되어 백그라운드에 진입하여 포즈 추천 네트워크를 훈련하는 이미지일 수 있으므로, 사용자가 업로드한 샘플 이미지는 다만 백그라운드에서만 볼 수 있고, 다른 사용자에게 보이는 것은 모두 처리된 추천 인체 포즈 및 대응되는 포즈 맵(예컨대 포즈 맵에서 사람 얼굴이 감추어지거나 사람 얼굴이 교체되거나 인물이 교체된 것)임으로써, 사용자 프라이버시 안전을 보장할 수 있으며, 여기서, 포즈 맵은 상이한 추천 인체 포즈를 선택하기 위한 것일 수 있다.
여기서, 본 분야의 기지의 기술을 사용하여, 애플리케이션 프로그램 및 촬영 모드 중 적어도 하나에서 상기 이미지 업로드 기능을 구현할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
이해해야 할 것은, 포즈 추천 네트워크의 훈련 과정은 서버에서 수행될 수 있다. 하나의 가능한 구현 방식에서 샘플 이미지는 서버에 업로드되어 제2 샘플 세트를 확장할 수 있고, 제2 샘플 세트에 기반하여 포즈 추천 네트워크를 주기적으로 재훈련하여, 새로운 버전의 포즈 추천 네트워크를 획득할 수 있음으로써, 단말 기기 중 이미 배치된 포즈 추천 네트워크를 업데이트할 수 있다. 상기 방식을 통해, 포즈 추천 네트워크가 풍부한 인체 포즈를 학습할 수 있음으로써, 훈련하여 획득된 포즈 추천 네트워크가 출력한 추천 인체 포즈가 더욱 전면적이고, 더욱 풍부할 수 있다.
하나의 가능한 구현 방식에서, 단말 기기에 이미 배치된 포즈 추천 네트워크의 재훈련 과정은, 단말 기기에서 수행될 수 있고, 즉, 대상이 업로드한 샘플 이미지를 직접 이용하여, 단말 기기에 이미 배치된 포즈 추천 네트워크에 대해 증분 훈련을 수행할 수 있다. 상기 방식을 통해, 이미 배치된 포즈 추천 네트워크가 출력한 추천 인체 포즈가, 대상의 선호에 더욱 가깝고, 타깃성을 구비할 수 있다.
이해해야 할 것은, 제2 샘플 세트는 촬영 효과가 비교적 우수한 고품질 이미지일 수 있고, 본 발명의 실시예에서, 포즈 추천 네트워크가 고품질 이미지로부터 인체 포즈를 학습함으로써, 시나리오 이미지에 기반하여 고품질의 추천 인체 포즈를 효과적으로 출력하여, 촬영 대상이 고품질 추천 인체 포즈에 접근하는 것을 안내함으로써, 비교적 좋은 촬영 효과를 획득하여, 사용자 촬영 체험이 향상될 수 있다.
전술한 바와 같이, 추천 인체 포즈는 복수 개를 포함하고, 대상이 상이한 추천 인체 포즈를 용이하게 선택하거나 스위칭하기 위해, 하나의 가능한 구현 방식에서, 상기 방법은,
촬영 인터페이스에서 복수 개의 추천 인체 포즈에 대응되는 포즈 맵을 디스플레이하는 단계; 및
포즈 맵에 대한 선택 동작에 응답하여, 선택된 포즈 맵에 따라, 선택된 포즈 맵에 대응되는 추천 인체 포즈를 결정하고 디스플레이하는 단계를 더 포함한다.
도 10은 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시하고, 도 10에 도시된 바와 같이, 촬영 인터페이스에서 복수 개의 포즈 맵이 전시될 수 있고, 또한 식별된 시나리오 특징 “창틀, 벽” 및 대상 특징 “스웨터, 롱 팬츠, 핸드백”이 전시되어, 재미를 향상시킬 수도 있다. 여기서, 상기 본 발명의 실시예 중 시나리오 이미지를 식별하는 방식을 참조하여, 식별된 시나리오 특징 및 대상 특징을 획득할 수 있다. 이해해야 할 것은, 촬영 인터페이스에서 또한 복수 개의 포즈 맵을 체크하기 위한 슬라이딩 컨트롤을 제공하여, 슬라이딩 동작을 통해 현재 촬영 인터페이스에서 디스플레이 되지 않은 다른 포즈 맵을 체크할 수도 있다.
하나의 가능한 구현 방식에서, 디스플레이된 포즈 맵은 축약도일 수 있으며, 추천 인체 포즈에 대응되는 프리뷰도 및 예시도 등으로 이해할 수 있다. 이해해야 할 것은, 포즈 맵은 추천 인체 포즈에 대응되고, 선택된 어느 하나의 포즈 맵에 따라, 대응되는 추천 인체 포즈를 획득할 수 있다.
하나의 가능한 구현 방식에서, 포즈 맵에 대한 선택 동작은, 예컨대 포즈 맵을 슬라이딩 체크하는 것 및 어느 하나의 포즈 맵을 클릭하여 선택하는 것 등 동작을 포함할 수 있다. 여기서, 선택된 포즈 맵이 강조 디스플레이되어, 우호한 인간-기계 인터페이스를 구현할 수 있다.
전술한 바와 같이, 디스플레이의 포즈 맵은 축약도일 수 있고, 하나의 가능한 구현 방식에서, 도 10에 도시된 바와 같은 촬영 인터페이스에서 어느 하나의 포즈 맵을 선택한 후, 촬영 인터페이스에서 상기 포즈 맵에 대응되는 확대도를 디스플레이하여, 대상이 포즈 맵을 더욱 명확하게 체크할 수 있다.
도 11a 및 도 11b는 본 발명의 실시예에 따른 촬영 인터페이스의 예시도를 도시한다. 도 11a에 도시된 바와 같이, 중간 영역에 디스플레이되는 것은 선택된 포즈 맵에 대응되는 확대도일 수 있고, 여기서, 확대도를 길게 눌르는 것 및 확대도를 두번 클릭하는 것 등 동작에 응답하여, 도 11b에 도시된 바와 같은 화대도에서 상기 포즈 맵에 대응되는 추천 인체 포즈를 프리뷰할 수 있다.
하나의 가능한 구현 방식에서, 도 11a 및 도 11b에서 도시된 “같은 스타일로 촬영” 버튼을 클릭하는 것을 통해, 선택된 포즈 맵 및 대응되는 추천 인체 포즈를 결정하고, 도 5, 도 7 및 도 8에 도시된 바와 같은 촬영 인터페이스에서 선택된 포즈 맵에 대응되는 추천 인체 포즈를 디스플레이할 수 있다. 여기서, 추천 인체 포즈를 디스플레이 하는 방식은 상기 본 발명의 실시예를 참조할 수 있다.
설명해야 할 것은, 위에서의 도 10, 도 11a 및 도 11b 중 포즈 맵을 디스플레이하는 방식 및 포즈 맵을 선택하는 방식은, 본 발명의 실시예에서 제공한 하나의 구현 방식이고, 실제에서, 본 분야의 통상의 기술자는 실제 요구에 따라, 촬영 인터페이스에서 포즈 맵을 디스플레이하는 방식 및 포즈 맵에 대한 선택 방식 등을 설계할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다.
본 발명의 실시예에서, 사용자가 용이하게 상이한 추천 인체 포즈를 선택할 수 있어, 상이한 포즈 선호가 만족되고, 촬영 체험이 향상되며, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하다.
하나의 가능한 구현 방식에서, 상기 방법은,
촬영 이미지를 처리하고, 처리된 촬영 이미지를 획득하는 단계를 더 포함할 수 있고, 여기서, 처리는 촬영 이미지에서의 대상에 대해 뷰티 처리를 수행하는 것 및 촬영 이미지에 필터를 추가하는 것 중 적어도 하나를 포함하며;
상기 촬영 이미지에 필터를 추가하는 것은, 추천 인체 포즈에 대응되는 추천 필터에 따라, 촬영 이미지의 채도, 색온도 및 휘도 중 적어도 하나를 조정하는 것을 포함한다.
여기서, 임의의 기지의 이미지 뷰티 기술을 사용하여, 촬영 이미지에서의 대상에 대해 뷰티 처리를 수행하는 것을 구현할 수 있으며, 본 발명의 실시예는 이에 대해 한정하지 않는다. 예컨대, 뷰티 처리의 과정은, 촬영 이미지 중 사람 얼굴 면부 위치를 결정한 다음, 면부 흡집 위치를 결정하고, 포지셔닝된 면부 흡집 위치에 따라 보완, 복원 또는 필터링 등 처리를 수행하는 것을 포함할 수 있다.
전술한 바와 같이, 추천 인체 포즈는 샘플 이미지로부터 학습된 것일 수 있고, 하나의 가능한 구현 방식에서, 추천 필터는 샘플 이미지의 필터를 분석하여 획득할 수 있으며, 이에 기반하여, 추천 인체 포즈는 추천 필터에 대응될 수 있다.
이해해야 할 것은, 추천 필터는 추천된 채도, 색온도 및 휘도 등 필터 파라미터를 포함할 수 있다. 하나의 가능한 구현 방식에서, 촬영 이미지의 채도, 색온도 및 휘도 중 적어도 하나를 조정하는 것은, 촬영 이미지의 채도, 색온도 및 휘도 중 적어도 하나를, 추천 필터의 필터 파라미터와 일치하도록 조정하는 것을 포함할 수 있다.
여기서, 본 분야의 통상의 기술자는 본 분야의 기지의 이미지 처리 기술을 사용하여, 촬영 이미지의 채도, 색온도 및 휘도를 조정하는 것을 구현할 수 있고, 본 발명의 실시예는 이에 대해 한정하지 않는다.
본 발명의 실시예에서, 촬영 이미지의 시각 효과가 더욱 고품질될 수 있어, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하고, 이미지 촬영 체험이 향상될 수 있다.
하나의 가능한 구현 방식에서, 본 발명의 실시예의 이미지 촬영 방법은, 인공 지능 교육 플랫폼, 소셜 공유 플랫폼, 비디오 이미지 촬영 소프트웨어 등에 적용될 수 있으며, 시나리오 이미지에 따라 시나리오 이미지에 대응되는 추천 인체 포즈를 지능적으로 추천하여, 사용자가 셀카 및 촬상 구도를 수행하는 것을 지도할 수 있어, 이미지 촬영의 재미가 향상되고, 촬영 체험이 향상되며, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하다.
여기서, 이미지 촬영 방법이 인공 지능 교육 플랫폼에 적용될 경우, Jetson Nano(엔비디아에서 개발한 마이크로 컴퓨터임), 라즈베리 파이(Raspberry Pi(마이크로 컴퓨터임)) 등과 같은 상기 인공 지능 교육 플랫폼에 연결된 지능형 하드웨어를 통해, 상기 이미지 촬영 방법을 구현할 수 있고, 상기 방식을 통해, 비주얼의 형태에 기반하여, 사용자의 학습 흥취를 더욱 용이하게 계발할 수 있다.
도 12는 본 발명의 실시예에 따른 이미지 촬영 방법의 응용 예시도를 도시한다. 도 12에 도시된 바와 같이, 인공 지능 교육 플랫폼은 지능형 하드웨어에 연결되고, 여기서, 인공 지능 교육 플랫폼은 상기 이미지 촬영 방법을 구현하는 프로젝트 코드를 편집하고, 프로젝트 코드를 지능형 하드웨어에 송신하기 위한 것이며, 지능형 하드웨어는 시나리오 이미지를 수집하고 프로젝트 코드를 작동하여, 작동 결과를 획득하고, 작동 결과를 인공 지능 교육 플랫폼에 송신하여, 인공 지능 교육 플랫폼의 디스플레이 인터페이스에서 작동 결과를 디스플레이하기 위한 것이다.
여기서, 인공 지능 교육 플랫폼의 웹 사이트 측의 디스플레이 인터페이스에서 시나리오 이미지, 촬영 이미지 및 이미지 촬영 방법의 작동 결과를 디스플레이할 수 있다. 여기서, 작동 결과는 추천 인체 포즈, 진실 인체 포즈, 촬영 이미지에 필터를 추가한 후의 촬영 이미지 및 촬영 이미지에서의 대상에 대해 뷰티 처리를 수행한 후의 촬영 이미지 등을 포함할 수 있다.
하나의 가능한 구현 방식에서, 상기 인공 지능 교육 플랫폼은 학생이 플랫폼에서 상기 이미지 촬영 방법을 구현하는 프로젝트 코드를 편집하는 것을 지원할 수 있으며, 예컨대 포즈 추천 네트워크 등 코드를 훈련하고, 지능형 하드웨어를 연결하여, 상기 이미지 촬영 방법을 구현하기 위한 프로젝트 코드를 지능형 하드웨어에 송신하여 실행함으로써, 지능형 하드웨어를 통해 시나리오 이미를 실시간 수집하는 것을 구현할 수 있고, 수집된 시나리오 이미지에 기반하여 상기 이미지 촬영 방법을 구현할 수 있다.
여기서, 학생은 또한 상기 인공 지능 교육 플랫폼에서 프로젝트 코드를 편집하여, 상기 이미지 촬영 방법을 업데이트하고 최적화할 수도 있으며, 예컨대 각 뉴럴 네트워크 등을 최적화할 수 있다.
본 발명의 실시예에서, 로컬에 각 타입의 하드위에 드라이버, 각 타입의 인공 지능 알고리즘을 배치하는 종속 라이브러리 및 종속 환경을 설치할 필요가 없어, 사용자가 흥미로운 사례를 통해 학습할 수 있으며, 인체 포즈 식별, 인체 키 포인트 검출 등 인공 지능 알고리즘을 학습할 수 있다.
이해할 수 있는 것은, 본 발명에서 언급된 상기 각 방법 실시예는, 원리 논리를 벗어나지 않는 경우, 모두 서로 결합되어 결합 후의 실시예를 구성할 수 있고, 편폭의 제한으로, 본 발명에서는 더이상 설명하지 않는다. 본 분야의 통상의 기술자는 구체적인 실시형태의 상기 방법에서, 각 단계의 구체적인 실행 순서는 그 기능 및 가능한 내부 논리에 의해 결정되어야 함을 이해할 수 있다.
또한, 본 발명은 이미지 촬영 장치, 전자 기기, 컴퓨터 판독 가능한 저장 매체, 프로그램을 더 제공하고, 상기 이미지 촬영 장치, 전자 기기, 컴퓨터 판독 가능한 저장 매체 및 프로그램은 모두 본 발명의 실시예에서 제공한 어느 하나의 이미지 처리 방법을 구현하기 위한 것이며, 상응하는 기술방안과 설명 및 참조 방법 부분의 상응하는 기재는, 여기서 더이상 반복하여 설명하지 않는다.
도 13은 본 발명의 실시예에 따른 이미지 촬영 장치의 블록도를 도시하고, 도 13에 도시된 바와 같이, 상기 장치는,
촬영 인터페이스에 대응되는 시나리오 이미지를 획득하도록 구성된 획득부(101);
상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하도록 구성된 식별부(102);
상기 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하여, 상기 시나리오 이미지에서의 대상 및 상기 대상의 진실 인체 포즈를 결정하도록 구성된 검출부(103);
상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하는 것을 통해, 상기 대상이 상기 추천 인체 포즈에 따라 포즈 조정을 수행하도록 안내하도록 구성된 디스플레이부(104); 및
촬영 조건을 만족하는 경우, 상기 대상의 촬영 이미지를 획득하도록 구성된 촬영부(105)를 포함한다.
하나의 가능한 구현 방식에서, 상기 추천 인체 포즈는 싱글 포즈를 포함하고, 상기 디스플레이부(104)는, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 싱글 포즈를 디스플레이하도록 구성된 제1 디스플레이 서브부; 또는, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 진실 인체 포즈를 디스플레이하고, 상기 촬영 인터페이스의 제1 지정 영역에서 상기 싱글 포즈를 디스플레이하도록 구성된 제2 디스플레이 서브부를 포함한다.
하나의 가능한 구현 방식에서, 상기 추천 인체 포즈는 다인 조합 포즈를 포함하고, 상기 장치는, 상기 시나리오 이미지 중 복수 개의 대상 사이의 상대적 위치 및 상기 다인 조합 포즈 중 각 포즈 사이의 상대적 위치에 따라, 상기 다인 조합 포즈로부터 각 대상에 대응되는 포즈를 결정하도록 구성된 위치 결정부를 더 포함하고; 상기 디스플레이부(104)는, 어느 하나의 대상의 경우, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 대상의 진실 인체 포즈 및 상기 대상에 대응되는 포즈를 디스플레이하도록 구성된 제3 디스플레이 서브부; 또는, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 대상의 진실 인체 포즈를 디스플레이하고, 상기 촬영 인터페이스의 제2 지정 영역에서 상기 대상에 대응되는 포즈를 디스플레이하도록 구성된 제4 디스플레이 서브부를 포함한다.
하나의 가능한 구현 방식에서, 상기 장치는, 상기 진실 인체 포즈의 제1 인체 키 포인트와, 상기 추천 인체 포즈의 제2 인체 키 포인트 사이의 키 포인트 쌍을 결정하도록 구성된 제1 결정부; 및 상기 키 포인트 쌍의 제1 유사도를 계산하는 것을 통해, 상기 제1 인체 키 포인트로부터 상기 제1 유사도가 제1 기설정된 임계값보다 작은 제3 인체 키 포인트를 결정하도록 구성된 제2 결정부를 더 포함하고; 상기 디스플레이부(104)는, 상기 제3 인체 키 포인트가 위치한 영역을 강조 디스플레이하도록 구성된 강조 디스플레이 서브부를 포함하며, 강조 디스플레이의 방식은 하이라이트, 굵게 하기 및 색상 변경 중 적어도 하나를 포함한다.
하나의 가능한 구현 방식에서, 상기 장치는, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 키 포인트 쌍의 제1 유사도에 따라, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도를 결정하도록 구성된 제3 결정부 - 상기 키 포인트 쌍은 상기 진실 인체 포즈의 제1 인체 키 포인트 및 상기 추천 인체 포즈의 제2 인체 키 포인트에 따라 결정된 것임 - ; 상기 촬영 인터페이스에서 상기 제2 유사도를 디스플레이하도록 구성된 유사도 디스플레이부를 더 포함한다.
하나의 가능한 구현 방식에서, 상기 장치는, 상기 시나리오 이미지를 영역 추천 네트워크에 입력하여, 상기 시나리오 이미지의 사진 촬영 추천 영역을 획득하도록 구성된 영역 결정부를 더 포함하고, 상기 사진 촬영 추천 영역은 상기 시나리오 이미지에서 사진 촬영을 추천하는 영역을 나타내기 위한 것이고, 상기 영역 추천 네트워크는 사진 촬영 영역을 태깅한 제1 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이며; 상기 장치는, 상기 촬영 인터페이스에서, 표지 심볼을 사용하여 상기 사진 촬영 추천 영역을 지시하거나; 상기 촬영 인터페이스의 상기 사진 촬영 추천 영역에서 상기 추천 인체 포즈를 디스플레이하도록 구성된 영역 디스플레이부를 더 포함하고; 상기 사진 촬영 추천 영역은 상기 대상이 상기 사진 촬영 추천 영역에 따라 위치 조정을 수행하도록 안내하기 위한 것이다.
하나의 가능한 구현 방식에서, 상기 영역 디스플레이부는 또한, 상기 촬영 인터페이스에서, 표지 심볼을 사용하여 상기 사진 촬영 추천 영역을 지시하고; 상기 촬영 인터페이스의 상기 사진 촬영 추천 영역에서 상기 추천 인체 포즈를 디스플레이하도록 구성된다.
하나의 가능한 구현 방식에서, 상기 식별부(102)는 또한, 포즈 추천 네트워크를 통해 상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하도록 구성되고, 상기 포즈 추천 네트워크는 샘플 시나리오 카테고리 및 샘플 인체 포즈가 태깅된 제2 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이고, 상기 제2 샘플 세트는 대상이 업로드한 샘플 이미지를 포함한다.
하나의 가능한 구현 방식에서, 상기 추천 인체 포즈는 복수 개를 포함하고, 상기 장치는, 상기 촬영 인터페이스에서 복수 개의 추천 인체 포즈에 대응되는 포즈 맵을 디스플레이하도록 구성된 포즈 맵 디스플레이부; 및 상기 포즈 맵에 대한 선택 동작에 응답하여, 선택된 포즈 맵에 따라, 상기 선택된 포즈 맵에 대응되는 추천 인체 포즈를 결정하고 디스플레이하도록 구성된 선택부를 더 포함한다.
하나의 가능한 구현 방식에서, 상기 촬영 조건은, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도가 제2 기설정된 임계값보다 크거나 같은 것; 또는, 상기 촬영 인터페이스에서의 촬영 컨트롤러가 트리거링되는 것을 포함한다.
하나의 가능한 구현 방식에서, 상기 장치는, 상기 촬영 이미지를 처리하여, 처리된 촬영 이미지를 획득하도록 구성된 처리부를 더 포함하고, 상기 처리는 상기 촬영 이미지에서의 대상에 대해 뷰티 처리를 수행하는 것 및 상기 촬영 이미지에 필터를 추가하는 것 중 적어도 하나를 포함하며; 상기 촬영 이미지에 필터를 추가하는 것은, 상기 추천 인체 포즈에 대응되는 추천 필터에 따라, 상기 촬영 이미지의 채도, 색온도 및 휘도 중 적어도 하나를 조정하는 것을 포함한다.
하나의 가능한 구현 방식에서, 상기 장치는 인공 지능 교육 플랫폼에 적용되고, 상기 인공 지능 교육 플랫폼은 지능형 하드웨어와 연결되고; 여기서, 상기 인공 지능 교육 플랫폼은 상기 이미지 촬영 장치를 구현한 프로젝트 코드를 편집하여, 상기 프로젝트 코드를 상기 지능형 하드웨어에 송신하기 위한 것이며; 상기 지능형 하드웨어는 시나리오 이미지를 수집하고 상기 프로젝트 코드를 작동하여, 작동 결과를 획득하고, 상기 작동 결과를 상기 인공 지능 교육 플랫폼에 송신하여, 상기 인공 지능 교육 플랫폼의 디스플레이 인터페이스에서 상기 작동 결과를 디스플레이하기 위한 것이다.
본 발명의 실시예에서, 시나리오 이미지의 시나리오 카테고리에 따라, 사용자에게 시나리오 카테고리에 대응되는 추천 인체 포즈를 추천할 수 있음으로써, 추천 인체 포즈가 시나리오 이미지에 매칭된 것으로 할 수 있고, 또한 촬영 인터페이스에서 진실 인체 포즈 및 추천 인체 포즈를 디스플레이하는 것을 통해, 사용자가 디스플레이된 추천 인체 포즈에 따라 포즈 조정을 수행하도록 안내하거나 사용자가 디스플레이된 추천 인체 포즈에 따라 촬영 대상이 포즈 조정을 수행하는 것을 용이하게 지도할 수 있어, 이미지 촬영 효과가 효과적으로 향상되고, 사용자의 촬영 체험이 향상되며, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하다.
일부 실시예에서, 본 발명의 실시예에서 제공한 장치에 구비된 기능 또는 포함된 부는 상기 방법 실시예에 설명한 방법을 실행하는데 사용될 수 있고, 그 실제적 구현은 상기 방법 실시예의 실제 설명을 참조할 수 있으며, 간결함을 위해 여기서 더이상 설명하지 않는다.
본 발명의 실시예는 컴퓨터 판독 가능한 저장 매체를 더 제공하고, 상기 컴퓨터 판독 가능한 저장 매체는 컴퓨터 프로그램 명령어를 저장하며, 상기 컴퓨터 프로그램 명령어가 프로세서에 의해 실행될 경우 상기 방법을 구현한다. 컴퓨터 판독 가능한 저장 매체는 비휘발성 컴퓨터 판독 가능한 저장 매체일 수 있다.
본 발명의 실시예는 전자 기기를 더 제공하고, 상기 전자 기기는 프로세서; 및 프로세서가 실행 가능한 명령어를 저장하도록 구성된 메모리를 포함하며; 여기서, 상기 프로세서는 상기 메모리에 저장된 명령어를 호출하여, 상기 방법을 구현하도록 구성된다.
본 발명의 실시예는 컴퓨터 프로그램 제품을 더 제공하고, 상기 컴퓨터 프로그램 제품은 컴퓨터 판독 가능한 코드를 포함하고, 컴퓨터 판독 가능한 코드가 기기에서 작동될 경우, 기기에서의 프로세서는 상기 어느 하나의 실시예에서 제공한 이미지 촬영 방법을 구현하기 위한 명령어를 실행한다.
본 발명의 실시예는 다른 한 가지 컴퓨터 프로그램 제품을 더 제공하고, 상기 컴퓨터 프로그램 제품은 컴퓨터 판독 가능한 명령어를 저장하기 위한 것이며, 명령어가 실행될 경우 컴퓨터로 하여금 상기 어느 하나의 실시예에서 제공한 이미지 촬영 방법의 동작을 실행하도록 한다.
본 발명의 실시예에서의 전자 기기는 단말, 서버로 제공될 수 있다.
도 14은 본 발명의 실시예에 따른 전자 기기(800)의 블록도를 도시한다. 예컨대, 전자 기기(800)는 휴대폰, 컴퓨터, 디지털 브로드캐스팅 단말, 메시징 기기, 게임 콘솔, 태블릿 기기, 의료 기기, 피트니스 기기 및 개인용 정보 단말기 등 단말일 수 있다.
도 14를 참조하면, 전자 기기(800)는 처리 컴포넌트(802), 메모리(804), 전원 컴포넌트(806), 멀티 미디어 컴포넌트(808), 오디오 컴포넌트(810), 입력/출력(I/O) 인터페이스(812), 센서 컴포넌트(814) 및 통신 컴포넌트(816) 중 하나 또는 복수 개의 컴포넌트를 포함할 수 있다.
처리 컴포넌트(802)는 일반적으로 디스플레이, 전화 통화, 데이터 통신, 카메라 동작 및 기록 동작과 관련된 동작과 같은 전자 기기(800)의 전체적인 동작을 제어한다. 처리 컴포넌트(802)는, 상기 방법의 전부 또는 일부 단계를 완료하기 위한 명령어를 실행하는 하나 또는 복수 개의 프로세서(820)를 포함할 수 있다. 또한, 처리 컴포넌트(802)는 처리 컴포넌트(802) 및 다른 컴포넌트 사이의 상호 작용을 용이하게 하기 위해, 하나 또는 복수 개의 모듈을 포함할 수 있다. 예컨대, 처리 컴포넌트(802)는 멀티 미디어 컴포넌트(808)와 처리 컴포넌트(802) 사이의 상호 작용을 용이하게 하기 위해, 멀티 미디어 모듈을 포함할 수 있다.
메모리(804)는 전자 기기(800)의 동작을 지원하기 위해, 다양한 타입의 데이터를 저장하도록 구성된다. 이러한 데이터의 예는 전자 기기(800)에서 동작하는 임의의 애플리케이션 프로그램 또는 방법의 명령어, 연락인 데이터, 전화 번호부 데이터, 메시지, 사진, 비디오 등을 포함한다. 메모리(804)는, 정적 랜덤 액세스 메모리(SRAM), 전기적 소거 가능한 프로그래머블 판독 전용 메모리(EEPROM), 소거 가능한 프로그래머블 판독 전용 메모리(EPROM), 프로그래머블 판독 전용 메모리(PROM), 판독 전용 메모리(ROM), 자기 메모리, 플래쉬 메모리, 자기 디스크 또는 광 디스크와 같은 임의의 타입의 휘발성 또는 비휘발성 저장 기기 또는 이들의 조합에 의해 구현될 수 있다.
전원 컴포넌트(806)는 전자 기기(800)의 다양한 컴포넌트에 전력을 공급한다. 전원 컴포넌트(806)는 전력 관리 시스템, 하나 또는 복수 개의 전원 및 전자 기기(800)를 위해 전력을 생성, 관리 및 분배하는 것과 관련된 다른 컴포넌트를 포함할 수 있다.
멀티 미디어 컴포넌트(808)는 상기 전자 기기(800)와 사용자 사이의 하나의 출력 인터페이스를 제공하는 스크린을 포함한다. 일부 실시예에서, 스크린은 액정 디스플레이(LCD) 및 터치 패널(TP)을 포함할 수 있다. 스크린이 터치 패널을 포함하는 경우, 사용자로부터의 입력 신호를 수신하기 위해 스크린은 터치 스크린으로서 구현될 수 있다. 터치 패널은 터치, 슬라이딩 및 터치 패널 상의 제스처를 감지하기 위한 하나 또는 복수 개의 터치 센서를 포함한다. 상기 터치 센서는 터치 또는 슬라이딩 동작의 경계를 감지할 수 있을 뿐만 아니라, 상기 터치나 슬라이딩 동작과 관련된 지속 시간 및 압력을 검출할 수도 있다. 일부 실시예에서, 멀티 미디어 컴포넌트(808)는 하나의 전방 웹캠 및 하나의 후방 웹캠 중 적어도 하나를 포함한다. 전자 기기(800)가 촬영 모드 또는 비디오 모드와 같은 동작 모드에 있을 경우, 전방 웹캠 및 후방 웹캠 중 적어도 하나는 외부의 멀티 미디어 데이터를 수신할 수 있다. 각 전방 웹캠 및 후방 웹캠은 고정된 광학 렌즈 시스템일 수 있거나 초점 거리 및 광학 줌 능력을 구비할 수 있다.
오디오 컴포넌트(810)는 오디오 신호를 출력하는 것 및 입력하는 것 중 적어도 하나를 수행하도록 구성된다. 예컨대, 오디오 컴포넌트(810)는 하나의 마이크로폰(MIC)을 포함하며, 전자 기기(800)가 콜 모드, 녹음 모드 및 음성 식별 모드와 같은 동작 모드에 있을 경우, 마이크로폰은 외부 오디오 신호를 수신하도록 구성된다. 수신된 오디오 신호는 추가로 메모리(804)에 저장되거나 통신 컴포넌트(816)에 의해 송신될 수 있다. 일부 실시예에서, 오디오 컴포넌트(810)는 오디오 신호를 출력하도록 구성된 하나의 스피커를 더 포함한다.
I/O 인터페이스(812)는 처리 컴포넌트(802)와 외부 인터페이스 모듈 사이에서 인터페이스를 제공하고, 상기 외부 인터페이스 모듈은 키보드, 클릭 휠, 버튼 등일 수 있다. 이러한 버튼은 홈 버튼, 볼륨 버튼, 시작 버튼 및 잠금 버튼을 포함할 수 있지만 이에 한정되지 않는다.
센서 컴포넌트(814)는 전자 기기(800)를 위해 각 측면의 상태 평가를 제공하도록 구성된 하나 또는 복수 개의 센서를 포함한다. 예컨대, 센서 컴포넌트(814)는 전자 기기(800)의 온/오프 상태, 컴포넌트의 상대 포지셔닝을 검출할 수 있으며, 예컨대, 상기 컴포넌트는 전자 기기(800)의 디스플레이와 키패드이며, 센서 컴포넌트(814)는 전자 기기(800) 또는 전자 기기(800)에서 하나의 컴포넌트의 위치 변화, 사용자와 전자 기기(800)의 접촉의 존재 유무, 전자 기기(800) 방위 또는 가속/감속 및 전자 기기(800)의 온도 변화를 검출할 수 있다. 센서 컴포넌트(814)는 그 어떤 물리적 접촉이 없이 근처의 물체의 존재를 검출하도록 구성된 근접 센서를 포함할 수 있다. 센서 컴포넌트(814)는 상보성 금속 산화막 반도체(CMOS) 또는 전하 결합 장치(CCD) 이미지 센서와 같은 광센서를 더 포함할 수 있고, 상기 광센서는 이미징 응용에 사용되기 위한 것이다. 일부 실시예에서, 상기 센서 컴포넌트(814)는 가속도 센서, 자이로스코프 센서, 자기 센서, 압력 센서 또는 온도 센서를 더 포함할 수 있다.
통신 컴포넌트(816)는 전자 기기(800)와 다른 기기 사이의 유선 또는 무선 방식의 통신을 용이하게 하도록 구성된다. 전자 기기(800)는 무선 네트워크(Wi-Fi), 2세대 이동 통신 기술(2G) 또는 3세대 이동 통신 기술(3G), 또는 이들의 조합과 같은 통신 기준에 기반한 무선 네트워크에 액세스할 수 있다. 하나의 예시적 실시예에서, 통신 컴포넌트(816)는 브로드캐스팅 채널을 통해 외부 브로드캐스팅 관리 시스템으로부터의 브로드캐스팅 신호 또는 브로드캐스팅 관련 정보를 수신한다. 하나의 예시적 실시예에서, 상기 통신 컴포넌트(816)는 근거리 통신을 촉진하는 근거리 통신(NFC) 모듈을 더 포함한다. 예컨대, NFC 모듈은 무선 주파수 식별자(RFID) 기술, 적외선 통신 규격(IrDA) 기술, 초광대역(UWB) 기술, 블루투스(BT) 기술 및 다른 기술에 기반하여 구현될 수 있다.
예시적 실시예에서, 전자 기기(800)는 하나 또는 복수 개의 주문형 집적 회로(ASIC), 디지털 신호 프로세서(DSP), 디지털 신호 처리 기기(DSPD), 프로그래머블 논리 소자(PLD), 필드 프로그래머블 게이트 어레이(FPGA), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 또는 다른 전자 요소에 의해 구현되며, 전자 기기(800)는 상기 방법을 실행하기 위한 것이다.
예시적 실시예에 있어서, 컴퓨터 프로그램 명령어를 포함하는 메모리(804)와 같은 비휘발성 컴퓨터 판독 가능한 저장 매체를 더 제공하며, 상기 컴퓨터 프로그램 명령어는 상기 방법을 완료하도록 전자 기기(800)의 프로세서(820)에 의해 실행된다.
본 발명은 시스템, 방법 및 컴퓨터 프로그램 제품 중 어느 하나일 수 있다. 컴퓨터 프로그램 제품은 컴퓨터 판독 가능한 저장 매체를 포함할 수 있고, 상기 컴퓨터 판독 가능한 저장 매체는 프로세서가 본 발명의 실시예의 각 측면을 구현하도록 하는 컴퓨터 판독 가능한 프로그램 명령어를 캐리하고 있다.
컴퓨터 판독 가능 저장 매체는 명령어 실행 기기에 의해 사용되는 명령어를 유지 및 저장할 수 있는 타입의 기기일 수 있다. 컴퓨터 판독 가능한 저장 매체는 예컨대 축전 기기, 자기 저장 기기, 광 저장 기기, 전자기 저장 기기, 반도체 저장 기기 또는 전술한 축전 기기, 자기 저장 기기, 광 저장 기기, 전자기 저장 기기, 반도체 저장 기기의 임의의 적절한 조합일 수 있지만 이에 한정되지 않는다. 컴퓨터 판독 가능한 저장 매체의 예(비제한 리스트)는, 휴대용 컴퓨터 디스크, 하드 디스크, 랜덤 액세스 메모리(RAM), 판독 전용 메모리(ROM), 소거 가능하고 프로그램 가능한 판독 전용 메모리((EPROM )또는 플래시 메모리), 정적 랜덤 액세스 메모리(SRAM), 휴대용 컴팩트 디스크 판독 전용 메모리(CD-ROM), 디지털 다기능 디스크(DVD), 메모리 스틱, 플로피 디스크, 기계적 인코딩 기기, 예컨대 명령어가 저장된 펀치 카드 또는 그루브 내의 볼록한 구조 및 전술한 임의의 적절한 조합을 포함한다. 여기서 사용되는 컴퓨터 판독 가능한 저장 매체는 무선 전자파 또는 다른 자유롭게 전파되는 전자기파, 도파관 또는 다른 전송 매체를 통해 전파되는 전자기파(예컨대, 광섬유 케이블을 통한 광펄스), 또는 와이어를 통해 전송되는 전기 신호와 같은 순간 신호 자체로 해석되지 않아야 한다.
여기서 설명된 컴퓨터 판독 가능한 프로그램 명령어는 컴퓨터 판독 가능한 저장 매체로부터 각 컴퓨팅/처리 기기로 다운 로드될 수 있거나, 인터넷, 근거리 통신망, 광역 통신망 및 무선 네트워크 중 적어도 하나와 같은 네트워크를 통해, 외부 컴퓨터 또는 외부 저장 기기로 다운 로드될 수 있다. 네트워크는 동 전송 케이블, 광섬유 전송, 무선 전송, 라우터, 방화벽, 교환기, 게이트웨이 컴퓨터 및 에지 서버 중 적어도 하나를 포함 할 수 있다. 각 컴퓨팅/처리 기기에서의 네트워크 어댑터 카드 또는 네트워크 인터페이스는 네트워크로부터 컴퓨터 판독 가능한 프로그램 명령어를 수신하고, 각 컴퓨팅/처리 기기에서의 컴퓨터 판독 가능한 저장 매체에 저장하기 위해, 상기 컴퓨터 판독 가능한 프로그램 명령어를 전달한다.
본 발명의 동작을 실행하기 위한 컴퓨터 프로그램 명령어는 어셈블리 명령어, 명령어 세트 아키텍처(ISA) 명령어, 머신 명령어, 머신 관련 명령어, 마이크로 코드, 펌웨어 명령어, 상태 설정 데이터, 또는 하나 또는 복수 개의 프로그래밍 언어의 임의의 조합으로 작성된 소스 코드 또는 타깃 코드일 수 있고, 상기 프로그래밍 언어에는 Smalltalk, C++ 등과 같은 대상 지향 프로그래밍 언어 및 "C" 언어 또는 유사한 프로그래밍 언어와 같은 기존의 절차적 프로그래밍 언어가 포함된다. 컴퓨터 판독 가능 프로그램 명령어는 사용자 컴퓨터에서 완전히 실행되거나, 사용자 컴퓨터에서 부분적으로 실행되거나, 독립적인 소프트웨어 패키지로서 실행되거나, 사용자 컴퓨터에서 일부가 실행되고 원격 컴퓨터에서 일부가 실행되거나, 원격 컴퓨터 또는 서버에서 완전히 실행될 수있다. 원격 컴퓨터와 관련된 상황에서, 원격 컴퓨터는 근거리 통신망LAN) 또는 광대역 통신망(WAN)을 포함하는 임의의 타입의 네트워크를 통해 사용자 컴퓨터에 연결되거나 외부 컴퓨터에 연결(예컨대 인터넷 서비스 제공 업체를 사용하여 인터넷을 통해 연결)될 수 있다. 일부 실시예에서, 프로그램 가능한 논리 회로, 필드 프로그래머블 게이트 어레이(FPGA) 또는 프로그램 가능한 논리 어레이(PLA)와 같은 전자 회로는 컴퓨터 판독 가능 프로그램 명령어의 상태 정보를 이용하여 개인화될 수 있고, 상기 전자 회로는 컴퓨터 판독 가능 프로그램 명령어를 실행할 수 있음으로써, 본 발명의 각 측면을 구현한다.
여기서, 본 발명의 각 측면은 본 발명의 실시예에 따른 방법, 장치(시스템) 및 컴퓨터 프로그램 제품의 흐름도 및 블록도 중 적어도 하나를 참조하여 설명된다. 흐름도 및 블록도 중 적어도 하나의 각 블록 및 흐름도 및 블록도 중 적어도 하나의 각 블록의 조합은, 컴퓨터 판독 가능 프로그램 명령어에 의해 모두 구현될 수 있음을 이해해야 한다.
이러한 컴퓨터 판독 가능한 프로그램 명령어는 범용 컴퓨터, 전용 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치의 프로세서에 제공 될 수 있음으로써, 이에 의해 이러한 명령어가 컴퓨터 또는 다른 프로그램 가능한 데이터 처리 장치의 프로세서에 의해 실행되도록 하는 기계가 생성될 경우, 흐름도 및 블록도 중 적어도 하나에서 하나 또는 복수 개의 블록에 지정된 기능/동작을 구현하는 장치가 생성된다. 이러한 컴퓨터 판독 가능한 프로그램 명령어를 컴퓨터 판독 가능한 저장 매체에 저장할 수도 있으며, 이러한 명령어는 컴퓨터, 프로그램 가능한 데이터 처리 장치 및 다른 기기 중 적어도 하나로 하여금 특정한 방식으로 작동될 수 있도록 함으로써, 명령어가 저장된 컴퓨터 판독 가능한 매체는 제조품을 포함하며, 상기 제조품은 흐름도 및 블록도 중 적어도 하나에서 하나 또는 복수 개의 블록에 지정된 기능/동작의 각 측면을 구현하는 명령어를 포함한다.
컴퓨터 판독 가능한 프로그램 명령어는 또한 컴퓨터, 다른 프로그램 가능한 데이터 처리 장치 또는 다른 기기에 로딩될 수 있어, 컴퓨터로 구현되는 과정을 생성하기 위해, 일련의 동작 단계가 컴퓨터, 다른 프로그램 가능한 데이터 처리 장치 또는 다른 기기에서 수행되도록 함으로써, 컴퓨터, 다른 프로그램 가능한 데이터 처리 장치 또는 다른 기기에서 실행되는 명령어는 흐름도 및 블록도 중 적어도 하나에서 하나 또는 복수 개의 블록에 지정된 기능/동작을 구현한다.
도면의 흐름도 및 블록도는 본 발명의 복수 개의 실시예에 따른 시스템, 방법 및 컴퓨터 프로그램 제품의 구현 가능한 체계 아키텍처, 기능 및 동작을 디스플레이한다. 이러한 점에서, 흐름도 또는 블록도에서의 각 블록은 모듈, 프로그램 세그먼트 또는 명령어의 일부를 나타낼 수 있고, 상기 모듈, 프로그램 세그먼트 또는 명령어의 일부는 하나 또는 복수 개의 지정된 논리적 기능을 구현하기 위한 실행 가능한 명령어를 포함한다. 일부 대안적인 구현에서, 블록에 태깅된 기능은 도면에 태깅된 것과 다른 순서로 발생될 수도 있다. 예컨대, 두 개의 연속적인 블록은 실제로 기본 병렬로 실행될 수 있으며, 때로는 이들이 역순으로 실행될 수도 있으며, 이는 관련된 기능에 의해 결정된다. 또한 유의해야 할 것은, 블록도 및 흐름도 중 적어도 하나에서의 각 블록, 및 블록도 및 흐름도 중 적어도 하나에서의 블록의 조합은, 지정된 기능 또는 동작을 실행하는 전용적인 하드웨어 기반의 시스템에 의해 구현될 수 있거나, 전용 하드웨어와 컴퓨터 명령어의 조합으로 구현될 수 있다.
상기 컴퓨터 프로그램 제품은 하드웨어, 소프트웨어 또는 이들의 조합을 통해 구현될 수 있다. 하나의 선택적인 실시예에서, 상기 컴퓨터 프로그램 제품은 컴퓨터 저장 매체로 반영되며, 다른 하나의 선택적인 실시예에서, 컴퓨터 프로그램 제품은 소프트웨어 개발 키트(Software Development Kit, SDK) 등과 같은 소프트웨어 제품으로 반영된다.
이상에서 본 발명의 각 실시예를 설명하였고, 상기 설명은 예시적이고, 비철저하며, 개시된 각 실시예에 한정되지도 않는다. 설명된 각 실시예의 범위 및 사상을 벗어나지 않는 한, 많은 수정 및 변경은 본 기술분야의 통상의 기술자에게는 자명한 것이다. 본 문에서 사용된 용어의 선택은 각 실시예의 원리, 실제 응용 또는 시장에서의 기술에 대한 개선을 가장 잘 해석하거나, 본 기술분야의 다른 통상의 기술자가 본 문에 개시된 각 실시예를 이해할 수 있도록 의도된다.
본 발명의 실시예에서, 시나리오 이미지의 시나리오 카테고리에 따라, 사용자에게 시나리오 카테고리에 대응되는 추천 인체 포즈를 추천할 수 있음으로써, 추천 인체 포즈가 시나리오 이미지에 매칭된 것으로 할 수 있고, 또한 촬영 인터페이스에서 진실 인체 포즈 및 추천 인체 포즈를 디스플레이하는 것을 통해, 사용자가 디스플레이된 추천 인체 포즈에 따라 포즈 조정을 수행하도록 안내하거나 사용자가 디스플레이된 추천 인체 포즈에 따라 촬영 대상이 포즈 조정을 수행하는 것을 용이하게 지도할 수 있어, 이미지 촬영 효과가 효과적으로 향상되고, 사용자의 촬영 체험이 향상되며, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하다. 또한, 촬영 인터페이스에서 싱글 포즈를 디스플레이하는 것을 통해, 대상이 싱글 포즈의 촬영을 완료하는 것을 효과적으로 안내할 수 있어, 촬영 체험이 향상되며, 또한 추천 인체 포즈가 고정적으로 디스플레이할 수 있고, 대상에 따라 디스플레이할 수 있어, 상이한 포즈 디스플레이 요구를 만족할 수 있다. 또한, 촬영 인터페이스에서 다인 조합 포즈를 디스플레이하는 것을 통해, 복수 개의 대상이 다인 조합 포즈를 공동으로 완료하는 것을 효과적으로 안내할 수 있어, 촬영 체험이 향상되며, 또한 추천 인체 포즈가 고정적으로 디스플레이할 수 있고, 대상에 따라 디스플레이할 수 있어, 상이한 포즈 디스플레이 요구를 만족할 수 있다. 또한, 디스플레이된 진실 인체 포즈 중 유사도가 낮은 인체 부위에 대해, 강조 디스플레이를 수행함으로써, 사용자가 포즈를 조정하는 것을 더욱 효과적으로 안내하여, 촬영 체험이 향상된다. 또한, 진실 인체 포즈와 추천 인체 포즈 사이의 전체적인 유사 정도를 디스플레이할 수 있어, 사용자가 전체적인 유사도에 따라 포즈를 조정하는 것을 효과적으로 안내하므로, 촬영 체험이 향상된다. 또한, 사진 촬영 추천 영역을 통해, 대상에 시각 효과가 비교적 좋은 사진 촬영 영역을 추천할 수 있어, 대상이 위치를 조정하는 것을 효과적으로 안내하여 촬영 이미지의 시각 효과를 향상시킴으로써, 사용자 촬영 체험을 향상시킬 수 있다. 또한, 포즈 추천 네트워크를 이용하여 고품질 이미지로부터 인체 포즈를 학습할 수 있음으로써, 시나리오 이미지에 기반하여 고품질의 추천 인체 포즈를 효과적으로 출력할 수 있다. 또한, 사용자가 용이하게 상이한 추천 인체 포즈를 선택하여, 상이한 포즈 선호가 만족되고, 촬영 체험이 향상되며, 사용자가 만족하는 촬영 이미지를 획득하는데 유리하다. 또한, 인공 지능 교육 플랫폼에 본 발명의 실시예에서의 방법을 적용하여, 사용자가 흥미로운 사례를 통해 학습할 수 있으며, 인체 포즈 식별, 인체 키 포인트 검출 등 인공 지능 알고리즘을 학습할 수 있다.

Claims (25)

  1. 이미지 촬영 방법으로서,
    촬영 인터페이스에 대응되는 시나리오 이미지를 획득하는 단계;
    상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하는 단계;
    상기 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하여, 상기 시나리오 이미지에서의 대상 및 상기 대상의 진실 인체 포즈를 결정하는 단계;
    상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하는 것을 통해, 상기 대상이 상기 추천 인체 포즈에 따라 포즈 조정을 수행하도록 안내하는 단계; 및
    촬영 조건을 만족하는 경우, 상기 대상의 촬영 이미지를 획득하는 단계를 포함하는 것을 특징으로 하는 이미지 촬영 방법.
  2. 제1항에 있어서,
    상기 추천 인체 포즈는 싱글 포즈를 포함하고, 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하는 단계는,
    상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 싱글 포즈를 디스플레이하는 단계; 또는,
    상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 진실 인체 포즈를 디스플레이하고, 상기 촬영 인터페이스의 제1 지정 영역에서 상기 싱글 포즈를 디스플레이하는 단계를 포함하는 것을 특징으로 하는 이미지 촬영 방법.
  3. 제1항 또는 제2항에 있어서,
    상기 추천 인체 포즈는 다인 조합 포즈를 포함하고, 상기 이미지 촬영 방법은,
    상기 시나리오 이미지 중 복수 개의 대상 사이의 상대적 위치 및 상기 다인 조합 포즈 중 각 포즈 사이의 상대적 위치에 따라, 상기 다인 조합 포즈로부터 각 대상에 대응되는 포즈를 각각 결정하는 단계를 더 포함하고;
    상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하는 단계는,
    어느 하나의 대상의 경우, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 대상의 진실 인체 포즈 및 상기 대상에 대응되는 포즈를 디스플레이하는 단계; 또는,
    상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 대상의 진실 인체 포즈를 디스플레이하고, 상기 촬영 인터페이스의 제2 지정 영역에서 상기 대상에 대응되는 포즈를 디스플레이하는 단계를 포함하는 것을 특징으로 하는 이미지 촬영 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서,
    상기 이미지 촬영 방법은,
    상기 진실 인체 포즈의 제1 인체 키 포인트와, 상기 추천 인체 포즈의 제2 인체 키 포인트 사이의 키 포인트 쌍을 결정하는 단계;
    상기 키 포인트 쌍의 제1 유사도를 계산하는 것을 통해, 상기 제1 인체 키 포인트로부터 상기 제1 유사도가 제1 기설정된 임계값보다 작은 제3 인체 키 포인트를 결정하는 단계를 더 포함하고;
    상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하는 단계는,
    상기 제3 인체 키 포인트가 위치한 영역을 강조 디스플레이하는 단계를 포함하며, 강조 디스플레이의 방식은 하이라이트, 굵게 하기 및 색상 변경 중 적어도 하나를 포함하는 것을 특징으로 하는 이미지 촬영 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 이미지 촬영 방법은,
    상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 키 포인트 쌍의 제1 유사도에 따라, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도를 결정하는 단계 - 상기 키 포인트 쌍은 상기 진실 인체 포즈의 제1 인체 키 포인트 및 상기 추천 인체 포즈의 제2 인체 키 포인트에 따라 결정된 것임 - ; 및
    상기 촬영 인터페이스에서 상기 제2 유사도를 디스플레이하는 단계를 더 포함하는 것을 특징으로 하는 이미지 촬영 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서,
    상기 이미지 촬영 방법은,
    상기 시나리오 이미지를 영역 추천 네트워크에 입력하여, 상기 시나리오 이미지의 사진 촬영 추천 영역을 획득하는 단계를 더 포함하고, 상기 사진 촬영 추천 영역은 상기 시나리오 이미지에서 사진 촬영을 추천하는 영역을 나타내기 위한 것이고, 상기 영역 추천 네트워크는 사진 촬영 영역을 태깅한 제1 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이며;
    상기 시나리오 이미지의 사진 촬영 추천 영역을 획득한 후, 상기 이미지 촬영 방법은,
    상기 촬영 인터페이스에서, 표지 심볼을 사용하여 상기 사진 촬영 추천 영역을 지시하는 단계; 및
    상기 촬영 인터페이스의 상기 사진 촬영 추천 영역에서 상기 추천 인체 포즈를 디스플레이하는 단계 중 적어도 하나를 더 포함하며, 상기 사진 촬영 추천 영역은 상기 대상이 상기 사진 촬영 추천 영역에 따라 위치 조정을 수행하도록 안내하기 위한 것임을 특징으로 하는 이미지 촬영 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서,
    상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하는 단계는,
    포즈 추천 네트워크를 통해 상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하는 단계를 포함하고, 상기 포즈 추천 네트워크는 샘플 시나리오 카테고리 및 샘플 인체 포즈가 태깅된 제2 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이고, 상기 제2 샘플 세트는 대상이 업로드한 샘플 이미지를 포함하는 것을 특징으로 하는 이미지 촬영 방법.
  8. 제1항에 있어서,
    상기 추천 인체 포즈는 복수 개를 포함하고, 상기 이미지 촬영 방법은,
    상기 촬영 인터페이스에서 복수 개의 추천 인체 포즈에 대응되는 포즈 맵을 디스플레이하는 단계; 및
    상기 포즈 맵에 대한 선택 동작에 응답하여, 선택된 포즈 맵에 따라, 상기 선택된 포즈 맵에 대응되는 추천 인체 포즈를 결정하고 디스플레이하는 단계를 더 포함하는 것을 특징으로 하는 이미지 촬영 방법.
  9. 제1항 또는 제5항에 있어서,
    상기 촬영 조건은,
    상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도가 제2 기설정된 임계값보다 크거나 같은 것; 또는,
    상기 촬영 인터페이스에서의 촬영 컨트롤러가 트리거링되는 것을 포함하는 것을 특징으로 하는 이미지 촬영 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서,
    상기 이미지 촬영 방법은,
    상기 촬영 이미지를 처리하여, 처리된 촬영 이미지를 획득하는 단계를 더 포함하고, 상기 처리는 상기 촬영 이미지에서의 대상에 대해 뷰티 처리를 수행하는 것 및 상기 촬영 이미지에 필터를 추가하는 것 중 적어도 하나를 포함하며;
    상기 촬영 이미지에 필터를 추가하는 것은, 상기 추천 인체 포즈에 대응되는 추천 필터에 따라, 상기 촬영 이미지의 채도, 색온도 및 휘도 중 적어도 하나를 조정하는 것을 포함하는 것을 특징으로 하는 이미지 촬영 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 이미지 촬영 방법은 인공 지능 교육 플랫폼에 적용되고, 상기 인공 지능 교육 플랫폼은 지능형 하드웨어에 연결되며;
    상기 인공 지능 교육 플랫폼은, 상기 이미지 촬영 방법을 구현하는 프로젝트 코드를 편집하고, 상기 프로젝트 코드를 상기 지능형 하드웨어에 송신하기 위한 것이며;
    상기 지능형 하드웨어는, 시나리오 이미지를 수집하고 상기 프로젝트 코드를 작동하여, 작동 결과를 획득하고, 상기 작동 결과를 상기 인공 지능 교육 플랫폼에 송신하여, 상기 인공 지능 교육 플랫폼의 디스플레이 인터페이스에서 상기 작동 결과를 디스플레이하기 위한 것임을 특징으로 하는 이미지 촬영 방법.
  12. 이미지 촬영 장치로서,
    촬영 인터페이스에 대응되는 시나리오 이미지를 획득하도록 구성된 획득부;
    상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하도록 구성된 식별부;
    상기 시나리오 이미지에 대해 인체 키 포인트 검출을 수행하여, 상기 시나리오 이미지에서의 대상 및 상기 대상의 진실 인체 포즈를 결정하도록 구성된 검출부;
    상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 추천 인체 포즈를 디스플레이하여, 상기 대상이 상기 추천 인체 포즈에 따라 포즈 조정을 수행하도록 안내하도록 구성된 디스플레이부; 및
    촬영 조건을 만족하는 경우, 상기 대상의 촬영 이미지를 획득하도록 구성된 촬영부를 포함하는 것을 특징으로 하는 이미지 촬영 장치.
  13. 제12항에 있어서,
    상기 추천 인체 포즈는 싱글 포즈를 포함하고, 상기 디스플레이부는,
    상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 진실 인체 포즈 및 상기 싱글 포즈를 디스플레이하도록 구성된 제1 디스플레이 서브부; 또는,
    상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 진실 인체 포즈를 디스플레이하고, 상기 촬영 인터페이스의 제1 지정 영역에서 상기 싱글 포즈를 디스플레이하도록 구성된 제2 디스플레이 서브부를 포함하는 것을 특징으로 하는 이미지 촬영 장치.
  14. 제12항 또는 제13항에 있어서,
    상기 추천 인체 포즈는 다인 조합 포즈를 포함하고, 상기 이미지 촬영 장치는,
    상기 시나리오 이미지 중 복수 개의 대상 사이의 상대적 위치 및 상기 다인 조합 포즈 중 각 포즈 사이의 상대적 위치에 따라, 상기 다인 조합 포즈로부터 각 대상에 대응되는 포즈를 각각 결정하도록 구성된 위치 결정부를 더 포함하고,
    상기 디스플레이부는, 어느 하나의 대상의 경우, 상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 대상의 진실 인체 포즈 및 상기 대상에 대응되는 포즈를 디스플레이하도록 구성된 제3 디스플레이 서브부; 또는,
    상기 대상이 상기 시나리오 이미지에서의 위치에 따라, 상기 촬영 인터페이스에서 상기 대상의 진실 인체 포즈를 디스플레이하고, 상기 촬영 인터페이스의 제2 지정 영역에서 상기 대상에 대응되는 포즈를 디스플레이하도록 구성된 제4 디스플레이 서브부를 포함하는 것을 특징으로 하는 이미지 촬영 장치.
  15. 제12항 내지 제14항 중 어느 한 항에 있어서,
    상기 이미지 촬영 장치는,
    상기 진실 인체 포즈의 제1 인체 키 포인트와, 상기 추천 인체 포즈의 제2 인체 키 포인트 사이의 키 포인트 쌍을 결정하도록 구성된 제1 결정부; 및
    상기 키 포인트 쌍의 제1 유사도를 계산하는 것을 통해, 상기 제1 인체 키 포인트로부터 상기 제1 유사도가 제1 기설정된 임계값보다 작은 제3 인체 키 포인트를 결정하도록 구성된 제2 결정부를 더 포함하고,
    상기 디스플레이부는,
    상기 제3 인체 키 포인트가 위치한 영역을 강조 디스플레이하도록 구성된 강조 디스플레이 서브부를 포함하고, 강조 디스플레이의 방식은 하이라이트, 굵게 하기 및 색상 변경 중 적어도 하나를 포함하는 것을 특징으로 하는 이미지 촬영 장치.
  16. 제12항 내지 제15항 중 어느 한 항에 있어서,
    상기 이미지 촬영 장치는,
    상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 키 포인트 쌍의 제1 유사도에 따라, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도를 결정하도록 구성된 제3 결정부 - 상기 키 포인트 쌍은 상기 진실 인체 포즈의 제1 인체 키 포인트 및 상기 추천 인체 포즈의 제2 인체 키 포인트에 따라 결정된 것임 - ; 및
    상기 촬영 인터페이스에서 상기 제2 유사도를 디스플레이하도록 구성된 유사도 디스플레이부를 더 포함하는 것을 특징으로 하는 이미지 촬영 장치.
  17. 제12항 내지 제16항 중 어느 한 항에 있어서,
    상기 이미지 촬영 장치는,
    상기 시나리오 이미지를 영역 추천 네트워크에 입력하여, 상기 시나리오 이미지의 사진 촬영 추천 영역을 획득하도록 구성된 영역 결정부를 더 포함하고, 상기 사진 촬영 추천 영역은 상기 시나리오 이미지에서 사진 촬영을 추천하는 영역을 나타내기 위한 것이고, 상기 영역 추천 네트워크는 사진 촬영 영역을 태깅한 제1 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이며;
    상기 이미지 촬영 장치는,
    상기 촬영 인터페이스에서, 표지 심볼을 사용하여 상기 사진 촬영 추천 영역을 지시하고; 또는,
    상기 촬영 인터페이스의 상기 사진 촬영 추천 영역에서 상기 추천 인체 포즈를 디스플레이하도록 구성된 영역 디스플레이부를 더 포함하고, 상기 사진 촬영 추천 영역은 상기 대상이 상기 사진 촬영 추천 영역에 따라 위치 조정을 수행하도록 안내하기 위한 것이며; 또는,
    상기 영역 디스플레이부는 또한, 상기 촬영 인터페이스에서, 표지 심볼을 사용하여 상기 사진 촬영 추천 영역을 지시하고; 상기 촬영 인터페이스의 상기 사진 촬영 추천 영역에서 상기 추천 인체 포즈를 디스플레이하도록 구성된 것을 특징으로 하는 이미지 촬영 장치.
  18. 제12항 내지 제17항 중 어느 한 항에 있어서,
    상기 식별부는 또한, 포즈 추천 네트워크를 통해 상기 시나리오 이미지를 식별하여, 상기 시나리오 이미지에 대응되는 시나리오 카테고리 및 상기 시나리오 카테고리에 대응되는 추천 인체 포즈를 결정하도록 구성되고, 상기 포즈 추천 네트워크는 샘플 시나리오 카테고리 및 샘플 인체 포즈가 태깅된 제2 샘플 세트를 통해 훈련하여 획득된 뉴럴 네트워크이고, 상기 제2 샘플 세트는 대상이 업로드한 샘플 이미지를 포함하는 것을 특징으로 하는 이미지 촬영 장치.
  19. 제12항에 있어서,
    상기 추천 인체 포즈는 복수 개를 포함하고, 상기 이미지 촬영 장치는,
    상기 촬영 인터페이스에서 복수 개의 추천 인체 포즈에 대응되는 포즈 맵을 디스플레이하도록 구성된 포즈 맵 디스플레이부; 및 상기 포즈 맵에 대한 선택 동작에 응답하여, 선택된 포즈 맵에 따라, 상기 선택된 포즈 맵에 대응되는 추천 인체 포즈를 결정하고 디스플레이하도록 구성된 선택부를 더 포함하는 것을 특징으로 하는 이미지 촬영 장치.
  20. 제12항 내지 제16항 중 어느 한 항에 있어서,
    상기 촬영 조건은, 상기 진실 인체 포즈와 상기 추천 인체 포즈 사이의 제2 유사도가 제2 기설정된 임계값보다 크거나 같은 것; 또는, 상기 촬영 인터페이스에서의 촬영 컨트롤러가 트리거링되는 것을 포함하는 것을 특징으로 하는 이미지 촬영 장치.
  21. 제12항 내지 제20항 중 어느 한 항에 있어서,
    상기 이미지 촬영 장치는,
    상기 촬영 이미지를 처리하여, 처리된 촬영 이미지를 획득하도록 구성된 처리부를 더 포함하고, 상기 처리는 상기 촬영 이미지에서의 대상에 대해 뷰티 처리를 수행하는 것 및 상기 촬영 이미지에 필터를 추가하는 것 중 적어도 하나를 포함하며; 상기 촬영 이미지에 필터를 추가하는 것은, 상기 추천 인체 포즈에 대응되는 추천 필터에 따라, 상기 촬영 이미지의 채도, 색온도 및 휘도 중 적어도 하나를 조정하는 것을 포함하는 것을 특징으로 하는 이미지 촬영 장치.
  22. 제12항 내지 제21항 중 어느 한 항에 있어서,
    상기 장치는 인공 지능 교육 플랫폼에 적용되고, 상기 인공 지능 교육 플랫폼은 지능형 하드웨어에 연결되며; 상기 인공 지능 교육 플랫폼은, 상기 이미지 촬영 장치를 구현한 프로젝트 코드를 편집하고, 상기 프로젝트 코드를 상기 지능형 하드웨어에 송신하기 위한 것이며; 상기 지능형 하드웨어는, 시나리오 이미지를 수집하고 상기 프로젝트 코드를 작동하여, 작동 결과를 획득하고, 상기 작동 결과를 상기 인공 지능 교육 플랫폼에 송신하여, 상기 인공 지능 교육 플랫폼의 디스플레이 인터페이스에서 상기 작동 결과를 디스플레이하기 위한 것임을 특징으로 하는 이미지 촬영 장치.
  23. 전자 기기로서,
    프로세서; 및
    프로세서가 실행 가능한 명령어를 저장하도록 구성된 메모리를 포함하고,
    상기 프로세서는 상기 메모리에 저장된 명령어를 호출하여, 제1항 내지 제11항 중 어느 한 항에 따른 이미지 촬영 방법을 실행하도록 구성된 것을 특징으로 하는 전자 기기.
  24. 컴퓨터 판독 가능한 저장 매체로서,
    컴퓨터 프로그램 명령어가 저장되고, 상기 컴퓨터 프로그램 명령어가 프로세서에 의해 실행될 경우 제1항 내지 제11항 중 어느 한 항에 따른 이미지 촬영 방법을 구현하는 것을 특징으로 하는 컴퓨터 판독 가능한 저장 매체.
  25. 컴퓨터 프로그램으로서,
    컴퓨터 판독 가능한 코드를 포함하고, 상기 컴퓨터 판독 가능한 코드가 전자 기기에서 작동되는 경우, 상기 전자 기기에서의 프로세서가 실행될 경우 제1항 내지 제11항 중 어느 한 항에 따른 이미지 촬영 방법을 구현하는 것을 특징으로 하는 컴퓨터 프로그램.
KR1020227018878A 2021-04-28 2021-09-26 이미지 촬영 방법 및 장치, 전자 기기 및 컴퓨터 판독 가능한 저장 매체 KR20220149503A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202110467998.6 2021-04-28
CN202110467998.6A CN113194254A (zh) 2021-04-28 2021-04-28 图像拍摄方法及装置、电子设备和存储介质
PCT/CN2021/120722 WO2022227393A1 (zh) 2021-04-28 2021-09-26 图像拍摄方法及装置、电子设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
KR20220149503A true KR20220149503A (ko) 2022-11-08

Family

ID=76979970

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227018878A KR20220149503A (ko) 2021-04-28 2021-09-26 이미지 촬영 방법 및 장치, 전자 기기 및 컴퓨터 판독 가능한 저장 매체

Country Status (3)

Country Link
KR (1) KR20220149503A (ko)
CN (1) CN113194254A (ko)
WO (1) WO2022227393A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111627115A (zh) * 2020-05-26 2020-09-04 浙江商汤科技开发有限公司 互动合影方法及装置、互动装置以及计算机存储介质
CN113194254A (zh) * 2021-04-28 2021-07-30 上海商汤智能科技有限公司 图像拍摄方法及装置、电子设备和存储介质
CN113923355A (zh) * 2021-09-30 2022-01-11 上海商汤临港智能科技有限公司 一种车辆及图像拍摄方法、装置、设备、存储介质
CN114285988B (zh) * 2021-12-03 2024-04-09 维沃移动通信有限公司 显示方法、装置、电子设备及存储介质
CN114598817A (zh) * 2022-03-04 2022-06-07 无锡乐骐科技股份有限公司 一种基于多人交互动作判断的人机交互判断方法及装置
CN116823869A (zh) * 2022-03-18 2023-09-29 华为技术有限公司 背景替换的方法和电子设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239728B (zh) * 2017-01-04 2021-02-02 赛灵思电子科技(北京)有限公司 基于深度学习姿态估计的无人机交互装置与方法
CN107734251A (zh) * 2017-09-29 2018-02-23 维沃移动通信有限公司 一种拍照方法和移动终端
US11025815B2 (en) * 2018-09-29 2021-06-01 Apple Inc. Devices, methods, and graphical user interfaces for assisted photo-taking
CN109727208A (zh) * 2018-12-10 2019-05-07 北京达佳互联信息技术有限公司 滤镜推荐方法、装置、电子设备及存储介质
CN112351185A (zh) * 2019-08-07 2021-02-09 华为技术有限公司 拍照方法和移动终端
CN110868538A (zh) * 2019-11-11 2020-03-06 三星电子(中国)研发中心 推荐拍摄姿态的方法和电子设备
CN111062276A (zh) * 2019-12-03 2020-04-24 广州极泽科技有限公司 基于人机交互的人体姿态推荐方法、装置、机器可读介质及设备
CN111277759B (zh) * 2020-02-27 2021-08-31 Oppo广东移动通信有限公司 构图提示方法、装置、存储介质及电子设备
CN113194254A (zh) * 2021-04-28 2021-07-30 上海商汤智能科技有限公司 图像拍摄方法及装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN113194254A (zh) 2021-07-30
WO2022227393A1 (zh) 2022-11-03

Similar Documents

Publication Publication Date Title
KR20220149503A (ko) 이미지 촬영 방법 및 장치, 전자 기기 및 컴퓨터 판독 가능한 저장 매체
US10951813B2 (en) Method and system for providing recommendation information related to photography
US10880495B2 (en) Video recording method and apparatus, electronic device and readable storage medium
WO2022179026A1 (zh) 图像处理方法及装置、电子设备和存储介质
US10534972B2 (en) Image processing method, device and medium
US11520824B2 (en) Method for displaying information, electronic device and system
KR20160021738A (ko) 피부색 조절방법, 장치, 프로그램 및 기록매체
CN111241887B (zh) 目标对象关键点识别方法及装置、电子设备和存储介质
CN111047526A (zh) 一种图像处理方法、装置、电子设备及存储介质
US11657085B1 (en) Optical devices and apparatuses for capturing, structuring, and using interlinked multi-directional still pictures and/or multi-directional motion pictures
CN112991553B (zh) 信息展示方法及装置、电子设备和存储介质
EP3905662A1 (en) Image processing method and apparatus, electronic device and storage medium
WO2021047069A1 (zh) 人脸识别方法和电子终端设备
CN112115894B (zh) 手部关键点检测模型的训练方法、装置及电子设备
WO2022110837A1 (zh) 图像处理方法及装置
WO2020119254A1 (zh) 滤镜推荐方法、装置、电子设备及存储介质
CN114387445A (zh) 对象关键点识别方法及装置、电子设备和存储介质
CN111724361B (zh) 实时显示病灶的方法及装置、电子设备和存储介质
CN114445562A (zh) 三维重建方法及装置、电子设备和存储介质
CN111526287A (zh) 图像拍摄方法、装置、电子设备、服务器、系统及存储介质
CN112099639A (zh) 展示属性的调整方法、装置、展示设备和存储介质
CN112069951A (zh) 视频片段提取方法、视频片段提取装置及存储介质
CN112783316A (zh) 基于增强现实的控制方法及装置、电子设备和存储介质
CN110110742B (zh) 多特征融合方法、装置、电子设备及存储介质
CN108986803B (zh) 场景控制方法及装置、电子设备、可读存储介质