KR102034839B1 - Terminal and server providing a video call service - Google Patents

Terminal and server providing a video call service Download PDF

Info

Publication number
KR102034839B1
KR102034839B1 KR1020180034757A KR20180034757A KR102034839B1 KR 102034839 B1 KR102034839 B1 KR 102034839B1 KR 1020180034757 A KR1020180034757 A KR 1020180034757A KR 20180034757 A KR20180034757 A KR 20180034757A KR 102034839 B1 KR102034839 B1 KR 102034839B1
Authority
KR
South Korea
Prior art keywords
user
terminal
call service
video call
feature points
Prior art date
Application number
KR1020180034757A
Other languages
Korean (ko)
Other versions
KR20190056273A (en
Inventor
안상일
최혁
Original Assignee
주식회사 하이퍼커넥트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 하이퍼커넥트 filed Critical 주식회사 하이퍼커넥트
Publication of KR20190056273A publication Critical patent/KR20190056273A/en
Application granted granted Critical
Publication of KR102034839B1 publication Critical patent/KR102034839B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • H04N21/4753End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data for user identification, e.g. by entering a PIN or password
    • G06K9/00288
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone

Abstract

영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보를 이용하여, 영상 통화 서비스를 제공하는 단말의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 영상 통화 서비스를 제공하는 단말 및 영상 통화 서비스를 제공하는 서버를 개시한다.Terminal and video call service providing a video call service that determines whether a user of a terminal providing a video call service is a limited user of the video call service using distribution information of facial feature points of a user limited in providing a video call service. Initiate a server that provides.

Figure R1020180034757
Figure R1020180034757

Description

영상 통화 서비스를 제공하는 단말 및 서버{TERMINAL AND SERVER PROVIDING A VIDEO CALL SERVICE}Terminal and server providing video call service {TERMINAL AND SERVER PROVIDING A VIDEO CALL SERVICE}

영상 통화 서비스를 제공하는 단말과 영상 통화 서비스를 제공하는 서버에 관한 것이다.A terminal for providing a video call service and a server for providing a video call service.

과학 기술의 발전에 따라, 대부분의 사람들이 스마트 폰, 태블릿 PC와 같은 단말을 보유하게 되었다. 이와 같은 단말은 영상을 촬영하고, 재생할 수 있으며, 다른 단말과 통신을 수행하여 정보를 주고받거나, 영상 통화(video call)를 지원할 수 있다. With the development of science and technology, most people have terminals such as smartphones and tablet PCs. Such a terminal may capture and play an image, communicate with another terminal, exchange information, or support a video call.

영상 통화를 기반으로 하는 다양한 종류의 영상 통화 서비스가 존재한다. 예를 들어, 랜덤 영상 채팅 서비스는 랜덤 영상 채팅 서비스 이용 요청을 한 사용자의 단말을 랜덤 영상 채팅 서비스를 이용하는 사용자들 중 무작위로 선정된 사용자의 단말과 연결시켜주는 서비스이다. There are various kinds of video calling services based on video calling. For example, the random video chat service is a service that connects a terminal of a user who makes a request for using a random video chat service with a terminal of a user randomly selected among users using the random video chat service.

랜덤 영상 채팅 서비스를 비롯한 다양한 종류의 영상 통화 서비스가 좋은 품질로 제공되기 위해, 영상 통화 서비스를 이용하여 상대방에게 의도적인 부정행위를 한 사용자에 대하여 영상 통화 서비스 이용에 제한을 주는 방안이 요구된다.In order to provide various kinds of video call services including a random video chat service with good quality, a method of restricting the use of the video call service to a user who has intentionally cheated the other party using the video call service is required.

영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보를 이용하여, 영상 통화 서비스를 제공하는 단말의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 영상 통화 서비스를 제공하는 단말 및 영상 통화 서비스를 제공하는 서버를 제공하는 것이다.Terminal and video call service providing a video call service that determines whether a user of a terminal providing a video call service is a limited user of the video call service using distribution information of facial feature points of a user limited in providing a video call service. It is to provide a server that provides.

제 1 측면에 따른 서버는, 단말과 통신을 수행하는 통신 인터페이스; 스토리지; 프로세서; 및 상기 프로세서에 의해 실행 가능한 명령어들을 저장하는 메모리;를 포함하고, 상기 프로세서는, 상기 명령어들을 실행함으로써, 상기 단말에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 상기 단말로부터 상기 단말의 사용자를 촬영한 영상 스트림을 수신하고, 상기 수신된 영상 스트림으로부터 상기 단말의 사용자의 안면 특징점들을 추출하며, 상기 스토리지에 저장된 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스와 상기 추출된 단말의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하고, 상기 판단 결과를 상기 단말에 전송할 수 있다.According to a first aspect, a server comprises: a communication interface for communicating with a terminal; storage; A processor; And a memory configured to store instructions executable by the processor, wherein the processor executes the instructions, thereby executing a user providing the video call service in the terminal. Receiving a captured video stream, extracts the facial feature points of the user of the terminal from the received video stream, the distribution information database of the facial feature points of the user limited to the provision of the video call service stored in the storage and the extracted terminal Based on the similarity between the distribution information of the facial feature points of the user, it may be determined whether the user of the terminal is limited to the provision of the video call service, and transmit the determination result to the terminal.

제 2 측면에 따른 서버는 단말과 통신을 수행하는 통신 인터페이스; 스토리지; 프로세서; 및 상기 프로세서에 의해 실행 가능한 명령어들을 저장하는 메모리;를 포함하고, 상기 프로세서는, 상기 명령어들을 실행함으로써, 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보에 기초하여, 상기 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 생성하여 상기 스토리지에 저장하고, 상기 단말에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 상기 단말의 사용자를 촬영한 영상 스트림을 수신하고, 상기 수신된 영상 스트림으로부터 상기 단말의 사용자의 안면 특징점들을 추출하며, 상기 스토리지에 저장된 학습 모델 및 상기 추출된 안면 특징점들을 이용하여, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지 판단하고, 상기 판단 결과를 상기 단말에 전송할 수 있다.The server according to the second aspect comprises a communication interface for communicating with the terminal; storage; A processor; And a memory configured to store instructions executable by the processor, wherein the processor is further configured to execute the instructions, based on distribution information of facial feature points of a user whose provision of a video call service is limited. Generate and store a learning model for determining a user limited in the provision, and store in the storage, and receives an image stream photographing the user of the terminal as an application for providing a video call service is executed in the terminal, Extracting facial feature points of a user of the terminal from a video stream, and determining whether the user of the terminal is a limited user of the video call service using the learning model and the extracted facial feature points stored in the storage, and determining Send the result to the terminal Can.

제 3 측면에 따른 컴퓨터 판독 가능 저장매체에 저장된 애플리케이션은 단말에서, 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보에 기초하여 생성되는, 상기 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 서버로부터 수신하는 단계; 상기 단말에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 상기 단말의 사용자를 촬영한 영상 스트림을 획득하는 단계; 상기 획득된 영상 스트림으로부터 상기 단말의 사용자의 안면 특징점들을 추출하는 단계; 상기 학습 모델 및 상기 추출된 안면 특징점들을 이용하여, 상기 단말의 사용자가 상기 영상 통화 서버의 제공이 제한된 사용자인지 판단하는 단계; 및 상기 판단 결과에 기초하여, 상기 영상 통화 서비스를 제공하는 애플리케이션의 실행을 유지하거나 제한하는 단계;를 수행하도록 할 수 있다.The application stored in the computer-readable storage medium according to the third aspect is generated in the terminal based on the distribution information of the facial feature points of the user limited in the provision of the video call service, for determining the user limited in the provision of the video call service Receiving a learning model from a server; Acquiring a video stream photographing a user of the terminal as an application for providing a video call service is executed in the terminal; Extracting facial feature points of a user of the terminal from the obtained video stream; Determining whether a user of the terminal is limited to providing the video call server by using the learning model and the extracted facial feature points; And maintaining or limiting execution of an application that provides the video call service based on the determination result.

도 1은 영상 통화 서비스가 제공되는 환경을 설명하기 위한 도면이다.
도 2는 일 실시예에 따른 영상 통화 서비스를 제공하는 단말의 구성을 나타낸 블록도이다.
도 3은 일 실시예에 따른 영상 통화 서비스를 제공하는 서버의 구성을 나타낸 블록도이다.
도 4는 일 실시예에 따른 영상 통화 서비스를 제공하는 서버가 복수 개의 분산 서버들로 구현된 모습을 설명하기 위한 도면이다.
도 5는 일 실시예에 따라, 사용자의 안면 특징점들의 분포 정보에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 과정을 설명하기 위한 도면이다.
도 6과 도 7은 일 실시예에 따라, 영상 통화 서비스를 제공하는 서버가 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스를 이용하여, 단말의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 실시예를 설명하기 위한 도면이다.
도 8은 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스와 단말의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는 다양한 방식들을 설명하기 위한 도면이다.
도 9와 도 10은 다른 실시예에 따라, 영상 통화 서비스를 제공하는 서버가 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 이용하여, 단말의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 실시예를 설명하기 위한 도면이다.
도 11과 도 12는 또 다른 실시예에 따라, 영상 통화 서비스를 제공하는 단말이 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 이용하여, 단말의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 실시예를 설명하기 위한 도면이다.
도 13과 도 14는 또 다른 실시예에 따라, 영상 통화 서비스를 제공하는 단말이 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스를 이용하여, 단말의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 실시예를 설명하기 위한 도면이다.
1 is a diagram illustrating an environment in which a video call service is provided.
2 is a block diagram illustrating a configuration of a terminal providing a video call service according to an exemplary embodiment.
3 is a block diagram illustrating a configuration of a server providing a video call service according to an exemplary embodiment.
FIG. 4 is a diagram illustrating an example in which a server providing a video call service is implemented by a plurality of distributed servers. Referring to FIG.
5 is a diagram for describing a process of determining whether a provision of a video call service is a limited user based on distribution information of facial feature points of a user, according to an exemplary embodiment.
6 and 7 illustrate that a server providing a video call service is restricted from providing a video call service by using a distribution information database of facial feature points of a user whose provision of a video call service is limited. A diagram for describing an embodiment of determining whether a user is a user.
FIG. 8 illustrates various methods of determining whether provision of a video call service is limited based on a similarity between a distribution information database of facial feature points of a user limited in providing a video call service and distribution information of facial feature points of a user of the terminal. It is a figure for following.
9 and 10 illustrate a user who is limited to providing a video call service by using a learning model for a server providing a video call service to determine a user who is limited in providing a video call service, according to another exemplary embodiment. It is a figure for explaining the Example which determines whether it is.
11 and 12 illustrate a method in which a terminal providing a video call service is limited in providing a video call service by using a learning model for determining a user whose provision of the video call service is limited. A diagram for describing an embodiment of determining whether a user is a user.
13 and 14 illustrate a method for providing a video call service by using a distribution information database of facial feature points of a user in which a terminal providing a video call service is limited in providing a video call service, according to another embodiment. FIG. Is a view for explaining an embodiment of determining whether a user is a limited user.

이하에서는 도면을 참조하여 다양한 실시예들을 상세히 설명한다. 이하에서 설명되는 실시예들은 여러 가지 상이한 형태로 변형되어 실시될 수도 있다. 실시예들의 특징을 보다 명확히 설명하기 위하여 이하의 실시예들이 속하는 기술분야에서 통상의 지식을 가진 자에게 널리 알려져 있는 사항들에 관해서 자세한 설명은 생략한다.Hereinafter, various embodiments will be described in detail with reference to the accompanying drawings. The embodiments described below may be embodied in various different forms. In order to more clearly describe the features of the embodiments, detailed descriptions of matters well known to those skilled in the art to which the following embodiments belong will be omitted.

한편, 본 명세서에서 어떤 구성이 다른 구성과 "연결"되어 있다고 할 때, 이는 '직접적으로 연결'되어 있는 경우뿐 아니라, '그 중간에 다른 구성을 사이에 두고 연결'되어 있는 경우도 포함한다. 또한, 어떤 구성이 다른 구성을 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한, 그 외 다른 구성을 제외하는 것이 아니라 다른 구성들 더 포함할 수도 있다는 것을 의미한다.On the other hand, when a certain configuration is "connected" with another configuration in the present specification, this includes not only 'directly connected', but also 'connected between the other configuration in the middle'. In addition, when one configuration "includes" another configuration, this means that, unless specifically stated otherwise, it may further include other configurations other than the other configuration.

또한, 본 명세서에서 사용되는 '제 1' 또는 '제 2' 등과 같이 서수를 포함하는 용어는 다양한 구성 요소들을 설명하는데 사용할 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만 사용된다. In addition, terms including ordinal numbers such as 'first' or 'second' as used herein may be used to describe various components, but the components should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another.

본 실시예들은 영상 통화 서비스를 제공하는 단말 및 서버에 관한 것으로서 이하의 실시예들이 속하는 기술 분야에서 통상의 지식을 가진 자에게 널리 알려져 있는 사항들에 관해서는 자세한 설명을 생략한다.The embodiments of the present invention relate to a terminal and a server for providing a video call service, and thus detailed descriptions of matters well known to those skilled in the art to which the following embodiments belong will be omitted.

도 1은 영상 통화 서비스가 제공되는 환경을 설명하기 위한 도면이다.1 is a diagram illustrating an environment in which a video call service is provided.

영상 통화 서비스는 복수의 사용자들이 각자의 단말을 이용하여 자신의 영상을 상대방에게 전송하고 상대방의 영상을 수신함으로써 의사를 주고받을 수 있는 서비스를 의미한다. 영상 통화 서비스를 이용하는 사용자들은 각자의 단말을 통해, 영상과 음성을 주고받을 수 있으며, 채팅 기능을 통해 텍스트를 주고받을 수도 있다. 영상 통화 서비스를 이용하려는 사용자는 상대방을 직접 지정하거나, 영상 통화 서비스를 제공하는 서버에서 랜덤으로 또는 소정의 방식에 따라 상대방을 지정해줌으로써, 상대방과 영상 통화 서비스를 이용할 수 있다. The video call service refers to a service that allows a plurality of users to exchange their intentions by transmitting their video to the counterpart and receiving the counterpart's video using their respective terminals. Users using the video call service can exchange video and audio through their respective terminals, and can also send and receive text through a chat function. A user who wants to use the video call service may use the video call service with the other party by directly designating the other party or by designating the other party in a random or predetermined manner in a server providing the video call service.

도 1을 참조하면, 단말(100)이 통신망을 통해 영상 통화 서비스를 제공하는 서버(200)와 연결되어 있다. 서버(200)는 복수의 사용자들이 각자의 단말(100)을 이용하여 영상 통화 서비스를 이용할 수 있도록 도와주는 각종 프로그램 또는 애플리케이션과 데이터를 저장할 수 있다. 서버(200)는 근거리 통신 및 원격지 통신을 모두 수행할 수 있다. 서버(200)는 통신망을 통해 복수의 단말(100)들과 연결될 수 있다. 단말(100)은 서버(200)와의 연결에 이용될 수 있는 다양한 종류의 사용자 단말이 될 수 있다. 예를 들어, 단말(100)은 서버(200)와 통신을 수행할 수 있는 장치로서, 스마트 왓치와 같은 웨어러블 장치, 스마트 폰, 태블릿 PC, 랩톱 컴퓨터와 같은 모바일 장치, 또는 데스크톱 컴퓨터와 같은 스테이셔너리(satationary) 장치 등이 될 수 있다. 또한, 단말(100)은 영상 통화 서비스를 통해 연결되는 사용자들 간 영상 통화가 이루어질 수 있도록, 영상을 촬영하고 재생할 수 있는, 영상 통화를 지원하는 영상 통화 장치일 수 있다.Referring to FIG. 1, the terminal 100 is connected to a server 200 that provides a video call service through a communication network. The server 200 may store various programs or applications and data which help a plurality of users to use a video call service using their respective terminals 100. The server 200 may perform both short range communication and remote location communication. The server 200 may be connected to the plurality of terminals 100 through a communication network. The terminal 100 may be various types of user terminals that may be used to connect to the server 200. For example, the terminal 100 is a device capable of communicating with the server 200, and is a wearable device such as a smart watch, a mobile device such as a smart phone, a tablet PC, a laptop computer, or a stationary device such as a desktop computer. It may be a stationary device or the like. In addition, the terminal 100 may be a video call device that supports a video call, which can capture and play back images so that video calls can be made between users connected through a video call service.

도 2는 일 실시예에 따른 단말(100)의 구성을 나타낸 블록도이다.2 is a block diagram illustrating a configuration of a terminal 100 according to an exemplary embodiment.

도 2를 참고하면, 단말(100)은 메모리(110), 프로세서(120), 사용자 인터페이스(130), 통신 인터페이스(140), 및 음성 및 영상 입력부(150)를 포함할 수 있다. 본 실시예와 관련된 기술분야에서 통상의 지식을 가진 자라면 도 2에 도시된 구성요소들 외에 다른 범용적인 구성요소들이 더 포함될 수 있음을 알 수 있다.Referring to FIG. 2, the terminal 100 may include a memory 110, a processor 120, a user interface 130, a communication interface 140, and an audio and video input unit 150. Those skilled in the art will appreciate that other general purpose elements may be included in addition to the elements shown in FIG. 2.

메모리(110)는 소프트웨어 또는 프로그램을 저장할 수 있다. 예를 들어, 메모리(110)는 애플리케이션, 애플리케이션 프로그래밍 인터페이스(API) 등과 같은 프로그램 및 다양한 종류의 데이터를 저장할 수 있다. 메모리(110)는 프로세서(120)에 의해 실행 가능한 명령어들을 저장할 수 있다. The memory 110 may store software or a program. For example, the memory 110 may store an application, a program such as an application programming interface (API), and the like, and various kinds of data. The memory 110 may store instructions executable by the processor 120.

프로세서(120)는 메모리(110)에 저장된 명령어들을 실행할 수 있다. 프로세서(120)는 메모리(110)에 저장된 각종 프로그램, 컨텐츠, 및 데이터를 이용하거나, 또는 새로운 프로그램, 컨텐츠, 및 데이터를 메모리(110)에 저장할 수도 있다. The processor 120 may execute instructions stored in the memory 110. The processor 120 may use various programs, contents, and data stored in the memory 110, or may store new programs, contents, and data in the memory 110.

프로세서(120)는 메모리(110)에 액세스하여, 메모리(110)에 저장된 O/S를 이용하여 부팅을 수행할 수 있다. 프로세서(120)는 메모리(110)에 저장된 각종 프로그램, 컨텐츠, 및 데이터 등을 이용하여 다양한 동작을 수행할 수 있다. 예를 들어, 프로세서(120)는 메모리(110)에 저장된 각종 프로그램, 컨텐츠, 및 데이터를 이용하여, 디스플레이(136)에 소정의 화면을 표시할 수 있다. 프로세서(120)는 디스플레이(136)의 일 영역에 대한 사용자 조작이 이루어지면, 사용자의 조작에 대응되는 제어 동작을 수행할 수 있다. The processor 120 may access the memory 110 and perform booting using an operating system stored in the memory 110. The processor 120 may perform various operations by using various programs, contents, data, and the like stored in the memory 110. For example, the processor 120 may display a predetermined screen on the display 136 using various programs, contents, and data stored in the memory 110. When a user manipulation of one region of the display 136 is performed, the processor 120 may perform a control operation corresponding to the manipulation of the user.

프로세서(120)는 그래픽 처리에 특화된 GPU(Graphic Processing Unit)를 포함할 수 있다. GPU는 단말(100)의 부팅이 완료되면, 디스플레이(136)의 영역에 사용자 인터페이스 화면을 디스플레이한다. 구체적으로는, GPU는 컨텐츠, 아이콘, 및 메뉴 등과 같은 다양한 객체를 포함하는 영상 통화 레이아웃이 표시된 화면을 생성할 수 있다. GPU는 화면의 영상 통화 레이아웃에 따라 각 객체들이 표시될 좌표값, 형태, 크기, 및 컬러 등과 같은 속성값을 연산할 수 있다. 그리고, GPU는 연산된 속성값에 기초하여 객체를 포함하는 다양한 레이아웃의 화면을 생성할 수 있다. GPU에서 생성된 화면은 디스플레이(136)로 제공되어, 디스플레이(136)의 각 영역에 각각 표시될 수 있다.The processor 120 may include a graphic processing unit (GPU) specialized in graphic processing. When the booting of the terminal 100 is completed, the GPU displays a user interface screen on an area of the display 136. Specifically, the GPU may generate a screen on which a video call layout including various objects such as content, icons, and menus is displayed. The GPU may calculate attribute values such as coordinates, shapes, sizes, and colors in which the objects are to be displayed according to the video call layout of the screen. The GPU may generate screens of various layouts including objects based on the calculated attribute values. The screen generated by the GPU may be provided to the display 136 and displayed on each area of the display 136.

한편, 프로세서(120)는 비디오 프로세서와 오디오 프로세서를 포함할 수 있다. 프로세서(120)는 비디오 프로세서와 오디오 프로세서를 제어하여, 통신 인터페이스(140)를 통해 수신된 영상 스트림 또는, 메모리(110)에 저장된 영상 스트림에 포함된 비디오 데이터 또는 오디오 데이터를 처리할 수 있다.The processor 120 may include a video processor and an audio processor. The processor 120 may control the video processor and the audio processor to process the video data or the audio data included in the video stream received through the communication interface 140 or the video stream stored in the memory 110.

사용자 인터페이스(130)는 입력부(131)와 출력부(135)를 포함할 수 있다.The user interface 130 may include an input unit 131 and an output unit 135.

입력부(131)는 사용자로부터 다양한 명령어를 입력받을 수 있다. 입력부(131)는 키패드(132), 터치 패널(133) 및 펜 인식 패널(134) 중 적어도 하나를 포함할 수 있다. The input unit 131 may receive various commands from a user. The input unit 131 may include at least one of a keypad 132, a touch panel 133, and a pen recognition panel 134.

키패드(132)는 단말(100)의 본체 외관의 전면부나 측면부, 또는 배면부 등의 다양한 영역에 형성된 기계적 버튼, 및 휠 등과 같은 다양한 유형의 키를 포함할 수 있다.The keypad 132 may include various types of keys, such as mechanical buttons and wheels, which are formed in various areas such as a front portion, a side portion, or a rear portion of the main body exterior of the terminal 100.

터치 패널(133)은 사용자의 터치 입력을 감지하고, 감지된 터치 신호에 해당하는 터치 이벤트 값을 출력할 수 있다. 터치 패널(133)이 표시 패널과 결합하여 터치 스크린을 구성한 경우, 터치 스크린은 정전식이나, 감압식, 및 압전식 등과 같은 다양한 유형의 터치 센서로 구현될 수 있다. The touch panel 133 may detect a user's touch input and output a touch event value corresponding to the detected touch signal. When the touch panel 133 is combined with the display panel to form a touch screen, the touch screen may be implemented as various types of touch sensors such as capacitive, pressure sensitive, and piezoelectric.

펜 인식 패널(134)은 사용자의 터치용 펜(예컨대, 스타일러스 펜(stylus pen))의 운용에 따른 펜의 근접 입력 또는 터치 입력을 감지하고 감지된 펜 근접 이벤트 또는 펜 터치 이벤트를 출력할 수 있다. 펜 인식 패널(134)은, 예로, EMR(Electromagnetic Radiation) 방식으로 구현될 수 있으며, 펜의 근접 또는 터치에 의한 전자기장의 세기 변화에 따라 터치 또는 근접 입력을 감지할 수 있다. 펜 인식 패널(134)은 그리드 구조를 가지는 전자 유도 코일 센서와 전자 유도 코일 센서의 각 루프 코일에 순차적으로 소정의 주파수를 가지는 교류 신호를 제공하는 전자 신호 처리부를 포함하여 구성될 수 있다. The pen recognition panel 134 may detect a proximity input or touch input of the pen according to the operation of the user's touch pen (eg, a stylus pen) and output the detected pen proximity event or pen touch event. . The pen recognition panel 134 may be implemented by, for example, an electromagnetic radiation (EMR) method, and may detect a touch or a proximity input according to a change in the intensity of an electromagnetic field due to a proximity or a touch of a pen. The pen recognition panel 134 may include an electromagnetic induction coil sensor having a grid structure and an electronic signal processor for sequentially providing an AC signal having a predetermined frequency to each loop coil of the electromagnetic induction coil sensor.

출력부(135)는 디스플레이(136), 및 스피커(137)를 포함할 수 있다. The output unit 135 may include a display 136 and a speaker 137.

디스플레이(136)는 표시 패널 및 표시 패널을 제어하는 컨트롤러를 포함할 수 있다. 표시 패널은 LCD(Liquid Crystal Display), OLED(Organic Light Emitting Diodes) 디스플레이, AM-OLED(Active-Matrix Organic Light-Emitting Diode), 및 PDP(Plasma Display Panel) 등과 같은 다양한 방식으로 구현될 수 있다. 표시 패널은 유연하게(flexible) 또는 착용할 수 있게(wearable) 구현될 수 있다. 디스플레이(136)는 입력부(131)의 터치 패널(133)과 결합되어 터치 스크린으로 제공될 수 있다. The display 136 may include a display panel and a controller to control the display panel. The display panel may be implemented in various ways such as a liquid crystal display (LCD), an organic light emitting diodes (OLED) display, an active-matrix organic light-emitting diode (AM-OLED), a plasma display panel (PDP), and the like. The display panel may be implemented to be flexible or wearable. The display 136 may be combined with the touch panel 133 of the input unit 131 and provided as a touch screen.

스피커(137)는 오디오 데이터에 기초하여 소리를 출력할 수 있다. 예를 들어, 스피커(137)는 영상 스트림에 포함된 오디오 데이터에 따라, 사용자의 음성을 출력할 수 있다.The speaker 137 may output sound based on the audio data. For example, the speaker 137 may output the user's voice according to the audio data included in the video stream.

통신 인터페이스(140)는 다양한 유형의 통신방식에 따라 다양한 유형의 외부 기기와 통신을 수행할 수 있다. 통신 인터페이스(140)는 와이파이 칩, 블루투스 칩, NFC(Near Field Communication) 칩, 및 무선통신 칩 중 적어도 하나를 포함할 수 있다. 프로세서(120)는 통신 인터페이스(140)를 이용하여 각종 외부 기기와 통신을 수행할 수 있다.The communication interface 140 may communicate with various types of external devices according to various types of communication methods. The communication interface 140 may include at least one of a Wi-Fi chip, a Bluetooth chip, a Near Field Communication (NFC) chip, and a wireless communication chip. The processor 120 may communicate with various external devices using the communication interface 140.

와이파이 칩, 블루투스 칩은 각각 WiFi 방식, 블루투스 방식으로 통신을 수행할 수 있다. 와이파이 칩이나 블루투스 칩을 이용하는 경우에는 SSID 및 세션 키 등과 같은 각종 연결 정보를 먼저 송수신하여, 이를 이용하여 통신 연결한 후 각종 정보들을 송수신할 수 있다. NFC 칩은 다양한 RF-ID 주파수 대역들 중에서 13.56MHz 대역을 사용하는 NFC 방식으로 동작하는 칩을 의미한다. 무선 통신 칩은 IEEE(Institute of Electrical and Electronics Engineers), 지그비, 3G(3rd Generation), 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), 및 5G(5th Generation) 등과 같은 다양한 통신 규격에 따라 통신을 수행하는 칩을 의미한다. The Wi-Fi chip and the Bluetooth chip may communicate with each other by WiFi or Bluetooth. In the case of using a Wi-Fi chip or a Bluetooth chip, various connection information such as SSID and session key may be transmitted and received first, and then various communication information may be transmitted and received by using the same. NFC chip refers to a chip that operates in the NFC method using the 13.56MHz band of the various RF-ID frequency bands. Wireless communication chips are based on various communication standards such as Institute of Electrical and Electronics Engineers (IEEE), Zigbee, 3rd Generation (3G), 3rd Generation Partnership Project (3GPP), Long Term Evolution (LTE), and 5th Generation (5G). Means a chip that performs communication.

음성 및 영상 입력부(150)는 마이크(151)와 카메라(153)를 포함할 수 있다. 마이크(151)는 사용자 음성이나 기타 소리를 입력받아 오디오 데이터로 변환할 수 있다. 프로세서(120)는 마이크(151)를 통해 입력되는 사용자 음성을 영상 통화에 이용하거나, 오디오 데이터로 변환하여 메모리(110)에 저장할 수 있다. 카메라(153)는 사용자의 제어에 따라 정지 영상 또는 동영상을 촬영할 수 있다. 카메라(153)는 단말(100)의 전면 또는 후면에 위치한 카메라 모듈일 수 있다. 프로세서(120)는 마이크(151)를 통해 입력되는 음성과 카메라(153)에 의해 촬영되는 영상을 이용하여, 영상 통화를 위한 영상 스트림을 생성할 수 있다. The audio and video input unit 150 may include a microphone 151 and a camera 153. The microphone 151 may receive a user voice or other sound and convert it into audio data. The processor 120 may use the user's voice input through the microphone 151 in a video call, or convert the user's voice into audio data and store it in the memory 110. The camera 153 may capture a still image or a video under the control of the user. The camera 153 may be a camera module located at the front or the rear of the terminal 100. The processor 120 may generate a video stream for a video call by using the voice input through the microphone 151 and the image captured by the camera 153.

한편, 단말(100)은 모션 제어 모드나 음성 제어 모드로 동작할 수 있다. 모션 제어 모드로 동작하는 경우, 프로세서(120)는 카메라(153)를 활성화시켜 사용자를 촬영하고, 사용자의 모션 변화를 추적하여 그에 대응되는 제어 동작을 수행할 수 있다. 음성 제어 모드로 동작하는 경우, 프로세서(120)는 마이크(151)를 통해 입력된 사용자 음성을 분석하고, 분석된 사용자 음성에 따라 제어 동작을 수행할 수 있다. Meanwhile, the terminal 100 may operate in a motion control mode or a voice control mode. When operating in the motion control mode, the processor 120 may activate the camera 153 to photograph the user, track the motion change of the user, and perform a control operation corresponding thereto. When operating in the voice control mode, the processor 120 may analyze a user voice input through the microphone 151 and perform a control operation according to the analyzed user voice.

전술한 단말(100)의 구성 요소들의 명칭은 달라질 수 있다. 또한, 본 개시에 따른 단말(100)은 전술한 구성요소들 중 적어도 하나를 포함하여 구성될 수 있으며, 일부 구성요소가 생략되거나 또는 추가적인 다른 구성요소를 더 포함할 수 있다. 단말(100)은 전술한 구성요소들 중 적어도 하나를 이용하여, 다음과 같은 동작을 수행할 수 있다.The names of the components of the terminal 100 described above may vary. In addition, the terminal 100 according to the present disclosure may be configured to include at least one of the above-described components, some components may be omitted or further include additional components. The terminal 100 may perform the following operations by using at least one of the above-described components.

도 3은 일 실시예에 따른 영상 통화 서비스를 제공하는 서버(200)의 구성을 나타낸 블록도이다. 3 is a block diagram illustrating a configuration of a server 200 that provides a video call service according to an exemplary embodiment.

도 3을 참조하면, 서버(200)는 메모리(210), 프로세서(220), 스토리지(230), 및 통신 인터페이스(240)을 포함한다. 본 실시예와 관련된 기술분야에서 통상의 지식을 가진 자라면 서버(200)가 도 3에 도시된 구성요소들 외에 다른 범용적인 구성요소들을 더 포함할 수 있음을 알 수 있다. 도 3의 블록도의 각 구성요소는 서버(200)의 구현 방식에 따라 분리, 추가, 또는 생략될 수 있다. 즉, 구현 방식에 따라 하나의 구성요소가 둘 이상의 구성요소로 세분화되거나, 둘 이상의 구성요소가 하나의 구성요소로 합쳐질 수도 있고, 일부 구성요소가 더 추가되거나 제거될 수 있다. Referring to FIG. 3, the server 200 includes a memory 210, a processor 220, a storage 230, and a communication interface 240. Those skilled in the art can recognize that the server 200 may further include other general purpose components in addition to the components illustrated in FIG. 3. Each component of the block diagram of FIG. 3 may be separated, added, or omitted depending on the implementation manner of the server 200. That is, one component may be subdivided into two or more components, two or more components may be combined into one component, and some components may be further added or removed according to an implementation manner.

메모리(210)는 프로세서(220)에 의해 실행 가능한 명령어들을 저장할 수 있다. 메모리(210)는 소프트웨어 또는 프로그램을 저장할 수 있다. The memory 210 may store instructions executable by the processor 220. The memory 210 may store software or a program.

프로세서(220)는 메모리(210)에 저장된 명령어들을 실행할 수 있다. 프로세서(220)는 서버(200)의 전반적인 동작을 제어할 수 있다. 프로세서(220)는 통신 인터페이스(240)를 통해 수신되는 정보 및 요청 사항을 획득하고, 수신되는 정보를 스토리지(230)에 저장할 수 있다. 또한, 프로세서(220)는 수신되는 정보를 가공할 수 있다. 예를 들어, 프로세서(220)는 단말(100)로부터 수신되는 정보로부터 영상 통화 서비스에 이용되는 정보를 생성하거나, 수신되는 정보들을 관리하기 위한 가공행위를 수행하여, 스토리지(230)에 저장할 수 있다. 또한, 프로세서(220)는 단말(100)로부터 획득된 요청 사항에 대한 응답으로써, 스토리지(230)에 저장된 정보를 이용하여, 통신 인터페이스(240)를 통해 단말(100)에 영상 통화 서비스를 제공하기 위한 정보를 전송할 수 있다.The processor 220 may execute instructions stored in the memory 210. The processor 220 may control the overall operation of the server 200. The processor 220 may obtain information and a request received through the communication interface 240 and store the received information in the storage 230. In addition, the processor 220 may process the received information. For example, the processor 220 may generate information used for the video call service from the information received from the terminal 100 or perform processing to manage the received information and store the information in the storage 230. . In addition, the processor 220 provides a video call service to the terminal 100 through the communication interface 240 by using information stored in the storage 230 as a response to the request obtained from the terminal 100. Information can be sent.

스토리지(230)는 서버(200)가 영상 통화 서비스를 제공하기 위해 필요한 각종 소프트웨어 및 정보들을 저장할 수 있다. 예를 들어, 스토리지(230)는 서버(200)에서 실행되는 프로그램, 애플리케이션, 및 영상 통화 서비스에 이용되는 각종 데이터를 저장할 수 있다. The storage 230 may store various software and information necessary for the server 200 to provide a video call service. For example, the storage 230 may store programs, applications, and various data used for a video call service executed in the server 200.

스토리지(230)는 영상 통화 서비스를 이용하는 사용자별 개인 정보를 데이터베이스화하여 저장 및 관리할 수 있다. 스토리지(230)는 서버(200)에 접속하기 위한 계정별로 사용자의 신상 정보와 영상 통화 서비스에 이용되는 가상 재화(virtual property) 정보와 같은 다양한 정보 등을 저장할 수 있다. 신상 정보는 영상 통화 서비스를 이용하는 사용자의 국적, 이름, 성별, 및 관심사 등의 개인 정보를 포함할 수 있다. 가상 재화 정보는 영상 통화 서비스를 이용하는 사용자가 유료로 제공되는 부가 서비스를 이용하기 위한 가상 재화일 수 있다. 예를 들어, 사용자가 원하는 조건의 상대방과 영상 통화 매칭을 하기 위해서는 사용자는 소정의 가상 재화를 지불하여야 한다. The storage 230 may store and manage a database of personal information for each user using a video call service. The storage 230 may store various information such as user's personal information and virtual property information used for a video call service for each account for accessing the server 200. The personal information may include personal information such as nationality, name, gender, and interest of the user who uses the video call service. The virtual goods information may be a virtual goods for using a supplementary service provided by a user using a video call service for a fee. For example, in order to perform video call matching with a counterpart of a user's desired condition, the user must pay a predetermined virtual goods.

통신 인터페이스(240)는 단말(100)을 포함한 외부 기기와 통신을 수행할 수 있다. 예를 들어, 서버(200)는 단말(100)로부터 영상 통화 서비스 개시 요청, 및 영상 통화 서비스 환경을 갖추기 위한 설정 정보에 대한 요청 등을 수신하고, 단말(100)의 요청에 대한 응답으로, 영상 통화 서비스와 관련된 정보들을 제공할 수 있다.The communication interface 240 may communicate with an external device including the terminal 100. For example, the server 200 receives a video call service start request from the terminal 100, a request for setting information for establishing a video call service environment, and the like, and responds to the request of the terminal 100. Information related to the call service may be provided.

도 4는 다른 실시예에 따라 영상 통화 서비스를 제공하는 서버(200)가 복수 개의 분산 서버들로 구현된 모습을 설명하기 위한 도면이다. 이상에서 영상 통화 서비스를 제공하는 서버(200)와 관련하여 기재된 내용은 이하 생략된 내용이라 하더라도 그대로 적용될 수 있다.4 is a diagram for describing a server 200 that provides a video call service according to another exemplary embodiment in which a plurality of distributed servers are implemented. The contents described above with respect to the server 200 for providing a video call service may be applied even if omitted below.

도 4를 참고하면, 영상 통화 서비스를 제공하는 분산 서버들은 부하 분산 서버(200-1)와 영상 통화 서비스를 제공하는 기능 서버들(200-3, 200-5, 200-7)로 구성될 수 있다. 부하 분산 서버(200-1)는 단말(100)과 같은 외부 기기의 영상 통화 서비스에 관한 요청이 있을 때, 영상 통화 서비스를 제공하는 기능 서버들(200-3, 200-5, 200-7) 중 임의의 서버를 결정하여 단말(100)에 연결시키거나, 영상 통화 서비스를 제공하는 기능 서버들(200-3, 200-5, 200-7)의 상태를 모니터링하여 최적의 서버를 선택하여 단말(100)에 연결시킬 수 있다.Referring to FIG. 4, distributed servers providing a video call service may include a load balancing server 200-1 and function servers 200-3, 200-5, and 200-7 providing a video call service. have. The load balancing server 200-1 is a function server for providing a video call service when a request for a video call service of an external device such as the terminal 100 is provided (200-3, 200-5, 200-7). Determining any of the servers to connect to the terminal 100, or monitor the status of the function server (200-3, 200-5, 200-7) providing a video call service to select the optimal server 100 can be connected.

한편, 영상 통화 서비스를 제공하는 서비스 제공자는 좋은 품질의 영상 통화 서비스를 제공하기 위해 부정행위를 한 사용자에 대해서 조치를 취할 수 있다. 부정행위를 한 사용자의 예로는, 영상 통화 서비스를 이용하는 도중에 소정 수위 이상의 신체 노출을 하거나, 인종 차별적 발언 또는 욕을 하거나, 반사회적 또는 반인륜적 컨텐츠를 실행한 자일 수 있다. 영상 통화 서비스를 제공하는 서비스를 제공하는 서비스 제공자는 다른 사용자들을 위해 이러한 부정행위를 한 사용자에 대해서는 영상 통화 서비스의 제공을 제한할 수 있다. 예를 들어, 서비스 제공자는 부정행위를 한 사용자를 영상 통화 서비스를 이용할 수 있는 사용자 목록에서 제거하거나 영상 통화 서비스를 이용할 수 없는 사용자 목록에 저장할 수 있다. 그리고, 서비스 제공자는 부정행위를 한 사용자의 영상 통화 서비스 개시 요청을 무시 또는 차단하거나, 실행된 영상 통화 서비스를 제공하는 애플리케이션을 종료시키거나, 부정행위를 한 이력에 의해 상기 영상 통화 서비스의 제공이 제한됨을 알려주는 메시지를 제공하여 영상 통화 서비스의 이후 진행이 불가함을 알려줄 수 있다. 이하, 부정행위 등을 이유로 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보를 이용하여, 단말의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 단말(100) 및 서버(200)에 대해 설명한다.On the other hand, a service provider that provides a video call service may take action against a user who has cheated to provide a good quality video call service. An example of a cheating user may be a person who exposes a certain level or more, racist remarks or insults, or executes anti-social or anti-human content while using the video call service. A service provider providing a service for providing a video call service may restrict the provision of a video call service to a user who has cheated on behalf of other users. For example, the service provider may remove the cheating user from the user list that can use the video call service or store it in the user list that cannot use the video call service. The service provider may ignore or block the video call service start request of the user who cheated, terminate the application providing the executed video call service, or provide the video call service based on the history of cheating. By providing a message indicating that the limited can be informed that the further progress of the video call service is not possible. Hereinafter, the terminal 100 and the server 200 that determine whether the user of the terminal is limited in the provision of the video call service by using distribution information of the facial feature points of the user whose provision of the video call service is restricted due to cheating or the like. Explain.

도 5는 일 실시예에 따라, 사용자의 안면 특징점들의 분포 정보에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 과정을 설명하기 위한 도면이다.5 is a diagram for describing a process of determining whether a provision of a video call service is a limited user based on distribution information of facial feature points of a user, according to an exemplary embodiment.

도 5를 참조하면, 사용자는 사용자의 단말(100)에서 영상 통화 서비스를 제공하는 애플리케이션을 실행할 수 있다. 단말(100)에서 애플리케이션이 실행됨에 따라, 단말(100)은 영상 통화 서비스의 제공을 위해 요구되는 정보를 단말(100)의 디스플레이에 표시하여 사용자로부터 입력받을 수 있다. 단말(100)은 영상 통화 서비스를 제공하는 애플리케이션에 대한 사용자의 회원가입 또는 로그인을 위해 사용자의 안면을 촬영할 수 있다. 또는, 단말(100)에서 애플리케이션이 실행됨에 따라, 애플리케이션을 통해 사용자의 단말(100)과 영상 통화의 상대방의 단말 간의 영상 통화가 이루어지기 전 또는 영상 통화 중에, 단말(100)은 사용자의 안면을 촬영한 영상을 수집할 수 있다. 부정행위를 이유로 이미 영상 통화 서비스 이용이 제한된 사용자가 새롭게 회원가입을 시도하거나, 다른 계정으로 로그인을 하거나, 다른 계정으로 로그인된 다른 사용자의 단말을 이용하여 영상 통화 서비스를 이용하려고 하는 경우, 영상 통화 서비스의 제공이 제한된 사용자가 영상 통화 서비스를 이용하는 것을 차단하기 위함이다.Referring to FIG. 5, a user may execute an application for providing a video call service in the user terminal 100. As the application is executed in the terminal 100, the terminal 100 may display information required for providing a video call service on a display of the terminal 100 and receive an input from a user. The terminal 100 may photograph the user's face in order to register or log in to the user for an application that provides a video call service. Alternatively, as the application is executed in the terminal 100, before the video call is made between the terminal 100 of the user and the terminal of the counterpart of the video call through the application, or during the video call, the terminal 100 faces the user's face. You can collect the images taken. If a user who is already restricted from using the video call service because of cheating attempts to register a new member, logs in with a different account, or tries to use the video call service using another user's terminal logged in with a different account, This is to block a user who has limited service provision from using the video call service.

단말(100)은 카메라(132)를 통해 사용자를 촬영한 영상 또는 영상 스트림을 획득할 수 있다. 영상 스트림은 적어도 하나의 영상을 포함한 것일 수 있다. 단말(100)은 단말(100)의 사용자의 안면의 각도와 사이즈가 소정의 기준에 맞게 촬영되도록, 단말(100)의 화면에 가이드라인을 제공할 수 있다. 가이드라인을 제공하는 이유는 최대한 규격화된 각도 및 사이즈의 안면 영상을 획득하기 위함이다. 단말(100)은 제공된 가이드라인에 따라 단말(100)의 사용자의 안면이 촬영된 영상 스트림을 획득할 수 있다.The terminal 100 may obtain an image or an image stream of the user through the camera 132. The video stream may include at least one video. The terminal 100 may provide a guideline on the screen of the terminal 100 so that the angle and size of the face of the user of the terminal 100 are photographed according to a predetermined criterion. The reason for providing a guideline is to obtain a facial image of the maximum standardized angle and size. The terminal 100 may obtain an image stream in which the face of the user of the terminal 100 is photographed according to the provided guidelines.

단말(100) 또는 서버(200)는 소정의 영상 처리 알고리즘에 기초하여, 사용자를 촬영한 영상 스트림으로부터 사용자의 안면 특징점들을 추출할 수 있다. 여기서, 안면 특징점들은 안면 영상에 포함된 특정한 모양, 패턴, 색상, 밝기 또는 이들의 조합으로부터 획득될 수 있다. 예를 들면, 단말(100) 또는 서버(200)는 사용자를 촬영한 영상 스트림 중 촬영된 각도에 기초하여 사용자의 안면이 가장 정면으로 촬영된 영상이나 사용자의 안면이 가장 선명하게 촬영되고, 소정의 사이즈에 가장 가까운 사이즈의 영상을 선정하여, 선정된 영상에서 단말(100)의 사용자의 안면 부위인 눈 부위, 코 부위, 입 부위, 이마 부위, 볼 부위, 턱 부위 및 안면 윤곽으로부터 안면 특징점들을 추출할 수 있다.The terminal 100 or the server 200 may extract facial feature points of the user from an image stream photographing the user based on a predetermined image processing algorithm. Here, the facial feature points may be obtained from a specific shape, pattern, color, brightness, or a combination thereof included in the facial image. For example, the terminal 100 or the server 200 captures the image of the user's face most front or the user's face most clearly based on the angle photographed from the image stream of the user. By selecting an image of the size closest to the size, the facial feature points are extracted from the eyes, nose, mouth, forehead, cheek, jaw and facial contours of the user's face of the terminal 100 from the selected image. can do.

단말(100) 또는 서버(200)는 사용자의 안면 특징점들의 분포 정보에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다. The terminal 100 or the server 200 may determine whether the provision of the video call service is limited based on the distribution information of the facial feature points of the user.

사용자가 영상 통화 서비스의 제공이 제한되지 않은 사용자인 것으로 판단되면, 단말(100) 또는 서버(200)는 영상 통화 서비스를 제공하는 애플리케이션의 실행을 유지시킬 수 있다. If it is determined that the user is a user who is not limited to providing the video call service, the terminal 100 or the server 200 may maintain execution of an application for providing the video call service.

사용자가 영상 통화 서비스의 제공이 제한된 사용자인 것으로 판단되면, 단말(100) 또는 서버(200)는 영상 통화 서비스를 제공하는 애플리케이션의 실행을 제한할 수 있다.If it is determined that the user is a limited user of providing the video call service, the terminal 100 or the server 200 may limit the execution of the application for providing the video call service.

이하, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는 주체와 판단하는 방식에 따라 구별되는 다양한 실시예들을 도 6 내지 도 14를 참조하여 설명한다.Hereinafter, various embodiments which are distinguished according to a subject and a method of determining whether the provision of a video call service is a limited user will be described with reference to FIGS. 6 to 14.

도 6과 도 7은 일 실시예에 따라, 영상 통화 서비스를 제공하는 서버(200)가 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스를 이용하여, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 실시예를 설명하기 위한 도면이다.6 and 7 illustrate an example in which a server 200 providing a video call service uses a distribution information database of facial feature points of a user whose provision of a video call service is restricted, so that a user of the terminal 100 may display an image. FIG. 14 is a diagram for describing an embodiment of determining whether a provision of a call service is a limited user.

도 6을 참조하면, 서버(200)가 단말(100)과 통신을 수행하여, 단말(100)의 사용자를 촬영한 영상 스트림을 수신하고, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단한 판단 결과를 단말(100)로 전송할 수 있다. Referring to FIG. 6, the server 200 communicates with the terminal 100 to receive a video stream photographing a user of the terminal 100, and the user of the terminal 100 is limited in providing a video call service. The determination result of determining whether the user is a user may be transmitted to the terminal 100.

단말(100)에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 단말(100)은 회원가입 과정이나 로그인 과정, 또는 영상 통화 서비스가 연결되기 전이나 영상 통화 서비스 이용 과정 중에서 사용자를 촬영할 수 있다. 단말(100)은 소정의 시기나 조건을 만족할 때 단말(100)의 사용자를 촬영하고, 촬영한 영상 스트림을 서버(200)로 전송할 수 있다.As the application for providing a video call service is executed in the terminal 100, the terminal 100 may photograph a user during a membership registration process, a login process, a video call service connection, or a video call service use process. When the terminal 100 satisfies a predetermined time or condition, the terminal 100 may photograph the user of the terminal 100 and transmit the captured image stream to the server 200.

서버(200)는 영상 통화 서비스를 제공하는데 이용되는 정보와 영상 통화 서비스를 이용하는 사용자의 신상 정보, 예를 들어, 사용자의 국적, 이름, 성별, 및 관심사 등의 개인 정보를 저장하여 관리할 수 있다. 서버(200)는 영상 통화 서비스를 이용하는 중 부정행위를 한 사용자에 대한 정보를 저장해 둘 수 있다. 예를 들어, 서버(200)는 부정행위를 하여 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보를 데이터베이스화하여 저장해 둘 수 있다. 서버(200)는 단말(100)로부터 사용자를 촬영한 영상 스트림이 수신함으로써, 영상 스트림에 포함된 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지에 대한 판단 요청이 수신되면, 판단 후 판단 결과를 단말(100)에 전송할 수 있다.The server 200 may store and manage information used to provide a video call service and personal information of a user who uses the video call service, for example, personal information such as nationality, name, gender, and interest of the user. . The server 200 may store information on a user who cheated while using the video call service. For example, the server 200 may store distribution information of facial feature points of a user who is restricted from providing a video call service by cheating. When the server 200 receives a video stream photographing the user from the terminal 100 and receives a request for determining whether the user included in the video stream is a user limited in providing a video call service, the server 200 determines the terminal after the determination. 100 can be sent.

도 7을 참조하면, 블록 710에서, 서버(200)는 단말(100)에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 단말(100)로부터 단말(100)의 사용자를 촬영한 영상 스트림을 수신할 수 있다. 예를 들어, 서버(200)는 영상 통화 서비스를 제공하는 애플리케이션에 대한 사용자의 회원가입 과정이나 로그인 과정, 또는 영상 통화가 이루어지기 전이나 영상 통화 중에, 단말(100)에서 촬영된 사용자의 안면을 포함한 영상 스트림을 수신할 수 있다. Referring to FIG. 7, in block 710, the server 200 receives an image stream of a user of the terminal 100 from the terminal 100 as an application for providing a video call service is executed in the terminal 100. can do. For example, the server 200 may face the user's face photographed by the terminal 100 before the user registration process or login process for the application providing the video call service, or before the video call or during the video call. The included video stream can be received.

블록 720에서, 서버(200)는 수신된 영상 스트림으로부터 단말(100)의 사용자의 안면 특징점들을 추출할 수 있다.In block 720, the server 200 may extract facial feature points of the user of the terminal 100 from the received video stream.

블록 730에서, 서버(200)는 스토리지(230)에 저장된 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스와 영상 스트림으로부터 추출된 단말(100)의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다. In block 730, the server 200 provides a similarity between the distribution information database of the facial feature points of the user whose provision of the video call service stored in the storage 230 and the distribution information of the facial feature points of the user of the terminal 100 extracted from the video stream. Based on the determination, the user of the terminal 100 may determine whether the provision of the video call service is limited.

도 8은 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스와 단말(100)의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는 다양한 방식들을 설명하기 위한 도면이다.FIG. 8 illustrates various methods for determining whether provision of a video call service is limited based on a similarity between a distribution information database of facial feature points of a user limited in providing a video call service and distribution information of facial feature points of a user of the terminal 100. A diagram for describing the methods.

도 8을 참조하면, 사용자 X와 사용자 Y가 각각 촬영된 영상이 있다. 사용자 X의 영상은 영상 통화 서비스를 제공하는 서버(200)의 스토리지(230)에 저장되어 있던 영상 통화 서비스의 제공이 제한된 사용자의 영상일 수 있다. 사용자 Y의 영상은 단말(100)에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라 촬영된, 단말(100)의 사용자의 영상일 수 있다. 각 영상에는 사용자의 안면 특징점들이 표시되어 있고, 이로부터 안면 특징점들의 분포 정보를 알 수 있다. Referring to FIG. 8, there is an image in which user X and user Y are respectively photographed. The image of the user X may be an image of a user in which the provision of the video call service stored in the storage 230 of the server 200 providing the video call service is limited. The image of the user Y may be an image of the user of the terminal 100, photographed as an application for providing a video call service is executed in the terminal 100. In each image, facial feature points of a user are displayed, and distribution information of facial feature points can be obtained from the image.

동일 인물이더라도 촬영된 영상에서의 안면의 각도, 사이즈, 또는 촬영 환경 등에 따라 안면 특징점들이 다를 수 있으므로, 동일한 촬영 조건에서 촬영된 영상을 비교하는 것이 바람직하다. 만일, 안면의 각도, 사이즈, 또는 촬영 환경 등에 차이가 있는 경우, 서버(200)는 데이터베이스에 저장된 영상 통화 서비스의 제공이 제한된 사용자의 영상 스트림과 단말(100)로부터 수신된 영상 스트림에 대해 정규화 프로세스를 수행하고, 정규화된 각각의 영상 스트림을 이용할 수 있다. 서버(200)는 정규화된 각각의 영상 스트림으로부터 추출된, 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보와 단말(100)의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다.Even if the same person has different facial feature points according to the angle, size, or shooting environment of the face in the captured image, it is preferable to compare images captured under the same shooting conditions. If there is a difference in facial angle, size, or shooting environment, the server 200 normalizes the video stream received from the terminal 100 and the video stream of the user limited in providing the video call service stored in the database. And use each normalized video stream. Based on the similarity between the distribution information of the facial feature points of the user limited in the provision of the video call service and the distribution information of the facial feature points of the user of the terminal 100, the server 200 is extracted from each normalized video stream. It may be determined whether the provision of the service is a limited user.

도 8을 참조하면, 사용자 X와 사용자 Y 각각의 영상에, 복수 개의 안면 특징점들이 검출될 수 있다. 이 중 사용자 X와 사용자 Y가 동일한 인물인지 판단하기 위해, 각 영상의 안면 특징점들을 이용할 수 있다. 예를 들어, 각 영상의 안면 특징점들 중 두 영상의 서로 대응되는 위치에 존재하는 특징점들 중에서 전부 또는 사용자의 표정 변화에 영향을 적게 받는 일부 특징점들을 활용할 수 있다. 두 영상의 안면 특징점들을 이용하여 두 영상의 사용자들이 동일한 인물인지 판단함에 있어서, 어느 한쪽 영상에만 있는 안면 특징점들을 더 활용할 수도 있다. Referring to FIG. 8, a plurality of facial feature points may be detected in images of user X and user Y, respectively. In order to determine whether the user X and the user Y are the same person, facial feature points of each image may be used. For example, all of the feature points existing at positions corresponding to each other of the two images among the facial feature points of each image may be utilized, or some feature points that are less influenced by the user's facial expression change. In determining whether the users of the two images are the same person by using the facial feature points of the two images, the facial feature points of only one image may be further utilized.

이하, 설명의 편의상, 사용자 X와 사용자 Y 각각의 영상의 안면 특징점들 중 3개의 안면 특징점들을 예로 들어, 영상 통화 서비스의 제공이 제한된 사용자 X의 안면 특징점들의 분포 정보 데이터베이스와 단말(100)의 사용자 Y의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는 방식에 대해 설명한다. 도 8을 참조하면, 사용자 X의 영상에 안면 특징점들 A, B, C가 있고, 사용자 Y의 영상에 안면 특징점들 A', B', C'가 있다. Hereinafter, for convenience of description, three facial feature points among the facial feature points of the images of each of the user X and the user Y are taken as examples, and the distribution information database of the face feature points of the user X limited in the provision of the video call service and the user of the terminal 100 are described. Based on the similarity between the distribution information of the facial feature points of Y, a method of determining whether the provision of the video call service is limited user will be described. Referring to FIG. 8, there are facial feature points A, B, and C in an image of user X, and there are facial feature points A ', B', and C 'in an image of user Y. FIG.

첫 번째 방식(①)에 따르면, 서버(200)는 영상 통화 서비스의 제공이 제한된 사용자 X의 안면 특징점들 A, B, C와 영상 스트림에서 추출된 단말(100)의 사용자 Y의 안면 특징점들 A', B', C'를 대응시키고, 서로 대응되는 안면 특징점들 간 변위의 합산을 고려한 유사도에 기초하여, 사용자 Y가 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다. 예를 들어, A와 A'를 기준으로서 일치시키고, B와 B' 간의 변위와 C와 C' 간의 변위를 합산하고, 소정의 임계치(H)와 비교하여, 소정의 임계치(H)보다 작거나 같으면 사용자 X와 사용자 Y가 동일한 인물이라고 판단할 수 있다.According to the first method (1), the server 200 may recognize the facial feature points A, B, and C of the user X, and the facial feature points A of the user Y of the terminal 100 extracted from the video stream. The user Y may determine whether the user Y is limited in the provision of the video call service based on the similarity in which ', B' and C 'correspond to each other and considering the sum of the displacements between the corresponding facial feature points. For example, A and A 'are matched as a reference, the displacement between B and B' and the displacement between C and C 'are summed and less than the predetermined threshold H, or less than the predetermined threshold H. If they are the same, it can be determined that user X and user Y are the same person.

두 번째 방식(②)에 따르면, 서버(200)는 영상 통화 서비스의 제공이 제한된 사용자 X의 안면 특징점들 A, B, C 중 기준 특징점 A와 주변 특징점들 B, C 간 변위의 합산과 영상 스트림에서 추출된 단말(100)의 사용자 Y의 안면 특징점들 A', B', C' 중 기준 특징점 A'와 주변 특징점들 B', C' 간 변위의 합산 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다. 예를 들어, A와 B 간의 변위 AB와 A와 C 간의 변위 AC를 합산하고, A'와 B' 간의 변위 A'B'와 A'와 C' 간의 변위 A'C'를 합산하여, 두 합산 간의 유사도가 소정의 값 이상이면, 사용자 X와 사용자 Y가 동일한 인물이라고 판단할 수 있다.According to the second method (②), the server 200 sums up the displacement between the reference feature A and the peripheral feature points B and C and the video stream among the facial feature points A, B, and C of the user X who is restricted from providing the video call service. Based on the similarity between the sum of the displacements between the reference feature A 'and the peripheral feature points B' and C 'among the facial feature points A', B ', and C' of the user Y of the terminal 100 extracted from It may be determined whether the provision is limited to the user. For example, the displacements AB between A and B and the displacements AC between A and C are summed, the displacements A'B 'between A' and B 'and the displacements A'C' between A 'and C' If the similarity between the two is equal to or greater than a predetermined value, it may be determined that the user X and the user Y are the same person.

세 번째 방식(③)에 따르면, 서버(200)는 영상 통화 서비스의 제공이 제한된 사용자 X의 안면 특징점들 A, B, C 중 기준 특징점 A과 주변 특징점들 B, C 간 변위의 비율과 영상 스트림에서 추출된 단말(100)의 사용자 Y의 안면 특징점들 A', B', C' 중 기준 특징점 A'과 주변 특징점들 B', C' 간 변위의 비율 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다. 예를 들어, A와 B 간의 변위 AB와 A와 C 간의 변위 AC의 비율을 산출하고, A'와 B' 간의 변위 A'B'와 A'와 C' 간의 변위 A'C'의 비율을 산출하여, 두 비율 간의 유사도가 소정의 값 이상이면, 사용자 X와 사용자 Y가 동일한 인물이라고 판단할 수 있다.According to the third method (③), the server 200 determines the ratio of the displacement between the reference feature A and the peripheral feature points B and C and the video stream among the facial feature points A, B, and C of the user X who are limited in providing the video call service. Based on the similarity between the reference feature A 'and the ratio of the displacement between the peripheral feature points B' and C 'among the facial feature points A', B 'and C' of the user Y of the terminal 100 extracted from It may be determined whether the provision is limited to the user. For example, calculate the ratio of displacement AB between A and B and the displacement AC between A and C, and calculate the ratio of displacement A'B 'between A' and B 'and the displacement A'C' between A 'and C'. Thus, when the similarity between the two ratios is equal to or greater than a predetermined value, it may be determined that the user X and the user Y are the same person.

한편, 서버(200)는 수신된 영상 스트림으로부터 단말(100)의 사용자의 안면에 대한 깊이 지도(depth map)를 생성하고, 생성된 깊이 지도에서의 안면 특징점들을 추출할 수 있다. 서버(200)는 영상 통화 서비스의 제공이 제한된 사용자의 안면에 대한 깊이 지도에서의 안면 특징점들의 분포 정보 데이터베이스와 단말(100)의 사용자의 안면에 대한 깊이 지도에서 추출된 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다.Meanwhile, the server 200 may generate a depth map of the face of the user of the terminal 100 from the received video stream and extract facial feature points from the generated depth map. The server 200 provides a similarity between the distribution information database of the facial feature points in the depth map of the user's face limited in providing the video call service and the distribution information of the facial feature points extracted from the depth map of the user's face in the terminal 100. Based on the determination, it may be determined whether the provision of the video call service is a limited user.

또한, 서버(200)는 수신된 영상 스트림으로부터 단말(100)의 사용자의 안면에 대한 3차원 영상을 생성하고, 생성된 3차원 영상에서의 안면 특징점들을 추출할 수 있다. 사용자의 안면에 대한 3차원 영상을 생성하기 위하여, 적어도 하나의 사용자의 안면이 포함된 영상이 이용될 수 있다. 영상 통화 서비스의 제공이 제한된 사용자의 안면에 대한 3차원 영상에서의 안면 특징점들의 분포 정보 데이터베이스와 단말(100)의 사용자의 안면에 대한 3차원 영상에서 추출된 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다.In addition, the server 200 may generate a 3D image of the face of the user of the terminal 100 from the received image stream, and extract the facial feature points in the generated 3D image. In order to generate a 3D image of a user's face, an image including at least one user's face may be used. Based on the similarity between the distribution information of the facial feature points in the 3D image of the user's face limited in providing the video call service and the distribution information of the facial feature points extracted from the 3D image of the user's face of the terminal 100 It may be determined whether the provision of the video call service is a limited user.

다시 도 7을 참조하면, 블록 740에서, 서버(200)는 영상 통화 서비스의 제공이 제한된 사용자인지 판단한 판단 결과를 단말(100)에 전송할 수 있다.Referring back to FIG. 7, in block 740, the server 200 may transmit a determination result of determining whether the provision of the video call service is a limited user to the terminal 100.

도 9와 도 10은 다른 실시예에 따라, 영상 통화 서비스를 제공하는 서버(200)가 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 이용하여, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 실시예를 설명하기 위한 도면이다. 9 and 10 illustrate that a server 200 providing a video call service uses a learning model for determining a user whose provision of the video call service is limited, so that the user of the terminal 100 makes a video call. FIG. 14 is a diagram for describing an embodiment of determining whether a service is limited to a user.

도 9를 참조하면, 서버(200)가 단말(100)과 통신을 수행하여, 단말(100)의 사용자를 촬영한 영상 스트림을 수신하고, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단한 판단 결과를 단말(100)로 전송할 수 있다. 이상에서, 도 6에서 설명한 내용과 중복되는 내용에 대해서는 이하 상세한 설명을 생략한다. Referring to FIG. 9, the server 200 communicates with the terminal 100 to receive a video stream photographing the user of the terminal 100, and the user of the terminal 100 is limited in providing a video call service. The determination result of determining whether the user is a user may be transmitted to the terminal 100. In the above, detailed descriptions of the contents duplicated with those described in FIG. 6 will be omitted.

단말(100)은 단말(100)의 사용자를 촬영하고, 촬영한 영상 스트림을 서버(200)에 전송할 수 있다. The terminal 100 may photograph the user of the terminal 100 and transmit the captured image stream to the server 200.

서버(200)는 부정행위를 하여 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 생성하여 스토리지(230)에 저장할 수 있다.The server 200 generates a learning model for determining a user limited in the provision of the video call service based on the distribution information of the facial feature points of the user who has restricted the provision of the video call service by cheating, and stores the learning model in the storage 230. Can be.

학습 모델은 영상 통화 서비스를 이용하는 사용자들 중 영상 통화 서비스의 제공이 제한된 사용자를 검출하기 위해 이용되는 데이터 인식 모델일 수 있다. 데이터 인식 모델은, 인공 신경망(Neural Network)을 기반으로 하는 모델일 수 있다. 예를 들면, 학습 모델은 DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network)과 같은 모델이 데이터 인식 모델로서 사용될 수 있으나, 이에 한정되지 않는다.The learning model may be a data recognition model used to detect a user who is limited to providing a video call service among users who use the video call service. The data recognition model may be a model based on an artificial neural network. For example, a model such as a deep neural network (DNN), a recurrent neural network (RNN), and a bidirectional recurrent deep neural network (BRDNN) may be used as the data recognition model, but is not limited thereto.

영상 통화 서비스의 제공이 제한된 사용자 판별을 위한 학습 모델은 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보를 이용하여 학습 된 것일 수 있다. 또는, 영상 통화 서비스의 제공이 제한된 사용자 판별을 위한 학습 모델은 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보와 영상 통화 서비스의 제공이 제한되게 된 부정행위에 관한 정보를 이용하여 학습 된 것일 수 있다. 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델은 부정행위의 종류와 관계없이, 영상 통화 서비스의 제공이 제한된 사용자 전체와 관련된 학습 모델이거나, 부정행위의 종류별로 준비된 학습 모델일 수 있다. 영상 통화 서비스의 제공이 제한된 사용자 판별을 위한 학습 모델 및 영상 스트림으로부터 추출된 단말(100)의 사용자의 안면 특징점들을 이용하면, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자일 확률을 수치로 나타낼 수 있다. 예를 들어, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자일 확률을 구하기 위해, 영상 통화 서비스의 제공이 제한된 사용자 판별을 위한 학습 모델에 단말(100)의 사용자의 안면 특징점들을 적용할 수 있다. 단말 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하기 위해, 학습 모델 및 단말(100)의 사용자의 안면 특징점들을 이용한 결과와 소정의 임계치를 비교할 수 있다. 비교 결과에 따라, 적용 결과가 소정의 임계치 이상이면, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인 것으로 판단할 수 있다.The learning model for determining a user limited in providing a video call service may be trained using distribution information of facial feature points of a user limited in providing a video call service. Or, the learning model for determining a user limited in providing a video call service is trained using information on distribution of facial feature points of a user who is limited in providing a video call service and information on cheating that is restricted in providing a video call service. It may be. The learning model for determining a user who is limited to providing a video call service may be a learning model related to the entire user who is limited to providing a video call service, or a learning model prepared for each kind of cheating, regardless of the kind of cheating. Using the learning model for the identification of the user limited in the provision of the video call service and the facial feature points of the user of the terminal 100 extracted from the video stream, it is possible to determine the probability that the user of the terminal 100 is the user limited in the provision of the video call service. It can be expressed numerically. For example, in order to obtain a probability that the user of the terminal 100 is limited in providing the video call service, the facial feature points of the user of the terminal 100 are applied to a learning model for determining a user limited in the provision of the video call service. can do. In order to determine whether the user of the terminal terminal 100 is limited to providing a video call service, a result of using the learning model and facial feature points of the user of the terminal 100 may be compared with a predetermined threshold. According to the comparison result, if the application result is more than a predetermined threshold, it may be determined that the user of the terminal 100 is a user limited to the provision of the video call service.

서버(200)는 단말(100)로부터 사용자를 촬영한 영상 스트림이 수신되어, 영상 통화 서비스의 제공이 제한된 사용자인지에 대한 판단 요청이 수신되면, 학습 모델을 이용하여 판단 후 판단 결과를 단말(100)에 전송할 수 있다.When the server 200 receives a video stream photographing the user from the terminal 100 and receives a request for determining whether the user is limited in the provision of the video call service, the server 200 determines the result of the determination after the determination using the learning model. ) Can be sent.

도 10을 참조하면, 블록 1010에서 서버(200)는 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 생성하여 스토리지(230)에 저장할 수 있다. Referring to FIG. 10, in block 1010, the server 200 generates and stores a learning model for determining a user limited in provision of a video call service based on distribution information of facial feature points of a user limited in provision of a video call service. And 230.

블록 1020에서, 서버(200)는 단말(100)에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 단말(100)의 사용자를 촬영한 영상 스트림을 수신할 수 있다. In block 1020, as the application for providing a video call service is executed in the terminal 100, the server 200 may receive a video stream photographing the user of the terminal 100.

블록 1030에서, 서버(200)는 수신된 영상 스트림으로부터 단말(100)의 사용자의 안면 특징점들을 추출할 수 있다.In block 1030, the server 200 may extract facial feature points of the user of the terminal 100 from the received video stream.

블록 1040에서, 서버(200)는 스토리지(230)에 저장된 학습 모델 및 영상 스트림으로부터 추출된 단말(100)의 사용자의 안면 특징점들을 이용하여, 영상 통화 서비스의 제공이 제한된 사용자인지 판단할 수 있다. 학습 모델 및 영상 스트림으로부터 추출된 영상 통화 서비스를 제공하는 단말(100)의 사용자의 안면 특징점들을 이용하면, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자일 확률을 수치로 나타낼 수 있다. 학습 모델 및 단말(100)의 사용자의 안면 특징점들을 이용한 결과와 소정의 임계치를 비교하여, 소정의 임계치 이상이면, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인 것으로 판단할 수 있다. 반대로, 소정의 임계치 미만이면, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한되지 않은 사용자라고 판단할 수 있다.In block 1040, the server 200 may determine whether the provision of the video call service is limited by using the learning models stored in the storage 230 and the facial feature points of the user of the terminal 100 extracted from the video stream. Using facial feature points of the user of the terminal 100 providing the video call service extracted from the learning model and the video stream, the user of the terminal 100 may represent a probability that the user of the terminal 100 is limited in the provision of the video call service. . The result of using the learning model and the facial feature points of the user of the terminal 100 is compared with a predetermined threshold, and when the threshold value is greater than or equal to the predetermined threshold, it may be determined that the user of the terminal 100 is a user who is limited to providing a video call service. . On the contrary, if it is less than a predetermined threshold, it may be determined that the user of the terminal 100 is a user who is not limited to providing a video call service.

블록 1050에서, 서버(200)는 영상 통화 서비스의 제공이 제한된 사용자인지 판단한 판단 결과를 단말(100)에 전송할 수 있다.In block 1050, the server 200 may transmit a determination result of determining whether the provision of the video call service is a limited user to the terminal 100.

도 11과 도 12는 또 다른 실시예에 따라, 영상 통화 서비스를 제공하는 단말(100)이 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 이용하여, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 실시예를 설명하기 위한 도면이다.11 and 12 are views of a user of a terminal 100 using a learning model for determining whether a terminal 100 providing a video call service is limited in providing a video call service, according to another exemplary embodiment. FIG. 14 is a diagram for describing an embodiment of determining whether a provision of a call service is a limited user.

도 11을 참조하면, 단말(100)은 서버(200)로부터 영상 통화 서비스의 제공이 제한된 사용자 판별을 위한 학습 모델을 수신할 수 있다. 학습 모델에 관한 설명은 도 9에서 설명한 바와 같다. 단말(100)은 서버(200)로부터 업데이트 주기에 따라 업데이트된 학습 모델을 수신할 수 있다.Referring to FIG. 11, the terminal 100 may receive a learning model for determining a user limited in providing a video call service from the server 200. The description of the learning model is as described with reference to FIG. 9. The terminal 100 may receive the updated learning model according to the update period from the server 200.

단말(100)은 사용자의 안면 특징점들 및 영상 통화 서비스의 제공이 제한된 사용자 판별을 위한 학습 모델을 이용하여, 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다. 단말(100)은 영상 스트림으로부터 사용자의 눈 부위, 코 부위, 입 부위, 이마 부위, 볼 부위, 턱 부위 및 안면 윤곽으로부터 안면 특징점들을 추출할 수 있다. 단말(100)은 영상 통화 서비스의 제공이 제한된 사용자 판별을 위한 학습 모델 및 사용자의 안면 부위 중 적어도 하나의 부위에 대한 특징점들의 분포 정보를 이용하여, 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다. The terminal 100 may determine whether the user is a user who is limited to providing the video call service by using the user's facial feature points and a learning model for determining a user limited in the provision of the video call service. The terminal 100 may extract facial feature points from an eye part, a nose part, a mouth part, a forehead part, a cheek part, a chin part, and a facial contour of the user from the video stream. The terminal 100 determines whether the user is limited in the provision of the video call service by using distribution information of feature points of at least one of a learning model for determining a user limited in the provision of the video call service and a face part of the user. You can judge.

단말(100)은 학습 모델을 이용한 판단 결과에 기초하여, 영상 통화 서비스를 제공하는 애플리케이션의 실행을 유지하거나 제한할 수 있다.The terminal 100 may maintain or limit the execution of an application that provides a video call service based on the determination result using the learning model.

도 12를 참조하면, 블록 1210에서, 단말(100)은 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보에 기초하여 생성되는, 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 서버(200)로부터 수신할 수 있다. 단말(100)은 서버(200)로부터 업데이트 주기에 따라 서버(200)에서 업데이트된 학습 모델을 수신할 수 있다.Referring to FIG. 12, in block 1210, the terminal 100 generates a learning model for determining a user limited in provision of a video call service, which is generated based on distribution information of facial feature points of a user limited in provision of a video call service. It may receive from the server 200. The terminal 100 may receive the learning model updated in the server 200 according to the update period from the server 200.

블록 1220에서, 단말(100)은 단말(100)에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 단말(100)의 사용자를 촬영한 영상 스트림을 획득할 수 있다. 예를 들어, 단말(100)은 영상 통화 서비스를 제공하는 애플리케이션에 대한 사용자의 회원가입 과정이나 로그인 과정, 또는 영상 통화가 이루어지기 전이나 영상 통화 중에, 단말(100)에서 촬영된 사용자의 안면을 포함한 영상 스트림을 획득할 수 있다. 단말(100)은 단말(100)의 사용자의 안면의 각도와 사이즈가 소정의 수준으로 촬영되도록, 단말(100)의 화면에 가이드라인을 제공할 수 있다. 단말(100)은 제공된 가이드라인에 따라 단말(100)의 사용자의 안면이 촬영된 영상 스트림을 획득할 수 있다.In block 1220, the terminal 100 may acquire an image stream of the user of the terminal 100 as an application for providing a video call service is executed in the terminal 100. For example, the terminal 100 may display a user's face photographed by the terminal 100 before a user registration process or a login process or a video call or a video call to an application that provides a video call service. The included video stream can be obtained. The terminal 100 may provide guidelines on the screen of the terminal 100 so that the angle and size of the face of the user of the terminal 100 are photographed at a predetermined level. The terminal 100 may obtain an image stream in which the face of the user of the terminal 100 is photographed according to the provided guidelines.

블록 1230에서, 단말(100)은 획득된 영상 스트림으로부터 단말(100)의 사용자의 안면 특징점들을 추출할 수 있다. 단말(100)은 획득된 영상 스트림 중 촬영된 각도에 기초하여 단말(100)의 사용자의 안면이 가장 정면으로 촬영된 영상을 선정하여, 선정된 영상에서 단말(100)의 사용자의 안면 특징점들을 추출할 수 있다. 단말(100)은 단말(100)의 사용자를 촬영한 영상 스트림으로부터 사용자의 눈 부위, 코 부위, 입 부위, 이마 부위, 볼 부위, 턱 부위 및 안면 윤곽으로부터 안면 특징점들을 추출할 수 있다. In block 1230, the terminal 100 may extract facial feature points of the user of the terminal 100 from the obtained image stream. The terminal 100 selects an image in which the face of the user of the terminal 100 is most photographed based on the photographed angle of the obtained image stream, and extracts facial feature points of the user of the terminal 100 from the selected image. can do. The terminal 100 may extract facial feature points from an eye part, a nose part, a mouth part, a forehead part, a cheek part, a chin part, and a facial contour of the user from an image stream photographing the user of the terminal 100.

블록 1240에서, 단말(100)은 서버(200)로부터 수신된 학습 모델 및 획득된 영상 스트림으로부터 추출된 단말(100)의 사용자의 안면 특징점들을 이용하여, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단할 수 있다. 학습 모델 및 영상 스트림으로부터 추출된 단말(100)의 사용자의 안면 특징점들을 이용하면, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자일 확률을 수치로 나타낼 수 있다. 학습 모델 및 단말(100)의 사용자의 안면 특징점들을 이용한 결과와 소정의 임계치를 비교하여, 소정의 임계치 이상이면, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인 것으로 판단할 수 있다. 반대로, 소정의 임계치 미만이면, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한되지 않은 사용자라고 판단할 수 있다. In block 1240, the terminal 100 uses the learning model received from the server 200 and the facial feature points of the user of the terminal 100 extracted from the obtained video stream, so that the user of the terminal 100 is connected to the video call service. It can be determined whether the offer is limited to the user. Using facial feature points of the user of the terminal 100 extracted from the learning model and the video stream, the user of the terminal 100 may indicate numerically the probability that the user of the terminal 100 is limited in providing the video call service. The result of using the learning model and the facial feature points of the user of the terminal 100 is compared with a predetermined threshold, and when the threshold value is greater than or equal to the predetermined threshold, it may be determined that the user of the terminal 100 is a user who is limited to providing a video call service. . On the contrary, if it is less than a predetermined threshold, it may be determined that the user of the terminal 100 is a user who is not limited to providing a video call service.

블록 1250에서, 단말(100)은 영상 통화 서비스의 제공이 제한된 사용자인지 판단한 판단 결과에 기초하여, 영상 통화 서비스를 제공하는 애플리케이션의 실행을 유지하거나 제한할 수 있다. 단말(100)은 판단 결과, 영상 통화 서비스의 제공이 제한된 사용자인 경우, 실행된 영상 통화 서비스를 제공하는 애플리케이션을 종료시키거나, 부정행위를 한 이력에 의해 영상 통화 서비스의 제공이 제한됨을 알려주는 메시지를 제공함으로써, 애플리케이션의 실행을 제한할 수 있다.In block 1250, the terminal 100 may maintain or limit the execution of an application that provides the video call service based on a determination result of determining whether the provision of the video call service is a limited user. When the terminal 100 determines that the provision of the video call service is limited, the terminal 100 terminates the application providing the executed video call service or informs that the provision of the video call service is restricted by the history of cheating. By providing a message, you can limit the execution of the application.

도 13과 도 14는 또 다른 실시예에 따라, 영상 통화 서비스를 제공하는 단말(100)이 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스를 이용하여, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 실시예를 설명하기 위한 도면이다.13 and 14 illustrate a terminal 100 that provides a video call service using a distribution information database of facial feature points of a user limited in providing a video call service. FIG. 14 is a diagram for describing an embodiment of determining whether provision of a video call service is a limited user.

도 13을 참조하면, 단말(100)은 서버(200)로부터 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스를 수신할 수 있다. 단말(100)은 서버(200)로부터 업데이트 주기에 따라 업데이트된 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스를 수신할 수 있다. Referring to FIG. 13, the terminal 100 may receive a distribution information database of facial feature points of a user limited in providing a video call service from the server 200. The terminal 100 may receive a distribution information database of facial feature points of a user limited in providing an updated video call service according to an update cycle from the server 200.

단말(100)은 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스와 단말(100)의 사용자를 촬영한 영상 스트림에서 추출된 단말(100)의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다. 단말(100)은 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스를 이용한 판단 결과에 기초하여, 영상 통화 서비스를 제공하는 애플리케이션의 실행을 유지하거나 제한할 수 있다.The terminal 100 determines the degree of similarity between the distribution information database of the facial feature points of the user whose provision of the video call service and the distribution information of the facial feature points of the user of the terminal 100 extracted from the video stream photographing the user of the terminal 100. On the basis of this, it may be determined whether the provision of the video call service is a limited user. The terminal 100 may maintain or limit the execution of an application that provides a video call service based on a determination result using a distribution information database of facial feature points of a user who is limited to providing a video call service.

도 14를 참조하면, 블록 1410에서, 단말(100)은 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스를 서버(200)로부터 수신할 수 있다.Referring to FIG. 14, in block 1410, the terminal 100 may receive from the server 200 a database of distribution information of facial feature points of a user limited in providing a video call service.

블록 1420에서, 단말(100)은 단말(100)에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 단말(100)의 사용자를 촬영한 영상 스트림을 획득할 수 있다. 예를 들어, 단말(100)은 영상 통화 서비스를 제공하는 애플리케이션에 대한 사용자의 회원가입 과정이나 로그인 과정, 또는 영상 통화가 이루어지기 전이나 영상 통화 중에, 단말(100)에서 촬영된 사용자의 안면을 포함한 영상 스트림을 획득할 수 있다. 단말(100)은 단말(100)의 사용자의 안면의 각도와 사이즈가 소정의 기준에 맞게 촬영되도록, 단말(100)의 화면에 가이드라인을 제공할 수 있다. 단말(100)은 제공된 가이드라인에 따라 단말(100)의 사용자의 안면이 촬영된 영상 스트림을 획득할 수 있다. In block 1420, the terminal 100 may acquire an image stream of the user of the terminal 100 as an application for providing a video call service is executed in the terminal 100. For example, the terminal 100 may display a user's face photographed by the terminal 100 before a user registration process or a login process or a video call or a video call to an application that provides a video call service. The included video stream can be obtained. The terminal 100 may provide a guideline on the screen of the terminal 100 so that the angle and size of the face of the user of the terminal 100 are photographed according to a predetermined criterion. The terminal 100 may obtain an image stream in which the face of the user of the terminal 100 is photographed according to the provided guidelines.

블록 1430에서, 단말(100)은 획득된 영상 스트림으로부터 단말(100)의 사용자의 안면 특징점들을 추출할 수 있다. 단말(100)은 획득된 영상 스트림 중 촬영된 각도에 기초하여 단말(100)의 사용자의 안면이 가장 정면으로 촬영된 영상을 선정하여, 선정된 영상에서 단말(100)의 사용자의 안면 특징점들을 추출할 수 있다. 단말(100)은 단말(100)의 사용자를 촬영한 영상 스트림으로부터 사용자의 눈 부위, 코 부위, 입 부위, 이마 부위, 볼 부위, 턱 부위 및 안면 윤곽으로부터 안면 특징점들을 추출할 수 있다.In block 1430, the terminal 100 may extract facial feature points of the user of the terminal 100 from the obtained image stream. The terminal 100 selects an image in which the face of the user of the terminal 100 is most photographed based on the photographed angle of the obtained image stream, and extracts facial feature points of the user of the terminal 100 from the selected image. can do. The terminal 100 may extract facial feature points from an eye part, a nose part, a mouth part, a forehead part, a cheek part, a chin part, and a facial contour of the user from an image stream photographing the user of the terminal 100.

블록 1440에서, 단말(100)은 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스와 영상 스트림으로부터 추출된 단말(100)의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 단말(100)의 사용자가 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다. In block 1440, the terminal 100 is based on the similarity between the distribution information database of the facial feature points of the user limited in providing the video call service and the distribution information of the facial feature points of the user of the terminal 100 extracted from the video stream. The user of 100) may determine whether the provision of the video call service is limited.

단말(100)은, 서버(200)로부터 수신된 데이터베이스에 저장된, 영상 통화 서비스의 제공이 제한된 사용자의 영상 스트림과 단말(100)에서 획득된 영상 스트림에 대해 정규화 프로세스를 수행할 수 있다. 단말(100)은 정규화된 각각의 영상 스트림으로부터 추출된, 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보와 단말(100)의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단할 수 있다.The terminal 100 may perform a normalization process with respect to a video stream of a user limited in providing a video call service and a video stream obtained from the terminal 100 stored in a database received from the server 200. The terminal 100 is based on the similarity between the distribution information of the facial feature points of the user limited in the provision of the video call service and the distribution information of the facial feature points of the user of the terminal 100 extracted from each normalized video stream. It may be determined whether the provision of the service is a limited user.

영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스와 단말(100)의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는 다양한 방식들은 앞서 도 8에서 설명한 것과 동일한 방식들이 적용될 수 있으므로 이와 관련된 상세한 설명은 생략한다.Based on the similarity between the distribution information database of the facial feature points of the user who is limited to providing the video call service and the distribution information of the facial feature points of the user of the terminal 100, various methods of determining whether the provision of the video call service is a limited user are as described above. Since the same methods as described with reference to FIG. 8 may be applied, detailed description thereof will be omitted.

블록 1450에서, 단말(100)은 영상 통화 서비스의 제공이 제한된 사용자인지 판단한 판단 결과에 기초하여, 영상 통화 서비스를 제공하는 애플리케이션의 실행을 유지하거나 제한할 수 있다. 단말(100)은 판단 결과, 영상 통화 서비스의 제공이 제한된 사용자인 경우, 실행된 영상 통화 서비스를 제공하는 애플리케이션을 종료시키거나, 부정행위를 한 이력에 의해 영상 통화 서비스의 제공이 제한됨을 알려주는 메시지를 제공함으로써, 애플리케이션의 실행을 제한할 수 있다.In block 1450, the terminal 100 may maintain or limit the execution of an application that provides the video call service based on the determination result of determining whether the provision of the video call service is a limited user. When the terminal 100 determines that the provision of the video call service is limited, the terminal 100 terminates the application providing the executed video call service or informs that the provision of the video call service is restricted by the history of cheating. By providing a message, you can limit the execution of the application.

상술한 영상 통화 서비스를 제공하는 방법에 관한 실시예들은 단말(100)에서, 영상 통화 서비스를 제공하는 방법을 수행하도록 하는 컴퓨터 판독가능 저장매체에 저장된 애플리케이션 형태로 제공될 수 있다. 다시 말해서, 상술한 영상 통화 서비스를 제공하는 방법에 관한 실시예들은 단말(100)로 하여금 상술한 영상 통화 서비스를 제공하는 방법의 각 단계를 실행시키기 위한 컴퓨터 판독가능 저장매체에 저장된 애플리케이션 또는 컴퓨터 프로그램 형태로 제공될 수 있다.Embodiments of the above-described method for providing a video call service may be provided in the form of an application stored in a computer-readable storage medium for performing the method for providing a video call service in the terminal 100. In other words, embodiments of the method for providing the video call service described above may be implemented by an application or a computer program stored in a computer readable storage medium for executing the steps of the terminal 100 for providing the video call service. It may be provided in the form.

상술한 실시예들은 컴퓨터 또는 프로세서에 의하여 실행 가능한 명령어 또는 데이터를 저장하는 컴퓨터 판독 가능 저장매체의 형태로 구현될 수 있다. 상기 명령어 및 데이터 중 적어도 하나는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 소정의 프로그램 모듈을 생성하여 소정의 동작을 수행할 수 있다. 이와 같은 컴퓨터 판독 가능 저장매체는 read-only memory (ROM), random-access memory (RAM), flash memory, CD-ROMs, CD-Rs, CD+Rs, CD-RWs, CD+RWs, DVD-ROMs, DVD-Rs, DVD+Rs, DVD-RWs, DVD+RWs, DVD-RAMs, BD-ROMs, BD-Rs, BD-R LTHs, BD-REs, 마그네틱 테이프, 플로피 디스크, 광자기 데이터 저장 장치, 광학 데이터 저장 장치, 하드 디스크, 솔리드-스테이트 디스크(SSD), 그리고 명령어 또는 소프트웨어, 관련 데이터, 데이터 파일, 및 데이터 구조들을 저장할 수 있고, 프로세서나 컴퓨터가 명령어를 실행할 수 있도록 프로세서나 컴퓨터에 명령어 또는 소프트웨어, 관련 데이터, 데이터 파일, 및 데이터 구조들을 제공할 수 있는 어떠한 장치라도 될 수 있다. The above-described embodiments may be implemented in the form of a computer readable storage medium storing instructions or data executable by a computer or a processor. At least one of the instructions and data may be stored in the form of program code, and when executed by a processor, a predetermined program module may be generated to perform a predetermined operation. Such computer-readable storage media include read-only memory (ROM), random-access memory (RAM), flash memory, CD-ROMs, CD-Rs, CD + Rs, CD-RWs, CD + RWs, DVD-ROMs , DVD-Rs, DVD + Rs, DVD-RWs, DVD + RWs, DVD-RAMs, BD-ROMs, BD-Rs, BD-R LTHs, BD-REs, Magnetic Tape, Floppy Disks, Magneto-optical Data Storage, Optical data storage devices, hard disks, solid-state disks (SSDs), and instructions or software, associated data, data files, and data structures; and instructions or instructions on a processor or computer for the processor or computer to execute instructions. It may be any device capable of providing software, associated data, data files, and data structures.

이제까지 실시예들을 중심으로 살펴보았다. 개시된 실시예들이 속하는 기술 분야에서 통상의 지식을 가진 자는 개시된 실시예들이 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 발명의 범위는 전술한 실시예들의 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 발명의 범위에 포함된 것으로 해석되어야 할 것이다.So far looked at the center of the embodiments. Those skilled in the art to which the disclosed embodiments belong will appreciate that the disclosed embodiments can be implemented in a modified form without departing from the essential characteristics. Therefore, the disclosed embodiments should be considered in descriptive sense only and not for purposes of limitation. The scope of the invention is set forth in the claims rather than the foregoing description of the embodiments, and all differences within the scope will be construed as being included in the scope of the invention.

Claims (15)

단말과 통신을 수행하는 통신 인터페이스;
영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 데이터베이스를 저장하는 스토리지;
프로세서; 및
상기 프로세서에 의해 실행 가능한 명령어들을 저장하는 메모리;를 포함하고,
상기 프로세서는, 상기 명령어들을 실행함으로써,
상기 단말에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 상기 단말로부터 상기 단말의 사용자를 촬영한 영상 스트림을 수신하고, 상기 수신된 영상 스트림으로부터 상기 단말의 사용자의 안면 특징점들을 추출하며, 상기 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들 및 상기 단말의 사용자의 안면 특징점들 중 기준 특징점들과 주변 특징점들 간의 변위에 기초하여 판단된, 상기 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보와 상기 단말의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하고, 상기 판단 결과를 상기 단말에 전송하는, 서버.
A communication interface for communicating with the terminal;
A storage storing a distribution information database of facial feature points of a user limited in providing a video call service;
A processor; And
A memory storing instructions executable by the processor;
The processor executes the instructions,
As the application for providing a video call service is executed in the terminal, the terminal receives a video stream photographing the user of the terminal from the terminal, extracts facial feature points of the user of the terminal from the received video stream, and the video. Distribution of facial feature points of a user with limited provision of a video call service, determined based on displacements between reference feature points and neighboring feature points among user's facial feature points with limited provision of a call service Based on the similarity between the information and the distribution information of the facial feature points of the user of the terminal, determining whether the user of the terminal is limited in the provision of the video call service, and transmitting the determination result to the terminal.
제 1 항에 있어서,
상기 프로세서는,
상기 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들 중 기준 특징점 및 주변 특징점들을 상기 추출된 단말의 사용자의 안면 특징점들 중 기준 특징점 및 주변 특징점들과 대응시키고, 서로 대응되는 주변 특징점들 간 변위의 합산 간의 유사도에 기초하여, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는, 서버.
The method of claim 1,
The processor,
The reference feature and the peripheral feature points among the facial feature points of the user of which the provision of the video call service is limited correspond to the reference feature points and the peripheral feature points of the user's facial feature points of the extracted terminal, and the displacement of the peripheral feature points corresponding to each other. Based on the similarity between sums, determining whether the user of the terminal is limited to providing the video call service.
제 1 항에 있어서,
상기 프로세서는,
상기 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들 중 기준 특징점과 주변 특징점들 간 변위의 합산과 상기 추출된 단말의 사용자의 안면 특징점들 중 기준 특징점과 주변 특징점들 간 변위의 합산 간의 유사도에 기초하여, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는, 서버.
The method of claim 1,
The processor,
Based on the similarity between the sum of the displacements between the reference feature points and the peripheral feature points among the facial feature points of the user who is limited to providing the video call service and the sum of the displacements between the reference feature points and the peripheral feature points among the extracted facial feature points of the user of the terminal. To determine whether the user of the terminal is limited to the provision of the video call service.
제 1 항에 있어서,
상기 프로세서는,
상기 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들 중 기준 특징점과 주변 특징점들 간 변위의 비율과 상기 추출된 단말의 사용자의 안면 특징점들 중 기준 특징점과 주변 특징점들 간 변위의 비율 간의 유사도에 기초하여, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는, 서버.
The method of claim 1,
The processor,
Based on the similarity between the ratio of the displacement between the reference feature point and the peripheral feature points among the facial feature points of the user who is limited to providing the video call service and the ratio of the displacement between the reference feature point and the peripheral feature points among the facial feature points of the extracted user To determine whether the user of the terminal is limited to the provision of the video call service.
제 1 항에 있어서,
상기 프로세서는,
상기 수신된 영상 스트림으로부터 상기 단말의 사용자의 안면에 대한 깊이 지도(depth map)를 생성하고, 상기 생성된 깊이 지도에서의 안면 특징점들을 추출하며, 상기 영상 통화 서비스의 제공이 제한된 사용자의 안면에 대한 깊이 지도에서의 안면 특징점들의 분포 정보 데이터베이스와 상기 추출된 단말의 사용자의 안면에 대한 깊이 지도에서의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는, 서버.
The method of claim 1,
The processor,
A depth map of a face of a user of the terminal is generated from the received video stream, facial feature points are extracted from the generated depth map, and a face of a user whose provision of the video call service is limited. Based on the similarity between the distribution information database of the facial feature points in the depth map and the distribution information of the facial feature points in the depth map of the extracted face of the user of the terminal, the user of the terminal is restricted from providing the video call service. Server to determine if it is.
제 1 항에 있어서,
상기 프로세서는,
상기 수신된 영상 스트림으로부터 상기 단말의 사용자의 안면에 대한 3차원 영상을 생성하고, 상기 생성된 3차원 영상에서의 안면 특징점들을 추출하며, 상기 영상 통화 서비스의 제공이 제한된 사용자의 안면에 대한 3차원 영상에서의 안면 특징점들의 분포 정보 데이터베이스와 상기 추출된 단말의 사용자의 안면에 대한 3차원 영상에서의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는, 서버.
The method of claim 1,
The processor,
Generate a 3D image of the face of the user of the terminal from the received video stream, extract the facial feature points in the generated 3D image, 3D for the face of the user limited in the provision of the video call service Based on the similarity between the distribution information database of the facial feature points in the image and the distribution information of the facial feature points in the 3D image of the extracted face of the user of the terminal, the user of the terminal is restricted from providing the video call service. Server to determine if it is.
제 1 항에 있어서,
상기 데이터베이스에 저장된 상기 영상 통화 서비스의 제공이 제한된 사용자의 영상 스트림과 상기 수신된 영상 스트림에 대해 정규화 프로세스를 수행하고, 정규화된 각각의 영상 스트림으로부터 추출된, 상기 영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보와 상기 단말의 사용자의 안면 특징점들의 분포 정보 간의 유사도에 기초하여, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지를 판단하는, 서버.
The method of claim 1,
Performing a normalization process on the video stream and the received video stream of the user limited to the provision of the video call service stored in the database, and extracted from each normalized video stream, Based on the similarity between distribution information of facial feature points and distribution information of facial feature points of a user of the terminal, determining whether the user of the terminal is a limited user of the video call service.
단말과 통신을 수행하는 통신 인터페이스;
스토리지;
프로세서; 및
상기 프로세서에 의해 실행 가능한 명령어들을 저장하는 메모리;를 포함하고,
상기 프로세서는, 상기 명령어들을 실행함으로써,
영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 및 상기 영상 통화 서비스의 제공이 제한되게 된 부정행위에 관한 정보에 기초하여, 상기 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 생성하여 상기 스토리지에 저장하고, 상기 단말에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 상기 단말의 사용자를 촬영한 영상 스트림을 수신하고, 상기 수신된 영상 스트림으로부터 상기 단말의 사용자의 안면 특징점들을 추출하며, 상기 스토리지에 저장된 학습 모델에 상기 추출된 안면 특징점들을 적용하여, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지 판단하고, 상기 판단 결과를 상기 단말에 전송하는, 서버.
A communication interface for communicating with the terminal;
storage;
A processor; And
A memory storing instructions executable by the processor;
The processor executes the instructions,
Based on distribution information of facial feature points of a user who is limited to providing a video call service and information about misconduct that causes the provision of the video call service to be restricted, a learning model for determining a user who is limited to providing the video call service is provided. As the application is generated and stored in the storage and the video call service is executed in the terminal, the video stream photographing the user of the terminal is received, and the facial feature points of the user of the terminal are received from the received video stream. Extracting and applying the extracted facial feature points to the learning model stored in the storage to determine whether the user of the terminal is limited in providing the video call service, and transmits the determination result to the terminal.
단말에서,
영상 통화 서비스의 제공이 제한된 사용자의 안면 특징점들의 분포 정보 및 상기 영상 통화 서비스의 제공이 제한되게 된 부정행위에 관한 정보에 기초하여 생성되는, 상기 영상 통화 서비스의 제공이 제한된 사용자를 판별하기 위한 학습 모델을 서버로부터 수신하는 단계;
상기 단말에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 상기 단말의 사용자를 촬영한 영상 스트림을 획득하는 단계;
상기 획득된 영상 스트림으로부터 상기 단말의 사용자의 안면 특징점들을 추출하는 단계;
상기 학습 모델에 상기 추출된 안면 특징점들을 적용하여, 상기 단말의 사용자가 소정 부정행위를 한 이력에 의해 상기 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는 단계; 및
상기 판단 결과에 기초하여, 상기 영상 통화 서비스를 제공하는 애플리케이션의 실행을 유지하거나 제한하는 단계;
를 수행하도록 하는, 컴퓨터 판독 가능 저장매체에 저장된 애플리케이션.
At the terminal,
Learning to determine a user limited in the provision of the video call service, generated based on distribution information of facial feature points of a user who is limited in the provision of the video call service, and information about misconduct that causes the provision of the video call service to be restricted Receiving a model from a server;
Acquiring a video stream photographing a user of the terminal as an application for providing a video call service is executed in the terminal;
Extracting facial feature points of a user of the terminal from the obtained video stream;
Applying the extracted facial feature points to the learning model to determine whether the provision of the video call service is limited by a history of a user cheating by the terminal; And
Based on the determination result, maintaining or limiting execution of an application that provides the video call service;
An application stored on the computer readable storage medium.
제 9 항에 있어서,
상기 단말의 사용자를 촬영한 영상 스트림을 획득하는 단계는,
상기 단말에서 영상 통화 서비스를 제공하는 애플리케이션이 실행됨에 따라, 회원가입 과정이나 로그인 과정에서 상기 단말의 사용자를 촬영한 영상 스트림을 획득하는, 컴퓨터 판독 가능 저장매체에 저장된 애플리케이션.
The method of claim 9,
Acquiring an image stream photographing the user of the terminal,
The application stored in the computer-readable storage medium to obtain a video stream photographing the user of the terminal in the sign-up process or login process as the application for providing a video call service in the terminal is executed.
제 9 항에 있어서,
상기 단말의 사용자를 촬영한 영상 스트림을 획득하는 단계는,
상기 단말의 사용자의 안면의 각도와 사이즈가 소정의 기준에 맞게 촬영되도록, 상기 단말의 화면에 가이드라인을 제공하는 단계; 및
상기 제공된 가이드라인에 따라 상기 단말의 사용자의 안면이 촬영된 영상 스트림을 획득하는 단계;
를 포함하는, 컴퓨터 판독 가능 저장매체에 저장된 애플리케이션.
The method of claim 9,
Acquiring an image stream photographing the user of the terminal,
Providing a guideline on a screen of the terminal so that the angle and size of the face of the user of the terminal are photographed according to a predetermined criterion; And
Acquiring an image stream of a face of the user of the terminal according to the provided guidelines;
And an application stored on the computer readable storage medium.
제 9 항에 있어서,
상기 추출하는 단계는,
상기 획득된 영상 스트림 중 촬영된 각도에 기초하여 상기 단말의 사용자의 안면이 정면으로 촬영된 영상을 선정하여, 상기 선정된 영상에서 상기 단말의 사용자의 안면 특징점들을 추출하는, 컴퓨터 판독 가능 저장매체에 저장된 애플리케이션.
The method of claim 9,
The extracting step,
A computer-readable storage medium for selecting an image in which the face of the user of the terminal is photographed in front of the acquired image stream, and extracting facial feature points of the user of the terminal from the selected image. Saved application.
제 9 항에 있어서,
상기 판단하는 단계는,
상기 학습 모델 및 상기 추출된 안면 특징점들을 이용하여, 상기 영상 통화 서비스의 제공이 제한된 사용자일 확률을 수치로 나타낸 결과와 소정의 임계치를 비교하고, 비교 결과에 따라, 상기 단말의 사용자가 상기 영상 통화 서비스의 제공이 제한된 사용자인지 판단하는, 컴퓨터 판독 가능 저장매체에 저장된 애플리케이션.
The method of claim 9,
The determining step,
By using the learning model and the extracted facial feature points, a result of numerically representing a probability that the provision of the video call service is a limited user is compared with a predetermined threshold value, and according to the comparison result, the user of the terminal An application stored on a computer readable storage medium for determining whether a service is provided to a limited user.
제 9 항에 있어서,
상기 애플리케이션의 실행을 유지하거나 제한하는 단계는,
상기 판단 결과, 상기 영상 통화 서비스의 제공이 제한된 사용자인 경우, 상기 실행된 영상 통화 서비스를 제공하는 애플리케이션을 종료시키거나, 상기 소정 부정행위를 한 이력에 의해 상기 영상 통화 서비스의 제공이 제한됨을 알려주는 메시지를 제공함으로써, 상기 애플리케이션의 실행을 제한하는, 컴퓨터 판독 가능 저장매체에 저장된 애플리케이션.
The method of claim 9,
Maintaining or limiting the execution of the application,
As a result of the determination, when the user of the provision of the video call service is limited, the notification of the provision of the video call service is limited by the termination of the application providing the executed video call service or the history of the cheating. Provides a message to limit the execution of the application.
제 9 항에 있어서,
상기 수신하는 단계는,
상기 서버에서 주기에 따라 업데이트된 학습 모델을 수신하는, 컴퓨터 판독 가능 저장매체에 저장된 애플리케이션.
The method of claim 9,
The receiving step,
An application stored on a computer-readable storage medium for receiving a training model updated on a periodic basis at the server.
KR1020180034757A 2017-11-16 2018-03-26 Terminal and server providing a video call service KR102034839B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20170153308 2017-11-16
KR1020170153308 2017-11-16

Publications (2)

Publication Number Publication Date
KR20190056273A KR20190056273A (en) 2019-05-24
KR102034839B1 true KR102034839B1 (en) 2019-10-21

Family

ID=66680111

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180034757A KR102034839B1 (en) 2017-11-16 2018-03-26 Terminal and server providing a video call service

Country Status (1)

Country Link
KR (1) KR102034839B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100690295B1 (en) * 2005-09-20 2007-03-09 삼성전자주식회사 Method of face image normalization and face recognition system for a mobile terminal
KR100828411B1 (en) * 2006-10-20 2008-05-09 연세대학교 산학협력단 Global feature extraction method for 3D face recognition
KR101117549B1 (en) * 2010-03-31 2012-03-07 경북대학교 산학협력단 Face recognition system and method thereof
KR101443021B1 (en) * 2013-03-08 2014-09-22 주식회사 슈프리마 Apparatus and method for registering face, and Apparatus for guiding pose, and Apparatus for recognizing face

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101076733B1 (en) * 2008-12-02 2011-10-26 에스케이 텔레콤주식회사 System for video call service and method thereof
KR101673032B1 (en) * 2010-01-25 2016-11-04 엘지전자 주식회사 Video communication method and digital television thereof
KR20130070670A (en) * 2011-12-16 2013-06-28 삼성전자주식회사 Automatic check of destination apparatas and method of using for face recognition in a portable terminal

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100690295B1 (en) * 2005-09-20 2007-03-09 삼성전자주식회사 Method of face image normalization and face recognition system for a mobile terminal
KR100828411B1 (en) * 2006-10-20 2008-05-09 연세대학교 산학협력단 Global feature extraction method for 3D face recognition
KR101117549B1 (en) * 2010-03-31 2012-03-07 경북대학교 산학협력단 Face recognition system and method thereof
KR101443021B1 (en) * 2013-03-08 2014-09-22 주식회사 슈프리마 Apparatus and method for registering face, and Apparatus for guiding pose, and Apparatus for recognizing face

Also Published As

Publication number Publication date
KR20190056273A (en) 2019-05-24

Similar Documents

Publication Publication Date Title
KR102044241B1 (en) Terminal providing a video call service
US11140356B2 (en) Terminal and server for providing video call service
KR102073351B1 (en) Server and operating method thereof
US20200412975A1 (en) Content capture with audio input feedback
KR102056806B1 (en) Terminal and server providing a video call service
US10885178B2 (en) Methods and devices for generating security questions and verifying identities
WO2016169432A1 (en) Identity authentication method and device, and terminal
CN108830062B (en) Face recognition method, mobile terminal and computer readable storage medium
US10949654B2 (en) Terminal and server for providing video call service
KR101979650B1 (en) Server and operating method thereof
US20200412864A1 (en) Modular camera interface
WO2020048392A1 (en) Application virus detection method, apparatus, computer device, and storage medium
US9977510B1 (en) Gesture-driven introduction system
CN112818733B (en) Information processing method, device, storage medium and terminal
KR102120871B1 (en) Terminal and server providing a video call service
KR102034839B1 (en) Terminal and server providing a video call service
CN116320721A (en) Shooting method, shooting device, terminal and storage medium
US10554698B2 (en) Terminal and server providing video call service
CN111756705B (en) Attack testing method, device, equipment and storage medium of in-vivo detection algorithm
US10721437B2 (en) Terminal and server for providing video call service
CN114648780A (en) Scoring method, intelligent terminal and readable storage medium

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant