KR20210158553A - Device selection control method by speaker age group identification and system for same - Google Patents

Device selection control method by speaker age group identification and system for same Download PDF

Info

Publication number
KR20210158553A
KR20210158553A KR1020200077006A KR20200077006A KR20210158553A KR 20210158553 A KR20210158553 A KR 20210158553A KR 1020200077006 A KR1020200077006 A KR 1020200077006A KR 20200077006 A KR20200077006 A KR 20200077006A KR 20210158553 A KR20210158553 A KR 20210158553A
Authority
KR
South Korea
Prior art keywords
speaker
voice
analysis server
control command
age
Prior art date
Application number
KR1020200077006A
Other languages
Korean (ko)
Inventor
최병기
김보성
Original Assignee
주식회사 오성전자
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 오성전자 filed Critical 주식회사 오성전자
Priority to KR1020200077006A priority Critical patent/KR20210158553A/en
Publication of KR20210158553A publication Critical patent/KR20210158553A/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Abstract

The present invention relates to a device selection control method by identifying a speaker age group and a system for the same. More specifically, the present invention relates to a method for selectively controlling a device by analyzing a voice of the speaker inputted using a voice recognition algorithm. To this end, the device selection control system of the present invention comprises: an analysis server that estimates the age group of the speaker using a received voice of the speaker and the stored voice data per age, and determines whether a control command included in the voice of the speaker is a control command that can be performed in the estimated age group; and a device that performs a control command received from the analysis server. Therefore, the present invention is capable of having an effect for which there is no need to separately set a blocking function according to age.

Description

화자 연령대 식별에 의한 디바이스 선택 제어 방법 및 이를 위한 시스템{Device selection control method by speaker age group identification and system for same}Device selection control method by speaker age group identification and system for same

본 발명은 화자 연령대 식별에 의한 디바이스 선택 제어 방법 및 이를 위한 시스템에 관한 것으로, 더욱 상세하게는 음성인식 알고리즘을 이용하여 입력된 화자의 음성을 분석하여 디바이스를 선택 제어하는 방안에 관한 것이다. The present invention relates to a method and system for controlling device selection by speaker age identification, and more particularly, to a method for selecting and controlling a device by analyzing a speaker's voice input using a voice recognition algorithm.

일반적으로 리모컨은 다수의 사람들이 사용하는 기기이기 때문에 개인 선호에 따른 설정에 어려움이 있다. 따라서 최근에는 지문인식, 음성인식 등 생체 인식 방법으로 사용자를 인식하거나 사용자 별로 비밀번호를 입력하는 방식으로 사용자의 개인 설정을 할 수 있는 리모컨이 개발되고 있다.In general, since a remote control is a device used by a large number of people, it is difficult to set it according to personal preference. Therefore, recently, a remote control capable of recognizing a user using biometric methods such as fingerprint recognition and voice recognition or inputting a password for each user is being developed.

하지만 생체인식을 통한 사용자 인식 방법은 생체인식 센서가 구비되어야 하므로 리모컨의 원가가 높아질 뿐만 아니라, 사용자는 리모컨을 제어하기 위하여 생체인식을 실시하는 단계를 수행하여야만 한다.However, the user recognition method through biometrics requires a biometric sensor to increase the cost of the remote control, and the user must perform a biometric step to control the remote control.

또한 비밀번호 입력을 통한 사용자 인식 방법은 리모컨을 사용할 때마다 비밀번호를 눌러 사용자 변경을 해야 하는 번거로움이 발생하는 문제점이 있다.In addition, the user recognition method through password input has a problem in that the user has to change the user by pressing the password every time the remote control is used.

이와 같은 문제점을 해결하기 위하여, 한국등록특허 제10-1717572호 및 한국공개특허 제10-2017-0044419호에 개시된 바와 같이, 사용자의 단말기의 위치를 파악하여 사용자의 위치를 인식하고 허용된 사용공간에서 사용자에 맞추어진 보안 또는 사물제어환경을 제공하기 위한 기술이 개발되고 있으나, 사용자 단말기를 활용하여 사물제어가 이루어지므로 사물제어 기능을 수행하는 동안 사용자가 단말기의 원래 기능을 사용하지 못하는 상황이 발생된다.In order to solve this problem, as disclosed in Korean Patent Registration No. 10-1717572 and Korean Patent Application Publication No. 10-2017-0044419, the location of the user's terminal is recognized to recognize the location of the user and the allowed space for use Although technology is being developed to provide a security or object control environment tailored to the user in do.

따라서, 사용자 맞춤형 사물제어 환경을 보다 손쉽게 제공할 수 있는 스마트환경을 제공하기 위한 다양한 방안이 요구된다.Accordingly, various methods are required to provide a smart environment that can more easily provide a user-customized object control environment.

한국공개특허 제2017-0044419호(발명의 명칭: 사용자의 위치를 인식하는 사용자 단말장치 및 방법)Korean Patent Application Laid-Open No. 2017-0044419 (Title of the invention: User terminal device and method for recognizing a user's location) 한국등록특허 제10-1717572호(발명의 명칭: 장소 기반 클라이언트 단말 동작 원격 제어 방법 및 시스템)Korean Patent Registration No. 10-1717572 (Title of Invention: Method and System for Remote Control of Location-Based Client Terminal Operation)

본 발명이 해결하고자 하는 과제는 화자의 음성을 분석하여 제어 가능한 디바이스를 선택하는 방안을 제안함에 있다.An object of the present invention is to propose a method of selecting a controllable device by analyzing a speaker's voice.

본 발명이 해결하고자 하는 다른 과제는 화자의 음성을 분석하여 수행 가능한 제어 명령을 추출하고, 추출한 제어 명령을 수행하는 방안을 제안함에 있다.Another object to be solved by the present invention is to analyze a speaker's voice, extract an executable control command, and propose a method for executing the extracted control command.

본 발명이 해결하고자 하는 또 다른 과제는 화자의 음성을 분석하여 화자를 특정하는 방안을 제안함에 있다.Another problem to be solved by the present invention is to propose a method for specifying the speaker by analyzing the speaker's voice.

본 발명이 해결하고자 하는 또 다른 과제는 화자의 음성을 분석하여 화자를 특정하며, 특정한 화자에 대응되는 제어 명령을 수행하는 방안을 제안함에 있다.Another object of the present invention is to propose a method of specifying a speaker by analyzing the speaker's voice and executing a control command corresponding to the specific speaker.

이를 위해 본 발명의 디바이스 선택 제어 시스템은 제공받은 화자의 음성과 저장된 연령별 음성 데이터를 이용하여 화자의 연령대를 추정하며, 화자의 음성에 포함된 제어명령이 추정한 상기 연령대에서 수행 가능한 제어명령인지 판단하는 분석서버; 및 상기 분석서버로부터 제공받은 제어명령을 수행하는 디바이스를 포함한다. To this end, the device selection control system of the present invention estimates the age of the speaker using the provided voice of the speaker and the stored voice data by age, and determines whether a control command included in the speaker's voice is a control command that can be performed in the estimated age group. analysis server; And it includes a device for performing the control command provided from the analysis server.

이를 위해 본 발명의 디바이스 선택 제어 시스템은 제공받은 화자의 음성과 저장된 화자의 음성 데이터를 이용하여 상기 화자를 특정하며, 화자의 음성에 포함된 제어명령이 특정한 상기 화자의 연령에서 수행 가능한 제어명령인지 판단하는 분석서버; 및 상기 분석서버로부터 제공받은 제어명령을 수행하는 디바이스를 포함한다.To this end, the device selection control system of the present invention specifies the speaker using the provided speaker's voice and the stored speaker's voice data, and whether the control command included in the speaker's voice is a control command that can be performed at the specific speaker's age an analysis server that judges; And it includes a device for performing the control command provided from the analysis server.

이를 위해 본 발명의 분석서버에서 디바이스 선택 제어 방법은 제공받은 화자의 음성과 저장된 연령별 음성 데이터를 이용하여 화자의 연령대를 추정하는 단계; 화자의 음성에 포함된 제어명령이 추정한 상기 연령대에서 수행 가능한 제어명령인지 판단하는 단계; 및 수행 가능한 제어명령이면 디바이스로 제어명령을 수행하도록 요청하는 단계를 포함한다.To this end, the device selection control method in the analysis server of the present invention includes the steps of estimating the age of the speaker using the provided voice of the speaker and the stored voice data for each age; determining whether a control command included in the speaker's voice is a control command that can be performed in the estimated age group; and if it is an executable control command, requesting the device to perform the control command.

본 발명에 따른 화자 연령대 식별에 의한 디바이스 선택 제어 방법 및 이를 위한 시스템은 화자의 음성을 분석하여 화자의 연령대를 추정하며, 추정한 연령대에서 실행 가능한 제어명령에 대해서는 실행하도록 지시함으로써, 연령에 따른 차단 기능을 별도로 설정할 필요가 없다는 효과가 있다.A method for controlling device selection by age identification of a speaker and a system therefor according to the present invention analyze the speaker's voice to estimate the speaker's age, and by instructing execution of control commands executable in the estimated age group, blocking according to age It has the effect that there is no need to set the function separately.

또한, 본 발명의 분석서버는 일정간격 또는 필요한 경우 음성분석 알고리즘을 업데이트함으로써 음성분석 성능을 향상시킬 수 있으며, 오인식하더라도 시간 정보를 파악하여 시간에 따른 차단 기능을 추가로 수행할 수 있는 장점이 있다.In addition, the analysis server of the present invention can improve voice analysis performance by updating the voice analysis algorithm at regular intervals or if necessary, and has the advantage of being able to additionally perform a blocking function according to time by grasping time information even if it is misrecognized. .

도 1은 본 발명의 일실시 예에 따른 화자 연령대 식별에 의한 디바이스 선택 시스템을 도시하고 있다.
도 2는 본 발명의 일실시 예에 따른 분석서버의 구성을 도시하고 있다.
도 3은 본 발명의 일실시 예에 따른 분석서버에서 수행되는 동작을 도시하고 있다.
도 4는 본 발명의 일실시 예에 따른 리모컨에서 수행되는 동작을 도시하고 있다.
1 illustrates a device selection system by identification of a speaker's age group according to an embodiment of the present invention.
2 shows the configuration of an analysis server according to an embodiment of the present invention.
3 illustrates an operation performed by the analysis server according to an embodiment of the present invention.
4 illustrates an operation performed by a remote controller according to an embodiment of the present invention.

전술한, 그리고 추가적인 본 발명의 양상들은 첨부된 도면을 참조하여 설명되는 바람직한 실시 예들을 통하여 더욱 명백해질 것이다. 이하에서는 본 발명의 이러한 실시 예를 통해 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.The foregoing and further aspects of the present invention will become more apparent through preferred embodiments described with reference to the accompanying drawings. Hereinafter, it will be described in detail so that those skilled in the art can easily understand and reproduce through these embodiments of the present invention.

도 1은 본 발명의 일실시 예에 따른 화자 연령대 식별에 의한 디바이스 선택 시스템을 도시하고 있다. 이하 도 1을 이용하여 본 발명의 일실시 예에 따른 화자 연령대 식별에 의한 디바이스 선택 시스템에 대해 상세하게 알아보기로 한다.1 illustrates a device selection system by identification of a speaker's age group according to an embodiment of the present invention. Hereinafter, a device selection system by speaker age identification according to an embodiment of the present invention will be described in detail with reference to FIG. 1 .

도 1에 의하면, 화자 연령대 식별에 의한 디바이스 선택 시스템(100)은 리모컨(110), 분석서버(120), 디바이스(130) 및 외부서버(140)를 포함한다. Referring to FIG. 1 , a device selection system 100 based on speaker age identification includes a remote controller 110 , an analysis server 120 , a device 130 , and an external server 140 .

리모컨(110)은 분석서버(120)와 통신을 수행한다. 리모컨(110)은 마이크를 포함하며, 화자의 음성을 제공받는다. 리모컨(110)은 제공받은 화자의 음성을 분석서버(120)로 제공한다.The remote control 110 communicates with the analysis server 120 . The remote control 110 includes a microphone and receives the speaker's voice. The remote control 110 provides the provided speaker's voice to the analysis server 120 .

리모컨(110)은 분석서버(120)의 분석 결과를 제공받는다. 본 발명과 관련하여 리모컨(110)은 음성을 이용하여 디바이스(130)에 대한 구동 명령을 지시하며, 분석서버(120)는 리모컨(110)으로부터 제공받은 구동 명령에 대한 음성을 분석하여 해당 디바이스(130)에 대한 구동 여부를 결정한다.The remote control 110 receives the analysis result of the analysis server 120 . In relation to the present invention, the remote control 110 instructs a driving command for the device 130 using a voice, and the analysis server 120 analyzes the voice for the driving command provided from the remote control 110 to the device ( 130) to determine whether to drive.

분석서버(120)는 리모컨(110), 외부서버(140) 및 디바이스(130)와 연결된다. 분석서버(120)는 리모컨으로 제공받은 디바이스에 대한 제어명령을 분석하며, 분석한 제어명령의 분석결과에 따라 디바이스의 구동 여부를 결정한다. 본 발명과 관련하여 분석서버(120)는 화자의 연령에 대한 음성 데이터를 저장하고 있다. 즉, 본 발명은 화자의 연령에 대응되는 음성 데이터를 저장하며, 리모컨(110)으로부터 제공받은 음성과 저장된 음성 데이터를 비교하여 화자의 연령대를 추정한다.The analysis server 120 is connected to the remote control 110 , the external server 140 and the device 130 . The analysis server 120 analyzes the control command for the device provided by the remote control, and determines whether to drive the device according to the analysis result of the analyzed control command. In relation to the present invention, the analysis server 120 stores voice data for the speaker's age. That is, the present invention stores voice data corresponding to the age of the speaker, and estimates the age of the speaker by comparing the voice received from the remote controller 110 with the stored voice data.

분석서버(120)는 추정한 화자의 연령대에서 가능한 제어명령을 저장하고 있다. 즉, 화자의 연령대가 10대인 경우 성인물이나 기타 성인만이 시청 가능한 채널에 대해서는 제어명령을 제한한다. 또한, 화장의 연령대가 10대 미만인 경우에는 가스 등과 관련된 디바이스에 대한 제어명령을 제한한다. 이와 같이 본 발명에서 제안하는 분석서버(120)는 화자의 연령대에서 가능한 제어명령에 대해서만 디바이스(130)로 제어명령을 지시한다.The analysis server 120 stores control commands that are possible in the estimated age of the speaker. That is, when the age of the speaker is a teenager, control commands are restricted for adult content or other channels that only adults can view. In addition, when the age of makeup is less than 10, control commands for devices related to gas and the like are restricted. As such, the analysis server 120 proposed in the present invention instructs the device 130 to control commands only for control commands that are possible in the age range of the speaker.

이를 위해 본 발명에서 제안하는 분석서버(120)는 제공받은 음성을 분석하기 위한 분석알고리즘이 저장된 분석모듈과 각 연령대에서 가능한 제어명령(또는 각 연령대에서 불가능한 제어명령)을 저장하는 저장모듈을 포함한다.For this purpose, the analysis server 120 proposed by the present invention includes an analysis module storing an analysis algorithm for analyzing the received voice and a storage module storing control commands available in each age group (or control commands impossible in each age group). .

분석서버(120)는 외부서버와 통신을 수행하며, 외부서버(140)로부터 음성분석 알고리즘을 제공받는다. 분석서버(120)는 음성분석 알고리즘을 일정시간 간격으로, 또는 필요한 경우 외부서버(140)로부터 제공받아 갱신한다.The analysis server 120 communicates with an external server and receives a voice analysis algorithm from the external server 140 . The analysis server 120 receives and updates the voice analysis algorithm at regular time intervals or, if necessary, from the external server 140 .

분석서버(120)는 리모컨(110)으로부터 제공받은 제어명령을 수행 가능한 경우에는 리모컨(110)으로 별도로 응답하지 않으나, 리모컨(110)으로부터 제공받은 제어명령을 수행할 수 없는 경우에는 리모컨(110)으로 제어명령을 수행할 수 없다고 응답한다.The analysis server 120 does not separately respond to the remote control 110 when the control command provided from the remote control 110 can be executed, but when the control command provided from the remote control 110 cannot be executed, the remote control 110 to respond that the control command cannot be executed.

본 발명이 화자의 연령대를 분석하는 것으로 기재되어 있으나, 이에 한정되는 것은 아니다. 즉, 분석서버(120)는 화자의 음성을 외부서버(140)로 제공하며, 외부서버(140)가 화자의 연령대를 분석할 수 있다.Although the present invention has been described as analyzing the age of the speaker, it is not limited thereto. That is, the analysis server 120 provides the speaker's voice to the external server 140 , and the external server 140 can analyze the speaker's age group.

디바이스(130)는 분석서버와 연결되며, 분석서버(120)의 명령에 따라 구동한다. 디바이스(130)는 분석서버(120)가 요청한 제어명령에 대한 결과를 응답할 수 있다. 본 발명 관련하여 디바이스(130)는 다양하게 구성될 수 있다. 디바이스(130)는 댁내에 위치하는 댁내 디바이스뿐만 아니라 댁외에 위치하는 댁외 디바이스를 포함한다. 댁내 디바이스는 가전, 조명 등이 포함될 수 있으며, 댁외 디바이스는 차량 등이 포함될 수 있다.The device 130 is connected to the analysis server, and operates according to the command of the analysis server 120 . The device 130 may respond to the result of the control command requested by the analysis server 120 . In relation to the present invention, the device 130 may be configured in various ways. The device 130 includes an indoor device located inside the premises as well as an outdoor device located outside the premises. The indoor device may include home appliances and lighting, and the outdoor device may include a vehicle.

외부서버(140)는 분석서버(120)와 연결되며, 분석서버(120)로 음성분석 알고리즘을 제공한다. 외부서버(140)는 일정 주기간격으로 또는 필요한 경우 음성분석 알고리즘을 분석서버(120)로 제공한다.The external server 140 is connected to the analysis server 120 , and provides a voice analysis algorithm to the analysis server 120 . The external server 140 provides the voice analysis algorithm to the analysis server 120 at regular intervals or if necessary.

본 발명은 외부서버(140)와 분석서버(120)가 별개의 구성으로 도시하고 있으나, 외부서버(140)와 분석서버(120)는 하나로 구성될 수 있다. 또한, 본 발명에서 제안하는 분석서버(120)는 리모컨(110)으로부터 화자의 제어명령을 제공받는 것으로 기재하고 있으나, 별도의 리모컨 구성없이 직접 화자의 제어명령을 제공받을 수 있다.In the present invention, although the external server 140 and the analysis server 120 are illustrated as separate configurations, the external server 140 and the analysis server 120 may be configured as one. In addition, although it is described that the analysis server 120 proposed in the present invention receives the speaker's control command from the remote control 110 , it can directly receive the speaker's control command without configuring a separate remote control.

이외에도 분석서버(120)는 제공받은 음성을 이용하여 화자의 연령대를 추정하는 것으로 기재하고 있으나, 이에 한정되는 것은 아니다. 분석서버(120)는 각 화자의 음성 데이터 및 각 화자별 제어 가능한 디바이스에 대한 정보를 저장하며, 저장된 음성데이터와 제공받은 음성을 이용하여 화자를 특정하며, 특정된 해당 화자에 대응되는 제어명령만을 수행한다.In addition, the analysis server 120 is described as estimating the age of the speaker using the provided voice, but is not limited thereto. The analysis server 120 stores the voice data of each speaker and information on controllable devices for each speaker, specifies the speaker using the stored voice data and the received voice, and only provides control commands corresponding to the specified speaker. carry out

즉, 본원 발명에서 제안하는 분석서버(120)는 제공받은 음성을 이용하여 화자의 연령대를 추출하거나, 화자를 특정할 수 있다. 화자의 연령대를 추출하는 실시예는 사전에 화자에 대한 음성을 미리 등록할 필요가 없다는 장점이 있으며, 화자를 특정하는 실시예는 사전에 화자의 음성을 미리 등록해야 한다는 단점이 있으나, 음성분석 알고리즘의 분석성능이 상대적으로 낮은 경우에도 활용이 가능하다는 장점이 있다.That is, the analysis server 120 proposed in the present invention may extract the age of the speaker or specify the speaker using the provided voice. The embodiment in which the age of the speaker is extracted has the advantage that it is not necessary to register the speaker's voice in advance, and the embodiment that specifies the speaker has the disadvantage that the speaker's voice must be registered in advance in advance, but the voice analysis algorithm It has the advantage that it can be used even when the analysis performance of

도 2는 본 발명의 일실시 예에 따른 분석서버의 구성을 도시하고 있다. 이하 도 2를 이용하여 본 발명의 일실시 예에 따른 분석서버의 구성에 대해 상세하게 알아보기로 한다.2 shows the configuration of an analysis server according to an embodiment of the present invention. Hereinafter, the configuration of the analysis server according to an embodiment of the present invention will be described in detail with reference to FIG. 2 .

도 2에 의하면, 분석서버는 통신모듈, 분석모듈, 저장모듈 및 제어모듈을 포함한다. 물론 상술한 구성 이외에 다른 구성이 본 발명에서 제안하는 분석서버에 포함될 수 있다.According to FIG. 2, the analysis server includes a communication module, an analysis module, a storage module, and a control module. Of course, other configurations other than the above-described configuration may be included in the analysis server proposed in the present invention.

통신모듈(122)은 외부 장치와 통신을 수행한다. 상술한 바와 같이 외부 장치는 리모컨, 외부서버 및 디바이스를 포함한다. 통신모듈(122)은 리모컨으로부터 화자의 음성이 포함된 제어명령을 수신한다. 통신모듈(122)은 리모컨으로부터 수신한 제어명령의 수행결과를 송신한다. 특히, 본 발명의 통신모듈(122)은 리모컨으로부터 수신한 제어명령을 수행하지 못한 경우에 수행결과를 송신한다.The communication module 122 communicates with an external device. As described above, the external device includes a remote control, an external server, and a device. The communication module 122 receives a control command including the speaker's voice from the remote control. The communication module 122 transmits the execution result of the control command received from the remote control. In particular, the communication module 122 of the present invention transmits the execution result when the control command received from the remote control cannot be executed.

통신모듈(122)은 외부서버로부터 음성분석 알고리즘을 수신한다. 통신모듈(122)은 연결된 디바이스로 제어명령을 송신하며, 디바이스로부터 구동 결과를 수신한다.The communication module 122 receives a voice analysis algorithm from an external server. The communication module 122 transmits a control command to a connected device and receives a driving result from the device.

분석모듈(124)은 음성분석 알고리즘을 이용하여 음성의 연령대를 분석한다. 또한, 분석모듈(124)은 음성분석 알고리즘을 이용하여 화자를 특정할 수 있다. 이를 위해 분석모듈(124)은 사전에 저장된 화자에 대한 음성을 이용한다.The analysis module 124 analyzes the age of the voice by using a voice analysis algorithm. Also, the analysis module 124 may specify a speaker using a voice analysis algorithm. To this end, the analysis module 124 uses the pre-stored voice for the speaker.

저장모듈(126)은 음성분석 알고리즘을 저장하며, 특히 화자의 음성을 저장한다. 저장모듈(126)은 각 화자별 실행 가능한 제어명령을 저장하거나, 각 화자별 구동 가능한 디바이스에 대한 정보를 저장한다. 또한, 저장모듈(126)은 각 연령대별로 실행 가능한 제어명령을 저장하거나, 각 연령대별 구동 가능한 디바이스에 대한 정보를 저장한다. 이외에도 저장모듈(126)은 분석서버를 구동하는데 필요한 프로그램을 저장한다.The storage module 126 stores the voice analysis algorithm, and in particular, stores the speaker's voice. The storage module 126 stores an executable control command for each speaker, or stores information on an drivable device for each speaker. In addition, the storage module 126 stores an executable control command for each age group or stores information about a device that can be operated for each age group. In addition, the storage module 126 stores a program necessary to drive the analysis server.

제어모듈(128)은 저장된 프로그램을 이용하여 분석서버를 구동한다. 제어모듈(128)은 분석모듈(124)에서 분석한 결과를 이용하여 디바이스로 제어명령을 전송하도록 요청한다. 즉, 제어모듈(128)은 분석모듈(124)에서 분석한 음성이 제어명령의 실행이 가능한 음성이라면, 해당 음성의 제어명령을 실행한다. 제어모듈(128)은 분석모듈(124)에서 분석한 음성이 제어명령의 실행이 불가능한 음성이라면, 이에 대한 정보를 리모컨으로 제공하도록 요청한다.The control module 128 drives the analysis server using the stored program. The control module 128 requests to transmit a control command to the device using the analysis result by the analysis module 124 . That is, if the voice analyzed by the analysis module 124 is a voice capable of executing the control command, the control module 128 executes the control command of the corresponding voice. If the voice analyzed by the analysis module 124 is a voice in which the execution of the control command is impossible, the control module 128 requests to provide information about this to the remote control.

이와 같이 본 발명에서 제안하는 제어모듈은 음성을 분석하여 제어명령의 실행 여부를 판단한다. 일 예로 제어모듈은 화자가 어른, 청소년, 유아 인지 여부를 판별하여 사용 가능한 채널, 제어 가능한 디바이스를 제어하여 안전사고 방지 및 유해 정보를 사전에 차단할 수 있다.As such, the control module proposed in the present invention analyzes the voice and determines whether the control command is executed. For example, the control module can determine whether the speaker is an adult, a teenager, or an infant, and control available channels and controllable devices to prevent safety accidents and block harmful information in advance.

이와 같이 본 발명은 화자의 나이를 식별하여 다양한 형태로 디바이스를 제어한다.As described above, the present invention identifies the age of the speaker and controls the device in various forms.

도 3은 본 발명의 일실시 예에 따른 분석서버에서 수행되는 동작을 도시한 흐름도이다. 이하 도 3을 이용하여 본 발명의 일실시 예에 따른 분석서버에서 수행되는 동작에 대해 상세하게 알아보기로 한다.3 is a flowchart illustrating an operation performed by the analysis server according to an embodiment of the present invention. Hereinafter, an operation performed in the analysis server according to an embodiment of the present invention will be described in detail with reference to FIG. 3 .

S300단계에서 분석서버는 리모컨으로부터 음성이 포함된 제어명령을 수신한다.In step S300, the analysis server receives a control command including voice from the remote control.

S302단계에서 분석서버는 음성분석 알고리즘을 이용하여 수신한 음성의 연령대를 분석한다.In step S302, the analysis server analyzes the age group of the received voice using a voice analysis algorithm.

S304단계에서 분석서버는 분석한 음성의 연령대가 수신한 제어명령을 수행할 수 있는 연령대인지 여부를 판단한다.In step S304, the analysis server determines whether the age group of the analyzed voice is an age group capable of performing the received control command.

S306단계에서 분석서버는 수신한 제어명령을 수행할 수 있는 연령대이면, 해당 제어명령을 수행하도록 디바이스로 요청하며, 수행할 수 없는 연령대이면 리모컨으로 해당 제어명령을 수행할 수 없음을 통보한다.In step S306, the analysis server requests the device to perform the corresponding control command if it is an age range that can perform the received control command, and notifies the remote controller that the corresponding control command cannot be performed if it is an age range that cannot be performed.

도 3은 분석서버에서 음성분석 알고리즘을 이용하여 수신한 음성의 연령대를 분석하는 것으로 기재하고 있으나, 상술한 바와 같이 분석서버는 음성분석 알고리즘을 이용하여 수신한 음성의 화자를 특정할 수 있으며, 특정한 화자가 해당 제어명령을 수행할 수 있는 화자인지 판단하며, 수행할 수 있는 화자이면 제어명령을 수행하도록 디바이스로 요청한다. 물론 분석서버는 수행할 수 없는 제어명령이면 리모컨으로 해당 제어명령을 수행할 수 없음을 통보한다.3 shows that the analysis server analyzes the age group of the received voice using the voice analysis algorithm, but as described above, the analysis server can specify the speaker of the received voice using the voice analysis algorithm, It is determined whether the speaker is a speaker capable of performing the corresponding control command, and if the speaker is capable of performing the control command, the device is requested to execute the control command. Of course, if the analysis server is a control command that cannot be executed, it notifies that the control command cannot be executed with the remote control.

상술한 바에 위하면, 화자의 음성을 분석하여 화자의 연령대를 추정하며, 추정한 연령대에서 수행 가능한 제어명령에 대해서만 수행하는 방안을 제안하고 있다. 이외에도 본 발명은 화자의 음성 이외에 시간 개념을 부가할 수 있다. 즉, 분석서버는 화자의 음성이 포함된 제어명령을 제공받은 시간을 확인하며, 확인된 시간에서 수행 가능한 제어명령에 대해서 디바이스로 제어명령을 제공한다. 물론 분석서버는 확인된 시간에서 수행이 불가능한 제어명령에 대해서는 이를 외부로 통보하며, 이 경우 화자는 별도의 인증절차를 통해 제어명령을 재전송할 수 있다. 부연하여 설명하면, 분석서버는 확인한 시간에서 수행이 불가능한 제어명령에 대해서는 일괄적으로 디바이스로 제어명령을 제공하지 않는 것이 아니라, 화자에 대해 추가 인증절차를 수행함으로써 디바이스로 제어명령을 제공할 수 있다. 즉, 화자에 따라서는 제어명령 실행이 반드시 요구되는 경우가 있으며, 이에 대해서는 제어명령을 수행할 필요가 있다.For the above reasons, it is proposed to analyze the speaker's voice to estimate the speaker's age, and to perform only the control commands that can be performed in the estimated age group. In addition, the present invention may add a concept of time in addition to the speaker's voice. That is, the analysis server checks the time when the control command including the speaker's voice is provided, and provides the control command to the device for the control command that can be performed at the checked time. Of course, the analysis server notifies the outside of the control command that cannot be executed at the confirmed time, and in this case, the speaker can retransmit the control command through a separate authentication procedure. In other words, the analysis server does not provide control commands to the device in a batch for control commands that cannot be performed at the confirmed time, but provides control commands to the device by performing an additional authentication procedure for the speaker. . That is, there are cases where the execution of the control command is necessarily required depending on the speaker, and in this case, it is necessary to execute the control command.

도 4는 본 발명의 일실시 예에 따른 음성 명령이 가능한 리모컨에서 수행되는 동작을 도시한 흐름도이다. 이하 도 4를 이용하여 본 발명의 일실시 예에 따른 음성 명령이 가능한 리모컨에서 수행되는 동작에 대해 상세하게 알아보기로 한다. 4 is a flowchart illustrating an operation performed by a remote control capable of a voice command according to an embodiment of the present invention. Hereinafter, an operation performed by a remote control capable of a voice command according to an embodiment of the present invention will be described in detail with reference to FIG. 4 .

S400단계에서 리모컨은 음성명령 버튼의 조작을 감지한다. 상술한 바와 같이 리모컨은 복수 개의 버튼을 포함하며, 사용자에 의해 복수 개의 버튼 중 음성명령 버튼의 조작되었음을 감지한다.In step S400, the remote control detects the operation of the voice command button. As described above, the remote control includes a plurality of buttons, and it is sensed that a voice command button among the plurality of buttons has been manipulated by the user.

S402단계에서 리모컨은 분석서버의 전원 상태를 확인한다. 리모컨은 분석서버의 전원 상태에 대한 정보를 저장하고 있다. 분석서버의 전원 상태가 켜진 상태라면 S404단계로 이동하며, 분석서버의 전원이 꺼진 상태라면 S410단계로 이동한다.In step S402, the remote control checks the power state of the analysis server. The remote control stores information about the power status of the analysis server. If the power state of the analysis server is on, it moves to step S404, and if the power of the analysis server is off, it moves to step S410.

S404단계에서 리모컨은 음성명령을 요청하는 음성명령 요청 제어코드를 출력(송신)한 후 음성명령을 위한 대기 상태로 진입한다. In step S404, the remote controller outputs (transmits) a voice command request control code for requesting a voice command, and then enters a standby state for a voice command.

S410단계에서 리모컨은 분석서버의 전원을 켠 후 음성명령 요청 제어코드를 송신한다. 물론 S410단계에서의 음성명령 요청 제어코드는 S404단계에서의 음성명령 요청 제어코드와 상이하다. 부연하여 설명하면 리모컨은 분석서버의 전원을 켜라는 제어신호와 음성명령을 요청하는 제어신호가 포함된 음성명령 요청 제어코드를 송신한다. 물론 리모컨은 디바이스의 전원이 꺼진 상태이면 디바이스의 전원을 켜라는 디바이스의 전원 온 제어코드를 음성명령 요청 제어코드에 포함시켜 송신하는 것이 필요하다.In step S410, the remote control transmits a voice command request control code after turning on the power of the analysis server. Of course, the voice command request control code in step S410 is different from the voice command request control code in step S404. To elaborate, the remote control transmits a voice command request control code including a control signal to turn on the power of the analysis server and a control signal to request a voice command. Of course, the remote control needs to transmit the device's power-on control code to turn on the device's power in the voice command request control code when the device's power is off.

S412단계에서 리모컨은 전원이 켜진 분석서버로부터 전원이 켜진 상태임을 제공받아 저장한다. 상술한 바와 같이 리모컨은 분석서버로부터 제공받은 분석서버의 전원 상태에 대한 정보를 저장한다. 물론 리모컨은 전원이 켜진 디바이스의 전원 상태에 대한 정보를 분석서버로부터 제공받아 저장한다.In step S412, the remote control receives the power-on state from the turned-on analysis server and stores it. As described above, the remote control stores information on the power state of the analysis server provided from the analysis server. Of course, the remote control receives information about the power state of the powered-on device from the analysis server and stores it.

S414단계에서 리모컨은 분석서버로부터 음성명령을 허락하는 음성명령 허락 제어코드를 수신한다.In step S414, the remote control receives a voice command permission control code for allowing a voice command from the analysis server.

S416단계에서 리모컨은 음성명령을 위해 사용자로부터 입력받은 음성 명령에 대응되는 제어코드를 분석서버로 제공한다. 물론 리모컨은 화자의 음성이 포함된 제어코드를 분석서버로 제공한다. 이와 같이 본 발명은 하나의 버튼 조작으로 분석서버의 전원과 음성명령을 수행하는 방안을 제안한다.In step S416, the remote control provides a control code corresponding to the voice command input from the user for the voice command to the analysis server. Of course, the remote control provides the control code including the speaker's voice to the analysis server. As described above, the present invention proposes a method of performing power and voice commands of the analysis server with one button operation.

도 4는 화자가 리모컨을 이용하여 분석서버로 제어명령을 제공하는 것으로 도시되어 있으나, 상술한 바와 이에 한정되는 것은 아니다. 즉, 화자는 직접 분석서버로 제어명령을 제공할 수 있다.4 illustrates that the speaker provides a control command to the analysis server using the remote control, but is not limited thereto. That is, the speaker can directly provide a control command to the analysis server.

이 경우, 분석서버는 음성명령(제어명령)을 수신하며, 수신된 음성명령에 포함된 화자의 음성으로부터 화자의 연령대를 추정한다. 분석서버는 추정한 화자의 음성명령을 수행할 필요가 있는 경우에는 디바이스의 전원 상태를 확인한다. 분석서버는 디바이스의 전원이 꺼진 상태이면, 제어명령과 더불어 디바이스의 전원을 켜라는 디바이스의 전원 온 제어코드가 포함된 제어명령을 디바이스로 송신한다. 이와 같이 본 발명은 화자가 별도로 디바이스의 전원을 켜지 않더라도 분석서버가 디바이스의 전원을 켤 필요가 있는 경우에는 분석서버는 디바이스로 전원을 켜라고 요청함으로서 화자(사용자)의 부담을 줄일 수 있게 된다.In this case, the analysis server receives a voice command (control command), and estimates the age of the speaker from the voice of the speaker included in the received voice command. The analysis server checks the power state of the device when it is necessary to perform the estimated speaker's voice command. When the power of the device is turned off, the analysis server transmits a control command including a power-on control code of the device to turn on the power of the device to the device along with the control command. As described above, according to the present invention, when the analysis server needs to turn on the power of the device even if the speaker does not turn on the device separately, the analysis server requests to turn on the power to the device, thereby reducing the burden on the speaker (user).

본 발명은 도면에 도시된 일실시 예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. Although the present invention has been described with reference to one embodiment shown in the drawings, this is merely exemplary, and it will be understood by those skilled in the art that various modifications and equivalent other embodiments are possible therefrom. .

100: 120: 분석서버 130: 디바이스
140: 외부서버 122: 통신모듈
124: 분석모듈 126: 저장모듈
디바이스 선택 시스템 110: 리모컨
128: 제어모듈
100: 120: analysis server 130: device
140: external server 122: communication module
124: analysis module 126: storage module
Device selection system 110: remote control
128: control module

Claims (7)

제공받은 화자의 음성과 저장된 연령별 음성 데이터를 이용하여 화자의 연령대를 추정하며, 화자의 음성에 포함된 제어명령이 추정한 상기 연령대에서 수행 가능한 제어명령인지 판단하는 분석서버; 및
상기 분석서버로부터 제공받은 제어명령을 수행하는 디바이스를 포함함을 특징으로 하는 디바이스 선택 제어 시스템.
an analysis server for estimating the age of the speaker using the provided voice of the speaker and the stored voice data for each age, and determining whether a control command included in the speaker's voice is a control command that can be performed in the estimated age; and
Device selection control system, characterized in that it comprises a device for executing the control command provided from the analysis server.
제 1항에 있어서, 상기 분석서버는,
제공받은 화자의 음성과 저장된 연령별 음성 데이터를 이용하여 화자의 연령대를 추정하는 음성분석 알고리즘을 포함하며,
연령대별로 수행 가능한 제어명령 또는 수행 불가능한 제어명령을 저장함을 특징으로 하는 디바이스 선택 제어 시스템.
According to claim 1, wherein the analysis server,
It includes a voice analysis algorithm for estimating the age of the speaker using the provided voice of the speaker and the stored voice data by age,
A device selection control system, characterized in that it stores control commands that can be performed or control commands that cannot be performed by age group.
제 2항에 있어서, 화자의 음성을 수신하는 마이크를 포함하며,
상기 분석서버로 화자의 음성을 제공하는 리모컨을 포함함을 특징으로 하는 디바이스 선택 제어 시스템.
According to claim 2, comprising a microphone for receiving the speaker's voice,
Device selection control system, characterized in that it comprises a remote control for providing the speaker's voice to the analysis server.
제 2항에 있어서, 상기 분석서버는,
화자의 음성에 포함된 제어명령의 대상이 되는 디바이스가 추정한 상기 연령대에서 수행 가능한 디바이스인지 판단하며,
추정한 상기 연령대에서 가능한 디바이스이면, 상기 제어명령이 추정한 상기 연령대에서 수행 가능한 제어명령인지 판단함을 특징으로 하는 디바이스 선택 제어 시스템.
According to claim 2, wherein the analysis server,
It is determined whether the device that is the target of the control command included in the speaker's voice is a device that can be performed in the estimated age group,
If the device is available in the estimated age group, the device selection control system, characterized in that it is determined whether the control command is a control command that can be performed in the estimated age group.
제공받은 화자의 음성과 저장된 화자의 음성 데이터를 이용하여 상기 화자를 특정하며, 화자의 음성에 포함된 제어명령이 특정한 상기 화자의 연령에서 수행 가능한 제어명령인지 판단하는 분석서버; 및
상기 분석서버로부터 제공받은 제어명령을 수행하는 디바이스를 포함함을 특징으로 하는 디바이스 선택 제어 시스템.
an analysis server that specifies the speaker using the provided speaker's voice and the stored speaker's voice data, and determines whether a control command included in the speaker's voice is a control command that can be performed at a specific age of the speaker; and
Device selection control system, characterized in that it comprises a device for executing the control command provided from the analysis server.
제 5항에 있어서, 상기 분석서버는,
제공받은 화자의 음성과 저장된 화자의 음성 데이터를 이용하여 화자를 특정하는 음성분석 알고리즘을 포함하며,
화자별 또는 화자의 연령대별로 수행 가능한 제어명령 또는 수행 불가능한 제어명령을 저장함을 특징으로 하는 디바이스 선택 제어 시스템.
According to claim 5, wherein the analysis server,
It includes a voice analysis algorithm for specifying the speaker using the provided speaker's voice and the stored speaker's voice data,
A device selection control system, characterized in that the control commands that can be executed or the control commands that cannot be executed are stored by each speaker or by the age of the speaker.
제공받은 화자의 음성과 저장된 연령별 음성 데이터를 이용하여 화자의 연령대를 추정하는 단계;
화자의 음성에 포함된 제어명령이 추정한 상기 연령대에서 수행 가능한 제어명령인지 판단하는 단계; 및
수행 가능한 제어명령이면 디바이스로 제어명령을 수행하도록 요청하는 단계를 포함함을 특징으로 하는 분석서버에서 디바이스 선택 제어 방법.
estimating the age of the speaker using the provided voice of the speaker and the stored voice data for each age;
determining whether a control command included in the speaker's voice is a control command that can be performed in the estimated age group; and
Device selection control method in the analysis server, characterized in that it comprises the step of requesting to perform the control command to the device if the control command that can be performed.
KR1020200077006A 2020-06-24 2020-06-24 Device selection control method by speaker age group identification and system for same KR20210158553A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200077006A KR20210158553A (en) 2020-06-24 2020-06-24 Device selection control method by speaker age group identification and system for same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200077006A KR20210158553A (en) 2020-06-24 2020-06-24 Device selection control method by speaker age group identification and system for same

Publications (1)

Publication Number Publication Date
KR20210158553A true KR20210158553A (en) 2021-12-31

Family

ID=79177630

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200077006A KR20210158553A (en) 2020-06-24 2020-06-24 Device selection control method by speaker age group identification and system for same

Country Status (1)

Country Link
KR (1) KR20210158553A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101717572B1 (en) 2016-10-20 2017-03-20 주식회사 아이에스큐어 Location-based Method and system for remotely controlling operation of client terminal
KR20170044419A (en) 2015-10-15 2017-04-25 삼성전자주식회사 A User Terminal Device And Method For Recognizing User Location

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170044419A (en) 2015-10-15 2017-04-25 삼성전자주식회사 A User Terminal Device And Method For Recognizing User Location
KR101717572B1 (en) 2016-10-20 2017-03-20 주식회사 아이에스큐어 Location-based Method and system for remotely controlling operation of client terminal

Similar Documents

Publication Publication Date Title
US10212040B2 (en) Troubleshooting voice-enabled home setup
EP2682841B1 (en) Gesture input device and method for controlling gesture input device
KR101975566B1 (en) User scan type remote controller and methods thereof
KR102452528B1 (en) Access control system and access control method using the same
CN109508522B (en) Data clearing method, device, storage medium and terminal
KR101698679B1 (en) Apparatus and method for controlling access using visible light communication
CN103419790A (en) Hierarchical recognition of vehicle driver and select activation of vehicle settings based on the recognition
US11822302B1 (en) Apparatus and method for controlling a device
KR102044526B1 (en) Method of increasing speech recognition based on artificial intelligence and device of implementing thereof
KR20210158553A (en) Device selection control method by speaker age group identification and system for same
KR101861057B1 (en) Digital door lock based on composite signal and the method for operating the same
JP2009096617A (en) Operation mode control device of elevator and program
US20180182393A1 (en) Security enhanced speech recognition method and device
JP6273174B2 (en) Elevator security system
JP5347388B2 (en) Operation instruction receiving device
KR20170100723A (en) Method for controlling remote switch of steering wheel
JP2020197807A (en) Communicator and management system
KR200383752Y1 (en) Device for controlling door open/close
KR101955601B1 (en) Stand-alone type finger print authentication device, method for controling doorlock and the device
KR101160452B1 (en) A system and method for wireless controlling a system using multiple finger scan
KR20150070453A (en) Trunk auto open system and method for controlling movement thereof
JP2009010867A (en) Remote controller, and electronic apparatus
KR102564369B1 (en) Vehicle user authentication system and vehicle user authentication method by using the system
KR100459404B1 (en) Method and system for storing and authenticating of the authentication information
KR100423495B1 (en) Operation control system by speech recognition for portable device and a method using the same

Legal Events

Date Code Title Description
E90F Notification of reason for final refusal
E601 Decision to refuse application
E601 Decision to refuse application
E801 Decision on dismissal of amendment