KR102277422B1 - 음성 단말기의 음성 검증 및 제한 방법 - Google Patents

음성 단말기의 음성 검증 및 제한 방법 Download PDF

Info

Publication number
KR102277422B1
KR102277422B1 KR1020200092470A KR20200092470A KR102277422B1 KR 102277422 B1 KR102277422 B1 KR 102277422B1 KR 1020200092470 A KR1020200092470 A KR 1020200092470A KR 20200092470 A KR20200092470 A KR 20200092470A KR 102277422 B1 KR102277422 B1 KR 102277422B1
Authority
KR
South Korea
Prior art keywords
voice
user
terminal
stored
verification
Prior art date
Application number
KR1020200092470A
Other languages
English (en)
Inventor
이종엽
이진용
Original Assignee
이종엽
(주)제이디미디어그룹
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이종엽, (주)제이디미디어그룹 filed Critical 이종엽
Priority to KR1020200092470A priority Critical patent/KR102277422B1/ko
Application granted granted Critical
Publication of KR102277422B1 publication Critical patent/KR102277422B1/ko
Priority to PCT/KR2021/009479 priority patent/WO2022019674A1/ko
Priority to JP2022540596A priority patent/JP2023510518A/ja
Priority to US18/152,101 priority patent/US20230162741A1/en
Priority to JP2023208040A priority patent/JP2024037831A/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B25/00Alarm systems in which the location of the alarm condition is signalled to a central station, e.g. fire or police telegraphic systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/18Artificial neural networks; Connectionist approaches
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/08Network architectures or network communication protocols for network security for authentication of entities
    • H04L63/0861Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Software Systems (AREA)
  • Psychiatry (AREA)
  • Hospice & Palliative Care (AREA)
  • Child & Adolescent Psychology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

본 발명은 전부 또는 일부에 대하여 잠금 설정을 한후 사용자가 지정한 단계별 대응조치를 실행함으로써 단말기의 분실이나 도난시 이에 대하여 효과적으로 대처하고, 복수의 인증서버에 사용자의 음성을 저장하여 상호 비교 검증함과 아울러, 언어처리모듈을 이용하여 사용자 음성을 감정상태별로 저장함으로써 사용자의 음성을 정확하고 안전하게 인식하고 검증할 수 있는 음성 단말기의 음성 검증 및 제한 방법을 제공한 본 발명은, a)음성 저장 단계와 b)음성 검증 단계를 포함하는 음성 단말기의 음성 검증 및 제한 방법에 있어서, 상기 a)음성 저장 단계는; 상기 음성 단말기의 마이크로 사용자의 음성을 입력 및 등록하는 단계; 상기 입력된 음성을 언어처리모듈로 수신하여 분석하는 단계; 상기 분석한 음성을 복수의 음성인증서버로 전송하여 각각 검증 및 저장하는 단계; 상기 저장된 음성을 인공지능(AI)프로세서로 학습하는 단계를 포함하고, 상기 b)음성 검증 단계는; 상기 a)단계에서 입력된 음성과 상기 복수의 음성인증서버에 저장된 음성중 적어도 1 이상의 서버에 저장된 음성을 상호 비교하여 검증하는 단계; 상기 입력된 음성이 저장된 음성과 일치할 경우 승인 및 음성명령을 수행하는 단계; 상기 입력된 음성이 저장된 음성과 일치하지 않을 경우 상기 음성 단말기의 전부 또는 일부 기능에 대하여 제한을 설정하고 사용자가 지정한 단계별 조치를 실행하는 단계를 포함한다.

Description

음성 단말기의 음성 검증 및 제한 방법{Voice verification and restriction method of the voice system}
본 발명은 음성 검증 및 제한 방법에 관한 것으로, 더욱 상세하게는 타인의 무단사용 및 개인정보유출을 방지하기 위한 음성 단말기의 음성 검증 및 제한 방법에 관한 것이다.
종래에는 유무선 통신망(인터넷망을 포함한다)을 통해 제공되는 정보(텍스트 또는 문자 또는 이미지 또는 음성의 형태)을 인공지능 음성기술을 이용해 이용자가 자신이 원하는 정보(데이터, 콘텐츠, 뉴스, 정보 등) 를 얻기 위해 음성명령을 하면, 마이크와 음성인식장치, 스피커가 장착된 제품 등을 통해 제품들에 내장되어 있거나, 또는 해당 제품들이 유무선 통신망을 통해 외부 정보 제공 포털사(구글, 아마존, 애플, 유튜브, 네이버, 다음 등과 같은 포털사 및 인터넷신문사 등과 같은 기타 정보제공 사이트 또는 플랫폼을 포함한다)로부터 수집한 데이터 DB로부터 특정 정보들을 추출하여 이미 제품내에 기저장되어 있는 기계음성으로만 이용자에게 정보를 제공하는 형태였다.
이러한 인공지능 음성기술 서비스는 현재 날씨정보, 음악정보, 뉴스, 최신 교통상황, 간단한 상품 및 서비스 주문까지 다양한 작업이 가능 할 수 있도록 진화됐다.
종래의 인공지능 음성기술을 이용한 제품들 중 마이크와 음성인식장치, 스피커가 장착된 제품들은 일명 "스마트스피커"라는 명칭으로도 불리우며, 이동 또는 휴대가 가능한 형태 또는 거치형태로 좀더 구체적으로는 휴대폰, 노트북, 테블릿, 컴퓨터, 헤드셋, 이어폰, 블루투스, 스피커 사물인터넷(IOT) 제품 외 자동차, 선박, 비행기 등과 같은 다양한 이동 단말기에도 그 적용 범위를 넓히면서 인공지능 음성정보 서비스를 제공하고 있다.
현재에는 음성 입력방식에 있어서 스크린(화면부)이 없는 상황, 즉 "제로 UI" 가 조금씩 그 보급의 범위를 확대하고 있는 상황이다. 디자이너 앤디 굿맨( Andy Goodman)이라는 자가 처음 사용한 제로UI는 음성인식 기술과 인공지능이 결합한 새로운 플랫폼을 대표하는 용어로 널리 주목받고 있다.
뉴스 서비스 시장의 경우도 2017년 이후 음성기기의 보급이 확대되고, 해외 IT기업 및 국내 SK텔레콤, KT같은 통신사 뿐아니라 네이버, 카카오도 앞다퉈 인공지능 스피커의 출시와 보급을 통해 음성 서비스 활용한 뉴스 제공 서비스를 시도하고 있다.
한편, 종래 음성 서비스 기술은, 일반적으로 사용자자로부터 음성정보를 수신하고 음성인증서버에 저장한 후, 음성인증서버에 저정된 사용자의 음성과 단말기로부터 입력되는 음성을 단순 비교 검증하여 사용자의 진위여부를 판별하고 있다.
하지만, 이런 종래 음성 서비스 기술은, 타인의 무단사용 및 개인정보유출을 방지하기 위하여, 단말기의 기능 전부 또는 일부에 대하여 잠금 설정을 하더라도 단말기의 분실이나 도단시 이에 대하여 효과적으로 대처할수 없는 문제점이 있었다.
또한, 단순히 하나의 음성인증서버에 저장된 사용자의 음성을 단순 비교함으로써, 사용자의 음성을 정확하고 안전하게 인식하거나 검증하지 못하는 문제점이 있었다.
대한민국 공개특허공보 제2017-0049317호
본 발명은 이러한 종래 문제점을 해결하기 위한 것으로, 타인의 무단사용 및 개인정보유출을 방지하기 위하여, 단말기의 기능 전부 또는 일부에 대하여 제한 설정을 한후 사용자가 지정한 단계별 대응조치를 실행함으로써 단말기의 분실이나 도난시 이에 대하여 효과적으로 대처하는 음성 단말기의 음성 검증 및 제한 방법을 제공하는데 목적이 있다.
또한, 복수의 인증서버에 사용자의 음성을 저장하여 상호 비교 검증함과 아울러, 언어처리모듈을 이용하여 사용자 음성을 감정상태별로 저장함으로써 사용자의 음성을 정확하고 안전하게 인식하고 검증할 수 있는 음성 단말기의 음성 검증 및 제한 방법을 제공하는데 목적이 있다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상기 목적을 달성하기 위해 본 발명에 따른 음성 단말기의 음성 검증 및 제한 방법은, a)음성 저장 단계와 b)음성 검증 단계를 포함하는 음성 단말기의 음성 검증 및 제한 방법에 있어서, 상기 a)음성 저장 단계는; 상기 음성 단말기의 마이크로 사용자의 음성을 입력 및 등록하는 단계; 상기 입력된 음성을 언어처리모듈로 수신하여 분석하는 단계; 상기 분석한 음성을 복수의 음성인증서버로 전송하여 각각 저장하는 단계; 상기 저장된 음성을 인공지능(AI)프로세서로 학습하는 단계를 포함하고, 상기 b)음성 검증 단계는, 상기 입력된 음성과 상기 복수의 음성인증서버에 저장된 음성중 적어도 1 이상의 서버에 저장된 음성을 상호 비교하는 단계; 상기 입력된 음성이 저장된 음성과 일치할 경우 승인 및 음성명령을 수행하는 단계; 상기 입력된 음성이 저장된 음성과 일치하지 않을 경우 상기 음성 단말기의 전부 또는 일부 기능에 대하여 제한을 설정하고 사용자가 지정한 단계별 조치를 실행하는 기능 잠금 설정 단계;를 포함하되, 한명 이상의 사용자가 기설정 되어 있는 경우, 특정인의 사용자가 음성입력을 통한 명령시, 음성인증서버에 저장되어 있는 사용자의 음성을 확인하여 기 설정된 사용자가 맞으면 해당 사용자의 이름을 불러주고 명령을 작동하거나, 해당 사용자를 확인하는 절차를 거쳐 명령을 수행하고, 사용자가 맞지 않으면, 사용자가 아니라는 멘트하거나 사용자가 아니라는 확인절차를 거쳐 다시 초기 단계로 돌아가되, 사용자의 음성이 설정되어 있지 않을 시에는, 별도의 음성인증절차 없이 사용자의 음성에 따른 명령을 수행하는 것을 특징으로 한다.
상기 사용자의 음성을 입력 및 등록하는 단계는; 특정 사용자를 지정 및 선택하여 입력 및 등록하는 것이 바람직하다.
삭제
또한, 상기 언어처리모듈로 음성을 분석하는 단계는; 사용자 음성을 발음, 속도, 호흡, 운율, 발성 특징별로 분류하여 각각의 감정상 태별로 저장하는 것이 더욱 바람직하다.
또한, 상기 음성 단말기의 기능 잠금을 설정하는 단계는; 상기 단말기의 기능 전부 또는 일부에 대하여 최초 잠금 설정을 한 후, 재 입력시 반복해서 음성 불일치할 경우에는 사용자가 미리 지정한 단계별 대응조치를 실행하되, 1단계로 사용자 단말기로 인증메시지를 발송하고, 2단계로 사용자가 미리 설정한 단말기로 경고메시지를 발송하고, 3단계로 이동통신사 또는 경찰서로 위치추적 및 비상알림메시지를 발송하도록 할 수 있다.
상기 음성 단말기는 이동 또는 휴대가 가능한 형태 또는 거치형태로 좀더 구체적으로는 휴대폰, 노트북, 테블릿, 컴퓨터, 헤드셋, 이어폰, 블루투스, 스피커, 사물인터넷(IOT) 제품 외 자동차, 선박, 비행기 중 어느 하나의 이동 단말기에 적용 될 수 있다.
a)음성 저장 단계와 b)음성 검증 단계는 한국어, 영어, 일어, 중국어 등 한 개 이상의 언어를 선택할 수 있다.
본 발명의 기타 특징 및 더욱 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
삭제
상기와 같이 구성된 본 발명에 따른 음성 단말기의 음성 검증 및 제한 방법에 의하면, 타인의 무단사용 및 개인정보유출을 방지하기 위하여, 단말기의 기능 전부 또는 일부에 대하여 제한 설정을 한후 반복해서 음성불일치할 경우에는 사용자가 지정한 단계별 대응조치를 실행함으로써 단말기의 분실이나 도난시 이에 대하여 효과적으로 대처하는 효과가 있다.
또한, 복수의 인증서버에 사용자의 음성을 저장하여 상호 비교 검증함과 아울러, 언어처리모듈을 이용하여 사용자 음성을 감정상태별로 저장함으로써 사용자의 음성을 정확하고 안전하게 인식하고 검증할 수 있는 효과도 있다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일실시예에 따른 음성 단말기의 음성 검증 및 제한 방법을 나타낸 제어 블록도로서 음성 저장 절차를 나타낸 도면이다.
도 2는 본 발명의 일실시예에 따른 음성 단말기의 음성 검증 및 제한 방법을 나타낸 제어 블록도로서 음성 검증 절차를 나타낸 도면이다.
도 3,4는 본 발명의 일실시예에 따른 음성 단말기의 음성 검증 및 제한 방법의 사용례를 나타낸 도면이다.
도 5는 본 발명의 다른 실시예의 본 발명의 일실시예에 따른 한명 이상의 사용자가 기설정 되어 있는 경우 특정인의 사용자가 음성입력을 통한 명령 처리 단계를 나타낸 제어 블록도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함하는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는 데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 도어맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서 "포함하다" 또는 “가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 이동, 구성요소, 부품 또는 이들을 조함한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 이동, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
본 발명은 다양한 변형 및 여러 가지 실시예를 가질 수 있는 바, 그중 특정 실시예를 상세한 설명과 도면의 예시를 통하여 보다 상세하게 설명하고자 한다. 아울러, 본 발명을 설명함에 있어서 관련된 주지 관용 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 설명을 생략한다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 상세히 설명하기로 한다.
도 1은 본 발명의 일실시예에 따른 음성 단말기의 음성 검증 및 제한 방법을 나타낸 제어 블록도로서 음성 저장 절차를 나타낸 도면이고, 도 2는 본 발명의 일실시예에 따른 음성 단말기의 음성 검증 및 제한 방법을 나타낸 제어 블록도로서 음성 검증 절차를 나타낸 도면이다.
도시된 바와 같이, 본 발명의 일실시예에 따른 음성 단말기의 음성 검증 및 제한 방법을 나타낸 제어 블록도로서, a)음성 저장 단계와 b)음성 검증 단계를 포함한다.
먼저, 도 1에 도시된 바와 같이, 본 발명의 일실시예에 따른 음성 단말기의 음성 검증 및 제한 방법을 나타낸 제어 블록도로서 음성 저장 절차를 살펴보면, 상기 a)음성 저장 단계는; 상기 음성 단말기(100)의 마이크(110)로 사용자의 음성을 입력 및 등록하는 단계(S10~S12); 상기 입력된 음성을 언어처리모듈로 수신하여 분석하는 단계(S13~S16); 상기 분석한 음성을 복수의 음성인증서버(200, 210)로 전송하여 각각 검증 및 저장하는 단계(S17~S19); 상기 저장된 음성을 인공지능(AI)프로세서로 학습하는 단계(S20);를 포함한다.
상기 사용자의 음성을 입력 및 등록하는 단계(S10~S12)는 특정 사용자를 지정 및 선택하여 입력 및 등록하는 것이 바람직하다. 예로서, 사용자는 본인, 어머니, 아버지, 아들, 딸, 지인 등 특정 사용자가 지정 및 선택될 수 있다.
또한, 상기 언어처리모듈로 음성을 분석하는 단계(S13~S16)는; 사용자 음성을 발음, 속도, 호흡, 운율, 발성 특징별로 분류하여 각각의 감정상 태별로 저장하는 것이 더욱 바람직하다.
또한, 도 2에 도시된 바와 같이, 본 발명의 일실시예에 따른 음성 단말기의 음성 검증 및 제한 방법을 나타낸 제어 블록도로서 상기 b)음성 검증 단계는; 상기 a)단계에서 입력된 음성과 상기 복수의 음성인증서버(200, 210)에 저장된 음성중 적어도 1 이상의 서버에 저장된 음성을 상호 비교하여 검증하는 단계(S21); 상기 입력된 음성이 저정된 음성과 일치할 경우 승인 및 음성명령을 수행하는 단계(S22~S24); 상기 입력된 음성이 저정된 음성과 일치하지 않을 경우 상기 음성 단말기의 전부 또는 일부 기능에 대하여 제한을 설정하고 사용자가 지정한 단계별 조치를 실행하는 단계를 포함한다.
이때, 비승인에 따른 특정 안내 멘트를 출력할 수도 있고, 설정 잠금 또는 미설정 동작할 수 있다.
상기 복수의 음성인증서버(200, 210)에 저장된 음성을 상호 비교하여 검증하는 단계(S21)에서는 바람직하게는 2의 서버(200, 210)에 저장된 음성을 상호 비교함으로써 저장된 음성의 일치여부를 통하여 보다 정확하게 신뢰성을 검증할 수 있다.
또한, 상기 음성 단말기의 기능 잠금을 설정하는 단계(S28)는; 상기 단말기(100)의 기능 전부 또는 일부에 대하여 최초 잠금 설정을 한후, 재입력시 반복해서 음성 불일치할 경우에는 사용자가 미리 지정한 단계별 대응조치를 실행하되, 1단계로 사용자 단말기로 인증메시지를 발송하고, 2단계로 사용자가 미리 설정한 단말기로 경고메시지를 발송하고, 3단계로 이동통신사 또는 경찰서로 위치추적 및 비상알림메시지를 발송하도록 할 수 있다.
즉, 상기 단말기의 기능 전부 또는 일부에 대하여 최초 잠금 설정을 한후, 재입력시 반복해서 음성 불일치할 경우에는 사용자가 미리 지정한 단계별 대응조치를 실행하는 것으로 다만, 단계별 조치는 사용자의 선택에 따라 조치별 순서는 상이할 수 있다.
상기 이동 또는 휴대가 가능한 형태 또는 거치형태의 좀더 구체적으로는 휴대폰, 노트북, 테블릿, 컴퓨터, 헤드셋, 이어폰, 블루투스, 스피커, 사물인터넷(IOT) 제품 외 자동차, 선박, 비행기 등과 같은 다양한 이동 단말기에도 적용 될 수 있다.
또한, a)음성 저장 단계와 b)음성 검증 단계는 한국어, 영어, 일어, 중국어 등 한 개 이상의 언어를 선택할 수 있다.
또한, 도 3 및 도 4는 본 발명의 일실시예에 따른 음성 단말기의 음성 검증 및 제한 방법의 사용례를 나타낸 도면이고, 도 5는 본 발명의 일실시예에 따른 한명 이상의 사용자가 기설정 되어 있는 경우 특정인의 사용자가 음성입력을 통한 명령 처리 단계를 나타낸 제어 블록도이다.
도시된 바와 같이, 한명 이상의 사용자가 기설정 되어 있는 경우, 특정인의 사용자가 음성입력을 통한 명령시, 음성인증서버에 저장되어 있는 사용자의 음성을 확인하여 기 설정된 사용자가 맞으면 해당 사용자의 이름을 불러주고(이는 실제 제품 구현에서는 삭제될 수도 있음) 명령을 작동한다.
또한, 해당 사용자의 이름을 불러주고 명령을 작동하거나, 해당 사용자를 확인하는 절차를 거쳐 명령을 수행하고, 사용자가 맞지 않으면, 사용자가 아니라는 멘트하거나 사용자가 아니라는 확인절차를 거쳐 다시 초기 단계로 돌아가되, 사용자의 음성이 설정되어 있지 않을 시에는, 별도의 음성인증절차 없이 사용자의 음성에 따른 명령을 수행하도록 한 특징을 갖는 음성단말기의 음성 검증 및 제한 방법을 제공하도록 하였다.
반면, 음성인증서버에 저장되어 있는 사용자의 음성을 확인하여 기 설정된 사용자의 음성이 맞지 않으면, 사용자가 아니라는 멘트와 함께 다시 초기 단계로 돌아간다.
만약, 사용자의 음성이 설정되어 있지 않을 시에는, 별도의 음성인증절차 없이 사용자의 음성에 따른 명령을 수행할 수 있다.
본 명세서에 기재된 본 발명의 실시예와 도면에 도시된 구성은 본 발명의 바람직한 실시예에 관한 것으로, 발명의 기술적 사상을 모두 포괄하는 것은 아니므로, 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다. 따라서, 본 발명은 상술한 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형실시가 가능한 것은 물론이고, 그와 같은 변경은 본 발명의 청구범위 기재의 권리범위 내에 있게 된다.
100 : 단말기
110 : 마이크
200, 210 : 음성인증서버

Claims (8)

  1. a)음성 저장 단계와 b)음성 검증 단계를 포함하는 음성 단말기의 음성 검증 및 제한 방법에 있어서,
    상기 a)음성 저장 단계는;
    상기 음성 단말기의 마이크로 사용자의 음성을 입력 및 등록하는 단계;
    상기 입력된 음성을 언어처리모듈로 수신하여 분석하는 단계;
    상기 분석한 음성을 복수의 음성인증서버로 전송하여 각각 저장하는 단계;
    상기 저장된 음성을 인공지능(AI)프로세서로 학습하는 단계를 포함하고,
    상기 b)음성 검증 단계는,
    상기 입력된 음성과 상기 복수의 음성인증서버에 저장된 음성중 적어도 1 이상의 서버에 저장된 음성을 상호 비교하는 단계;
    상기 입력된 음성이 저장된 음성과 일치할 경우 승인 및 음성명령을 수행하는 단계;
    상기 입력된 음성이 저장된 음성과 일치하지 않을 경우 상기 음성 단말기의 전부 또는 일부 기능에 대하여 제한을 설정하고 사용자가 지정한 단계별 조치를 실행하는 기능 잠금 설정 단계;를 포함하되,
    상기 기능 잠금 설정 단계는,
    한명 이상의 사용자가 기설정 되어 있는 경우, 특정인의 사용자가 음성입력을 통한 명령시, 음성인증서버에 저장되어 있는 사용자의 음성을 확인하여 기 설정된 사용자가 맞으면 해당 사용자의 이름을 불러주고 명령을 작동하거나, 해당 사용자를 확인하는 절차를 거쳐 명령을 수행하고,
    사용자가 맞지 않으면, 사용자가 아니라는 멘트하거나 사용자가 아니라는 확인절차를 거쳐 다시 초기 단계로 돌아가되, 사용자의 음성이 설정되어 있지 않을 시에는, 별도의 음성인증절차 없이 사용자의 음성에 따른 명령을 수행하며,
    상기 단말기의 기능 전부 또는 일부에 대하여 최초 잠금 설정을 한후, 재입력시 반복해서 음성 불일치할 경우에는 사용자가 미리 지정한 단계별 대응조치를 실행하되,
    1단계로 사용자 단말기로 인증메시지를 발송하고, 2단계로 사용자가 미리 설정한 단말기로 경고메시지를 발송하고, 3단계로 이동통신사 또는 경찰서로 위치추적 또는 비상알림메시지를 발송하도록 하는 것을 특징으로 하는 음성 단말기의 음성 검증 및 제한 방법.
  2. 제 1 항에 있어서,
    상기 사용자의 음성을 입력 및 등록하는 단계는;
    특정 사용자를 지정 및 선택하여 입력 및 등록하는 것을 특징으로 하는 음성 단말기의 음성 검증 및 제한 방법.
  3. 제 1 항에 있어서,
    상기 언어처리모듈로 음성을 분석하는 단계는;
    사용자 음성을 발음, 속도, 호흡, 운율, 발성 특징별로 분류하여 각각의 감정상 태별로 저장하는 것을 특징으로 하는 음성 단말기의 음성 검증 및 제한 방법.
  4. 삭제
  5. 삭제
  6. 제 1 항에 있어서,
    상기 음성 단말기는 이동 또는 휴대가 가능한 형태 또는 거치형태로 좀더 구체적으로는 휴대폰, 노트북, 테블릿, 컴퓨터, 헤드셋, 이어폰, 블루투스, 스피커, 사물인터넷(IOT) 제품 외 자동차, 선박, 비행기 중 어느 하나의 단말기에 적용 되어 있는 것을 특징으로 하는 음성 단말기의 음성 검증 및 제한 방법.
  7. 제 1항에 있어서,
    상기 a)음성 저장 단계와 b)음성 검증 단계는;
    한국어, 영어, 일어, 중국어 등 한 개 이상의 언어를 선택하는 것을 특징으로 하는 음성 단말기의 음성 검증 및 제한 방법.
  8. 삭제
KR1020200092470A 2020-07-24 2020-07-24 음성 단말기의 음성 검증 및 제한 방법 KR102277422B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020200092470A KR102277422B1 (ko) 2020-07-24 2020-07-24 음성 단말기의 음성 검증 및 제한 방법
PCT/KR2021/009479 WO2022019674A1 (ko) 2020-07-24 2021-07-22 음성 단말기의 음성 검증 및 제한 방법
JP2022540596A JP2023510518A (ja) 2020-07-24 2021-07-22 音声端末機の音声検証及び制限方法
US18/152,101 US20230162741A1 (en) 2020-07-24 2023-01-09 Voice verification and restriction method of voice terminal
JP2023208040A JP2024037831A (ja) 2020-07-24 2023-12-08 音声端末機の音声検証及び制限方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200092470A KR102277422B1 (ko) 2020-07-24 2020-07-24 음성 단말기의 음성 검증 및 제한 방법

Publications (1)

Publication Number Publication Date
KR102277422B1 true KR102277422B1 (ko) 2021-07-19

Family

ID=77125722

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200092470A KR102277422B1 (ko) 2020-07-24 2020-07-24 음성 단말기의 음성 검증 및 제한 방법

Country Status (4)

Country Link
US (1) US20230162741A1 (ko)
JP (2) JP2023510518A (ko)
KR (1) KR102277422B1 (ko)
WO (1) WO2022019674A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022019674A1 (ko) * 2020-07-24 2022-01-27 이종엽 음성 단말기의 음성 검증 및 제한 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080060870A (ko) * 2006-12-27 2008-07-02 (주) 엘지텔레콤 음성인증을 통한 이동단말기의 기능 제한 방법 및 시스템
KR20130130138A (ko) * 2012-02-02 2013-12-02 김선배 향상된 보안성을 갖는 스마트폰의 사용자 인증방법
KR20160116586A (ko) * 2015-03-30 2016-10-10 한국전자통신연구원 사용자 감정 인식 방법 및 장치
KR20170049317A (ko) 2015-10-28 2017-05-10 브이피 주식회사 음성인식을 활용한 인증 장치 및 방법
KR20180050365A (ko) * 2016-07-15 2018-05-14 구글 엘엘씨 화자 검증

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003235078A (ja) * 2002-02-08 2003-08-22 Matsushita Electric Ind Co Ltd 通信装置、通信装置の盗難防止方法、およびそのプログラム
JP2005184618A (ja) * 2003-12-22 2005-07-07 Matsushita Electric Ind Co Ltd 音声認証装置、音声認証システム及び音声認証方法
JP2006011989A (ja) * 2004-06-28 2006-01-12 Ntt Docomo Inc 認証方法、端末装置、中継装置及び認証サーバ
JP4500324B2 (ja) * 2007-03-27 2010-07-14 株式会社エヌ・ティ・ティ・ドコモ 音声認証システム
JP5104124B2 (ja) * 2007-08-22 2012-12-19 日本電気株式会社 携帯端末及びその利用制限方法
US9444816B2 (en) * 2011-03-30 2016-09-13 Qualcomm Incorporated Continuous voice authentication for a mobile device
KR102277422B1 (ko) * 2020-07-24 2021-07-19 이종엽 음성 단말기의 음성 검증 및 제한 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080060870A (ko) * 2006-12-27 2008-07-02 (주) 엘지텔레콤 음성인증을 통한 이동단말기의 기능 제한 방법 및 시스템
KR20130130138A (ko) * 2012-02-02 2013-12-02 김선배 향상된 보안성을 갖는 스마트폰의 사용자 인증방법
KR20160116586A (ko) * 2015-03-30 2016-10-10 한국전자통신연구원 사용자 감정 인식 방법 및 장치
KR20170049317A (ko) 2015-10-28 2017-05-10 브이피 주식회사 음성인식을 활용한 인증 장치 및 방법
KR20180050365A (ko) * 2016-07-15 2018-05-14 구글 엘엘씨 화자 검증

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022019674A1 (ko) * 2020-07-24 2022-01-27 이종엽 음성 단말기의 음성 검증 및 제한 방법

Also Published As

Publication number Publication date
JP2023510518A (ja) 2023-03-14
WO2022019674A1 (ko) 2022-01-27
US20230162741A1 (en) 2023-05-25
JP2024037831A (ja) 2024-03-19

Similar Documents

Publication Publication Date Title
US11011170B2 (en) Speech processing method and device
US20180103376A1 (en) Device and method for authenticating a user of a voice user interface and selectively managing incoming communications
US10956480B2 (en) System and method for generating dialogue graphs
CN103366745B (zh) 基于语音识别保护终端设备的方法及其终端设备
CN110765502B (zh) 信息处理方法及相关产品
CN104834847A (zh) 身份验证方法及装置
US11416703B2 (en) Network optimization method and apparatus, image processing method and apparatus, and storage medium
US11380303B2 (en) System and method for call classification
US20210125616A1 (en) Voice Processing Method, Non-Transitory Computer Readable Medium, and Electronic Device
KR102585231B1 (ko) 화자 인식을 수행하기 위한 음성 신호 처리 방법 및 그에 따른 전자 장치
CN112334978A (zh) 支持个性化装置连接的电子装置及其方法
JP2024037831A (ja) 音声端末機の音声検証及び制限方法
CN106453802A (zh) 一种密码验证方法及装置、终端
CN115859220B (zh) 数据处理方法、相关装置及存储介质
CN107371144B (zh) 一种智能发送信息的方法及装置
CN105100005A (zh) 身份验证方法及装置
US20220286757A1 (en) Electronic device and method for processing voice input and recording in the same
US11552958B2 (en) Geo-aware capture with reduced personal information disclosure
EP3873075A1 (en) System and method for call classification
KR102606456B1 (ko) 피싱 분석 장치 및 그 방법
CN113760993A (zh) 业务数据查询方法、装置和电子设备
KR20200002710A (ko) 항공기용 음성 인식 기반 처리 방법
KR20200002657A (ko) 항공기용 음성 인식 기반 처리 방법
US20240184876A1 (en) Multi-dimensional voice-based digital authentication
CN109150959A (zh) 档案分享系统及其方法

Legal Events

Date Code Title Description
AMND Amendment
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant