WO2019078492A1

WO2019078492A1 - 음성 인증 시스템

Info

Publication number: WO2019078492A1
Application number: PCT/KR2018/010922
Authority: WO
Inventors: 이태훈
Original assignee: 주식회사 공훈
Priority date: 2017-10-20
Filing date: 2018-09-17
Publication date: 2019-04-25
Also published as: KR101812022B1

Abstract

음성 인증 시스템이 개시된다. 본 발명의 일 실시예에 따른 음성 인증 시스템은 음성 인증 요청 장치 및 음성 인증 장치의 시간 동기화 및 단어 사전 데이터 동기화를 통하여 사용자의 발화된 단어의 동일 여부 및 사용자 음성의 고유성 동일 여부를 판단하여 사용자의 음성을 인증할 수 있다.

Description

음성 인증 시스템

본 발명은 음성 인증 시스템에 관한 것으로서, 더욱 상세하게는 음성 인증 요청 장치 및 음성 인증 장치의 시간 동기화 및 단어 사전 데이터 동기화를 통하여 사용자의 발화된 단어의 동일 여부 및 사용자 음성의 고유성 동일 여부를 판단하여 사용자의 음성을 인증하기 위한 음성 인증 시스템에 관한 것이다.

음성 인식 기술은 2000년대 들어 급속히 발전하여 현재는 대부분의 사용자 언어를 인식할 수 있는 수준까지 이르렀으며, 스마트폰과 가정용 스피커를 통한 음성 인식을 통해서 실생활 속에 급격히 퍼지고 있다.

따라서, 음성 인식 기술은 사람에게 가장 친숙하고 편리한 MMI(Man-Machine Interface)로서 사용처를 급속히 확장하고 있으나, 음성으로 통제되는 다양한 기기에 대한 사용자 인증(보안)은 미흡한 실정이다.

즉, 음성 인증 기술은 사전 입력된 화자의 음성과 인증하고자 하는 음성을 비교하여 처리하나 아직은 기술적으로 완벽하지 못한 상태이며, 더욱이 사람의 경우에는 나이가 들어감에 따라서 발성 기관의 근육이 퇴화하여 자연스럽게 음성 특징이 변경되기 때문에 더욱더 음성 인증을 어렵게 하는 문제가 되고 있다.

이에 변화하는 사람의 음성 특성에 따라서 적절히 대응하며, 현재 기술적으로 완벽한 비교가 불가능한 음성 인증 기술에 추가적인 인증 요소를 결합하여 인증이 수행될 수 있도록 함으로써 보안성의 확보와 더불어 편리성 및 간편성을 확보하고자 하는 방안이 강구되고 있다.

본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로, 음성 인증 요청 장치 및 음성 인증 장치의 시간 동기화 및 단어 사전 데이터 동기화를 통하여 사용자의 발화된 단어의 동일 여부 및 사용자 음성의 고유성 동일 여부를 판단하여 사용자의 음성을 인증하기 위한 음성 인증 시스템을 제공하는데 그 목적이 있다.

본 발명의 일 실시예에 따른 음성 인증 시스템은, 사용자의 음성을 인증하기 위해서 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 음성 인증 요청 장치 및 음성 인증 장치를 포함하고, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치가 인증 요청 코드를 음성 인증 요청 장치로 전송하고, 음성 인증 요청 장치는, 인증 요청 코드의 전송된 시간을 입력값으로 난수를 생성하기 위한 난수 생성부, 사용자에게 음성 인증을 위한 단어의 발화를 요청하기 위한 출력부, 동기화된 단어 사전 데이터를 저장하기 위한 저장부, 음성 인증 장치와 무선 연결을 하기 위한 통신부 및 동기화된 단어 사전 데이터에서 음성 인증 요청 장치의 난수 생성부에서 생성된 난수에 대응되는 단어를 검출하기 위한 제어부를 포함하고, 음성 인증 장치는, 인증 요청 코드의 전송한 시간을 입력값으로 난수를 생성하기 위한 난수 생성부, 사용자가 발화한 단어의 음성을 인식하기 위한 음성 입력부, 동기화된 단어 사전 데이터를 포함하는 단어 사전 DB 및 사용자의 음성 특성을 포함하는 음성 인증 특성 DB를 저장하기 위한 저장부, 음성 인증 요청 장치와 무선 연결을 하기 위한 통신부 및 동기화된 단어 사전 데이터에서 음성 인증 장치의 난수 생성부에서 생성된 난수에 대응되는 단어를 검출하기 위한 제어부를 포함하고, 음성 인증 장치의 제어부는, 사용자의 발화 단어를 인식하고, 인식된 사용자의 발화 단어를 음성 인증 장치의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단하고, 판단결과 동일하면, 인식된 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.

또한, 음성 인증 시스템에 있어서, 단어 사전 데이터는 MxN 행렬 구조의 단어 데이터로 구성되며, 생성된 난수에 대응되는 단어의 검출은, 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, MxN 행렬 구조의 단어 데이터에서 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출할 수 있다. M 과 N은 각각 동일하거나 상이한 자연수 일 수 있고, 또한, K도 자연수 일 수 있다.

또한, 음성 인증 시스템에 있어서, 단어 사전 데이터의 동기화는 음성 인증 요청 장치와 음성 인증 장치가 시간을 동기화하면서 음성 인증 장치에 저장된 단어 사전 데이터를 음성 인증 요청 장치로 전송하여 동기화할 수 있다.

본 발명의 일 실시예에 따른 음성 인증 방법은, 음성 인증 요청 장치와 음성 인증 장치가 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 단계, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치가 인증 요청 코드를 음성 인증 요청 장치로 전송하는 단계, 음성 인증 장치와 음성 인증 요청 장치가 인증 요청 코드의 전송된 시간을 입력값으로 각각의 난수 생성부를 구동하여 각각 난수를 생성시키고, 동기화된 단어 사전 데이터에서 각각 생성된 난수에 대응되는 단어를 검출하는 단계, 음성 인증 요청 장치가 사용자에게 음성 인증 요청 장치의 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청하는 단계, 음성 인증 장치가 사용자의 발화 단어를 인식하는 단계, 음성 인증 장치가 인식된 사용자의 발화 단어를 음성 인증 장치의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단하는 단계 및 판단 결과 동일하면, 음성 인증 장치가 인식된 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB에 저장된 값과 비교하여 사용자의 음성을 인증하는 단계를 포함할 수 있다.

또한, 음성 인증 방법에 있어서, 단어 사전 데이터는 MxN 행렬 구조의 단어 데이터로 구성되며, 생성된 난수에 대응되는 단어의 검출은, 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, MxN 행렬 구조의 단어 데이터에서 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출할 수 있다. M 과 N은 각각 동일하거나 상이한 자연수 일 수 있고, 또한, K도 자연수 일 수 있다.

또한, 음성 인증 방법에 있어서, 단어 사전 데이터의 동기화는, 음성 인증 요청 장치와 음성 인증 장치가 시간을 동기화하면서 음성 인증 장치에 저장된 단어 사전 데이터를 음성 인증 요청 장치로 전송하여 동기화할 수 있다.

한편, 본 발명의 일 실시예로써, 전술한 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체가 제공될 수 있다.

본 발명의 일 실시예에 따른 음성 인증 시스템에 따르면 추가적인 인증 요소를 결합하여 보안성의 확보와 더불어 음성 인증의 편리성 및 간편성을 확보할 수 있다.

본 발명의 일 실시예에 따른 음성 인증 시스템에 따르면 사용자의 음성 인증 후에도 계속적으로 사용자 음성을 분석하여 단어 사전 DB 및 음성 인증 특성 DB를 업데이트 함으로써 사용자의 음성 인증의 정확성을 유지함과 동시에 보안성을 강화할 수 있다.

이하에 첨부되는 도면들은 본 발명에 관한 이해를 돕기 위한 것으로, 상세한 설명과 함께 본 발명에 대한 실시 예들을 제공한다. 다만, 본 발명의 기술적 특징이 특정 도면에 한정되는 것은 아니며, 각 도면에서 개시하는 특징들은 서로 조합되어 새로운 실시 예로 구성될 수 있다.

도 1은 본 발명의 일 실시예에 따른 음성 인증 시스템(1000)의 블록도이다.

도 2는 본 발명의 일 실시예에 따른 음성 인증 방법의 순서도이다.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.

본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 명세서 전체에서 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, "그 중간에 다른 소자를 사이에 두고" 연결되어 있는 경우도 포함한다.

이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 음성 인증 시스템(1000)은 사용자의 음성을 인증하기 위해서 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 음성 인증 요청 장치(100) 및 음성 인증 장치(200)를 포함할 수 있다.

본 발명의 일 실시예에 따른 음성 인증 요청 장치(100)는 난수 생성부(110), 출력부(120), 저장부(130), 통신부(140) 및 제어부(150)를 포함할 수 있다.

본 발명의 일 실시예에 따른 난수 생성부(110)는 시간을 입력값으로 난수를 생성하기 위한 장치이다. 예를 들어, 음성 인증 요청 장치(100) 및 음성 인증 장치(200)는 무선으로 연결되어 음성 인증 요청이 발생하기 전에는 기 설정된 시간 간격으로 각각 시간 동기화와 단어 사전 데이터의 동기화를 수행하고, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치(200)가 인증 요청 코드를 음성 인증 요청 장치(100)로 전송하는데, 이 때 음성 인증 요청 장치(100)는 인증 요청 코드를 전송받고, 난수 생성부(110)를 이용하여 인증 요청 코드의 전송된 시간을 입력값으로 난수를 생성할 수 있다.

이 때, 음성 인증 요청 장치(100)는 기 설정된 시간 간격으로 음성 인증 장치(200)와 시간 동기화를 수행하므로 음성 인증 장치(200)가 인증 요청 코드를 전송하는 시간과 음성 인증 요청 장치(100)가 인증 요청 코드를 전송받는 시간은 동일하게 된다.

즉, 난수 생성부(110)에 입력되는 인증 요청 코드의 전송된 시간은 음성 인증 장치(200)의 난수 생성부(210)에 입력되는 인증 요청 코드의 전송한 시간과 동일하게 되므로 동일한 난수가 생성되게 된다.

본 발명의 일 실시예에 따른 출력부(120)는 사용자에게 음성 인증을 위한 단어의 발화를 요청하기 위한 장치로서, 저장부(130)에 저장된 단어 사전 데이터의 단어를 사용자에게 발화하도록 요청할 수 있다.

예를 들어, '민족' 이라는 단어가 저장부(130)의 단어 사전 데이터에 저장되어 있고, 음성 인증을 위하여 사용자의 '민족' 이라는 단어의 발화가 필요한 경우에, 출력부(120)는 사용자에게 "'민족'을 발음하시오" 라고 요청할 수 있다.

즉, 출력부(120)는 사용자에게 인증에 필요한 인증용 단어의 발화를 요청하기 위하여, 스피커를 이용하여 인증용 단어의 발화를 요청하거나 디스플레이 등을 이용하여 화면에 표시하는 방법으로 사용자의 인증용 단어의 발화를 유도할 수 있다.

본 발명의 일 실시예에 따른 저장부(130)는 음성 인증 장치(200)와 동기화된 단어 사전 데이터를 저장할 수 있다.

음성 인증 장치(200)는 사용자 음성 인증 전에 미리 사용자 음성 인증에 필요한 단어 사전 데이터를 구축하는데, 음성 인증 장치(200)는 음성 인증 요청 장치(100)와 기 설정된 시간 간격으로 시간 동기화를 수행하면서, 구축된 단어 사전 데이터를 음성 인증 요청 장치(100)로 전송하고, 음성 인증 요청 장치(100)는 전송받은 단어 사전 데이터를 저장부(130)에 저장함으로써 단어 사전 데이터의 동기화를 수행할 수 있다.

본 발명의 일 실시예에 따른 통신부(140)는 음성 인증 장치(200)와 무선 연결을 하기 위한 장치로서, 음성 인증 요청 장치(100)는 통신부(140)를 이용하여 음성 인증 장치(200)와 무선으로 연결되어 기 설정된 시간 간격으로 시간 동기화 및 단어 사전 데이터의 동기화를 수행할 수 있다.

예를 들어, 통신부(140)는 블루투스(Bluetooth) 통신 모듈, BLE(Bluetooth Low Energy) 통신 모듈, 근거리 무선 통신 모듈(Near Field Communication unit), 와이파이(Wi-Fi) 통신 모듈, 지그비(Zigbee) 통신 모듈, 적외선(IrDA, infrared Data Association) 통신 모듈, WFD(Wi-Fi Direct) 통신 모듈, UWB(ultra wideband) 통신 모듈, Ant+ 통신 모듈 등일 수 있으나, 이에 한정되는 것은 아니다.

본 발명의 일 실시예에 따른 제어부(150)는 음성 인증 요청 장치(100)의 각 장치들을 제어하기 위한 장치이다.

예를 들어, 제어부(150)는 음성 인증 장치(200)로부터 인증 요청 코드를 전송받으면 난수 생성부(110)로 하여금 인증 요청 코드의 전송된 시간을 입력값으로 난수를 생성하도록 제어할 수 있고, 출력부(120)로 하여금 사용자에게 음성 인증에 필요한 단어를 발화하도록 요청하는 문구, 음성 명령 등을 출력하도록 할 수 있다.

또한, 제어부(150)는 저장부(130)로 하여금 동기화된 단어 사전 데이터를 저장하도록 제어할 수 있고, 통신부(140)를 이용하여 음성 인증 장치(200)와 무선 연결되도록 제어하고, 기 설정된 시간 간격으로 시간 동기화 및 단어 사전 데이터를 동기화하도록 제어할 수 있다.

또한, 본 발명의 일 실시예에 따른 제어부(150)는 저장부(130)에 저장된 동기화된 단어 사전 데이터로부터 난수 생성부(110)에서 생성된 난수에 대응되는 단어를 검출할 수 있다.

예를 들어, 동기화된 단어 사전 데이터를 MxN 행렬 구조의 단어 데이터로 구성할 수 있다. M 과 N은 각각 동일하거나 상이한 자연수 일 수 있고, 예를 들어, M 과 N은 10일 수 있다. 즉, 단어 사전 데이터를 10행과 10열로 이루어진 10Х10 행렬 구조의 데이터로 구성할 수 있다. 각 행과 열마다 단어가 들어가게 되므로, 100개의 단어로 구성될 수 있다.

이 때 난수 생성부(110)에 의해서 생성된 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, 전술한 예의 10 X 10 행렬 구조의 단어 데이터에서 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출하는 방식으로 생성된 난수에 대응되는 단어를 검출할 수 있다. 여기서, K는 자연수 일 수 있으며, 예컨대, K는 2일 수 있다.

예를 들어, 난수 생성부(110)에 의하여 생성된 난수가 987653 이라고 가정하면, 2자리 숫자씩 묶었을 때 맨앞의 2자리 숫자는 98이고, 중간 2자리 숫자는 76이며, 맨끝의 2자리 숫자는 53이 된다. 이 때 맨앞의 2자리 숫자를 설정된 자릿수에 대응되는 2자리 숫자로 가정하면 98 이라는 2자리 숫자를 결정할 수 있고, 전술한 예의 10Х10 행렬 구조의 단어 데이터에서 9행 8열에 해당하는 단어를 선택함으로써 생성된 난수에 대응되는 단어를 검출할 수 있다.

즉, 기 설정된 자릿수는 생성된 난수(예: 6자리 난수)에서 맨앞의 2자리, 중간 2자리, 맨끝의 2자리 숫자 중에서 자릿수를 설정할 수 있으며, 단어 사전 데이터를 10Х10 행렬 구조의 단어 데이터로 구성하기 때문에 2자리의 숫자를 포함하도록 자릿수를 설정하여 행과 열에 해당하는 단어를 선택할 수 있다.

물론, 난수 생성부(110)를 제어하여 단순히 2자리의 숫자가 난수로 생성되게 하여 바로 10Х10 행렬 구조의 단어 데이터에서 해당하는 행과 열의 단어를 검출하는 것도 가능하다.

즉, 난수 생성부(110)가 예컨대 4자리, 6자리, 8자리 이상의 난수를 생성하더라도 난수의 자릿수를 구분하여 기 설정된 자릿수 부분의 2자리 숫자만 결정할 수 있으면, 10Х10 행렬 구조의 단어 데이터에서 결정된 2자리 숫자에 대응되는 행과 열의 단어를 검출할 수 있다.

본 발명의 일 실시예에 따른 음성 인증 장치(200)는 난수 생성부(210), 음성 입력부(220), 저장부(230), 통신부(240) 및 제어부(250)를 포함할 수 있다.

본 발명의 일 실시예에 따른 난수 생성부(210)는 시간을 입력값으로 난수를 생성하기 위한 장치이다.

예를 들어, 음성 인증 요청 장치(100) 및 음성 인증 장치(200)는 무선으로 연결되어 음성 인증 요청이 발생하기 전에는 기 설정된 시간 간격으로 각각 시간 동기화와 단어 사전 데이터의 동기화를 수행하고, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치(200)가 인증 요청 코드를 음성 인증 요청 장치(100)로 전송하는데, 이 때 음성 인증 장치(200)는 인증 요청 코드를 전송하고, 난수 생성부(210)를 이용하여 인증 요청 코드의 전송한 시간을 입력값으로 난수를 생성할 수 있다.

즉, 전술한 바와 같이, 음성 인증 장치(200)는 기 설정된 시간 간격으로 음성 인증 요청 장치(100)와 시간 동기화를 수행하므로, 난수 생성부(210)에 입력되는 인증 요청 코드의 전송한 시간은 음성 인증 요청 장치(100)의 난수 생성부(110)에 입력되는 인증 요청 코드의 전송된 시간과 동일하게 되므로 동일한 난수가 생성되게 된다.

본 발명의 일 실시예에 따른 음성 입력부(220)는 사용자가 발화한 단어의 음성을 인식할 수 있다.

예를 들어, 음성 입력부(220)는 음성 인증 장치(200)가 사용자의 음성을 인증하기 위하여 사용자가 발화한 단어의 음성을 입력받기 위한 장치로서, 마이크 등의 음성 입력 장치가 될 수 있다.

본 발명의 일 실시예에 따른 저장부(230)는 동기화된 단어 사전 데이터를 포함하는 단어 사전 DB(232) 및 사용자의 음성 특성을 포함하는 음성 인증 특성 DB(234)를 저장할 수 있다.

즉, 음성 인증 장치(200)는 사용자 음성 인증 전에 미리 사용자 음성 인증에 필요한 단어 사전 데이터를 구축하여 저장부(230)에 저장하는데, 저장부(230)에는 단어 사전 데이터를 구축하기 위한 단어 사전 DB(232)를 미리 저장해 둘 수 있다.

예를 들어, 사용자가 최초로 음성 인증 시스템(1000)을 사용하는 경우에, 인증에 필요한 단어 사전 데이터를 구축하기 위해서 최초 1회 사용자에게 문장 등을 제공하여 발화하게 하는데, 제공되는 문장을 포함하는 단어 사전 DB(232)를 저장부(230)에 저장해 둘 수 있다.

예를 들어, 처음에는 저장부(230)의 단어 사전 DB(232)에 국민 교육 헌장을 저장하고, 최초 1회 사용자에게 저장된 국민 교육 헌장의 문장을 랜덤하게 제공하여 사용자가 읽도록 함으로써, 사용자의 음성 및 사용자가 읽은 문장을 분석하여 명사를 구분하여 단어 사전 DB(232)에 저장하게 할 수 있다. 이 때 단어 사전 DB(232)는 명사로 구분된 단어 사전으로 업데이트되고, 제어부(250)는 업데이트된 단어 사전 DB(232)에 저장된 단어를 이용하여 10 X 10 행렬 구조의 단어 사전 데이터를 구성할 수 있다.

또한, 음성 인증 특성 DB(234)는 사용자의 음성 및 사용자가 읽은 문장을 분석하여 사용자의 음성 특징을 판별하여 저장부(230)에 저장할 수 있다.

즉, 단어 사전 DB(232)는 단어 사전 데이터를 구성하기 위한 단어를 저장하는 DB가 되고, 음성 인증 특성 DB(234)는 단어를 발화하는 사용자의 음성 특성값을 저장하여 사용자의 음성을 인증, 검증하기 위한 DB가 된다. 즉, 사용자의 음성의 고유성에 관한 정보는 음성 인증 특성 DB(234)에 저장되게 된다.

예를 들어, 사용자가 인증받아 발화한 단어를 특징벡터 모델로 설정하여 음성 인증 특성 DB(234)에 음성 특성값으로 저장하는 방식으로, 이후에 음성 인증을 위하여 사용자가 인증용 단어를 발화하면 음성 인증 특성 DB(234)에 저장된 특징벡터 모델의 음성 특성값과 사용자의 발화 단어의 음성 특성값을 비교하여 사용자의 음성을 인증할 수 있다.

또한, 사용자의 음성 인증이 완료되더라도, 즉 음성 인증 승인 후에도 계속 사용자가 발화한 음성을 분석함으로써 계속 명사를 도출하여 단어 사전 DB(232) 및 음성 인증 특성 DB(234)를 업데이트할 수 있다.

즉, 사용자의 음성 인증 승인 후에도 업데이트된 단어 사전 DB(232)를 이용하여 계속 새로운 단어 사전 데이터, 즉 음성 인증용 10Х10 행렬 구조의 단어 사전 데이터를 계속 신규로 업데이트할 수 있고, 업데이트된 음성 인증 특성 DB(234)를 이용하여 사용자가 시간의 흐름에 따라서 음성이 변화하더라도 사용자의 음성 인증을 가능하게 한다.

여기에서 업데이트된 단어 사전 데이터는 저장부(230)에 저장되고, 시간 동기화가 수행될 때마다 음성 인증 요청 장치(100)로 전송되어 업데이트된 단어 사전 데이터의 동기화가 수행될 수 있다.

즉, 음성 인증 특성 DB(234)의 계속적 업데이트에 따라서 자연스럽게 변화하는 사용자의 음성의 고유성을 판별하게 됨으로써, 음성 인증의 신뢰성을 확보할 수 있다.

본 발명의 일 실시예에 따른 통신부(240)는 음성 인증 요청 장치(100)와 무선 연결을 하기 위한 장치로서, 음성 인증 장치(200)는 통신부(240)를 이용하여 음성 인증 요청 장치(100)와 무선으로 연결되어 기 설정된 시간 간격으로 시간 동기화 및 업데이트된 단어 사전 데이터의 동기화를 수행할 수 있다.

예를 들어, 통신부(240)는 블루투스(Bluetooth) 통신 모듈, BLE(Bluetooth Low Energy) 통신 모듈, 근거리 무선 통신 모듈(Near Field Communication unit), 와이파이(Wi-Fi) 통신 모듈, 지그비(Zigbee) 통신 모듈, 적외선(IrDA, infrared Data Association) 통신 모듈, WFD(Wi-Fi Direct) 통신 모듈, UWB(ultra wideband) 통신 모듈, Ant+ 통신 모듈 등일 수 있으나, 이에 한정되는 것은 아니다.

본 발명의 일 실시예에 따른 제어부(250)는 음성 인증 장치(200)의 각 장치들을 제어하기 위한 장치이다.

예를 들어, 제어부(250)는 음성 인증이 필요한 사건이 발생하면 통신부(240)를 이용하여 음성 인증 요청 장치(100)로 인증 요청 코드를 전송하고, 난수 생성부(210)로 하여금 인증 요청 코드의 전송한 시간을 입력값으로 난수를 생성하도록 제어할 수 있다.

또한, 제어부(250)는 음성 입력부(220)로 하여금 사용자가 발화한 단어의 음성을 인식하도록 제어할 수 있고, 저장부(230)로 하여금 업데이트된 단어 사전 DB(232) 및 음성 인증 특성 DB(234)를 저장하도록 제어할 수 있고, 업데이트된 단어 사전 DB(232)에 의해 새로이 생성되는 단어 사전 데이터를 저장하도록 제어할 수 있다.

또한, 제어부(250)는 통신부(240)를 이용하여 음성 인증 장치(200)와 무선 연결되도록 제어하고, 기 설정된 시간 간격으로 시간 동기화 및 단어 사전 데이터를 동기화하도록 제어할 수 있다.

또한, 본 발명의 일 실시예에 따른 제어부(250)는 저장부(230)에 저장된 동기화된 단어 사전 데이터로부터 난수 생성부(210)에서 생성된 난수에 대응되는 단어를 검출할 수 있다.

즉, 전술한 예에서와 같이, 동기화된 단어 사전 데이터는 10 X 10 행렬 구조의 단어 데이터로 구성되고, 난수 생성부(210)에 의해서 생성된 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 2자리 숫자를 결정하고, 10 X 10 행렬 구조의 단어 데이터에서 결정된 2자리 숫자와 대응되는 행과 열의 단어를 검출하는 방식으로 생성된 난수에 대응되는 단어를 검출할 수 있다.

즉, 난수 생성부(110)가 예컨대 4자리, 6자리, 8자리 이상의 난수를 생성하더라도 난수의 자릿수를 구분하여 기 설정된 자릿수 부분의 2자리 숫자만 결정할 수 있으면, 10 X 10 행렬 구조의 단어 데이터에서 결정된 2자리 숫자에 대응되는 행과 열의 단어를 검출할 수 있다.

또한, 본 발명의 일 실시예에 따른 제어부(250)는 사용자의 발화 단어를 인식하고, 인식된 사용자의 발화 단어를 음성 인증 장치(200)의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단할 수 있다.

즉, 제어부(250)는 사용자의 음성 인증을 위해서 음성 입력부(220)를 통해서 사용자의 발화 단어를 인식하고, 인식된 사용자의 발화 단어를 음성 인증 장치(200)의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단할 수 있다.

예를 들어, 사용자는 음성 인증 요청 장치(100)의 난수 생성부(110)에서 생성된 난수와 대응되는 단어를 발화하게 되는데, 음성 인증 요청 장치(100)와 음성 인증 장치(200)의 시간 동기화 및 단어 데이터 동기화에 의해서 음성 인증 장치(200)의 난수 생성부(210)가 생성하는 난수가 음성 인증 요청 장치(100)의 난수 생성부(110)에서 생성된 난수와 동일하게 되고, 결국 음성 인증 요청 장치(100)와 음성 인증 장치(200)가 각각 난수에 대응되게 검출하는 단어도 동일하게 되므로 각 장치의 단어 동일 여부에 따라서 사용자의 음성 인증에 사용될 수 있다.

또한, 본 발명의 일 실시예에 따른 제어부(250)는 인식된 사용자의 발화 단어를 음성 인증 특성 DB(234)에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.

즉, 사용자의 음성 인증, 환언하면 사용자 음성의 고유성을 판별하기 위해서, 제어부(250)는 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB(234)에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.

예를 들어, 제어부(250)는 사용자가 발화한 단어의 음성 특성값에서 임계값을 설정하고, 음성 특성값과 음성 인증 특성 DB(234)에 저장된 값과 비교하여 그 차이가 설정된 임계값 이내인 경우에는 동일한 사용자가 단어를 발화한 것으로 판별하여 사용자의 음성을 인증할 수 있다.

또한, 제어부(250)는 사용자가 발화한 단어의 음성 신호의 특성 벡터 모델을 추정하고, 추정된 특성 벡터 모델과 음성 인증 특성 DB(234)에 저장된 값을 통계적 모델에서 오버랩되는 부분을 비교하는 방법으로 사용자의 음성을 인증할 수 있다.

도 2는 본 발명의 일 실시예에 따른 음성 인증 방법의 순서도이다

도 2를 참조하면, 단계 S10에서, 사용자의 음성을 인증하기 위해서 음성 인증 요청 장치(100) 및 음성 인증 장치(200)는 무선으로 연결되어 각각 시간 동기화 및 단어 사전 데이터를 동기화할 수 있다.

즉, 음성 인증 요청 장치(100) 및 음성 인증 장치(200)는 음성 인증 요청이 발생하기 전에는 기 설정된 시간 간격으로 각각 시간 동기화와 단어 사전 데이터의 동기화를 수행할 수 있다.

여기에서, 기 설정된 시간 간격뿐만 아니라 연결시마다 동기화가 가능하도록 설정할 수 있으며, 음성 인증 장치(200)를 기준으로 음성 인증 요청 장치(100)의 시간 동기화 및 단어 사전 데이터의 동기화를 수행한다.

단계 S20에서, 음성 인증이 필요한 사건이 발생하면 음성 인증 장치(200)가 인증 요청 코드를 음성 인증 요청 장치(100)로 전송할 수 있다.

즉, 음성 인증이 필요한 사건이 발생하면, 음성 인증 장치(200)가 사용자의 음성 인증을 요청하기 위한 인증 요청 코드를 생성하고 생성된 인증 요청 코드를 음성 인증 요청 장치(100)로 전송할 수 있다.

단계 S30에서, 음성 인증 장치(200)와 음성 인증 요청 장치(100)가 인증 요청 코드의 전송된 시간을 입력값으로 각각의 난수 생성부(110, 210)를 구동하여 각각 난수를 생성시키고, 동기화된 단어 사전 데이터에서 각각 생성된 난수에 대응되는 단어를 검출할 수 있다.

즉, 음성 인증 장치(200)는 기 설정된 시간 간격으로 음성 인증 요청 장치(100)와 시간 동기화를 수행하므로, 난수 생성부(210)에 입력되는 인증 요청 코드의 전송한 시간은 음성 인증 요청 장치(100)의 난수 생성부(110)에 입력되는 인증 요청 코드의 전송된 시간과 동일하게 되므로 각각의 난수 생성부(110, 210)에 각각 난수를 생성하더라도 동일한 난수가 생성되게 된다.

따라서, 동기화된 단어 사전 데이터에서 각각 생성된 난수에 대응되는 단어 또한 동일하게 되며, 각각 다른 장치인 음성 인증 장치(200)와 음성 인증 요청 장치(100)에서 검출된 단어의 동일성을 이용하여 사용자 음성 인증을 수행할 수 있다.

또한, 전술한 예에서와 같이, 동기화된 단어 사전 데이터는 10Х10 행렬 구조의 단어 데이터로 구성될 수 있으며, 각각의 난수 생성부(110, 210)에 의해서 생성된 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 2자리 숫자를 결정하고, 10Х10 행렬 구조의 단어 데이터에서 결정된 2자리 숫자와 대응되는 행과 열의 단어를 검출하는 방식으로 생성된 난수에 대응되는 단어를 검출할 수 있다.

단계 S40에서, 음성 인증 요청 장치(100)가 사용자에게 음성 인증 요청 장치(100)의 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청할 수 있다.

예를 들어, 음성 인증 요청 장치(100)는 출력부(120)를 이용하여 사용자에게 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청할 수 있다.

즉, 음성 인증 요청 장치(100)는 사용자의 음성 인증을 위해서 스피커를 이용하여 사용자에게 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청하거나 디스플레이 등을 이용하여 화면에 표시하는 방법으로 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 유도할 수 있다.

단계 S50에서, 음성 인증 장치(200)가 사용자의 발화 단어를 인식할 수 있다.

예를 들어, 음성 인증 장치(200)는 음성 입력부(220)를 이용하여 사용자가 발화한 단어 및 발화한 단어의 음성(음성 특성값)을 인식할 수 있다. 즉, 음성 인증 장치(200)는 단어 사전 데이터에서 검출된 단어와의 비교를 위해서 사용자가 발화한 단어를 인식하고, 사용자 음성의 고유성 판단을 위해서, 예컨대 음성 인증 특성 DB(234)에 저장된 값과의 비교를 위해서 사용자가 발화한 단어의 음성(음성 특성값)을 인식할 수 있다.

단계 S60에서, 음성 인증 장치(200)가 인식된 사용자의 발화 단어를 음성 인증 장치(200)의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단할 수 있다.

단계 S70에서, 판단 결과 동일하면, 음성 인증 장치(200)가 인식된 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB(234)에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.

즉, 사용자가 음성 인증 요청 장치(100)를 통하여 발화한 단어와 음성 인증 장치(200)에서 검출된 단어의 동일 여부를 판단하고, 인식된 단어가 동일하면, 발화된 단어의 음성 특성값을 음성 인증 특성 DB(234)에 저장된 값과 비교하여 사용자의 음성을 인증할 수 있다.

즉, 사용자 음성 인증을 위해서 각각의 장치(100, 200)에서 검출된 단어의 동일 여부를 판단한 후, 사용자 음성의 고유성을 판단하게 되는데, 음성 인증 요청 장치(100)는 사용자가 발화한 단어의 음성 신호의 특성 벡터 모델을 추정하고, 추정된 특성 벡터 모델과 음성 인증 특성 DB(234)에 저장된 값을 통계적 모델에서 오버랩되는 부분을 비교하는 방법으로 사용자의 음성을 인증할 수 있다.

또한, 음성 인증 요청 장치(100)는 사용자가 발화한 단어의 음성 특성값에서 임계값을 설정하고, 음성 특성값과 음성 인증 특성 DB(234)에 저장된 값과 비교하여 그 차이가 설정된 임계값 이내인 경우에는 동일한 사용자가 단어를 발화한 것으로 판별하여 사용자의 음성을 인증할 수 있다.

또한, 사용자의 음성 인증이 완료되더라도 즉 음성 인증 승인 후에도 계속 사용자가 발화한 음성을 분석함으로써 계속 명사를 도출하여 단어 사전 DB(232) 및 음성 인증 특성 DB(234)를 업데이트할 수 있다.

즉, 사용자의 음성을 지속적으로 단어 사전화 하는 과정에서 사용자의 음성을 분석하고 사용자의 음성 특성을 업데이트함으로써 사용자 음성 인증의 정확성을 유지함과 동시에 보안성을 강화할 수 있다.

음성 인증 요청 장치(100)는 이어폰의 형태로 음성 인증 장치(200)는 스마트폰, 이동 단말, PC, PDA, 패드 등의 형태로 구현 가능하나, 본 발명의 범위가 이에 한정되는 것은 아니다.

또한, 예로써 전술한 수치 값들은 단순히 설명을 위한 예시적인 것으로, 제시된 수치 값에 반드시 제한되는 것은 아니다.

본 발명의 일 실시예에 따른 음성 인증 방법에 관련하여서는 전술한 음성 인증 시스템(1000)에 대한 내용이 적용될 수 있다. 따라서, 음성 인증 방법과 관련하여, 전술한 음성 인증 시스템(1000)에 대한 내용과 동일한 내용에 대하여는 설명을 생략하였다.

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims

음성 인증 시스템에 있어서,

상기 음성 인증 시스템은 사용자의 음성을 인증하기 위해서 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 음성 인증 요청 장치 및 음성 인증 장치를 포함하고,

음성 인증이 필요한 사건이 발생하면 상기 음성 인증 장치가 인증 요청 코드를 상기 음성 인증 요청 장치로 전송하고,

상기 음성 인증 요청 장치는,

상기 인증 요청 코드의 전송된 시간을 입력값으로 난수를 생성하기 위한 난수 생성부;

사용자에게 음성 인증을 위한 단어의 발화를 요청하기 위한 출력부;

상기 동기화된 단어 사전 데이터를 저장하기 위한 저장부;

상기 음성 인증 장치와 무선 연결을 하기 위한 통신부; 및

상기 동기화된 단어 사전 데이터에서 상기 음성 인증 요청 장치의 난수 생성부에서 생성된 난수에 대응되는 단어를 검출하기 위한 제어부; 를 포함하고,

상기 음성 인증 장치는,

상기 인증 요청 코드의 전송한 시간을 입력값으로 난수를 생성하기 위한 난수 생성부;

상기 사용자가 발화한 단어의 음성을 인식하기 위한 음성 입력부;

상기 동기화된 단어 사전 데이터를 포함하는 단어 사전 DB 및 상기 사용자의 음성 특성을 포함하는 음성 인증 특성 DB를 저장하기 위한 저장부;

상기 음성 인증 요청 장치와 무선 연결을 하기 위한 통신부; 및

상기 동기화된 단어 사전 데이터에서 상기 음성 인증 장치의 난수 생성부에서 생성된 난수에 대응되는 단어를 검출하기 위한 제어부; 를 포함하고,

상기 음성 인증 장치의 제어부는,

상기 사용자의 발화 단어를 인식하고, 상기 인식된 사용자의 발화 단어를 상기 음성 인증 장치의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단하고, 상기 판단결과 동일하면, 상기 인식된 사용자의 발화 단어의 음성 특성값을 상기 음성 인증 특성 DB에 저장된 값과 비교하여 상기 사용자의 음성을 인증하는 음성 인증 시스템.
제 1 항에 있어서,

상기 단어 사전 데이터는 M x N 행렬 구조의 단어 데이터로 구성되며,

상기 생성된 난수에 대응되는 단어의 검출은,

상기 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, 상기 M x N 행렬 구조의 단어 데이터에서 상기 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출하는 것이며, M 과 N은 각각 동일하거나 상이한 자연수이고, K도 자연수인 음성 인증 시스템.
제 1 항에 있어서,

상기 단어 사전 데이터의 동기화는,

상기 음성 인증 요청 장치와 상기 음성 인증 장치가 시간을 동기화하면서 상기 음성 인증 장치에 저장된 단어 사전 데이터를 상기 음성 인증 요청 장치로 전송하여 동기화하는 음성 인증 시스템.
음성 인증 방법에 있어서,

음성 인증 요청 장치와 음성 인증 장치가 각각 시간 동기화 및 단어 사전 데이터를 동기화하는 단계;

음성 인증이 필요한 사건이 발생하면 상기 음성 인증 장치가 인증 요청 코드를 상기 음성 인증 요청 장치로 전송하는 단계;

상기 음성 인증 장치와 상기 음성 인증 요청 장치가 상기 인증 요청 코드의 전송된 시간을 입력값으로 각각의 난수 생성부를 구동하여 각각 난수를 생성시키고, 상기 동기화된 단어 사전 데이터에서 상기 각각 생성된 난수에 대응되는 단어를 검출하는 단계;

상기 음성 인증 요청 장치가 사용자에게 상기 음성 인증 요청 장치의 동기화된 단어 사전 데이터에서 검출된 단어의 발화를 요청하는 단계;

상기 음성 인증 장치가 상기 사용자의 발화 단어를 인식하는 단계;

상기 음성 인증 장치가 상기 인식된 사용자의 발화 단어를 상기 음성 인증 장치의 동기화된 단어 사전 데이터에서 검출된 단어와 비교하여 동일한지 판단하는 단계; 및

상기 판단 결과 동일하면, 상기 음성 인증 장치가 상기 인식된 사용자의 발화 단어의 음성 특성값을 음성 인증 특성 DB에 저장된 값과 비교하여 상기 사용자의 음성을 인증하는 단계를 포함하는 음성 인증 방법.
제 4 항에 있어서,

상기 단어 사전 데이터는 M x N 행렬 구조의 단어 데이터로 구성되며,

상기 생성된 난수에 대응되는 단어의 검출은,

상기 난수의 자릿수를 구분하여 기 설정된 자릿수에 대응되는 K 자리 숫자를 결정하고, 상기 M x N 행렬 구조의 단어 데이터에서 상기 결정된 K 자리 숫자와 대응되는 행과 열의 단어를 검출하는 것이며, M 과 N은 각각 동일하거나 상이한 자연수이고, K도 자연수인 음성 인증 방법.
제 4 항에 있어서,

상기 단어 사전 데이터의 동기화는,

상기 음성 인증 요청 장치와 상기 음성 인증 장치가 시간을 동기화하면서 상기 음성 인증 장치에 저장된 단어 사전 데이터를 상기 음성 인증 요청 장치로 전송하여 동기화하는 음성 인증 방법.
제 4 항 내지 제 6 항 중 어느 한 항의 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체.