상기의 목적들을 달성하기 위한 본 발명의 일 실시예에 따른 사용자 인식 장치는, 사용자의 통계용 음성 신호로부터 변환된 특성 벡터에 의해 설정된 사용자 모델에 따라 상기 사용자의 사용시 음성 신호의 특성 벡터를 분류하는 특성 벡터 분류부; 및 상기 사용시 음성 신호를 수신하여 상기 사용자 모델과 비교함으로써 상기 사용자를 인식하는 판단부를 구비하는 것을 특징으로 한다.
여기서, 상기 사용자 인식 장치는 가정용 서비스 로봇에 적용될 수 있다.
또한, 상기 특성 벡터는 사용자 인식 오류를 유발하지 않는 제1 특성 벡터와 사용자 인식 오류를 유발하는 제2 특성 벡터로 구분될 수 있다.
또한, 상기 판단부는 최우추정법(Maximum likelihood method)을 이용하여 상기 사용시 음성 신호의 특성 벡터와 상기 사용자 모델을 비교할 수 있다.
또한, 상기 특성 벡터 분류부는, 상기 사용시 음성 신호의 특성 벡터와 상기 사용자 모델의 비교 결과, 상기 사용시 음성 신호의 특성 벡터를 통계적 모델에서 오버랩되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터와 오버랩되는 특성을 보이는 사용시 음성 신호의 특성 벡터로 분류할 수 있다.
또한, 상기 판단부는, 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터만을 이용하여, 최우추정법(Maximum likelihood method)으로 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터와 상기 사용자 모델을 비교할 수 있다.
상기의 목적들을 달성하기 위한 본 발명의 다른 실시예에 따른 사용자 인식 장치는, 사용자의 통계용 음성 신호로부터 변환된 특성 벡터를 사용자 인식 오류를 유발하지 않는 특성 벡터와 사용자 인식 오류를 유발하는 특성 벡터로 분류하여 각각의 특성 벡터에 대응되게 사용자별로 설정된 사용자 모델에 따라 사용자의 사용시 음성 신호의 특성 벡터를 분류하는 특성 벡터 분류부; 및 상기 특성 벡터 분류 부의 분류 결과를 사용자 판단을 위한 데이터로 활용하여 사용자를 판단하되, 상기 사용자의 사용시 음성 신호의 특성 벡터 중 사용자 인식 오류를 유발하지 않는 특성 벡터로 분류된 특성 벡터만으로 사용자를 판단하는 판단부를 구비하는 것을 특징으로 한다.
상기의 목적들을 달성하기 위한 본 발명의 일 실시예에 따른 가정용 서비스 로봇은 외부의 사운드를 수신하는 입력부; 상기 입력부로부터의 신호를 수신하여 특성 벡터로 변환하는 특성 벡터 추출부; 사용자의 통계용 음성 신호로부터 변환된 특성 벡터에 의해 설정된 사용자 모델에 따라 상기 외부의 사운드의 특성 벡터를 분류하는 특성 벡터 분류부; 및 상기 특성 벡터 분류부에서 분류된 특성 벡터들 중 소정의 특성 벡터만을 활용하여 사용자를 판단하는 판단부; 및
상기 판단부에서의 판단 결과에 따라 명령 실행부를 제어하는 제어부를 구비하는 것을 특징으로 한다.
여기서, 상기 외부의 사운드는 사용자의 음성 신호일 수 있다.
또한, 상기 입력부는 마이크로폰일 수 있다.
또한, 상기 특성 벡터 분류부는, 상기 외부의 사운드에 대응되는 특성 벡터를 통계적 모델에서 오버랩되지 않는 특성을 보이는 특성 벡터와 오버랩되는 특성을 보이는 특성 벡터로 분류할 수 있다.
또한, 상기 판단부는, 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 외부의 사운드의 특성 벡터만을 이용하여, 최우추정법(Maximum likelihood method)으로 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 상기 외부의 사운드의 특성 벡터와 상기 사용자 모델을 비교할 수 있다.
상기의 목적들을 달성하기 위한 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법은, 음성을 수신하는 단계; 상기 음성 신호로부터 특성 벡터를 추출하는 단계; 상기 특성 벡터를 미리 준비된 사용자 모델들과 비교 판단한 후 사용자 인식 오류를 유발하지 않는 제1 특성 벡터 및 사용자 인식 오류를 유발하는 제2 특성 벡터로 분류하는 단계; 및 상기 제1 특성 벡터를 상기 사용자 모델들과 비교 판단하여 사용자를 판단하는 단계를 포함하는 것을 특징으로 한다.
여기서, 상기 특성 벡터를 상기 사용자 모델들과 비교 판단함에 있어서, 최우추정법(Maximum likelihood method)을 적용할 수 있다.
또한, 상기 제1 특성 벡터를 상기 사용자 모델들과 비교 판단함에 있어서, 최우추정법(Maximum likelihood method)을 적용할 수 있다.
이하에서는 첨부한 도면들을 참조하여 본 발명의 바람직한 실시 예들을 상세히 설명한다. 이하의 설명들은 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자에게 본 발명에 대한 보다 철저한 이해를 돕기 위한 의도 이외에는 다른 의도없이 예를 들어 도시되고 한정된 것에 불과하므로, 본 발명의 범위를 제한하는 것으로 사용되어서는 아니 될 것이다.
도 1은 본 발명의 일 실시예에 따른 사용자 인식 장치를 보인 블록도이다.
도 1을 참조하면, 상기 사용자 인식 장치는, 특성 벡터 분류부(30) 및 판단부(40)를 구비할 수 있다.
상기 특성 벡터 분류부(30)는 사용자의 통계용 음성 신호로부터 변환된 특성 벡터로부터 설정된 사용자 모델에 따라 상기 사용자의 사용시 음성 신호의 특성 벡터를 분류한다.
상기 특성 벡터는 사용자 인식 오류를 유발하지 않는 제1 특성 벡터와 사용자 인식 오류를 유발하는 제2 특성 벡터로 구분될 수 있다.
상기 판단부(40)는 상기 사용자의 사용시 음성 신호를 수신하여 상기 사용자 모델과 비교함으로써 상기 사용자를 인식한다.
예를 들어, 상기 판단부(40)는 최우추정법(Maximum likelihood method)을 이용하여 상기 사용시 음성 신호의 특성 벡터와 상기 사용자 모델을 비교할 수 있다. 그리고, 상기 판단부(40)는 상기 사용시 음성 신호의 특성 벡터와 상기 사용자 모델의 비교 결과, 상기 사용시 음성 신호의 특성 벡터를 통계적 모델에서 오버랩(overlap)되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터와 오버랩되는 특성을 보이는 사용시 음성 신호로 분류할 수 있다. 그리고, 상기 판단부(40)는, 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터만을 이용하여, 최우추정법으로 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터와 상기 사용자 모델을 비교한다.
상기 통계용 음성 신호는 사용자 모델 설정을 위한 사용자의 음성 신호이고, 상기 사용시 음성 신호는 상기 사용자 인식 장치를 실제로 실행시키고자 하는 경우의 사용자의 음성 신호를 의미한다.
그리고, 상기 특성 벡터를 이용한 통계적 모델의 일 예는 도 2에 도시되어 있다.
즉, 도 2는 특성 벡터를 이용한 통계적 모델의 일 예를 보인 그래프로서, 도 2를 참조하면, 6 개의 그래프(g1 ~ g6)가 도시되어 있다.
g1, g3, g5는 제1 사용자의 통계적 모델을 보인 그래프이고, g2, g4, g6는 제2 사용자의 통계적 모델을 보인 그래프이다. 도 2에서는 두 명의 사용자만 예시하였으나, 그 이상의 사용자에 대해서도 가능하다.
g1은 제1 사용자의 종래 모델이고, g2는 제2 사용자의 종래 모델이며, g3 내지 g6는 본 발명에서 제안된 사용자 모델로서, 특히 g3 및 g5는 g1에 대한 두 개의 제1 사용자 모델이고, g4 및 g6은 g2에 대한 두 개의 제2 사용자 모델이다. 여기서, g3 및 g4는 오버랩되지 않는 사용자 모델이고, g5 및 g6은 오버랩되는 사용자 모델이다.
상기 실시예에 따른 사용자 인식 장치는 가정용 서비스 로봇에 적용될 수 있다.
도 1을 참조하여 그러한 가정용 서비스 로봇을 설명하면 이하와 같다.
상기 가정용 서비스 로봇은, 입력부(10), 특성 벡터 추출부(20), 특성 벡터 분류부(30), 판단부(40), 제어부(50) 및 명령 실행부(60)를 구비한다.
상기 입력부(10)는 외부의 사운드를 수신하는 부분이다. 상기 입력부(10)는 예를 들면 마이크로폰일 수 있다.
상기 특성 벡터 추출부(20)는 상기 입력부(10)로부터의 신호를 수신하여 특성 벡터로 변환하는 부분이다.
상기 특성 벡터 분류부(30)는 사용자의 통계용 음성 신호로부터 변환된 특성 벡터에 의해 설정된 사용자 모델에 따라 상기 사용자의 사용시 음성 신호의 특성 벡터를 분류하는 부분이다.
예를 들어, 상기 특성 벡터 분류부(30)는 상기 외부의 사운드에 대응되는 특성 벡터를 통계적 모델에서 오버랩되지 않는 특성을 보이는 특성 벡터와 오버랩되는 특성을 보이는 특성 벡터로 분류할 수 있다.
상기 판단부(40)는 상기 특성 벡터 분류부(30)에서 분류된 특성 벡터들 중 소정의 특성 벡터만을 활용하여 상기 사용자를 인식하는 부분이다.
예를 들어, 상기 판단부(40)는, 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 외부의 사운드의 특성 벡터만을 이용하여, 최우추정법(Maximum likelihood method)으로 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 상기 외부의 사운드의 특성 벡터와 상기 사용자 모델을 비교할 수 있다.
상기 제어부(50)는 상기 판단부(40)에서의 판단 결과에 따라 명령 실행부(미도시)를 제어하는 부분이다. 상기 명령 실행부(미도시)는 명령을 최종적으로 처리하는 부분이다.
상기 외부의 사운드는 사용자의 사용시 음성 신호일 수 있다.
도 3은 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법을 설명하기 위한 흐름도이다.
도 3을 참조하면, 음성 수신 단계(S10), 특성 벡터 추출 단계(S20), 특성 벡터 분류 단계(S30), 사용자 인식 오류 유발 특성 벡터인지를 판단하는 단계(S40), 사용자 오류를 유발하지 않는 제1 특성 벡터를 사용자 모델과 비교 판단하여(S50) 사용자를 결정하는 단계(S60)를 포함한다.
상기 판단하는 단계(S40)에서는 상기 특성 벡터 분류 단계(S30)의 분류 결과에 따라서, 사용자 인식 오류 유발 벡터인 제2 특성 벡터의 경우에는 사용자 모델들과의 비교 판단에 사용하지 않고, 덤프(DUMP)시킨다(S70).
여기서, 상기 특성 벡터를 상기 사용자 모델들과 비교 판단함에 있어서는, 최우추정법이 적용될 수 있고, 상기 제1 특성 벡터를 상기 사용자 모델들과 비교 판단함에 있어서도, 최우추정법이 적용될 수 있다.
도 4는 본 발명의 일 실시예에 따른 사용자 모델을 설정하는 방법을 보인 흐름도이다.
도 4를 참조하면, 통계용 음성 데이터를 수신하는 단계(S100), 사용자 모델을 구축하는 단계(S110), 특성 벡터를 분류하는 단계(S120) 및 사용자 모델을 재구축하는 단계(S130)가 도시되어 있다.
즉, 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법은, 통계용 음성 신호를 수신하여(S100), 특성 벡터를 추출한 후 사용자 인식 오류를 유발하지 않는 특성 벡터들과 구별하여 저장하는 사용자 모델을 구축(설정)한다.
상기 특성 벡터가 사용자 인식 오류를 유발하는지를 확인하여, 사용자 인식 오류를 유발하지 않는 특성 벡터들과 구별된 사용자 인식 오류를 유발하는 특성벡터들을 이용하여 사용자 별로 두 가지의 사용자 모델들을 구별하여 재설정(재구축)(S130)한다.
이와 같이, 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법에 있어서는, 결과적으로는 각 사용자마다 두 가지의 모델을 갖게 된다. 이렇게 얻어진 사용자 모델들을 이용하여 사용자 인식을 하게 되는데, 이 때 인식을 위하여 입력된 음성 데이터로부터 추출한 특성 벡터들 중 오류를 일으키는 특성 벡터들과 유사한 것으로 판단되는 특성 벡터는 사용자 인식 판단에서 제외시키고, 오류를 일으키지 않는 특성 벡터들과 유사한 것으로 판단되는 특성 벡터는 사용자 인식 판단의 대상으로 최종 결정을 한다.
그리하여, 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법에 따르면, 상대적으로 적은 음성 데이터만으로도 향상된 사용자 인식 효과를 얻을 수 있는 이점이 있다.
본 발명에 따른 사용자 인식 장치 및 그에 의한 사용자 인식 방법은 상기 실시 예들에 한정되지 않고, 본 발명의 기본 원리를 벗어나지 않는 범위에서 다양하게 설계되고, 응용될 수 있음은 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자에게는 자명한 사실이라 할 것이다.