KR100833096B1 - 사용자 인식 장치 및 그에 의한 사용자 인식 방법 - Google Patents

사용자 인식 장치 및 그에 의한 사용자 인식 방법 Download PDF

Info

Publication number
KR100833096B1
KR100833096B1 KR1020070005798A KR20070005798A KR100833096B1 KR 100833096 B1 KR100833096 B1 KR 100833096B1 KR 1020070005798 A KR1020070005798 A KR 1020070005798A KR 20070005798 A KR20070005798 A KR 20070005798A KR 100833096 B1 KR100833096 B1 KR 100833096B1
Authority
KR
South Korea
Prior art keywords
user
feature vector
vector
characteristic
feature
Prior art date
Application number
KR1020070005798A
Other languages
English (en)
Inventor
권순일
Original Assignee
한국과학기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술연구원 filed Critical 한국과학기술연구원
Priority to KR1020070005798A priority Critical patent/KR100833096B1/ko
Priority to PCT/KR2008/000225 priority patent/WO2008088154A1/en
Priority to US12/373,141 priority patent/US8326457B2/en
Application granted granted Critical
Publication of KR100833096B1 publication Critical patent/KR100833096B1/ko

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • B25J13/003Controls for manipulators by means of an audio-responsive input
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Robotics (AREA)
  • Game Theory and Decision Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Manipulator (AREA)

Abstract

가정용 서비스 로봇의 사용자 인식 장치가 개시된다. 그러한 사용자 인식 장치는, 사용자의 통계용 음성 신호로부터 변환된 특성 벡터를 사용자 인식 오류를 유발하지 않는 특성 벡터와 사용자 인식 오류를 유발하는 특성 벡터로 분류하여 각각의 특성 벡터에 대응되는 사용자 모델을 사용자별로 설정하는 특성 벡터 분류부 및 상기 특성 벡터 분류부의 분류 결과를 사용자 판단을 위한 데이터로 활용하여 사용자를 판단하는 판단부를 구비한다. 그리하여, 본 발명은 가정용 서비스 로봇이 사용자를 인식하는 데 있어서의 시간적 제약을 극복할 수 있으며, 사용자의 짧은 음성만으로 사용자를 인식할 경우 데이터의 절대량 부족으로 인해 사용자 인식 성능의 저하가 초래되는 문제점을 해결할 수 있다.
특성 벡터, 가우시안 혼합 모델, 로봇, 음성

Description

사용자 인식 장치 및 그에 의한 사용자 인식 방법{APPARATUS FOR DETECTING USER AND METHOD FOR DETECTING USER BY THE SAME}
도 1은 본 발명의 일 실시예에 따른 사용자 인식 장치를 보인 블록도.
도 2는 특성 벡터를 이용한 통계적 모델의 일 예를 보인 그래프.
도 3은 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법을 설명하기 위한 흐름도.
도 4는 본 발명의 일 실시예에 따른 사용자 모델을 설정하는 방법을 보인 흐름도.
<도면의 주요 부분에 대한 부호의 설명>
10 : 입력부 20 : 특성 벡터 추출부
30 : 특성 벡터 분류부 40 : 판단부
50 : 제어부 60 : 명령 실행부
본 발명은 가정용 서비스 로봇에 관한 것으로서, 보다 상세하게는 가정용 서비스 로봇이 사용자를 인식하는 데 있어서 해결해야 할 시간적 제약을 극복하기 위 한 가정용 서비스 로봇의 음성을 이용한 사용자 인식 장치 및 그에 의한 사용자 인식 방법에 관한 것이다.
음성 정보만으로 사용자를 인식하기 위해서는, 음성 신호 처리와 패턴 인식을 기반으로 하는 일반적인 화자 인식 방법이 이용될 수 있다. 화자 인식이란 화자가 누구인지 즉 음성이 누구의 음성인지를 구분해 내는 것으로서, 음성 정보를 이용한 화자 인증 시스템, 음성 추출 시스템, 온라인 다자간 대화 음성 신호의 화자 인식 및 정보 추출 시스템, 그리고 다중 정보를 이용한 실시간 화자 추적 시스템 등 다양한 분야에 요구되고 있다.
종래의 화자 인식 방법에 의한 사용자 인식 방법은 인식할 대상자들의 음성 데이터를 수집한 다음, 그것으로부터 특성 벡터를 추출하고, 그 특성 벡터들을 이용하여 각각의 사용자들에 대한 통계적 모델을 만든다. 사용자에 대한 모델로는 특성 벡터를 이용한 통계적 모델인 가우시안 혼합 모델(Gaussian Mixture Model;GMM)이 많이 사용된다.
이와 같이, 미리 만들어진 모델들을 이용하여 사용자 인식을 하게 되는 데, 인식 대상이 되는 사용자의 음성 신호가 들어오면 이에 대한 특성 벡터와 사용자 모델들과 비교한 후, 최우추정법(Maximum likelihood method)을 이용하여 확률적으로 가장 유사한 사용자가 선택되어 인식 결과를 얻게 된다.
하지만, 위와 같이 일반적인 화자 인식 방법을 이용하는 경우, 대략 90% 이상의 정확도를 얻을 수 있기 위해서는 최소한 2 ~ 4초 이상의 음성 정보가 요구된다.
위와 같은 방법을 로봇의 사용자 인식에 적용할 경우 사용자에게 불편을 야기시킨다. 즉, 사용자의 짧은 한 단어 정도 길이의 음성만으로는 사용자를 인식할 경우 데이터의 절대량의 부족으로 인해 사용자 인식 성능의 저하를 초래하고, 대략 90% 이상의 정확도를 얻을 수 있기 위해서 최소 2 ~ 4 초 이상의 음성 정보를 요구하므로 그로 인한 실행 속도도 느리게 되는 문제점이 있다.
따라서, 본 발명의 목적은 상기의 문제점들을 해결하기 위해 가정용 서비스 로봇이 사용자를 인식하는 데 있어서 해결해야 할 시간적 제약을 극복할 수 있는 사용자 인식 장치 및 그에 의한 사용자 인식 방법을 제공함에 있다.
본 발명의 다른 목적은, 사용자의 짧은 음성만으로 사용자를 인식할 경우 데이터의 절대량 부족으로 인해 사용자 인식 성능의 저하가 초래되는 문제점을 개선할 수 있는 사용자 인식 장치 및 그에 의한 사용자 인식 방법을 제공함에 있다.
본 발명의 또 다른 목적은, 종래의 사용자 인식 방법에 있어서 일정 수준 이상의 정확도를 얻을 수 있기 위해서 최소 수 초 이상의 음성 정보가 요구됨으로 인해 실행 속도가 느린 문제점을 개선할 수 있는 사용자 인식 장치 및 그에 의한 사용자 인식 방법을 제공함에 있다.
상기의 목적들을 달성하기 위한 본 발명의 일 실시예에 따른 사용자 인식 장치는, 사용자의 통계용 음성 신호로부터 변환된 특성 벡터에 의해 설정된 사용자 모델에 따라 상기 사용자의 사용시 음성 신호의 특성 벡터를 분류하는 특성 벡터 분류부; 및 상기 사용시 음성 신호를 수신하여 상기 사용자 모델과 비교함으로써 상기 사용자를 인식하는 판단부를 구비하는 것을 특징으로 한다.
여기서, 상기 사용자 인식 장치는 가정용 서비스 로봇에 적용될 수 있다.
또한, 상기 특성 벡터는 사용자 인식 오류를 유발하지 않는 제1 특성 벡터와 사용자 인식 오류를 유발하는 제2 특성 벡터로 구분될 수 있다.
또한, 상기 판단부는 최우추정법(Maximum likelihood method)을 이용하여 상기 사용시 음성 신호의 특성 벡터와 상기 사용자 모델을 비교할 수 있다.
또한, 상기 특성 벡터 분류부는, 상기 사용시 음성 신호의 특성 벡터와 상기 사용자 모델의 비교 결과, 상기 사용시 음성 신호의 특성 벡터를 통계적 모델에서 오버랩되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터와 오버랩되는 특성을 보이는 사용시 음성 신호의 특성 벡터로 분류할 수 있다.
또한, 상기 판단부는, 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터만을 이용하여, 최우추정법(Maximum likelihood method)으로 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터와 상기 사용자 모델을 비교할 수 있다.
상기의 목적들을 달성하기 위한 본 발명의 다른 실시예에 따른 사용자 인식 장치는, 사용자의 통계용 음성 신호로부터 변환된 특성 벡터를 사용자 인식 오류를 유발하지 않는 특성 벡터와 사용자 인식 오류를 유발하는 특성 벡터로 분류하여 각각의 특성 벡터에 대응되게 사용자별로 설정된 사용자 모델에 따라 사용자의 사용시 음성 신호의 특성 벡터를 분류하는 특성 벡터 분류부; 및 상기 특성 벡터 분류 부의 분류 결과를 사용자 판단을 위한 데이터로 활용하여 사용자를 판단하되, 상기 사용자의 사용시 음성 신호의 특성 벡터 중 사용자 인식 오류를 유발하지 않는 특성 벡터로 분류된 특성 벡터만으로 사용자를 판단하는 판단부를 구비하는 것을 특징으로 한다.
상기의 목적들을 달성하기 위한 본 발명의 일 실시예에 따른 가정용 서비스 로봇은 외부의 사운드를 수신하는 입력부; 상기 입력부로부터의 신호를 수신하여 특성 벡터로 변환하는 특성 벡터 추출부; 사용자의 통계용 음성 신호로부터 변환된 특성 벡터에 의해 설정된 사용자 모델에 따라 상기 외부의 사운드의 특성 벡터를 분류하는 특성 벡터 분류부; 및 상기 특성 벡터 분류부에서 분류된 특성 벡터들 중 소정의 특성 벡터만을 활용하여 사용자를 판단하는 판단부; 및
상기 판단부에서의 판단 결과에 따라 명령 실행부를 제어하는 제어부를 구비하는 것을 특징으로 한다.
여기서, 상기 외부의 사운드는 사용자의 음성 신호일 수 있다.
또한, 상기 입력부는 마이크로폰일 수 있다.
또한, 상기 특성 벡터 분류부는, 상기 외부의 사운드에 대응되는 특성 벡터를 통계적 모델에서 오버랩되지 않는 특성을 보이는 특성 벡터와 오버랩되는 특성을 보이는 특성 벡터로 분류할 수 있다.
또한, 상기 판단부는, 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 외부의 사운드의 특성 벡터만을 이용하여, 최우추정법(Maximum likelihood method)으로 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 상기 외부의 사운드의 특성 벡터와 상기 사용자 모델을 비교할 수 있다.
상기의 목적들을 달성하기 위한 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법은, 음성을 수신하는 단계; 상기 음성 신호로부터 특성 벡터를 추출하는 단계; 상기 특성 벡터를 미리 준비된 사용자 모델들과 비교 판단한 후 사용자 인식 오류를 유발하지 않는 제1 특성 벡터 및 사용자 인식 오류를 유발하는 제2 특성 벡터로 분류하는 단계; 및 상기 제1 특성 벡터를 상기 사용자 모델들과 비교 판단하여 사용자를 판단하는 단계를 포함하는 것을 특징으로 한다.
여기서, 상기 특성 벡터를 상기 사용자 모델들과 비교 판단함에 있어서, 최우추정법(Maximum likelihood method)을 적용할 수 있다.
또한, 상기 제1 특성 벡터를 상기 사용자 모델들과 비교 판단함에 있어서, 최우추정법(Maximum likelihood method)을 적용할 수 있다.
이하에서는 첨부한 도면들을 참조하여 본 발명의 바람직한 실시 예들을 상세히 설명한다. 이하의 설명들은 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자에게 본 발명에 대한 보다 철저한 이해를 돕기 위한 의도 이외에는 다른 의도없이 예를 들어 도시되고 한정된 것에 불과하므로, 본 발명의 범위를 제한하는 것으로 사용되어서는 아니 될 것이다.
도 1은 본 발명의 일 실시예에 따른 사용자 인식 장치를 보인 블록도이다.
도 1을 참조하면, 상기 사용자 인식 장치는, 특성 벡터 분류부(30) 및 판단부(40)를 구비할 수 있다.
상기 특성 벡터 분류부(30)는 사용자의 통계용 음성 신호로부터 변환된 특성 벡터로부터 설정된 사용자 모델에 따라 상기 사용자의 사용시 음성 신호의 특성 벡터를 분류한다.
상기 특성 벡터는 사용자 인식 오류를 유발하지 않는 제1 특성 벡터와 사용자 인식 오류를 유발하는 제2 특성 벡터로 구분될 수 있다.
상기 판단부(40)는 상기 사용자의 사용시 음성 신호를 수신하여 상기 사용자 모델과 비교함으로써 상기 사용자를 인식한다.
예를 들어, 상기 판단부(40)는 최우추정법(Maximum likelihood method)을 이용하여 상기 사용시 음성 신호의 특성 벡터와 상기 사용자 모델을 비교할 수 있다. 그리고, 상기 판단부(40)는 상기 사용시 음성 신호의 특성 벡터와 상기 사용자 모델의 비교 결과, 상기 사용시 음성 신호의 특성 벡터를 통계적 모델에서 오버랩(overlap)되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터와 오버랩되는 특성을 보이는 사용시 음성 신호로 분류할 수 있다. 그리고, 상기 판단부(40)는, 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터만을 이용하여, 최우추정법으로 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 사용시 음성 신호의 특성 벡터와 상기 사용자 모델을 비교한다.
상기 통계용 음성 신호는 사용자 모델 설정을 위한 사용자의 음성 신호이고, 상기 사용시 음성 신호는 상기 사용자 인식 장치를 실제로 실행시키고자 하는 경우의 사용자의 음성 신호를 의미한다.
그리고, 상기 특성 벡터를 이용한 통계적 모델의 일 예는 도 2에 도시되어 있다.
즉, 도 2는 특성 벡터를 이용한 통계적 모델의 일 예를 보인 그래프로서, 도 2를 참조하면, 6 개의 그래프(g1 ~ g6)가 도시되어 있다.
g1, g3, g5는 제1 사용자의 통계적 모델을 보인 그래프이고, g2, g4, g6는 제2 사용자의 통계적 모델을 보인 그래프이다. 도 2에서는 두 명의 사용자만 예시하였으나, 그 이상의 사용자에 대해서도 가능하다.
g1은 제1 사용자의 종래 모델이고, g2는 제2 사용자의 종래 모델이며, g3 내지 g6는 본 발명에서 제안된 사용자 모델로서, 특히 g3 및 g5는 g1에 대한 두 개의 제1 사용자 모델이고, g4 및 g6은 g2에 대한 두 개의 제2 사용자 모델이다. 여기서, g3 및 g4는 오버랩되지 않는 사용자 모델이고, g5 및 g6은 오버랩되는 사용자 모델이다.
상기 실시예에 따른 사용자 인식 장치는 가정용 서비스 로봇에 적용될 수 있다.
도 1을 참조하여 그러한 가정용 서비스 로봇을 설명하면 이하와 같다.
상기 가정용 서비스 로봇은, 입력부(10), 특성 벡터 추출부(20), 특성 벡터 분류부(30), 판단부(40), 제어부(50) 및 명령 실행부(60)를 구비한다.
상기 입력부(10)는 외부의 사운드를 수신하는 부분이다. 상기 입력부(10)는 예를 들면 마이크로폰일 수 있다.
상기 특성 벡터 추출부(20)는 상기 입력부(10)로부터의 신호를 수신하여 특성 벡터로 변환하는 부분이다.
상기 특성 벡터 분류부(30)는 사용자의 통계용 음성 신호로부터 변환된 특성 벡터에 의해 설정된 사용자 모델에 따라 상기 사용자의 사용시 음성 신호의 특성 벡터를 분류하는 부분이다.
예를 들어, 상기 특성 벡터 분류부(30)는 상기 외부의 사운드에 대응되는 특성 벡터를 통계적 모델에서 오버랩되지 않는 특성을 보이는 특성 벡터와 오버랩되는 특성을 보이는 특성 벡터로 분류할 수 있다.
상기 판단부(40)는 상기 특성 벡터 분류부(30)에서 분류된 특성 벡터들 중 소정의 특성 벡터만을 활용하여 상기 사용자를 인식하는 부분이다.
예를 들어, 상기 판단부(40)는, 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 외부의 사운드의 특성 벡터만을 이용하여, 최우추정법(Maximum likelihood method)으로 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 상기 외부의 사운드의 특성 벡터와 상기 사용자 모델을 비교할 수 있다.
상기 제어부(50)는 상기 판단부(40)에서의 판단 결과에 따라 명령 실행부(미도시)를 제어하는 부분이다. 상기 명령 실행부(미도시)는 명령을 최종적으로 처리하는 부분이다.
상기 외부의 사운드는 사용자의 사용시 음성 신호일 수 있다.
도 3은 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법을 설명하기 위한 흐름도이다.
도 3을 참조하면, 음성 수신 단계(S10), 특성 벡터 추출 단계(S20), 특성 벡터 분류 단계(S30), 사용자 인식 오류 유발 특성 벡터인지를 판단하는 단계(S40), 사용자 오류를 유발하지 않는 제1 특성 벡터를 사용자 모델과 비교 판단하여(S50) 사용자를 결정하는 단계(S60)를 포함한다.
상기 판단하는 단계(S40)에서는 상기 특성 벡터 분류 단계(S30)의 분류 결과에 따라서, 사용자 인식 오류 유발 벡터인 제2 특성 벡터의 경우에는 사용자 모델들과의 비교 판단에 사용하지 않고, 덤프(DUMP)시킨다(S70).
여기서, 상기 특성 벡터를 상기 사용자 모델들과 비교 판단함에 있어서는, 최우추정법이 적용될 수 있고, 상기 제1 특성 벡터를 상기 사용자 모델들과 비교 판단함에 있어서도, 최우추정법이 적용될 수 있다.
도 4는 본 발명의 일 실시예에 따른 사용자 모델을 설정하는 방법을 보인 흐름도이다.
도 4를 참조하면, 통계용 음성 데이터를 수신하는 단계(S100), 사용자 모델을 구축하는 단계(S110), 특성 벡터를 분류하는 단계(S120) 및 사용자 모델을 재구축하는 단계(S130)가 도시되어 있다.
즉, 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법은, 통계용 음성 신호를 수신하여(S100), 특성 벡터를 추출한 후 사용자 인식 오류를 유발하지 않는 특성 벡터들과 구별하여 저장하는 사용자 모델을 구축(설정)한다.
상기 특성 벡터가 사용자 인식 오류를 유발하는지를 확인하여, 사용자 인식 오류를 유발하지 않는 특성 벡터들과 구별된 사용자 인식 오류를 유발하는 특성벡터들을 이용하여 사용자 별로 두 가지의 사용자 모델들을 구별하여 재설정(재구축)(S130)한다.
이와 같이, 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법에 있어서는, 결과적으로는 각 사용자마다 두 가지의 모델을 갖게 된다. 이렇게 얻어진 사용자 모델들을 이용하여 사용자 인식을 하게 되는데, 이 때 인식을 위하여 입력된 음성 데이터로부터 추출한 특성 벡터들 중 오류를 일으키는 특성 벡터들과 유사한 것으로 판단되는 특성 벡터는 사용자 인식 판단에서 제외시키고, 오류를 일으키지 않는 특성 벡터들과 유사한 것으로 판단되는 특성 벡터는 사용자 인식 판단의 대상으로 최종 결정을 한다.
그리하여, 본 발명의 일 실시예에 따른 가정용 서비스 로봇의 사용자 인식 방법에 따르면, 상대적으로 적은 음성 데이터만으로도 향상된 사용자 인식 효과를 얻을 수 있는 이점이 있다.
본 발명에 따른 사용자 인식 장치 및 그에 의한 사용자 인식 방법은 상기 실시 예들에 한정되지 않고, 본 발명의 기본 원리를 벗어나지 않는 범위에서 다양하게 설계되고, 응용될 수 있음은 본 발명이 속하는 기술분야에서 통상의 지식을 가지는 자에게는 자명한 사실이라 할 것이다.
그리하여, 본 발명은 개선된 사용자 인식 장치 및 그에 의한 사용자 인식 방법을 제공함으로써, 가정용 서비스 로봇이 사용자를 인식하는 데 있어서 해결해야 할 시간적 제약을 극복하는 효과를 갖는다.
또한, 본 발명은 개선된 사용자 인식 장치 및 그에 의한 사용자 인식 방법을 제공함으로써, 사용자의 짧은 음성만으로 사용자를 인식할 경우 데이터의 절대량 부족으로 인해 사용자 인식 성능의 저하가 초래되는 문제점을 해결하는 효과를 갖 는다.
또한, 본 발명은 개선된 사용자 인식 장치 및 그에 의한 사용자 인식 방법을 제공함으로써, 종래의 사용자 인식 방법에 있어서 일정 수준 이상의 정확도를 얻을 수 있기 위해서 최소 수 초 이상의 음성 정보가 요구됨으로 인해 실행 속도가 느린 문제점을 해결하는 효과를 갖는다.

Claims (15)

  1. 삭제
  2. 삭제
  3. 사용자의 실 음성이 입력되면 미리 준비된 사용자 모델과 비교하여 상기 실 음성 신호를 사용자 인식 오류를 유발하지 않는 제 1 특성 벡터와, 사용자 인식 오류를 유발하는 제 2 특성 벡터로 각기 분류하는 특성 벡터 분류부; 및
    상기 특성 벡터 분류부의 분류 결과를 사용자 판단을 위한 데이터로 활용하여 사용자를 판단하되, 사용자 인식 오류를 유발하지 않는 상기 제 1 특성 벡터만으로 사용자를 판단하는 판단부를 구비하는 것을 특징으로 하는 사용자 인식 장치.
  4. 제3항에 있어서,
    상기 사용자 인식 장치는 가정용 서비스 로봇에 적용되는 것을 특징으로 하는 사용자 인식 장치.
  5. 삭제
  6. 제3항에 있어서, 상기 특성 벡터 분류부는
    상기 실 음성 신호의 제 1 및 제 2 특성 벡터 중 적어도 하나와 상기 사용자 모델을 비교하여, 통계적 모델에서 오버랩되지 않는 특성을 보이는 특성 벡터와 오버랩되는 특성을 보이는 특성 벡터로 분류하는 것을 특징으로 하는 사용자 인식 장치.
  7. 제6항에 있어서, 상기 판단부는
    상기 통계적 모델에서 오버랩되지 않는 특성을 보이고, 그리고 상기 사용자 인식 오류를 유발하지 않는 특성 벡터를 상기 사용자 모델과 비교하는 것을 특징으로 하는 사용자 인식 장치.
  8. 외부의 사운드를 수신하는 입력부;
    상기 입력부로부터의 신호를 수신하여 특성 벡터로 변환하는 특성 벡터 추출부;
    사용자의 통계용 음성 신호로부터 변환된 특성 벡터에 의해 설정된 사용자 모델에 따라 상기 외부의 사운드에 대한 특성 벡터를 분류하는 특성 벡터 분류부; 및
    상기 특성 벡터 분류부에서 분류된 특성 벡터들 중 사용자 인식 오류를 유발하지 않는 특성 벡터만을 활용하여 사용자를 판단하는 판단부; 및
    상기 판단부에서의 판단 결과에 따라 명령 실행부를 제어하는 제어부를 구비하는 것을 특징으로 하는 가정용 서비스 로봇.
  9. 제8항에 있어서,
    상기 외부의 사운드는 사용자의 음성 신호인 것을 특징으로 하는 가정용 서비스 로봇.
  10. 제8항에 있어서,
    상기 입력부는 마이크로폰인 것을 특징으로 하는 가정용 서비스 로봇.
  11. 제8항에 있어서,
    상기 특성 벡터 분류부는, 상기 외부의 사운드에 대응되는 특성 벡터를 통계적 모델에서 오버랩되지 않는 특성을 보이는 특성 벡터와 오버랩되는 특성을 보이는 특성 벡터로 분류하는 것을 특징으로 하는 가정용 서비스 로봇.
  12. 제11항에 있어서,
    상기 판단부는, 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 외부의 사운드의 특성 벡터만을 이용하여, 최우추정법(Maximum likelihood method)으로 상기 통계적 모델에서 오버랩되지 않는 특성을 보이는 상기 외부의 사운드의 특성 벡터와 상기 사용자 모델을 비교하는 것을 특징으로 하는 가정용 서비스 로봇.
  13. 음성을 수신하는 단계;
    상기 음성 신호로부터 특성 벡터를 추출하는 단계;
    상기 특성 벡터를 미리 준비된 사용자 모델들과 비교 판단한 후 사용자 인식 오류를 유발하지 않는 제1 특성 벡터 및 사용자 인식 오류를 유발하는 제2 특성 벡터로 분류하는 단계; 및
    상기 제1 특성 벡터를 상기 사용자 모델들과 비교 판단하여 사용자를 판단하는 단계를 포함하는 것을 특징으로 하는 가정용 서비스 로봇의 사용자 인식 방법.
  14. 제13항에 있어서,
    상기 특성 벡터를 상기 사용자 모델들과 비교 판단함에 있어서, 최우추정법(Maximum likelihood method)을 적용하는 것을 특징으로 하는 가정용 서비스 로봇의 사용자 인식 방법.
  15. 제13항 또는 제14항에 있어서,
    상기 제1 특성 벡터를 상기 사용자 모델들과 비교 판단함에 있어서, 최우추정법(Maximum likelihood method)을 적용하는 것을 특징으로 하는 가정용 서비스 로봇의 사용자 인식 방법.
KR1020070005798A 2007-01-18 2007-01-18 사용자 인식 장치 및 그에 의한 사용자 인식 방법 KR100833096B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020070005798A KR100833096B1 (ko) 2007-01-18 2007-01-18 사용자 인식 장치 및 그에 의한 사용자 인식 방법
PCT/KR2008/000225 WO2008088154A1 (en) 2007-01-18 2008-01-14 Apparatus for detecting user and method for detecting user by the same
US12/373,141 US8326457B2 (en) 2007-01-18 2008-01-14 Apparatus for detecting user and method for detecting user by the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070005798A KR100833096B1 (ko) 2007-01-18 2007-01-18 사용자 인식 장치 및 그에 의한 사용자 인식 방법

Publications (1)

Publication Number Publication Date
KR100833096B1 true KR100833096B1 (ko) 2008-05-29

Family

ID=39636123

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070005798A KR100833096B1 (ko) 2007-01-18 2007-01-18 사용자 인식 장치 및 그에 의한 사용자 인식 방법

Country Status (3)

Country Link
US (1) US8326457B2 (ko)
KR (1) KR100833096B1 (ko)
WO (1) WO2008088154A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015137658A1 (ko) * 2014-03-13 2015-09-17 재단법인 다차원 스마트 아이티 융합시스템 연구단 입력 사운드 신호에 기반한 영상 저장장치 및 방법
WO2020022621A1 (ko) * 2018-07-23 2020-01-30 엘지전자 주식회사 인공지능 이동 로봇의 제어 방법

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6117021B2 (ja) * 2013-07-01 2017-04-19 シャープ株式会社 会話処理装置、制御方法、制御プログラム、および記録媒体
US10043101B2 (en) * 2014-11-07 2018-08-07 Adobe Systems Incorporated Local feature representation for image recognition
KR102167719B1 (ko) 2014-12-08 2020-10-19 삼성전자주식회사 언어 모델 학습 방법 및 장치, 음성 인식 방법 및 장치
CN110136727B (zh) * 2019-04-16 2024-04-16 平安科技(深圳)有限公司 基于说话内容的说话者身份识别方法、装置及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060064494A (ko) * 2004-12-08 2006-06-13 한국전자통신연구원 음성/비음성 검증 방법 및 이를 이용한 음성 인식 장치

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6442519B1 (en) * 1999-11-10 2002-08-27 International Business Machines Corp. Speaker model adaptation via network of similar users
US7613601B2 (en) * 2001-12-26 2009-11-03 National Institute Of Information And Communications Technology Method for predicting negative example, system for detecting incorrect wording using negative example prediction
US6917911B2 (en) * 2002-02-19 2005-07-12 Mci, Inc. System and method for voice user interface navigation
US7328154B2 (en) 2003-08-13 2008-02-05 Matsushita Electrical Industrial Co., Ltd. Bubble splitting for compact acoustic modeling
KR100631608B1 (ko) 2004-11-25 2006-10-09 엘지전자 주식회사 음성 판별 방법
US7496693B2 (en) * 2006-03-17 2009-02-24 Microsoft Corporation Wireless enabled speech recognition (SR) portable device including a programmable user trained SR profile for transmission to external SR enabled PC

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060064494A (ko) * 2004-12-08 2006-06-13 한국전자통신연구원 음성/비음성 검증 방법 및 이를 이용한 음성 인식 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015137658A1 (ko) * 2014-03-13 2015-09-17 재단법인 다차원 스마트 아이티 융합시스템 연구단 입력 사운드 신호에 기반한 영상 저장장치 및 방법
US10150447B2 (en) 2014-03-13 2018-12-11 Center For Integrated Smart Sensors Foundation Apparatus and method for storing image on basis of input sound signal
WO2020022621A1 (ko) * 2018-07-23 2020-01-30 엘지전자 주식회사 인공지능 이동 로봇의 제어 방법

Also Published As

Publication number Publication date
WO2008088154A1 (en) 2008-07-24
US20100138040A1 (en) 2010-06-03
US8326457B2 (en) 2012-12-04

Similar Documents

Publication Publication Date Title
US7620547B2 (en) Spoken man-machine interface with speaker identification
US9530401B2 (en) Apparatus and method for reporting speech recognition failures
US7729920B2 (en) Systems and methods for predicting consequences of misinterpretation of user commands in automated systems
US9940949B1 (en) Dynamic adjustment of expression detection criteria
EP1704668B1 (en) System and method for providing claimant authentication
KR100833096B1 (ko) 사용자 인식 장치 및 그에 의한 사용자 인식 방법
JP6350536B2 (ja) 音声検出装置、音声検出方法及びプログラム
EP2898510B1 (en) Method, system and computer program for adaptive control of gain applied to an audio signal
US20090119103A1 (en) Speaker recognition system
JP6436088B2 (ja) 音声検出装置、音声検出方法及びプログラム
JP2010537321A (ja) 統計的分類のための最適な選択方略の方法及びシステム
US20240029736A1 (en) Voice wakeup method and apparatus, storage medium, and system
CN112585674B (zh) 信息处理装置、信息处理方法和存储介质
Huang et al. Detecting the instant of emotion change from speech using a martingale framework
KR20190110728A (ko) 음성 화자 인식 장치 및 그 방법
KR20210066774A (ko) 멀티모달 기반 사용자 구별 방법 및 장치
US11107476B2 (en) Speaker estimation method and speaker estimation device
EP1387350A1 (en) Spoken man-machine interface with speaker identification
KR100873920B1 (ko) 화상 분석을 이용한 음성 인식 방법 및 장치
Górriz et al. New Advances in Voice Activity Detection using HOS and Optimization Strategies
KR20140072727A (ko) 음성 인식 장치 및 방법
Ma et al. Distant microphone speech recognition in a noisy indoor environment: combining soft missing data and speech fragment decoding
JPH1097283A (ja) 音声認識装置
JPH02181883A (ja) パターン認識装置における認識方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120508

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140507

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150430

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20171101

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180423

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190415

Year of fee payment: 12