KR20150086339A

KR20150086339A - 전자 기기 및 청소기

Info

Publication number: KR20150086339A
Application number: KR1020157016096A
Authority: KR
Inventors: 가즈노리 야스다; 마미 야타케; 가즈히로 미키
Original assignee: 샤프 가부시키가이샤
Priority date: 2013-01-16
Filing date: 2013-12-03
Publication date: 2015-07-27
Also published as: JP2014137430A; WO2014112226A1; CN104871239B; EP2947651A1; EP2947651B1; US20150332675A1; CN104871239A; EP2947651A4; KR101707359B1

Abstract

본 발명은 입력된 음성을 음성 데이터로 변환하는 음성 입력 수단(3)과, 음성 데이터를 해석함으로써, 상기 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출하는 음성 인식 수단(11)과, 확신도에 기초하여, 유저에 대한 되묻기의 필요 여부를 결정하는 반응 결정 수단(12)과, 되묻기를 행하는 되묻기 수단(31)을 구비하고, 반응 결정 수단은, 제2 역치 이상에서 제1 역치 미만인 경우에 되묻기를 행하는 결정을 하고, 확신도가 제2 역치 미만인 경우에 되묻기를 행하지 않는 결정을 한다.

Description

전자 기기 및 청소기{ELECTRONIC APPARATUS AND VACUUM CLEANER}

본 발명은 전자 기기 등에 관한 것이고, 특히 음성 인식 수단을 구비한 전자 기기 등에 관한 것이다.

종래, 전자 기기에 대하여 각종 동작의 지시 입력을 행하는 사용자 인터페이스로서, 조작 버튼이나 리모콘 등이 사용되고 있다. 또한, 최근, 유저가 내는 음성에 의해 지시 입력을 행하기 위한 음성 인식 수단을 구비한 전자 기기가 개발되고 있다.

여기서, 음성 인식 수단을 이용한 지시 입력을 행하는 경우, 유저가 내는 음성을 전자 기기가 오인식할 가능성이 있다. 그리고, 전자 기기가 유저가 낸 음성을 오인식한 경우, 전자 기기는, 오인식한 결과에 기초하여 각종 동작을 행하게 되어, 오동작의 우려가 있다. 따라서, 음성 인식 수단을 구비하는 전자 기기의 오인식을 방지하는 기술이 개발되고 있다. 예를 들어, 특허문헌 1에는, 음성을 잘 인식하지 못한 경우, 음성을 낸 유저에게 되묻기를 실시하는 음성 인식 장치가 기재되어 있다.

도 10은 특허문헌 1에 기재된 음성 인식 장치(301)가 구비하는 컨트롤러(302)의 주된 구성을 도시하는 블록도이다. 음성 인식 장치(301)는 음성이 입력되는 마이크로폰(303), 음성 인식한 단어의 확신도를 산출하는 확신도 산출부(304), 확신도 산출부(304)가 산출한 단어의 확신도에 기초하여 대화자가 말을 건 문장을 특정하는 문장 특정부(305), 및 특정된 문장에 포함되는 단어의 확신도에 기초하여, 대화자에게 되묻기의 필요 여부를 판단하는 제1 되묻기 판정부(306)를 구비하고 있다. 그리고, 제1 되묻기 판정부(306)는 단어의 확신도가 소정의 역치 이상인 경우, 되묻기는 불필요하다고 판단함과 함께, 단어의 확신도가 소정의 역치를 만족하지 않는 경우, 유저에 대하여 더 분명히 이야기할 것을 촉구하는 취지의 되묻기가 필요하다고 판단한다.

일본 특허 공개 제2008-52178호 공보(2008년 3월 6일 공개)

그러나, 특허문헌 1에 기재된 음성 인식 장치(301)에서는, 단어의 확신도가 소정의 역치를 만족하지 않으면 반드시 어떠한 되묻기를 행하므로, 음성 인식 장치(301)가 시끄러운 장소에서 이용되었을 경우에는, 유저가 실제로는 음성을 내고 있지 않는데도, 유저가 낸 음성 이외의 소음에 대해서도 음성 인식 장치(301)가 되묻기를 행하는 경우를 생각할 수 있다. 그리고, 그 경우에는, 쓸데없는 되묻기를 유저가 번거롭게 느끼는 경우가 있고, 나아가서는, 음성 인식 기능에 대한 유저의 신뢰성을 손상시킬 우려가 있었다.

본원 발명은, 상기의 사정을 감안하여 이루어진 것이며, 그 목적은, 유저가 낸 음성을 음성 인식할 때, 유저에 대하여 적절하게 되묻기를 행하는 것이 가능한 전자 기기 등을 제공하는 데 있다.

본 발명에 따른 전자 기기는, 입력된 음성을 음성 데이터로 변환하는 음성 입력 수단과, 음성 데이터를 해석함으로써, 상기 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출하는 음성 인식 수단과, 확신도에 기초하여, 유저에 대한 되묻기의 필요 여부를 결정하는 반응 결정 수단과, 되묻기를 행하는 되묻기 수단을 구비하고, 반응 결정 수단은, 확신도가 제2 역치 이상이고 제1 역치 미만인 경우에 되묻기를 행하는 결정을 하고, 확신도가 제2 역치 미만인 경우에 되묻기를 행하지 않는 결정을 한다.

본 발명에 따르면, 유저가 낸 음성을 음성 인식할 때, 유저에 대하여 적절하게 되묻기를 행하는 것이 가능한 전자 기기 등을 제공할 수 있다.

도 1은 본 발명의 실시 형태 1에 관한 전자 기기의 사시도이다.
도 2는 본 발명의 실시 형태 1에 관한 전자 기기의 저면도이다.
도 3은 본 발명의 실시 형태 1에 관한 전자 기기의 주된 구성을 도시하는 블록도이다.
도 4는 본 발명의 실시 형태 1에 관한 전자 기기가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다.
도 5는 본 발명의 실시 형태 1에 관한 전자 기기가 행하는 되묻기의 구체예를 도시하는 모식도이다.
도 6은 본 발명의 실시 형태 2에 관한 전자 기기가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다.
도 7은 본 발명의 실시 형태 2에 관한 전자 기기가 행하는 되묻기의 구체예를 도시하는 모식도이다.
도 8은 본 발명의 실시 형태 3에 관한 전자 기기 및 외부 장치의 주된 구성을 도시하는 블록도이다.
도 9는 본 발명의 실시 형태 3에 관한 전자 기기가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다.
도 10은 특허문헌 1에 기재된 음성 인식 장치가 구비하는 컨트롤러의 주된 구성을 도시하는 블록도이다.

[실시 형태 1]

본 발명의 실시 형태 1에 관한 전자 기기에 대해서, 이하에 설명한다.

실시 형태 1에 관한 전자 기기는, 주행부 및 송풍부를 구비하고, 상기 주행부에 의해 바닥면을 자주(自走)함과 함께, 상기 송풍부에 의해 발생하는 기류로 바닥면의 진애를 흡인하여 청소를 행하는 청소기이다.

또한, 실시 형태 1에 관한 전자 기기는, 음성 인식부를 구비하고 있고, 유저가 낸 음성을 음성 인식하여, 상기 음성에 포함되는 지시에 기초하여 각종 반응을 행한다. 예를 들어, 유저가 낸 음성에 「청소해」가 포함되어 있는 경우, 상기 전자 기기는, 주행부 및 송풍부를 제어함으로써 소정의 청소 동작을 행한다.

또한, 실시 형태 1에 관한 전자 기기는, 음성 인식 시에, 유저에 대한 되묻기가 필요하다고 판단한 경우, 되묻기를 행한다. 여기서, 되묻기란, 유저에 대하여 다시 음성을 낼 것을 촉구하는 것이다. 되묻기는, 예를 들어 음성 및/또는 동작에 의해 행해진다.

실시 형태 1에 관한 전자 기기의 구체적인 구조에 대해서, 도면을 참조하여 이하에 설명한다.

(전자 기기(1)의 구조)

도 1은 실시 형태 1에 관한 전자 기기(1)의 사시도이다. 여기서, 전자 기기(1)가 자주하여 청소를 행할 때의 진행 방향을 전방이라 하고, 도 1에 화살표로 표시한다. 또한, 진행 방향과 역방향을 후방이라 한다.

전자 기기(1)는 평면에서 보아 원형의 하우징(2)을 구비하고 있다. 하우징(2)의 상면(2a)에는, 진애가 제거된 공기가 배기되는 배기구(2b) 및, 전자 기기(1)에 대하여 지시 입력을 행하는 패널 조작부(4)가 설치되어 있다.

패널 조작부(4)는 전자 기기(1)에 대하여 각종 지시 입력을 행하는 조작부 및 각종 정보를 표시하는 표시부를 구비하고 있다. 조작부에는 복수의 조작 버튼이 설치되어 있다. 유저는, 조작부를 통한 지시 입력 및 음성 인식에 의한 지시 입력을 병용할 수 있다.

또한, 하우징(2)의 상면(2a)의 전방측에는, 충전대로부터의 귀환 신호를 수신하는 귀환 신호 수신부(5)가 설치되어 있다. 그리고, 전자 기기(1)는, 예를 들어 바닥면의 청소가 종료되었다고 판단한 경우에, 상기 귀환 신호를 귀환 신호 수신부(5)를 통하여 수신함으로써 자율적으로 충전대로 귀환할 수 있도록 구성되어 있다.

하우징(2)의 측면(2c)은, 전후 방향으로 2분할되어 있다. 측면(2c)의 전방부는, 하우징(2)의 기타 부분에 대하여 전후 방향으로 미끄럼 이동 가능하게 구성되어 있고, 전자 기기(1)가 장해물에 충돌했을 때의 완충 부재로서 기능한다.

또한, 하우징(2)의 측면(2c)에는, 음성 출력부(31)가 설치되어 있다. 음성 출력부(31)는, 예를 들어 음성 또는 음악 등의 소리를 출력하는 것이다. 음성 출력부(31)는, 예를 들어 스피커 등으로 구성되어 있다. 음성 출력부(31)는 본 발명에 따른 되묻기 수단의 일례이다. 전자 기기(1)의 저면에는, 사이드 브러시(34b)가 하우징(2)으로부터 비어져 나오도록 설치되어 있다. 사이드 브러시(34b)에 대해서는 이하에서 상세히 기술한다.

도 2는 전자 기기(1)의 저면도이다. 도 2에 있어서도, 전자 기기(1)가 자주하여 청소를 행할 때의 진행 방향을 화살표로 표시하고 있다. 하우징(2)의 저면(2d)에는, 바닥면의 진애를 흡입하기 위한 흡입구(2e)가 오목 형성되어 있다. 또한, 하우징(2)의 저면(2d)에는 주행부(32), 청소 브러시부(34), 전륜(6a) 및 후륜(6b)이 설치되어 있다.

주행부(32)는 전자 기기(1)를 주행시키는 부분이다. 주행부(32)는, 예를 들어 저면(2d)으로부터 돌출되도록 설치된 구동륜 및 상기 구동륜을 구동하는 모터 등으로 구성된다. 또한, 도 2에 있어서는, 주행부(32) 중, 저면(2d)으로부터 돌출된 구동륜의 일부를 도시하고 있다. 주행부(32)는 본 발명에 따른 주행 수단의 일례이다.

청소 브러시부(34)는 바닥면을 쓸어서 청소하는 부분이다. 청소 브러시부(34)는, 예를 들어 바닥면을 쓰는 브러시 및 브러시를 구동하는 모터 등을 포함한다. 예를 들어, 브러시로서는, 흡입구(2e)에 설치되고, 바닥면과 평행하게 축 지지된 회전축으로 회전하는 회전 브러시(34a) 및, 저면(2d)의 비듬히 앞쪽의 양측에 하우징(2)으로부터 비어져 나오도록 설치되고, 바닥면과 수직으로 축 지지된 회전축으로 회전하는 사이드 브러시(34b)를 사용할 수 있다.

전륜(6a) 및 후륜(6b)은 주행부(32)의 주행에 종동하는 종동륜이다.

이어서, 전자 기기(1)의 구성에 대하여 설명한다. 또한, 도 1 또는 도 2에 있어서 설명한 구성에 대해서는, 동일한 부호를 부여하고 설명을 생략한다.

(전자 기기(1)의 구성)

도 3은 전자 기기(1)의 주된 구성을 도시하는 블록도이다. 전자 기기(1)는 음성 입력부(3) 및 송풍부(33)를 구비하고 있다.

음성 입력부(3)는 음성이 입력됨과 함께, 입력된 음성을 디지털 변환하여, 음성 데이터를 생성하는 부분이다. 음성 입력부(3)는, 예를 들어 마이크로폰 등 및 아날로그/디지털 변환 장치 등으로 구성된다. 마이크로폰으로서는, 소정의 방향으로부터 도래하는 음성을, 특히 고감도로 집음하는 지향성 마이크로폰을 사용해도 되고, 음성이 도래하는 방향에 관계없이 일정한 감도로 음성을 집음하는 무지향성 마이크로폰을 사용해도 된다. 음성 입력부(3)는, 예를 들어 하우징(2)의 상면(2a)의 이측에 설치할 수 있다.

송풍부(33)는 진애를 흡인하기 위한 기류를 발생시키는 것이다. 발생한 기류는, 흡입구(2e)로부터 도시하지 않은 집진부에 유도되고, 집진부에 의해 진애가 분리된 후, 배기구(2b)로부터 전자 기기(1)의 기외로 배출된다.

전자 기기(1)는, 기억부(20)를 더 구비하고 있다. 이하에 있어서 기억부(20)에 대하여 상세하게 설명한다.

(기억부(20)의 구성)

기억부(20)는 후술하는 제어부(10)가 실행하는 각종 프로그램, 각종 프로그램을 실행할 때 사용 및 작성되는 각종 데이터 및, 전자 기기(1)에 입력되는 각종 데이터 등등을 기억하는 것이다. 기억부(20)는, 예를 들어 ROM(Read Only Memory), 플래시 메모리 또는 HDD(Hard Disk Drive) 등의 불휘발성 기억 장치 및 작업 영역을 구성하는 RAM(Random Access Memory) 등의 휘발성 기억 장치로 구성되어 있다.

기억부(20)는 음향 특징 기억부(21), 사전 기억부(22) 및 문법 기억부(23)를 구비하고 있다.

음향 특징 기억부(21)는 음성 인식하는 음성의 음향적인 특징을 나타내는 음향 특징을 기억하고 있는 부분이다. 음향 특징의 종류는 적절히 선택할 수 있다. 음향 특징은, 예를 들어 음성 파형 또는 음성의 파워의 주파수 스펙트럼 등이다. 이하에서 상세히 기술하겠지만, 음성 인식부(11)는 음성 입력부(3)에서 생성된 음성 데이터에 포함되는 음향 특징과, 음향 특징 기억부(21)에 기억되어 있는 음향 특징을 비교함으로써 유저가 낸 음성을 음성 인식한다.

사전 기억부(22)는 음성 인식 대상의 각 단어 및 상기 단어에 관한 음운 정보 등이 등록된 사전을 기억하고 있는 부분이다.

문법 기억부(23)는 사전 기억부(22)의 사전에 등록되어 있는 각 단어가 어떻게 연쇄되는지를 기술한 문법 규칙을 기억하고 있는 부분이다. 문법 규칙은, 예를 들어 통계적으로 구해진 각 단어가 연쇄될 확률에 기초하는 것이다.

전자 기기(1)는 제어부(10)을 더 구비하고 있다. 이하에 있어서 제어부(10)에 대하여 상세하게 설명한다.

(제어부(10)의 구성)

제어부(10)는 기억부(20)에 기억된 프로그램 또는 데이터에 기초하여, 전자 기기(1)의 각 부를 통괄하여 제어하는 것이다. 프로그램이 실행됨으로써, 제어부(10)에는 음성 인식부(11), 반응 결정부(12), 음성 합성부(13) 및 동작 생성부(14)가 구축된다.

음성 인식부(11)는 유저가 낸 음성에 대하여 음성 인식을 행하는 부분이다. 음성 인식부(11)는 음성 인식의 결과로서, 음성 데이터에 포함되는 단어 또는 문장에 관한 정보 및, 단어 또는 문장의 확신도를 출력한다. 음성 인식부(11)는 음성 구간 검출부(111), 음향 특징 추출부(112) 및 음향 특징 비교부(113)를 구비하고 있다. 여기서, 단어 또는 문장에 관한 정보에는, 예를 들어 상기 단어 또는 문장의 음운 정보가 포함된다.

음성 구간 검출부(111)는 음성 인식하는 음성의 개시 및 종료를 검출하는 부분이다. 음성 구간 검출부(111)는 음성이 검출되지 않은 경우에는, 음성 입력부(3)에서 생성된 음성 데이터의 파워가, 기억부(20)에 기억되어 있는 소정의 역치 이상인지 여부를 감시한다. 그리고, 음성 구간 검출부(111)는 음성 데이터의 파워가 상기 역치 이상이 된 시점에서 음성이 검출되었다고 판단한다. 또한, 음성 구간 검출부(111)는 음성 데이터의 파워가 상기 역치 미만이 된 시점에서 음성이 종료되었다고 판단한다.

음향 특징 추출부(112)는 음성 입력부(3)에서 생성된 음성 데이터에 대해서, 적당한 프레임마다 음향 특징을 추출하는 부분이다.

음향 특징 비교부(113)는 음향 특징 추출부(112)가 추출한 음향 특징과 음향 특징 기억부(21)가 기억하는 음향 특징을 비교하여, 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출하는 부분이다. 음향 특징 비교부(113)는 사전 기억부(22)에 기억된 사전 및/또는 문법 기억부(23)에 기억된 문법 규칙을, 필요에 따라 참조할 수 있다. 음향 특징 비교부(113)에 의해 특정된 단어 또는 문장 및 상기 특정된 단어 또는 문장의 확신도에 관한 정보는, 반응 결정부(12)에 출력된다.

여기서, 음향 특징 비교부(113)가 행하는 처리의 구체예에 대하여 설명한다. 음향 특징 비교부(113)는 음향 특징 추출부(112)가 추출한 프레임마다, 음성 데이터로부터 추출된 음향 특징과 음향 특징 기억부(21)에 기억된 음향 특징을 비교한다. 그리고, 음향 특징 비교부(113)는 기억부(20)에 기억된 후보가 되는 단어 각각에 대하여 단어의 확신도를 산출함과 함께, 단어의 확신도가 가장 높은 단어를 특정한다. 또한, 음향 특징 비교부(113)는 사전 기억부(22)에 기억되어 있는 사전을 참조하여, 특정한 단어의 음운 정보를 취득한다.

또한, 음향 특징 추출부(112)가 복수의 프레임을 추출한 경우, 음향 특징 비교부(113)는 복수의 프레임마다 결정된 단어를 적절히 접속하여 문장을 작성한다. 그리고, 음향 특징 비교부(113)는 작성된 문장마다 문장의 확신도를 산출함과 함께, 문장의 확신도가 가장 높은 문장을 특정한다. 여기서, 음향 특징 비교부(113)는 문법 기억부(23)에 기억되어 있는 문법 규칙을 참조함으로써, 문장의 확신도를 산출할 수 있다.

반응 결정부(12)는 음성 인식부(11)로부터 입력된 음성 인식의 결과에 기초하여, 전자 기기(1)의 반응을 결정하는 부분이다. 구체적으로는, 반응 결정부(12)는 특정된 단어 또는 문장의 확신도에 기초하여, 전자 기기(1)의 반응을 결정한다. 즉, 특정된 단어 또는 문장의 확신도가, 음성 인식의 결과에 애매함이 없을 정도로 높은 경우에는, 반응 결정부(12)는 단어 또는 문장에 대응하는 반응을 행할 것을 결정한다. 또한, 음성 인식된 단어 또는 문장의 확신도가, 음성 인식의 결과에 애매함이 어느 정도 있는 경우에는, 반응 결정부(12)는 되묻기를 행할 것을 결정한다. 또한, 음성 인식된 단어 또는 문장의 확신도가 더 낮은 경우에는, 반응 결정부(12)는, 단어 또는 문장에 대응하는 반응 및 되묻기를 모두 실시하지 않을 것을 결정한다.

음성 합성부(13)는 반응 결정부(12)에 의해 결정된 반응에 대응하는 음성 데이터를 합성하는 부분이다. 음성 합성부(13)는 합성한 음성 데이터를 음성 출력부(31)에 출력한다. 음성 합성부(13)는 사전 기억부(22)에 기억된 사전 및/또는 문법 기억부(23)에 기억된 문법 규칙을, 필요에 따라 참조할 수 있다.

동작 생성부(14)는 반응 결정부(12)에 의해 결정된 반응에 대응하는 동작 패턴을 생성하는 부분이다. 동작 생성부(14)는 생성한 동작 패턴을 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)에 출력한다.

이어서, 전자 기기(1)가 행하는 음성 인식 처리의 흐름 및 효과에 대하여 설명한다.

(처리의 흐름 및 효과)

이하에 나타내는 처리는, 전자 기기(1)의 제어부(10)가 기억부(20)에 기억된 프로그램을 실행함으로써 이루어진다.

도 4는 전자 기기(1)가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다. 또한, 도 4 및 그 이후에서 설명하는 흐름도에 있어서, 「스텝」을 「S」로 나타낸다. 또한, 문장 중에서도 「S」는 「스텝」을 나타내고 있다.

먼저, 음성 구간 검출부(111)는 음성 입력부(3)로부터 입력되는 음성 데이터를 감시하여, 음성 인식하는 음성이 검출되었는지 여부를 판단한다(S1).

음성이 검출된 경우(S1에서 "예"의 경우), 음향 특징 추출부(112)는 음성 입력부(3)로부터 입력된 음성 데이터에 대해서, 적당한 프레임마다 음향적인 특징을 나타내는 음향 특징을 추출한다(S2). 한편, 음성이 검출되지 않은 경우(S1에서 "아니오"의 경우), 음성 구간 검출부(111)는 음성 입력부(3)로부터 입력되는 음성 데이터의 감시를 계속한다.

이어서, 음향 특징 비교부(113)는 음향 특징 추출부(112)가 추출한 음향 특징과, 음향 특징 기억부(21)가 기억하는 음향 특징을 비교하여, 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출한다(S3).

음성 구간 검출부(111)는 음성 입력부(3)로부터 입력된 음성 데이터를 감시하고, 음성 인식하는 음성이 종료되었는지 여부를 판단한다(S4). 음성의 종료가 검출되지 않은 경우(S4에서 "아니오"의 경우), 음성 구간 검출부(111)는 음성 입력부(3)로부터 입력되는 음성 데이터의 감시를 계속한다. 또한, 여기서, 음성 구간 검출부(111)가 새로운 음성을 검출한 경우, 음성 인식부(11)는 먼저 검출된 음성에 대하여 산출된 확신도를 반응 결정부(12)에 출력해도 되고, 나중에 검출된 음성에 대하여 산출된 확신도를 반응 결정부(12)에 출력해도 되며, 또는, 먼저 검출된 음성에 대하여 산출된 확신도 및 나중에 검출된 음성에 대하여 산출된 확신도를 반응 결정부(12)에 출력해도 된다.

음성의 종료가 검출된 경우(S4에서 "예"의 경우), 반응 결정부(12)는 음향 특징 비교부(113)에 의해 특정된 단어 또는 문장의 확신도가 제1 역치 이상인지 여부를 판단한다(S5). 그리고, 단어 또는 문장의 확신도가 제1 역치 이상인 경우, 반응 결정부(12)는 음성 인식한 단어 또는 문장에 대응하는 반응을 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 상기 반응을 행한다(S6).

음향 특징 비교부(113)에 의해 특정된 단어 또는 문장의 확신도가 제1 역치 미만인 경우(S5에서 "아니오"의 경우), 반응 결정부(12)는 단어 또는 문장의 확신도가 제2 역치 이상인지 여부를 판단한다(S7). 그리고, 단어 또는 문장의 확신도가 제2 역치 이상인 경우(S7에서 "예"의 경우), 반응 결정부(12)는 되묻기를 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 되묻기를 행한다(S8). 한편, 단어 또는 문장의 확신도가 제2 역치 미만인 경우(S7에서 "아니오"의 경우), 반응 결정부(12)는 단어 또는 문장에 대응하는 반응 및 되묻기를 모두 실시하지 않을 것을 결정하고, 처리를 종료한다. 또한, 제2 역치는, 제1 역치보다도 작은 값이다.

도 5는 전자 기기(1)가 행하는 되묻기의 구체예를 도시하는 모식도이고, 도 5의 (a)는 음성으로 되묻기를 행하는 경우, 도 5의 (b)는 동작으로 되묻기를 행하는 경우, 도 5의 (c)는 음성 및 동작으로 되묻기를 행하는 경우를 도시하고 있다.

음성으로 되묻기를 행하는 경우, 음성 합성부(13)는, 예를 들어 「뭐라구요?」에 대응하는 음성 데이터를 합성하고, 음성 출력부(31)에 출력한다. 음성 출력부(31)는 입력된 음성 데이터를 아날로그 변환하여, 「뭐라구요?」를 음성 출력한다.

동작으로 되묻기를 행할 경우, 동작 생성부(14)는, 예를 들어 전자 기기(1)를 그 자리에서 좌우로 일정 각도씩 회전시키는 동작 패턴을 생성하고, 주행부(32)를 상기 동작 패턴으로 주행하도록 제어한다.

이상과 같이 구성되는 전자 기기(1)에 있어서는, 음성 인식부(11)에 의해 특정된 단어 또는 문장의 확신도가 제1 역치 이하이고, 또한, 제2 역치 이상일 경우에, 전자 기기(1)가 유저에 대하여 되묻기를 행한다. 따라서, 전자 기기(1)는 단어 또는 문장의 확신도에 애매함이 있는 경우에는, 되묻기를 행함으로써 오인식을 방지함과 함께, 단어 또는 문장의 확신도가 더 낮은 경우에는, 되묻기를 행하지 않게 함으로써, 쓸데없는 되묻기를 감소시킬 수 있다.

또한, 본 실시 형태의 전자 기기(1)에서는, 소정의 범위의 확신도에서, 단어 또는 문장이 한번이라도 음성 인식되면, 전자 기기(1)가 되묻기를 행하는 경우에 대하여 설명했지만, 이것에만 한정되지는 않는다. 예를 들어, 전자 기기(1)는 소정의 범위의 확신도에서, 단어 또는 문장이 복수회, 또한 연속적으로 음성 인식되었을 때 되묻기를 행하도록 해도 된다. 이렇게 전자 기기(1)를 구성함으로써, 쓸데없는 되묻기를 더 감소시킬 수 있다.

[실시 형태 2]

본 발명의 실시 형태 2에 관한 전자 기기(1)에 대해서, 도면을 참조하여 설명한다. 본 발명에 따른 전자 기기(1)는 음성 인식부(11)가 음성 인식한 단어 또는 문장의 확신도에 기초하여 상이한 되묻기를 행하는 점에서 상술한 실시 형태와 상이하다. 또한, 실시 형태 1에서 설명한 구성 요소에 대해서는, 실시 형태 1과 동일한 기능을 갖는 것으로 하고, 특별히 기재하는 경우를 제외하고 설명을 생략한다.

도 6은 전자 기기(1)가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다. 또한, 실시 형태 1에서 설명한 스텝에 대해서는, 실시 형태 1과 동일한 기능을 갖는 것으로 하고, 특별히 기재하는 경우를 제외하고 설명을 생략한다.

음성 인식부(11)가 산출한 단어 또는 문장의 확신도가 제1 역치 미만인 경우(S5에서 "아니오"의 경우), 반응 결정부(12)는 단어 또는 문장의 확신도가 제3 역치 이상인지 여부를 판단한다(S11). 그리고, 단어 또는 문장의 확신도가 제3 역치 이상인 경우(S11에서 "예"의 경우), 반응 결정부(12)는 제1 되묻기를 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 상기 반응을 행한다(S12). 또한, 제3 역치는, 제1 역치보다도 작은 값이다.

음성 인식부(11)가 산출한 단어 또는 문장의 확신도가 제3 역치 미만인 경우(S11에서 "아니오"의 경우), 반응 결정부(12)는 단어 또는 문장의 확신도가 제4 역치 이상인지 여부를 판단한다(S13). 그리고, 단어 또는 문장의 확신도가 제4 역치 이상인 경우(S13에서 "예"의 경우), 반응 결정부(12)는 제2 되묻기를 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 상기 반응을 행한다(S14). 또한, 제4 역치는, 제3 역치보다도 작은 값이다.

음성 인식부(11)가 산출한 단어 또는 문장의 확신도가 제4 역치 미만인 경우(S13에서 "아니오"의 경우), 반응 결정부(12)는 음성 인식한 단어 또는 문장에 대응하는 반응 및 되묻기를 모두 실시하지 않을 것을 결정하고, 처리를 종료한다.

도 7은 전자 기기(1)가 행하는 되묻기의 구체예를 도시하는 모식도이고, 도 7의 (a)는 제1 되묻기를 행하는 경우, 도 7의 (b)는 제2 되묻기를 행하는 경우를 도시하고 있다.

제1 되묻기를 행하는 경우, 음성 합성부(13)는, 예를 들어 「청소하라구요?」에 대응하는 음성 데이터를 합성하고, 음성 출력부(31)에 출력한다. 음성 출력부(31)는 입력된 음성 데이터를 아날로그 변환하여, 「청소하라구요?」를 음성 출력한다.

본 실시 형태에 있어서는, 제1 되묻기의 음성은, 음성 인식부(11)에서 특정된 가장 확신도가 높은 단어 또는 문장에 기초하여 음성 합성된다. 예를 들어, 가장 확신도가 높은 문장이, 「청소해」일 경우, 반응 결정부(12)는 상기 문장에 기초하여 「청소하라구요」라고 되묻기를 행할 것을 결정한다.

제2 되묻기를 행하는 경우, 음성 합성부(13)는 「뭐라구요?」에 대응하는 음성 데이터를 합성하고, 음성 출력부(31)에 출력한다. 음성 출력부(31)는 입력된 음성 데이터를 아날로그 변환하여, 「뭐라구요?」를 음성 출력한다.

이상과 같이 구성되는 전자 기기(1)에 있어서는, 음성 인식부(11)가 음성 인식한 단어 또는 문장의 확신도에 기초하여 전자 기기(1)가 상이한 되묻기를 행한다. 따라서, 유저는, 되묻기의 음성 및/또는 동작으로부터 전자 기기(1)가 어느 정도 음성 인식하고 있는지를 알 수 있으므로, 예를 들어 다시 음성으로 지시 입력을 행할 것인지, 또는, 패널 조작부(4) 등을 통하여 지시 입력을 할지 등을 선택할 수 있어, 유저의 편리성이 향상된다.

[실시 형태 3]

본 발명의 실시 형태 3에 관한 전자 기기(1a)에 대해서, 도면을 참조하여 설명한다. 본 발명에 따른 전자 기기(1a)는 외부 장치(200)와 통신을 행하는 통신부(6)를 구비하고, 외부 장치(200)와 통신을 행함으로써, 유저가 낸 음성의 음성 인식 처리를, 외부 장치(200)에서도 행하는 점에서 상술한 모든 실시 형태와 상이하다. 또한, 실시 형태 1에서 설명한 구성 요소에 대해서는, 실시 형태 1과 동일한 기능을 갖는 것으로 하고, 특별히 기재하는 경우를 제외하고 설명을 생략한다.

(전자 기기(1a) 및 외부 장치(200)의 구성)

도 8은 전자 기기(1a) 및 외부 장치(200)의 주된 구성을 도시하는 블록도이다. 전자 기기(1a)는 실시 형태 1에서 설명한 구성 요소에 더하여, 통신부(6)를 더 구비하고 있다. 또한, 도 8에 있어서는, 실시 형태 1에서 설명한 구성 요소 중 일부만을 도시하고 있다.

통신부(6)는 외부 장치(200)와의 사이에서 정보의 송수신을 행하는 것이다. 통신부(6)는 통신망(300)에 접속되어 있고, 통신망(300)을 통하여 외부 장치(200)와 접속되어 있다.

통신망(300)은 한정되는 것이 아니라, 적절히 선택할 수 있다. 통신망(300)은, 예를 들어 인터넷을 사용할 수 있다. 또한, 통신망(300)은 IrDA나 리모콘과 같은 적외선, Bluetooth(등록 상표), WiFi(등록 상표) 또는 IEEE802.11 등의 무선을 사용해도 된다.

반응 결정부(12a)는 음성 인식부(11)로부터 입력되는 음성 인식의 결과 및, 후술하는 외부 장치(200)의 음성 인식부(11a)로부터 수신한 음성 인식의 결과에 기초하여, 전자 기기(1a)의 반응을 결정하는 부분이다.

외부 장치(200)는 통신부(206), 기억부(220) 및 제어부(210)를 구비하고 있다. 통신부(206)는 전자 기기(1a)와의 사이에서 정보의 송수신을 행하는 것이다. 통신부(206)는 통신망(300)에 접속되어 있고, 통신망(300)을 통하여 전자 기기(1a)와 접속되어 있다.

기억부(220)는 후술하는 제어부(210)가 실행하는 각종 프로그램, 각종 프로그램을 실행할 때 사용 및 작성되는 각종 데이터 및 외부 장치(200)에 입력되는 각종 데이터 등을 기억하는 것이다. 기억부(220)는, 예를 들어 ROM, 플래시 메모리, HDD 등의 불휘발성 기억 장치 및 작업 영역을 구성하는 RAM 등의 휘발성 기억 장치로 구성되어 있다.

기억부(220)는 음향 특징 기억부(21a), 사전 기억부(22a) 및 문법 기억부(23a)를 구비하고 있다. 음향 특징 기억부(21a)는 상술한 음향 특징 기억부(21)와 마찬가지의 데이터를 기억하는 것이다. 사전 기억부(22a)는 상술한 사전 기억부(22)와 마찬가지의 데이터를 기억하는 것이다. 문법 기억부(23a)는 상술한 문법 기억부(23)와 마찬가지의 데이터를 기억하는 것이다.

제어부(210)는 기억부(220)에 기억된 프로그램 또는 데이터에 기초하여, 외부 장치(200)의 각 부를 통괄하여 제어하는 것이다. 프로그램이 실행됨으로써, 제어부(210)에는 음성 인식부(11a)가 구축된다.

음성 인식부(11a)는 음성 구간 검출부(111a), 음향 특징 추출부(112a) 및 음향 특징 비교부(113a)를 구비하고 있다. 음성 구간 검출부(111a)는 상술한 음성 구간 검출부(111)와 마찬가지의 기능을 갖는 것이다. 음향 특징 추출부(112a)는 상술한 음향 특징 추출부(112)와 마찬가지의 기능을 갖는 것이다. 음향 특징 비교부(113a)는 상술한 음향 특징 비교부(113)와 마찬가지의 기능을 갖는 것이다.

이어서, 전자 기기(1a)가 행하는 음성 인식 처리의 흐름 및 효과에 대하여 설명한다.

(처리의 흐름 및 효과)

이하에 나타내는 처리는, 전자 기기(1a)의 제어부(10)가 기억부(20)에 기억된 프로그램을 실행함으로써 이루어진다.

도 9는 전자 기기(1a)가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다. 또한, 실시 형태 1에서 설명한 스텝에 대해서는, 실시 형태 1과 동일한 기능을 갖는 것으로 하고, 특별히 기재하는 경우를 제외하고 설명을 생략한다.

음성 인식부(11a)가 산출한 단어 또는 문장의 확신도가 제1 역치 미만인 경우(S5에서 "아니오"의 경우), 제어부(10)는 통신부(6)를 통하여 음성 입력부(3)로부터 입력된 음성 데이터를 외부 장치(200)에 송신한다(S21).

외부 장치(200)에서는, 음성 인식부(11a)가 도 4 및 도 6에 도시하는 S2 및 S3과 마찬가지의 처리로 음성 인식을 행함으로써, 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출한다. 그리고, 제어부(210)는 통신부(206)를 통하여, 특정한 단어 또는 문장에 관한 정보 및 상기 특정된 단어 또는 문장의 확신도를, 전자 기기(1a)에 대하여 송신한다. 전자 기기(1a)는 외부 장치(200)로부터 상기 정보를 수신한다(S22).

반응 결정부(12a)는 외부 장치(200)로부터 수신한 단어 또는 문장의 확신도가 제1 역치 이상인지 여부를 판단한다(S23). 그리고, 단어 또는 문장의 확신도가 제1 역치 이상인 경우(S23에서 "예"의 경우), 반응 결정부(12a)는 음성 인식한 단어 또는 문장에 대응하는 반응을 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 상기 반응을 행한다(S6).

외부 장치(200)로부터 수신한 단어 또는 문장의 확신도가 제1 역치 미만인 경우(S23에서 "아니오"의 경우), 반응 결정부(12a)는 단어 또는 문장의 확신도가 제2 역치 이상인지 여부를 판단한다(S24). 그리고, 단어 또는 문장의 확신도가 제2 역치 이상인 경우(S24에서 "예"의 경우), 반응 결정부(12a)는 되묻기를 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 상기 반응을 행한다(S8). 한편, 단어 또는 문장의 확신도가 제2 역치 미만인 경우(S24에서 "아니오"의 경우), 반응 결정부(12a)는 음성 인식한 단어 또는 문장에 대응하는 반응 및 되묻기를 모두 실시하지 않을 것을 결정하고, 처리를 종료한다.

이상과 같이 구성되는 전자 기기(1a)에 있어서는, 전자 기기(1a)에서 산출된 단어 또는 문장의 확신도가 제1 역치 이하인 경우, 전자 기기(1a)는 외부 장치(200)에서 산출된 단어 또는 문장의 확신도에 관한 정보를 수신함과 함께, 수신한 정보에 기초하여, 다시, 단어 또는 문장의 확신도가 제1 역치 이하인지 여부를 판단한다. 따라서, 전자 기기(1a)는 전자 기기(1a)에서 행한 음성 인식의 결과에 애매함이 있을 경우, 바로 되묻기를 행하지 않고, 외부 장치(200)를 통하여 다시 음성 인식을 행하므로, 쓸데없는 되묻기를 감소시킬 수 있다.

또한, 외부 장치(200)에 있어서는, 기억부(220)에 기억되어 있는 음향 특징, 사전 및/또는 문법 규칙의 데이터수를, 전자 기기(1a)에 기억되어 있는 데이터수보다도 많게 할 수 있다. 그 경우에는, 전자 기기(1a)만으로 음성 인식을 행하는 경우에 비하여, 음성 인식의 정밀도를 향상시킬 수 있다.

[기타 실시 형태]

상술한 실시 형태에 있어서는, 음성 인식부(11)에 의해 특정된 단어 또는 문장의 확신도가 소정의 범위에 포함될 때, 전자 기기(1)가 유저에 대하여 되묻기를 행하는 경우에 대하여 설명했지만, 특정된 단어 또는 문장의 확신도가 소정의 범위에 포함될 때에도, 소정의 조건을 만족할 때에는, 전자 기기(1)는 되묻기를 행하지 않도록 구성되어도 된다.

여기서, 소정의 조건을 만족할 때란, 예를 들어 전자 기기(1)가 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동하고 있을 때이다. 전자 기기(1)가 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동하면, 상기 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)에 의해 소음이 발생하게 되고, 그 경우에는, 음성 인식의 정밀도가 낮아지므로, 쓸데없는 되묻기를 방지하기 위해서, 되묻기를 행하지 않게 할 수 있다.

또한, 소정의 조건을 만족할 때란, 예를 들어 야간 등의 소정의 시간대이다. 야간 등의 소정의 시간대에 있어서는, 전자 기기(1)가 되묻기를 행하지 않게 함으로써, 유저가 되묻기를 번거롭게 느끼는 것을 방지할 수 있다.

상술한 실시 형태에 있어서는, 전자 기기(1)는 음성 인식부(11)에 의해 특정된 단어 또는 문장의 확신도와 소정의 제1 역치 내지 제4 역치를 비교함으로써, 되묻기의 필요 여부를 판단하는 경우에 대하여 설명했지만, 전자 기기(1)는 음성 인식을 행하는 조건, 또는 특정된 단어 또는 문장의 내용 등에 따라서 제1 역치 내지 제4 역치를 변경하도록 구성되어도 된다.

전자 기기(1)는, 예를 들어 전자 기기(1)가 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동하고 있는 경우, 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동하고 있지 않은 경우에 비하여 제2 역치를 낮은 값 또는 높은 값으로 할 수 있다. 여기서, 제2 역치를 낮은 값으로 할지, 높은 값으로 할지는, 전자 기기(1)의 종류 또는 사용 환경 등에 따라서 적절히 선택하면 된다.

주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)의 구동 중에는, 제2 역치를 낮은 값으로 하는 경우, 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동함으로써 소음이 발생하고, 상기 소음에 의해 전자 기기(1)에서 산출되는 단어 또는 문장의 확신도가 낮아져도, 유저에 대하여 되묻기를 행할 수 있다.

주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)의 구동 중에는, 제2 역치를 높은 값으로 하는 경우, 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동함으로써 소음이 발생하고, 상기 소음에 의해 음성 인식의 정밀도가 저하되었을 때에는, 더 높은 역치로 되묻기의 필요 여부를 판단하므로, 쓸데없는 되묻기를 감소시킬 수 있다.

또한, 전자 기기(1)는, 예를 들어 특정된 단어 또는 문장의 내용이 전자 기기(1)의 동작을 수반하는 것인 경우, 동작을 수반하지 않는 것인 경우에 비하여 제1 역치를 높은 값으로 할 수 있다. 이렇게 전자 기기(1)를 구성한 경우, 특히 오인식을 방지할 필요가 높은 동작을 수반하는 음성 지시에 대한 오인식을 방지할 수 있다.

상술한 실시 형태에 있어서는, 전자 기기(1a)가 통신부(6)를 통하여, 외부 장치(200)에서 특정된 단어 또는 문장 및, 단어 또는 문장의 확신도에 관한 정보를 수신하는 경우에 대하여 설명했지만, 그것에만 한정되지 않는다.

전자 기기(1a)는, 예를 들어 음성 인식 처리에 있어서 참조되는 음향 특징, 사전 및/또는 문법 규칙에 관한 정보를, 외부 장치(200)로부터 수신해도 된다. 이렇게 전자 기기(1a)를 구성한 경우, 전자 기기(1a)로 음성 인식할 수 있는 단어 또는 문장의 수를 증가시킬 수 있다.

또한, 전자 기기(1a)는, 예를 들어 음성 출력부(31)로부터 출력하는 음성에 대응하는 음성 데이터를, 외부 장치(200)로부터 수신해도 된다. 이렇게 전자 기기(1a)를 구성한 경우, 유저는, 음성 출력부(31)로부터 출력하는 음성을 변경할 수 있다.

또한, 수신하는 정보는, 유저가 외부 장치(200)에 의해 작성해도 된다. 구체적으로는, 유저는, 예를 들어 스마트폰 등의 단말 장치를 통하여 외부 장치(200)에 액세스함으로써, 외부 장치(200)에 대하여, 예를 들어 원하는 사전 또는 음성 데이터 등의 정보를 작성하도록 지시한다. 외부 장치(200)의 제어부(210)는 기억부(220)에 기억된 프로그램 또는 데이터에 기초하여 상기 정보를 생성한다. 유저가 원하는 음성 데이터를 작성하는 경우, 유저는 스스로 녹음한 음성 데이터, 인터넷 등을 통하여 취득한 음성 데이터, 또는 음악 CD 등의 음악 데이터 등의 각종 기존의 소리 데이터를 사용할 수 있다.

또한, 작성한 정보는, 상기 정보가 기억된 기록 매체를 전자 기기(1)에 공급함으로써 전자 기기(1)에 제공해도 된다. 여기서, 기록 매체는, 특별히 한정되지 않는다. 기록 매체는, 예를 들어 자기 테이프 등의 테이프, HDD 등의 자기 디스크, CD-ROM 등의 광 디스크, IC 카드 등의 카드, 플래시 ROM 등의 반도체 메모리 또는 PLD(Programmable logic device) 등의 논리 회로 등을 사용할 수 있다.

상술한 실시 형태에 있어서는, 전자 기기로서 청소기에 대하여 설명했지만, 그것에만 한정되지는 않는다. 전자 기기는, TV 또는 PC(Personal Computer) 등의 AVC 기기 또는 전자 조리기 또는 공기 조화기 등의 가전 기기 등이어도 된다.

이상 설명한 바와 같이, 전자 기기는, 입력된 음성을 음성 데이터로 변환하는 음성 입력 수단과, 음성 데이터를 해석함으로써, 상기 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출하는 음성 인식 수단과, 확신도에 기초하여, 유저에 대한 되묻기의 필요 여부를 결정하는 반응 결정 수단과, 되묻기를 행하는 되묻기 수단을 구비하고, 반응 결정 수단은, 확신도가 제2 역치 이상에서 제1 역치 미만인 경우에 되묻기를 행하는 결정을 하고, 확신도가 상기 제2 역치 미만인 경우에 되묻기를 행하지 않는 결정을 한다.

이렇게 전자 기기를 구성함으로써, 단어 또는 문장의 확신도에 애매함이 있을 경우에는, 되묻기를 행함으로써 오인식을 방지함과 함께, 단어 또는 문장의 확신도가 더 낮을 경우에는, 되묻기를 행하지 않게 함으로써, 쓸데없는 되묻기를 감소시킬 수 있다.

또한, 반응 결정 수단은, 상기 확신도에 기초하여 복수의 되묻기를 선택해도 된다.

이렇게 전자 기기를 구성함으로써, 유저는, 되묻기의 음성 및/또는 동작으로부터 전자 기기가 어느 정도 음성 인식하고 있는지를 알 수 있으므로, 예를 들어 다시 음성으로 지시 입력을 행할지, 또는, 패널 조작부 등을 통하여 지시 입력을 행할지를 선택할 수 있어, 유저의 편리성이 향상된다.

또한, 전자 기기는, 음성 데이터를 외부 장치에 대하여 송신함과 함께, 상기 음성 데이터에 포함되는 단어 또는 문장의 확신도를 상기외 장치로부터 수신하는 통신 수단을 더 구비해도 된다.

이렇게 전자 기기를 구성함으로써, 전자 기기는, 전자 기기에서 행한 음성 인식의 결과에 애매함이 있을 경우, 바로 되묻기를 행하지 않고, 외부 장치를 통하여 다시 음성 인식을 행하므로, 쓸데없는 되묻기를 감소시킬 수 있다.

또한, 되묻기 수단은, 소정의 음성 및/또는 동작을 행함으로써 되묻기를 행해도 된다.

또한, 청소기는, 상기 전자 기기 중 어느 하나와, 전자 기기를 자주시키기 위한 자주 수단, 진애를 흡인하기 위한 송풍 수단 및/또는 바닥면을 쓸어서 청소하기 위한 청소 브러시 수단을 구비해도 된다.

이렇게 청소기를 구성함으로써, 청소기는, 자주 수단, 송풍 수단 및/또는 청소 브러시 수단의 구동 등에 의해, 시끄러운 상황에서 사용되는 경우가 많은 청소기에 있어서, 단어 또는 문장의 확신도에 애매함이 있을 경우에는, 되묻기를 행함으로써 오인식을 방지함과 함께, 단어 또는 문장의 확신도가 더 낮은 경우에는, 되묻기를 행하지 않게 하므로, 쓸데없는 되묻기를 감소시킬 수 있다.

또한, 반응 결정 수단은, 자주 수단, 송풍 수단 및/또는 청소 브러시 수단의 구동 중에는 제2 역치를 변경해도 된다.

이렇게 청소기를 구성함으로써, 청소기는, 확신도와 시끄러운 상황에 맞춰서 변경된 제2 역치를 비교함으로써 되묻기의 필요 여부를 판단하므로, 시끄러운 상황에 있어도, 보다 적절하게 되묻기를 행할 수 있다.

금회 개시된 실시 형태는, 모든 점에서 예시이며 제한적인 것이 아니라고 생각해야 한다. 본 발명의 범위는 상기한 설명이 아닌 특허 청구 범위에 의해 나타나고, 특허 청구 범위와 균등한 의미 및 범위 내에서의 모든 변경이 포함되는 것이 의도된다.

본 발명에 따른 전자 기기는, 음성 인식 수단을 구비한 전자 기기 등에 널리 이용 가능하다.

1, 1a: 전자 기기
2: 하우징
2a: 상면
2b: 배기구
2c: 측면
2d: 저면
2e: 흡입구
3: 음성 입력부
6: 통신부
10: 제어부
11, 11a: 음성 인식부
111, 111a: 음성 구간 검출부
112, 112a: 음향 특징 추출부
113, 113a: 음향 특징 비교부
12: 반응 결정부
13: 음성 합성부
14: 동작 생성부
20: 기억부
21, 21a: 음향 특징 기억부
22, 22a: 사전 기억부
23, 23a: 문법 기억부
31: 음성 출력부
32: 주행부
33: 송풍부
34: 청소 브러시부
200: 외부 장치
206: 통신부
210: 제어부
220: 기억부

Claims

입력된 음성을 음성 데이터로 변환하는 음성 입력 수단과,
상기 음성 데이터를 해석함으로써, 상기 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출하는 음성 인식 수단과,
상기 확신도에 기초하여, 유저에 대한 되묻기의 필요 여부를 결정하는 반응 결정 수단과,
상기 되묻기를 행하는 되묻기 수단을 구비하고,
상기 반응 결정 수단은, 상기 확신도가 제2 역치 이상이고 제1 역치 미만인 경우에 되묻기를 행하는 결정을 하고, 상기 확신도가 상기 제2 역치 미만인 경우에 되묻기를 행하지 않는 결정을 하는 것을 특징으로 하는 전자 기기.
제1항에 있어서,
상기 반응 결정 수단은, 상기 확신도에 기초하여 복수의 되묻기를 선택하는 것을 특징으로 하는 전자 기기.
제1항 또는 제2항에 있어서,
상기 음성 데이터를 외부 장치에 대하여 송신함과 함께, 상기 음성 데이터에 포함되는 단어 또는 문장의 확신도를 상기 외부 장치로부터 수신하는 통신 수단을 더 구비하는 것을 특징으로 하는 전자 기기.
제1항 내지 제3항 중 어느 한 항에 기재된 전자 기기와,
상기 전자 기기를 자주시키기 위한 자주 수단, 진애를 흡인하기 위한 송풍 수단 및/또는 바닥면을 쓸어서 청소하기 위한 청소 브러시 수단을 구비하는 것을 특징으로 하는 청소기.
제4항에 있어서,
상기 반응 결정 수단은, 상기 자주 수단, 상기 송풍 수단 및/또는 상기 청소 브러시 수단의 구동 중에는, 상기 제2 역치를 변경하는 것을 특징으로 하는 청소기.