KR20150086339A - 전자 기기 및 청소기 - Google Patents

전자 기기 및 청소기 Download PDF

Info

Publication number
KR20150086339A
KR20150086339A KR1020157016096A KR20157016096A KR20150086339A KR 20150086339 A KR20150086339 A KR 20150086339A KR 1020157016096 A KR1020157016096 A KR 1020157016096A KR 20157016096 A KR20157016096 A KR 20157016096A KR 20150086339 A KR20150086339 A KR 20150086339A
Authority
KR
South Korea
Prior art keywords
voice
unit
degree
word
sentence
Prior art date
Application number
KR1020157016096A
Other languages
English (en)
Other versions
KR101707359B1 (ko
Inventor
가즈노리 야스다
마미 야타케
가즈히로 미키
Original Assignee
샤프 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 샤프 가부시키가이샤 filed Critical 샤프 가부시키가이샤
Publication of KR20150086339A publication Critical patent/KR20150086339A/ko
Application granted granted Critical
Publication of KR101707359B1 publication Critical patent/KR101707359B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L9/00Details or accessories of suction cleaners, e.g. mechanical means for controlling the suction or for effecting pulsating action; Storing devices specially adapted to suction cleaners or parts thereof; Carrying-vehicles specially adapted for suction cleaners
    • A47L9/28Installation of the electric equipment, e.g. adaptation or attachment to the suction cleaner; Controlling suction cleaners by electric means
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L9/00Details or accessories of suction cleaners, e.g. mechanical means for controlling the suction or for effecting pulsating action; Storing devices specially adapted to suction cleaners or parts thereof; Carrying-vehicles specially adapted for suction cleaners
    • A47L9/28Installation of the electric equipment, e.g. adaptation or attachment to the suction cleaner; Controlling suction cleaners by electric means
    • A47L9/2836Installation of the electric equipment, e.g. adaptation or attachment to the suction cleaner; Controlling suction cleaners by electric means characterised by the parts which are controlled
    • A47L9/2842Suction motors or blowers
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L9/00Details or accessories of suction cleaners, e.g. mechanical means for controlling the suction or for effecting pulsating action; Storing devices specially adapted to suction cleaners or parts thereof; Carrying-vehicles specially adapted for suction cleaners
    • A47L9/28Installation of the electric equipment, e.g. adaptation or attachment to the suction cleaner; Controlling suction cleaners by electric means
    • A47L9/2836Installation of the electric equipment, e.g. adaptation or attachment to the suction cleaner; Controlling suction cleaners by electric means characterised by the parts which are controlled
    • A47L9/2847Surface treating elements
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L9/00Details or accessories of suction cleaners, e.g. mechanical means for controlling the suction or for effecting pulsating action; Storing devices specially adapted to suction cleaners or parts thereof; Carrying-vehicles specially adapted for suction cleaners
    • A47L9/28Installation of the electric equipment, e.g. adaptation or attachment to the suction cleaner; Controlling suction cleaners by electric means
    • A47L9/2857User input or output elements for control, e.g. buttons, switches or displays
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L2201/00Robotic cleaning machines, i.e. with automatic control of the travelling movement or the cleaning operation
    • A47L2201/04Automatic control of the travelling movement; Automatic obstacle detection
    • AHUMAN NECESSITIES
    • A47FURNITURE; DOMESTIC ARTICLES OR APPLIANCES; COFFEE MILLS; SPICE MILLS; SUCTION CLEANERS IN GENERAL
    • A47LDOMESTIC WASHING OR CLEANING; SUCTION CLEANERS IN GENERAL
    • A47L2201/00Robotic cleaning machines, i.e. with automatic control of the travelling movement or the cleaning operation
    • A47L2201/06Control of the cleaning action for autonomous devices; Automatic detection of the surface condition before, during or after cleaning
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Abstract

본 발명은 입력된 음성을 음성 데이터로 변환하는 음성 입력 수단(3)과, 음성 데이터를 해석함으로써, 상기 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출하는 음성 인식 수단(11)과, 확신도에 기초하여, 유저에 대한 되묻기의 필요 여부를 결정하는 반응 결정 수단(12)과, 되묻기를 행하는 되묻기 수단(31)을 구비하고, 반응 결정 수단은, 제2 역치 이상에서 제1 역치 미만인 경우에 되묻기를 행하는 결정을 하고, 확신도가 제2 역치 미만인 경우에 되묻기를 행하지 않는 결정을 한다.

Description

전자 기기 및 청소기{ELECTRONIC APPARATUS AND VACUUM CLEANER}
본 발명은 전자 기기 등에 관한 것이고, 특히 음성 인식 수단을 구비한 전자 기기 등에 관한 것이다.
종래, 전자 기기에 대하여 각종 동작의 지시 입력을 행하는 사용자 인터페이스로서, 조작 버튼이나 리모콘 등이 사용되고 있다. 또한, 최근, 유저가 내는 음성에 의해 지시 입력을 행하기 위한 음성 인식 수단을 구비한 전자 기기가 개발되고 있다.
여기서, 음성 인식 수단을 이용한 지시 입력을 행하는 경우, 유저가 내는 음성을 전자 기기가 오인식할 가능성이 있다. 그리고, 전자 기기가 유저가 낸 음성을 오인식한 경우, 전자 기기는, 오인식한 결과에 기초하여 각종 동작을 행하게 되어, 오동작의 우려가 있다. 따라서, 음성 인식 수단을 구비하는 전자 기기의 오인식을 방지하는 기술이 개발되고 있다. 예를 들어, 특허문헌 1에는, 음성을 잘 인식하지 못한 경우, 음성을 낸 유저에게 되묻기를 실시하는 음성 인식 장치가 기재되어 있다.
도 10은 특허문헌 1에 기재된 음성 인식 장치(301)가 구비하는 컨트롤러(302)의 주된 구성을 도시하는 블록도이다. 음성 인식 장치(301)는 음성이 입력되는 마이크로폰(303), 음성 인식한 단어의 확신도를 산출하는 확신도 산출부(304), 확신도 산출부(304)가 산출한 단어의 확신도에 기초하여 대화자가 말을 건 문장을 특정하는 문장 특정부(305), 및 특정된 문장에 포함되는 단어의 확신도에 기초하여, 대화자에게 되묻기의 필요 여부를 판단하는 제1 되묻기 판정부(306)를 구비하고 있다. 그리고, 제1 되묻기 판정부(306)는 단어의 확신도가 소정의 역치 이상인 경우, 되묻기는 불필요하다고 판단함과 함께, 단어의 확신도가 소정의 역치를 만족하지 않는 경우, 유저에 대하여 더 분명히 이야기할 것을 촉구하는 취지의 되묻기가 필요하다고 판단한다.
일본 특허 공개 제2008-52178호 공보(2008년 3월 6일 공개)
그러나, 특허문헌 1에 기재된 음성 인식 장치(301)에서는, 단어의 확신도가 소정의 역치를 만족하지 않으면 반드시 어떠한 되묻기를 행하므로, 음성 인식 장치(301)가 시끄러운 장소에서 이용되었을 경우에는, 유저가 실제로는 음성을 내고 있지 않는데도, 유저가 낸 음성 이외의 소음에 대해서도 음성 인식 장치(301)가 되묻기를 행하는 경우를 생각할 수 있다. 그리고, 그 경우에는, 쓸데없는 되묻기를 유저가 번거롭게 느끼는 경우가 있고, 나아가서는, 음성 인식 기능에 대한 유저의 신뢰성을 손상시킬 우려가 있었다.
본원 발명은, 상기의 사정을 감안하여 이루어진 것이며, 그 목적은, 유저가 낸 음성을 음성 인식할 때, 유저에 대하여 적절하게 되묻기를 행하는 것이 가능한 전자 기기 등을 제공하는 데 있다.
본 발명에 따른 전자 기기는, 입력된 음성을 음성 데이터로 변환하는 음성 입력 수단과, 음성 데이터를 해석함으로써, 상기 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출하는 음성 인식 수단과, 확신도에 기초하여, 유저에 대한 되묻기의 필요 여부를 결정하는 반응 결정 수단과, 되묻기를 행하는 되묻기 수단을 구비하고, 반응 결정 수단은, 확신도가 제2 역치 이상이고 제1 역치 미만인 경우에 되묻기를 행하는 결정을 하고, 확신도가 제2 역치 미만인 경우에 되묻기를 행하지 않는 결정을 한다.
본 발명에 따르면, 유저가 낸 음성을 음성 인식할 때, 유저에 대하여 적절하게 되묻기를 행하는 것이 가능한 전자 기기 등을 제공할 수 있다.
도 1은 본 발명의 실시 형태 1에 관한 전자 기기의 사시도이다.
도 2는 본 발명의 실시 형태 1에 관한 전자 기기의 저면도이다.
도 3은 본 발명의 실시 형태 1에 관한 전자 기기의 주된 구성을 도시하는 블록도이다.
도 4는 본 발명의 실시 형태 1에 관한 전자 기기가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다.
도 5는 본 발명의 실시 형태 1에 관한 전자 기기가 행하는 되묻기의 구체예를 도시하는 모식도이다.
도 6은 본 발명의 실시 형태 2에 관한 전자 기기가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다.
도 7은 본 발명의 실시 형태 2에 관한 전자 기기가 행하는 되묻기의 구체예를 도시하는 모식도이다.
도 8은 본 발명의 실시 형태 3에 관한 전자 기기 및 외부 장치의 주된 구성을 도시하는 블록도이다.
도 9는 본 발명의 실시 형태 3에 관한 전자 기기가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다.
도 10은 특허문헌 1에 기재된 음성 인식 장치가 구비하는 컨트롤러의 주된 구성을 도시하는 블록도이다.
[실시 형태 1]
본 발명의 실시 형태 1에 관한 전자 기기에 대해서, 이하에 설명한다.
실시 형태 1에 관한 전자 기기는, 주행부 및 송풍부를 구비하고, 상기 주행부에 의해 바닥면을 자주(自走)함과 함께, 상기 송풍부에 의해 발생하는 기류로 바닥면의 진애를 흡인하여 청소를 행하는 청소기이다.
또한, 실시 형태 1에 관한 전자 기기는, 음성 인식부를 구비하고 있고, 유저가 낸 음성을 음성 인식하여, 상기 음성에 포함되는 지시에 기초하여 각종 반응을 행한다. 예를 들어, 유저가 낸 음성에 「청소해」가 포함되어 있는 경우, 상기 전자 기기는, 주행부 및 송풍부를 제어함으로써 소정의 청소 동작을 행한다.
또한, 실시 형태 1에 관한 전자 기기는, 음성 인식 시에, 유저에 대한 되묻기가 필요하다고 판단한 경우, 되묻기를 행한다. 여기서, 되묻기란, 유저에 대하여 다시 음성을 낼 것을 촉구하는 것이다. 되묻기는, 예를 들어 음성 및/또는 동작에 의해 행해진다.
실시 형태 1에 관한 전자 기기의 구체적인 구조에 대해서, 도면을 참조하여 이하에 설명한다.
(전자 기기(1)의 구조)
도 1은 실시 형태 1에 관한 전자 기기(1)의 사시도이다. 여기서, 전자 기기(1)가 자주하여 청소를 행할 때의 진행 방향을 전방이라 하고, 도 1에 화살표로 표시한다. 또한, 진행 방향과 역방향을 후방이라 한다.
전자 기기(1)는 평면에서 보아 원형의 하우징(2)을 구비하고 있다. 하우징(2)의 상면(2a)에는, 진애가 제거된 공기가 배기되는 배기구(2b) 및, 전자 기기(1)에 대하여 지시 입력을 행하는 패널 조작부(4)가 설치되어 있다.
패널 조작부(4)는 전자 기기(1)에 대하여 각종 지시 입력을 행하는 조작부 및 각종 정보를 표시하는 표시부를 구비하고 있다. 조작부에는 복수의 조작 버튼이 설치되어 있다. 유저는, 조작부를 통한 지시 입력 및 음성 인식에 의한 지시 입력을 병용할 수 있다.
또한, 하우징(2)의 상면(2a)의 전방측에는, 충전대로부터의 귀환 신호를 수신하는 귀환 신호 수신부(5)가 설치되어 있다. 그리고, 전자 기기(1)는, 예를 들어 바닥면의 청소가 종료되었다고 판단한 경우에, 상기 귀환 신호를 귀환 신호 수신부(5)를 통하여 수신함으로써 자율적으로 충전대로 귀환할 수 있도록 구성되어 있다.
하우징(2)의 측면(2c)은, 전후 방향으로 2분할되어 있다. 측면(2c)의 전방부는, 하우징(2)의 기타 부분에 대하여 전후 방향으로 미끄럼 이동 가능하게 구성되어 있고, 전자 기기(1)가 장해물에 충돌했을 때의 완충 부재로서 기능한다.
또한, 하우징(2)의 측면(2c)에는, 음성 출력부(31)가 설치되어 있다. 음성 출력부(31)는, 예를 들어 음성 또는 음악 등의 소리를 출력하는 것이다. 음성 출력부(31)는, 예를 들어 스피커 등으로 구성되어 있다. 음성 출력부(31)는 본 발명에 따른 되묻기 수단의 일례이다. 전자 기기(1)의 저면에는, 사이드 브러시(34b)가 하우징(2)으로부터 비어져 나오도록 설치되어 있다. 사이드 브러시(34b)에 대해서는 이하에서 상세히 기술한다.
도 2는 전자 기기(1)의 저면도이다. 도 2에 있어서도, 전자 기기(1)가 자주하여 청소를 행할 때의 진행 방향을 화살표로 표시하고 있다. 하우징(2)의 저면(2d)에는, 바닥면의 진애를 흡입하기 위한 흡입구(2e)가 오목 형성되어 있다. 또한, 하우징(2)의 저면(2d)에는 주행부(32), 청소 브러시부(34), 전륜(6a) 및 후륜(6b)이 설치되어 있다.
주행부(32)는 전자 기기(1)를 주행시키는 부분이다. 주행부(32)는, 예를 들어 저면(2d)으로부터 돌출되도록 설치된 구동륜 및 상기 구동륜을 구동하는 모터 등으로 구성된다. 또한, 도 2에 있어서는, 주행부(32) 중, 저면(2d)으로부터 돌출된 구동륜의 일부를 도시하고 있다. 주행부(32)는 본 발명에 따른 주행 수단의 일례이다.
청소 브러시부(34)는 바닥면을 쓸어서 청소하는 부분이다. 청소 브러시부(34)는, 예를 들어 바닥면을 쓰는 브러시 및 브러시를 구동하는 모터 등을 포함한다. 예를 들어, 브러시로서는, 흡입구(2e)에 설치되고, 바닥면과 평행하게 축 지지된 회전축으로 회전하는 회전 브러시(34a) 및, 저면(2d)의 비듬히 앞쪽의 양측에 하우징(2)으로부터 비어져 나오도록 설치되고, 바닥면과 수직으로 축 지지된 회전축으로 회전하는 사이드 브러시(34b)를 사용할 수 있다.
전륜(6a) 및 후륜(6b)은 주행부(32)의 주행에 종동하는 종동륜이다.
이어서, 전자 기기(1)의 구성에 대하여 설명한다. 또한, 도 1 또는 도 2에 있어서 설명한 구성에 대해서는, 동일한 부호를 부여하고 설명을 생략한다.
(전자 기기(1)의 구성)
도 3은 전자 기기(1)의 주된 구성을 도시하는 블록도이다. 전자 기기(1)는 음성 입력부(3) 및 송풍부(33)를 구비하고 있다.
음성 입력부(3)는 음성이 입력됨과 함께, 입력된 음성을 디지털 변환하여, 음성 데이터를 생성하는 부분이다. 음성 입력부(3)는, 예를 들어 마이크로폰 등 및 아날로그/디지털 변환 장치 등으로 구성된다. 마이크로폰으로서는, 소정의 방향으로부터 도래하는 음성을, 특히 고감도로 집음하는 지향성 마이크로폰을 사용해도 되고, 음성이 도래하는 방향에 관계없이 일정한 감도로 음성을 집음하는 무지향성 마이크로폰을 사용해도 된다. 음성 입력부(3)는, 예를 들어 하우징(2)의 상면(2a)의 이측에 설치할 수 있다.
송풍부(33)는 진애를 흡인하기 위한 기류를 발생시키는 것이다. 발생한 기류는, 흡입구(2e)로부터 도시하지 않은 집진부에 유도되고, 집진부에 의해 진애가 분리된 후, 배기구(2b)로부터 전자 기기(1)의 기외로 배출된다.
전자 기기(1)는, 기억부(20)를 더 구비하고 있다. 이하에 있어서 기억부(20)에 대하여 상세하게 설명한다.
(기억부(20)의 구성)
기억부(20)는 후술하는 제어부(10)가 실행하는 각종 프로그램, 각종 프로그램을 실행할 때 사용 및 작성되는 각종 데이터 및, 전자 기기(1)에 입력되는 각종 데이터 등등을 기억하는 것이다. 기억부(20)는, 예를 들어 ROM(Read Only Memory), 플래시 메모리 또는 HDD(Hard Disk Drive) 등의 불휘발성 기억 장치 및 작업 영역을 구성하는 RAM(Random Access Memory) 등의 휘발성 기억 장치로 구성되어 있다.
기억부(20)는 음향 특징 기억부(21), 사전 기억부(22) 및 문법 기억부(23)를 구비하고 있다.
음향 특징 기억부(21)는 음성 인식하는 음성의 음향적인 특징을 나타내는 음향 특징을 기억하고 있는 부분이다. 음향 특징의 종류는 적절히 선택할 수 있다. 음향 특징은, 예를 들어 음성 파형 또는 음성의 파워의 주파수 스펙트럼 등이다. 이하에서 상세히 기술하겠지만, 음성 인식부(11)는 음성 입력부(3)에서 생성된 음성 데이터에 포함되는 음향 특징과, 음향 특징 기억부(21)에 기억되어 있는 음향 특징을 비교함으로써 유저가 낸 음성을 음성 인식한다.
사전 기억부(22)는 음성 인식 대상의 각 단어 및 상기 단어에 관한 음운 정보 등이 등록된 사전을 기억하고 있는 부분이다.
문법 기억부(23)는 사전 기억부(22)의 사전에 등록되어 있는 각 단어가 어떻게 연쇄되는지를 기술한 문법 규칙을 기억하고 있는 부분이다. 문법 규칙은, 예를 들어 통계적으로 구해진 각 단어가 연쇄될 확률에 기초하는 것이다.
전자 기기(1)는 제어부(10)을 더 구비하고 있다. 이하에 있어서 제어부(10)에 대하여 상세하게 설명한다.
(제어부(10)의 구성)
제어부(10)는 기억부(20)에 기억된 프로그램 또는 데이터에 기초하여, 전자 기기(1)의 각 부를 통괄하여 제어하는 것이다. 프로그램이 실행됨으로써, 제어부(10)에는 음성 인식부(11), 반응 결정부(12), 음성 합성부(13) 및 동작 생성부(14)가 구축된다.
음성 인식부(11)는 유저가 낸 음성에 대하여 음성 인식을 행하는 부분이다. 음성 인식부(11)는 음성 인식의 결과로서, 음성 데이터에 포함되는 단어 또는 문장에 관한 정보 및, 단어 또는 문장의 확신도를 출력한다. 음성 인식부(11)는 음성 구간 검출부(111), 음향 특징 추출부(112) 및 음향 특징 비교부(113)를 구비하고 있다. 여기서, 단어 또는 문장에 관한 정보에는, 예를 들어 상기 단어 또는 문장의 음운 정보가 포함된다.
음성 구간 검출부(111)는 음성 인식하는 음성의 개시 및 종료를 검출하는 부분이다. 음성 구간 검출부(111)는 음성이 검출되지 않은 경우에는, 음성 입력부(3)에서 생성된 음성 데이터의 파워가, 기억부(20)에 기억되어 있는 소정의 역치 이상인지 여부를 감시한다. 그리고, 음성 구간 검출부(111)는 음성 데이터의 파워가 상기 역치 이상이 된 시점에서 음성이 검출되었다고 판단한다. 또한, 음성 구간 검출부(111)는 음성 데이터의 파워가 상기 역치 미만이 된 시점에서 음성이 종료되었다고 판단한다.
음향 특징 추출부(112)는 음성 입력부(3)에서 생성된 음성 데이터에 대해서, 적당한 프레임마다 음향 특징을 추출하는 부분이다.
음향 특징 비교부(113)는 음향 특징 추출부(112)가 추출한 음향 특징과 음향 특징 기억부(21)가 기억하는 음향 특징을 비교하여, 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출하는 부분이다. 음향 특징 비교부(113)는 사전 기억부(22)에 기억된 사전 및/또는 문법 기억부(23)에 기억된 문법 규칙을, 필요에 따라 참조할 수 있다. 음향 특징 비교부(113)에 의해 특정된 단어 또는 문장 및 상기 특정된 단어 또는 문장의 확신도에 관한 정보는, 반응 결정부(12)에 출력된다.
여기서, 음향 특징 비교부(113)가 행하는 처리의 구체예에 대하여 설명한다. 음향 특징 비교부(113)는 음향 특징 추출부(112)가 추출한 프레임마다, 음성 데이터로부터 추출된 음향 특징과 음향 특징 기억부(21)에 기억된 음향 특징을 비교한다. 그리고, 음향 특징 비교부(113)는 기억부(20)에 기억된 후보가 되는 단어 각각에 대하여 단어의 확신도를 산출함과 함께, 단어의 확신도가 가장 높은 단어를 특정한다. 또한, 음향 특징 비교부(113)는 사전 기억부(22)에 기억되어 있는 사전을 참조하여, 특정한 단어의 음운 정보를 취득한다.
또한, 음향 특징 추출부(112)가 복수의 프레임을 추출한 경우, 음향 특징 비교부(113)는 복수의 프레임마다 결정된 단어를 적절히 접속하여 문장을 작성한다. 그리고, 음향 특징 비교부(113)는 작성된 문장마다 문장의 확신도를 산출함과 함께, 문장의 확신도가 가장 높은 문장을 특정한다. 여기서, 음향 특징 비교부(113)는 문법 기억부(23)에 기억되어 있는 문법 규칙을 참조함으로써, 문장의 확신도를 산출할 수 있다.
반응 결정부(12)는 음성 인식부(11)로부터 입력된 음성 인식의 결과에 기초하여, 전자 기기(1)의 반응을 결정하는 부분이다. 구체적으로는, 반응 결정부(12)는 특정된 단어 또는 문장의 확신도에 기초하여, 전자 기기(1)의 반응을 결정한다. 즉, 특정된 단어 또는 문장의 확신도가, 음성 인식의 결과에 애매함이 없을 정도로 높은 경우에는, 반응 결정부(12)는 단어 또는 문장에 대응하는 반응을 행할 것을 결정한다. 또한, 음성 인식된 단어 또는 문장의 확신도가, 음성 인식의 결과에 애매함이 어느 정도 있는 경우에는, 반응 결정부(12)는 되묻기를 행할 것을 결정한다. 또한, 음성 인식된 단어 또는 문장의 확신도가 더 낮은 경우에는, 반응 결정부(12)는, 단어 또는 문장에 대응하는 반응 및 되묻기를 모두 실시하지 않을 것을 결정한다.
음성 합성부(13)는 반응 결정부(12)에 의해 결정된 반응에 대응하는 음성 데이터를 합성하는 부분이다. 음성 합성부(13)는 합성한 음성 데이터를 음성 출력부(31)에 출력한다. 음성 합성부(13)는 사전 기억부(22)에 기억된 사전 및/또는 문법 기억부(23)에 기억된 문법 규칙을, 필요에 따라 참조할 수 있다.
동작 생성부(14)는 반응 결정부(12)에 의해 결정된 반응에 대응하는 동작 패턴을 생성하는 부분이다. 동작 생성부(14)는 생성한 동작 패턴을 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)에 출력한다.
이어서, 전자 기기(1)가 행하는 음성 인식 처리의 흐름 및 효과에 대하여 설명한다.
(처리의 흐름 및 효과)
이하에 나타내는 처리는, 전자 기기(1)의 제어부(10)가 기억부(20)에 기억된 프로그램을 실행함으로써 이루어진다.
도 4는 전자 기기(1)가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다. 또한, 도 4 및 그 이후에서 설명하는 흐름도에 있어서, 「스텝」을 「S」로 나타낸다. 또한, 문장 중에서도 「S」는 「스텝」을 나타내고 있다.
먼저, 음성 구간 검출부(111)는 음성 입력부(3)로부터 입력되는 음성 데이터를 감시하여, 음성 인식하는 음성이 검출되었는지 여부를 판단한다(S1).
음성이 검출된 경우(S1에서 "예"의 경우), 음향 특징 추출부(112)는 음성 입력부(3)로부터 입력된 음성 데이터에 대해서, 적당한 프레임마다 음향적인 특징을 나타내는 음향 특징을 추출한다(S2). 한편, 음성이 검출되지 않은 경우(S1에서 "아니오"의 경우), 음성 구간 검출부(111)는 음성 입력부(3)로부터 입력되는 음성 데이터의 감시를 계속한다.
이어서, 음향 특징 비교부(113)는 음향 특징 추출부(112)가 추출한 음향 특징과, 음향 특징 기억부(21)가 기억하는 음향 특징을 비교하여, 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출한다(S3).
음성 구간 검출부(111)는 음성 입력부(3)로부터 입력된 음성 데이터를 감시하고, 음성 인식하는 음성이 종료되었는지 여부를 판단한다(S4). 음성의 종료가 검출되지 않은 경우(S4에서 "아니오"의 경우), 음성 구간 검출부(111)는 음성 입력부(3)로부터 입력되는 음성 데이터의 감시를 계속한다. 또한, 여기서, 음성 구간 검출부(111)가 새로운 음성을 검출한 경우, 음성 인식부(11)는 먼저 검출된 음성에 대하여 산출된 확신도를 반응 결정부(12)에 출력해도 되고, 나중에 검출된 음성에 대하여 산출된 확신도를 반응 결정부(12)에 출력해도 되며, 또는, 먼저 검출된 음성에 대하여 산출된 확신도 및 나중에 검출된 음성에 대하여 산출된 확신도를 반응 결정부(12)에 출력해도 된다.
음성의 종료가 검출된 경우(S4에서 "예"의 경우), 반응 결정부(12)는 음향 특징 비교부(113)에 의해 특정된 단어 또는 문장의 확신도가 제1 역치 이상인지 여부를 판단한다(S5). 그리고, 단어 또는 문장의 확신도가 제1 역치 이상인 경우, 반응 결정부(12)는 음성 인식한 단어 또는 문장에 대응하는 반응을 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 상기 반응을 행한다(S6).
음향 특징 비교부(113)에 의해 특정된 단어 또는 문장의 확신도가 제1 역치 미만인 경우(S5에서 "아니오"의 경우), 반응 결정부(12)는 단어 또는 문장의 확신도가 제2 역치 이상인지 여부를 판단한다(S7). 그리고, 단어 또는 문장의 확신도가 제2 역치 이상인 경우(S7에서 "예"의 경우), 반응 결정부(12)는 되묻기를 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 되묻기를 행한다(S8). 한편, 단어 또는 문장의 확신도가 제2 역치 미만인 경우(S7에서 "아니오"의 경우), 반응 결정부(12)는 단어 또는 문장에 대응하는 반응 및 되묻기를 모두 실시하지 않을 것을 결정하고, 처리를 종료한다. 또한, 제2 역치는, 제1 역치보다도 작은 값이다.
도 5는 전자 기기(1)가 행하는 되묻기의 구체예를 도시하는 모식도이고, 도 5의 (a)는 음성으로 되묻기를 행하는 경우, 도 5의 (b)는 동작으로 되묻기를 행하는 경우, 도 5의 (c)는 음성 및 동작으로 되묻기를 행하는 경우를 도시하고 있다.
음성으로 되묻기를 행하는 경우, 음성 합성부(13)는, 예를 들어 「뭐라구요?」에 대응하는 음성 데이터를 합성하고, 음성 출력부(31)에 출력한다. 음성 출력부(31)는 입력된 음성 데이터를 아날로그 변환하여, 「뭐라구요?」를 음성 출력한다.
동작으로 되묻기를 행할 경우, 동작 생성부(14)는, 예를 들어 전자 기기(1)를 그 자리에서 좌우로 일정 각도씩 회전시키는 동작 패턴을 생성하고, 주행부(32)를 상기 동작 패턴으로 주행하도록 제어한다.
이상과 같이 구성되는 전자 기기(1)에 있어서는, 음성 인식부(11)에 의해 특정된 단어 또는 문장의 확신도가 제1 역치 이하이고, 또한, 제2 역치 이상일 경우에, 전자 기기(1)가 유저에 대하여 되묻기를 행한다. 따라서, 전자 기기(1)는 단어 또는 문장의 확신도에 애매함이 있는 경우에는, 되묻기를 행함으로써 오인식을 방지함과 함께, 단어 또는 문장의 확신도가 더 낮은 경우에는, 되묻기를 행하지 않게 함으로써, 쓸데없는 되묻기를 감소시킬 수 있다.
또한, 본 실시 형태의 전자 기기(1)에서는, 소정의 범위의 확신도에서, 단어 또는 문장이 한번이라도 음성 인식되면, 전자 기기(1)가 되묻기를 행하는 경우에 대하여 설명했지만, 이것에만 한정되지는 않는다. 예를 들어, 전자 기기(1)는 소정의 범위의 확신도에서, 단어 또는 문장이 복수회, 또한 연속적으로 음성 인식되었을 때 되묻기를 행하도록 해도 된다. 이렇게 전자 기기(1)를 구성함으로써, 쓸데없는 되묻기를 더 감소시킬 수 있다.
[실시 형태 2]
본 발명의 실시 형태 2에 관한 전자 기기(1)에 대해서, 도면을 참조하여 설명한다. 본 발명에 따른 전자 기기(1)는 음성 인식부(11)가 음성 인식한 단어 또는 문장의 확신도에 기초하여 상이한 되묻기를 행하는 점에서 상술한 실시 형태와 상이하다. 또한, 실시 형태 1에서 설명한 구성 요소에 대해서는, 실시 형태 1과 동일한 기능을 갖는 것으로 하고, 특별히 기재하는 경우를 제외하고 설명을 생략한다.
도 6은 전자 기기(1)가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다. 또한, 실시 형태 1에서 설명한 스텝에 대해서는, 실시 형태 1과 동일한 기능을 갖는 것으로 하고, 특별히 기재하는 경우를 제외하고 설명을 생략한다.
음성 인식부(11)가 산출한 단어 또는 문장의 확신도가 제1 역치 미만인 경우(S5에서 "아니오"의 경우), 반응 결정부(12)는 단어 또는 문장의 확신도가 제3 역치 이상인지 여부를 판단한다(S11). 그리고, 단어 또는 문장의 확신도가 제3 역치 이상인 경우(S11에서 "예"의 경우), 반응 결정부(12)는 제1 되묻기를 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 상기 반응을 행한다(S12). 또한, 제3 역치는, 제1 역치보다도 작은 값이다.
음성 인식부(11)가 산출한 단어 또는 문장의 확신도가 제3 역치 미만인 경우(S11에서 "아니오"의 경우), 반응 결정부(12)는 단어 또는 문장의 확신도가 제4 역치 이상인지 여부를 판단한다(S13). 그리고, 단어 또는 문장의 확신도가 제4 역치 이상인 경우(S13에서 "예"의 경우), 반응 결정부(12)는 제2 되묻기를 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 상기 반응을 행한다(S14). 또한, 제4 역치는, 제3 역치보다도 작은 값이다.
음성 인식부(11)가 산출한 단어 또는 문장의 확신도가 제4 역치 미만인 경우(S13에서 "아니오"의 경우), 반응 결정부(12)는 음성 인식한 단어 또는 문장에 대응하는 반응 및 되묻기를 모두 실시하지 않을 것을 결정하고, 처리를 종료한다.
도 7은 전자 기기(1)가 행하는 되묻기의 구체예를 도시하는 모식도이고, 도 7의 (a)는 제1 되묻기를 행하는 경우, 도 7의 (b)는 제2 되묻기를 행하는 경우를 도시하고 있다.
제1 되묻기를 행하는 경우, 음성 합성부(13)는, 예를 들어 「청소하라구요?」에 대응하는 음성 데이터를 합성하고, 음성 출력부(31)에 출력한다. 음성 출력부(31)는 입력된 음성 데이터를 아날로그 변환하여, 「청소하라구요?」를 음성 출력한다.
본 실시 형태에 있어서는, 제1 되묻기의 음성은, 음성 인식부(11)에서 특정된 가장 확신도가 높은 단어 또는 문장에 기초하여 음성 합성된다. 예를 들어, 가장 확신도가 높은 문장이, 「청소해」일 경우, 반응 결정부(12)는 상기 문장에 기초하여 「청소하라구요」라고 되묻기를 행할 것을 결정한다.
제2 되묻기를 행하는 경우, 음성 합성부(13)는 「뭐라구요?」에 대응하는 음성 데이터를 합성하고, 음성 출력부(31)에 출력한다. 음성 출력부(31)는 입력된 음성 데이터를 아날로그 변환하여, 「뭐라구요?」를 음성 출력한다.
이상과 같이 구성되는 전자 기기(1)에 있어서는, 음성 인식부(11)가 음성 인식한 단어 또는 문장의 확신도에 기초하여 전자 기기(1)가 상이한 되묻기를 행한다. 따라서, 유저는, 되묻기의 음성 및/또는 동작으로부터 전자 기기(1)가 어느 정도 음성 인식하고 있는지를 알 수 있으므로, 예를 들어 다시 음성으로 지시 입력을 행할 것인지, 또는, 패널 조작부(4) 등을 통하여 지시 입력을 할지 등을 선택할 수 있어, 유저의 편리성이 향상된다.
[실시 형태 3]
본 발명의 실시 형태 3에 관한 전자 기기(1a)에 대해서, 도면을 참조하여 설명한다. 본 발명에 따른 전자 기기(1a)는 외부 장치(200)와 통신을 행하는 통신부(6)를 구비하고, 외부 장치(200)와 통신을 행함으로써, 유저가 낸 음성의 음성 인식 처리를, 외부 장치(200)에서도 행하는 점에서 상술한 모든 실시 형태와 상이하다. 또한, 실시 형태 1에서 설명한 구성 요소에 대해서는, 실시 형태 1과 동일한 기능을 갖는 것으로 하고, 특별히 기재하는 경우를 제외하고 설명을 생략한다.
(전자 기기(1a) 및 외부 장치(200)의 구성)
도 8은 전자 기기(1a) 및 외부 장치(200)의 주된 구성을 도시하는 블록도이다. 전자 기기(1a)는 실시 형태 1에서 설명한 구성 요소에 더하여, 통신부(6)를 더 구비하고 있다. 또한, 도 8에 있어서는, 실시 형태 1에서 설명한 구성 요소 중 일부만을 도시하고 있다.
통신부(6)는 외부 장치(200)와의 사이에서 정보의 송수신을 행하는 것이다. 통신부(6)는 통신망(300)에 접속되어 있고, 통신망(300)을 통하여 외부 장치(200)와 접속되어 있다.
통신망(300)은 한정되는 것이 아니라, 적절히 선택할 수 있다. 통신망(300)은, 예를 들어 인터넷을 사용할 수 있다. 또한, 통신망(300)은 IrDA나 리모콘과 같은 적외선, Bluetooth(등록 상표), WiFi(등록 상표) 또는 IEEE802.11 등의 무선을 사용해도 된다.
반응 결정부(12a)는 음성 인식부(11)로부터 입력되는 음성 인식의 결과 및, 후술하는 외부 장치(200)의 음성 인식부(11a)로부터 수신한 음성 인식의 결과에 기초하여, 전자 기기(1a)의 반응을 결정하는 부분이다.
외부 장치(200)는 통신부(206), 기억부(220) 및 제어부(210)를 구비하고 있다. 통신부(206)는 전자 기기(1a)와의 사이에서 정보의 송수신을 행하는 것이다. 통신부(206)는 통신망(300)에 접속되어 있고, 통신망(300)을 통하여 전자 기기(1a)와 접속되어 있다.
기억부(220)는 후술하는 제어부(210)가 실행하는 각종 프로그램, 각종 프로그램을 실행할 때 사용 및 작성되는 각종 데이터 및 외부 장치(200)에 입력되는 각종 데이터 등을 기억하는 것이다. 기억부(220)는, 예를 들어 ROM, 플래시 메모리, HDD 등의 불휘발성 기억 장치 및 작업 영역을 구성하는 RAM 등의 휘발성 기억 장치로 구성되어 있다.
기억부(220)는 음향 특징 기억부(21a), 사전 기억부(22a) 및 문법 기억부(23a)를 구비하고 있다. 음향 특징 기억부(21a)는 상술한 음향 특징 기억부(21)와 마찬가지의 데이터를 기억하는 것이다. 사전 기억부(22a)는 상술한 사전 기억부(22)와 마찬가지의 데이터를 기억하는 것이다. 문법 기억부(23a)는 상술한 문법 기억부(23)와 마찬가지의 데이터를 기억하는 것이다.
제어부(210)는 기억부(220)에 기억된 프로그램 또는 데이터에 기초하여, 외부 장치(200)의 각 부를 통괄하여 제어하는 것이다. 프로그램이 실행됨으로써, 제어부(210)에는 음성 인식부(11a)가 구축된다.
음성 인식부(11a)는 음성 구간 검출부(111a), 음향 특징 추출부(112a) 및 음향 특징 비교부(113a)를 구비하고 있다. 음성 구간 검출부(111a)는 상술한 음성 구간 검출부(111)와 마찬가지의 기능을 갖는 것이다. 음향 특징 추출부(112a)는 상술한 음향 특징 추출부(112)와 마찬가지의 기능을 갖는 것이다. 음향 특징 비교부(113a)는 상술한 음향 특징 비교부(113)와 마찬가지의 기능을 갖는 것이다.
이어서, 전자 기기(1a)가 행하는 음성 인식 처리의 흐름 및 효과에 대하여 설명한다.
(처리의 흐름 및 효과)
이하에 나타내는 처리는, 전자 기기(1a)의 제어부(10)가 기억부(20)에 기억된 프로그램을 실행함으로써 이루어진다.
도 9는 전자 기기(1a)가 행하는 음성 인식 처리의 흐름을 나타내는 흐름도이다. 또한, 실시 형태 1에서 설명한 스텝에 대해서는, 실시 형태 1과 동일한 기능을 갖는 것으로 하고, 특별히 기재하는 경우를 제외하고 설명을 생략한다.
음성 인식부(11a)가 산출한 단어 또는 문장의 확신도가 제1 역치 미만인 경우(S5에서 "아니오"의 경우), 제어부(10)는 통신부(6)를 통하여 음성 입력부(3)로부터 입력된 음성 데이터를 외부 장치(200)에 송신한다(S21).
외부 장치(200)에서는, 음성 인식부(11a)가 도 4 및 도 6에 도시하는 S2 및 S3과 마찬가지의 처리로 음성 인식을 행함으로써, 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출한다. 그리고, 제어부(210)는 통신부(206)를 통하여, 특정한 단어 또는 문장에 관한 정보 및 상기 특정된 단어 또는 문장의 확신도를, 전자 기기(1a)에 대하여 송신한다. 전자 기기(1a)는 외부 장치(200)로부터 상기 정보를 수신한다(S22).
반응 결정부(12a)는 외부 장치(200)로부터 수신한 단어 또는 문장의 확신도가 제1 역치 이상인지 여부를 판단한다(S23). 그리고, 단어 또는 문장의 확신도가 제1 역치 이상인 경우(S23에서 "예"의 경우), 반응 결정부(12a)는 음성 인식한 단어 또는 문장에 대응하는 반응을 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 상기 반응을 행한다(S6).
외부 장치(200)로부터 수신한 단어 또는 문장의 확신도가 제1 역치 미만인 경우(S23에서 "아니오"의 경우), 반응 결정부(12a)는 단어 또는 문장의 확신도가 제2 역치 이상인지 여부를 판단한다(S24). 그리고, 단어 또는 문장의 확신도가 제2 역치 이상인 경우(S24에서 "예"의 경우), 반응 결정부(12a)는 되묻기를 행할 것을 결정하고, 음성 합성부(13) 및 동작 생성부(14)를 통하여 상기 반응을 행한다(S8). 한편, 단어 또는 문장의 확신도가 제2 역치 미만인 경우(S24에서 "아니오"의 경우), 반응 결정부(12a)는 음성 인식한 단어 또는 문장에 대응하는 반응 및 되묻기를 모두 실시하지 않을 것을 결정하고, 처리를 종료한다.
이상과 같이 구성되는 전자 기기(1a)에 있어서는, 전자 기기(1a)에서 산출된 단어 또는 문장의 확신도가 제1 역치 이하인 경우, 전자 기기(1a)는 외부 장치(200)에서 산출된 단어 또는 문장의 확신도에 관한 정보를 수신함과 함께, 수신한 정보에 기초하여, 다시, 단어 또는 문장의 확신도가 제1 역치 이하인지 여부를 판단한다. 따라서, 전자 기기(1a)는 전자 기기(1a)에서 행한 음성 인식의 결과에 애매함이 있을 경우, 바로 되묻기를 행하지 않고, 외부 장치(200)를 통하여 다시 음성 인식을 행하므로, 쓸데없는 되묻기를 감소시킬 수 있다.
또한, 외부 장치(200)에 있어서는, 기억부(220)에 기억되어 있는 음향 특징, 사전 및/또는 문법 규칙의 데이터수를, 전자 기기(1a)에 기억되어 있는 데이터수보다도 많게 할 수 있다. 그 경우에는, 전자 기기(1a)만으로 음성 인식을 행하는 경우에 비하여, 음성 인식의 정밀도를 향상시킬 수 있다.
[기타 실시 형태]
상술한 실시 형태에 있어서는, 음성 인식부(11)에 의해 특정된 단어 또는 문장의 확신도가 소정의 범위에 포함될 때, 전자 기기(1)가 유저에 대하여 되묻기를 행하는 경우에 대하여 설명했지만, 특정된 단어 또는 문장의 확신도가 소정의 범위에 포함될 때에도, 소정의 조건을 만족할 때에는, 전자 기기(1)는 되묻기를 행하지 않도록 구성되어도 된다.
여기서, 소정의 조건을 만족할 때란, 예를 들어 전자 기기(1)가 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동하고 있을 때이다. 전자 기기(1)가 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동하면, 상기 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)에 의해 소음이 발생하게 되고, 그 경우에는, 음성 인식의 정밀도가 낮아지므로, 쓸데없는 되묻기를 방지하기 위해서, 되묻기를 행하지 않게 할 수 있다.
또한, 소정의 조건을 만족할 때란, 예를 들어 야간 등의 소정의 시간대이다. 야간 등의 소정의 시간대에 있어서는, 전자 기기(1)가 되묻기를 행하지 않게 함으로써, 유저가 되묻기를 번거롭게 느끼는 것을 방지할 수 있다.
상술한 실시 형태에 있어서는, 전자 기기(1)는 음성 인식부(11)에 의해 특정된 단어 또는 문장의 확신도와 소정의 제1 역치 내지 제4 역치를 비교함으로써, 되묻기의 필요 여부를 판단하는 경우에 대하여 설명했지만, 전자 기기(1)는 음성 인식을 행하는 조건, 또는 특정된 단어 또는 문장의 내용 등에 따라서 제1 역치 내지 제4 역치를 변경하도록 구성되어도 된다.
전자 기기(1)는, 예를 들어 전자 기기(1)가 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동하고 있는 경우, 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동하고 있지 않은 경우에 비하여 제2 역치를 낮은 값 또는 높은 값으로 할 수 있다. 여기서, 제2 역치를 낮은 값으로 할지, 높은 값으로 할지는, 전자 기기(1)의 종류 또는 사용 환경 등에 따라서 적절히 선택하면 된다.
주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)의 구동 중에는, 제2 역치를 낮은 값으로 하는 경우, 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동함으로써 소음이 발생하고, 상기 소음에 의해 전자 기기(1)에서 산출되는 단어 또는 문장의 확신도가 낮아져도, 유저에 대하여 되묻기를 행할 수 있다.
주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)의 구동 중에는, 제2 역치를 높은 값으로 하는 경우, 주행부(32), 송풍부(33) 및/또는 청소 브러시부(34)를 구동함으로써 소음이 발생하고, 상기 소음에 의해 음성 인식의 정밀도가 저하되었을 때에는, 더 높은 역치로 되묻기의 필요 여부를 판단하므로, 쓸데없는 되묻기를 감소시킬 수 있다.
또한, 전자 기기(1)는, 예를 들어 특정된 단어 또는 문장의 내용이 전자 기기(1)의 동작을 수반하는 것인 경우, 동작을 수반하지 않는 것인 경우에 비하여 제1 역치를 높은 값으로 할 수 있다. 이렇게 전자 기기(1)를 구성한 경우, 특히 오인식을 방지할 필요가 높은 동작을 수반하는 음성 지시에 대한 오인식을 방지할 수 있다.
상술한 실시 형태에 있어서는, 전자 기기(1a)가 통신부(6)를 통하여, 외부 장치(200)에서 특정된 단어 또는 문장 및, 단어 또는 문장의 확신도에 관한 정보를 수신하는 경우에 대하여 설명했지만, 그것에만 한정되지 않는다.
전자 기기(1a)는, 예를 들어 음성 인식 처리에 있어서 참조되는 음향 특징, 사전 및/또는 문법 규칙에 관한 정보를, 외부 장치(200)로부터 수신해도 된다. 이렇게 전자 기기(1a)를 구성한 경우, 전자 기기(1a)로 음성 인식할 수 있는 단어 또는 문장의 수를 증가시킬 수 있다.
또한, 전자 기기(1a)는, 예를 들어 음성 출력부(31)로부터 출력하는 음성에 대응하는 음성 데이터를, 외부 장치(200)로부터 수신해도 된다. 이렇게 전자 기기(1a)를 구성한 경우, 유저는, 음성 출력부(31)로부터 출력하는 음성을 변경할 수 있다.
또한, 수신하는 정보는, 유저가 외부 장치(200)에 의해 작성해도 된다. 구체적으로는, 유저는, 예를 들어 스마트폰 등의 단말 장치를 통하여 외부 장치(200)에 액세스함으로써, 외부 장치(200)에 대하여, 예를 들어 원하는 사전 또는 음성 데이터 등의 정보를 작성하도록 지시한다. 외부 장치(200)의 제어부(210)는 기억부(220)에 기억된 프로그램 또는 데이터에 기초하여 상기 정보를 생성한다. 유저가 원하는 음성 데이터를 작성하는 경우, 유저는 스스로 녹음한 음성 데이터, 인터넷 등을 통하여 취득한 음성 데이터, 또는 음악 CD 등의 음악 데이터 등의 각종 기존의 소리 데이터를 사용할 수 있다.
또한, 작성한 정보는, 상기 정보가 기억된 기록 매체를 전자 기기(1)에 공급함으로써 전자 기기(1)에 제공해도 된다. 여기서, 기록 매체는, 특별히 한정되지 않는다. 기록 매체는, 예를 들어 자기 테이프 등의 테이프, HDD 등의 자기 디스크, CD-ROM 등의 광 디스크, IC 카드 등의 카드, 플래시 ROM 등의 반도체 메모리 또는 PLD(Programmable logic device) 등의 논리 회로 등을 사용할 수 있다.
상술한 실시 형태에 있어서는, 전자 기기로서 청소기에 대하여 설명했지만, 그것에만 한정되지는 않는다. 전자 기기는, TV 또는 PC(Personal Computer) 등의 AVC 기기 또는 전자 조리기 또는 공기 조화기 등의 가전 기기 등이어도 된다.
이상 설명한 바와 같이, 전자 기기는, 입력된 음성을 음성 데이터로 변환하는 음성 입력 수단과, 음성 데이터를 해석함으로써, 상기 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출하는 음성 인식 수단과, 확신도에 기초하여, 유저에 대한 되묻기의 필요 여부를 결정하는 반응 결정 수단과, 되묻기를 행하는 되묻기 수단을 구비하고, 반응 결정 수단은, 확신도가 제2 역치 이상에서 제1 역치 미만인 경우에 되묻기를 행하는 결정을 하고, 확신도가 상기 제2 역치 미만인 경우에 되묻기를 행하지 않는 결정을 한다.
이렇게 전자 기기를 구성함으로써, 단어 또는 문장의 확신도에 애매함이 있을 경우에는, 되묻기를 행함으로써 오인식을 방지함과 함께, 단어 또는 문장의 확신도가 더 낮을 경우에는, 되묻기를 행하지 않게 함으로써, 쓸데없는 되묻기를 감소시킬 수 있다.
또한, 반응 결정 수단은, 상기 확신도에 기초하여 복수의 되묻기를 선택해도 된다.
이렇게 전자 기기를 구성함으로써, 유저는, 되묻기의 음성 및/또는 동작으로부터 전자 기기가 어느 정도 음성 인식하고 있는지를 알 수 있으므로, 예를 들어 다시 음성으로 지시 입력을 행할지, 또는, 패널 조작부 등을 통하여 지시 입력을 행할지를 선택할 수 있어, 유저의 편리성이 향상된다.
또한, 전자 기기는, 음성 데이터를 외부 장치에 대하여 송신함과 함께, 상기 음성 데이터에 포함되는 단어 또는 문장의 확신도를 상기외 장치로부터 수신하는 통신 수단을 더 구비해도 된다.
이렇게 전자 기기를 구성함으로써, 전자 기기는, 전자 기기에서 행한 음성 인식의 결과에 애매함이 있을 경우, 바로 되묻기를 행하지 않고, 외부 장치를 통하여 다시 음성 인식을 행하므로, 쓸데없는 되묻기를 감소시킬 수 있다.
또한, 되묻기 수단은, 소정의 음성 및/또는 동작을 행함으로써 되묻기를 행해도 된다.
또한, 청소기는, 상기 전자 기기 중 어느 하나와, 전자 기기를 자주시키기 위한 자주 수단, 진애를 흡인하기 위한 송풍 수단 및/또는 바닥면을 쓸어서 청소하기 위한 청소 브러시 수단을 구비해도 된다.
이렇게 청소기를 구성함으로써, 청소기는, 자주 수단, 송풍 수단 및/또는 청소 브러시 수단의 구동 등에 의해, 시끄러운 상황에서 사용되는 경우가 많은 청소기에 있어서, 단어 또는 문장의 확신도에 애매함이 있을 경우에는, 되묻기를 행함으로써 오인식을 방지함과 함께, 단어 또는 문장의 확신도가 더 낮은 경우에는, 되묻기를 행하지 않게 하므로, 쓸데없는 되묻기를 감소시킬 수 있다.
또한, 반응 결정 수단은, 자주 수단, 송풍 수단 및/또는 청소 브러시 수단의 구동 중에는 제2 역치를 변경해도 된다.
이렇게 청소기를 구성함으로써, 청소기는, 확신도와 시끄러운 상황에 맞춰서 변경된 제2 역치를 비교함으로써 되묻기의 필요 여부를 판단하므로, 시끄러운 상황에 있어도, 보다 적절하게 되묻기를 행할 수 있다.
금회 개시된 실시 형태는, 모든 점에서 예시이며 제한적인 것이 아니라고 생각해야 한다. 본 발명의 범위는 상기한 설명이 아닌 특허 청구 범위에 의해 나타나고, 특허 청구 범위와 균등한 의미 및 범위 내에서의 모든 변경이 포함되는 것이 의도된다.
본 발명에 따른 전자 기기는, 음성 인식 수단을 구비한 전자 기기 등에 널리 이용 가능하다.
1, 1a: 전자 기기
2: 하우징
2a: 상면
2b: 배기구
2c: 측면
2d: 저면
2e: 흡입구
3: 음성 입력부
6: 통신부
10: 제어부
11, 11a: 음성 인식부
111, 111a: 음성 구간 검출부
112, 112a: 음향 특징 추출부
113, 113a: 음향 특징 비교부
12: 반응 결정부
13: 음성 합성부
14: 동작 생성부
20: 기억부
21, 21a: 음향 특징 기억부
22, 22a: 사전 기억부
23, 23a: 문법 기억부
31: 음성 출력부
32: 주행부
33: 송풍부
34: 청소 브러시부
200: 외부 장치
206: 통신부
210: 제어부
220: 기억부

Claims (5)

  1. 입력된 음성을 음성 데이터로 변환하는 음성 입력 수단과,
    상기 음성 데이터를 해석함으로써, 상기 음성 데이터에 포함되는 단어 또는 문장을 특정함과 함께, 상기 특정된 단어 또는 문장의 확신도를 산출하는 음성 인식 수단과,
    상기 확신도에 기초하여, 유저에 대한 되묻기의 필요 여부를 결정하는 반응 결정 수단과,
    상기 되묻기를 행하는 되묻기 수단을 구비하고,
    상기 반응 결정 수단은, 상기 확신도가 제2 역치 이상이고 제1 역치 미만인 경우에 되묻기를 행하는 결정을 하고, 상기 확신도가 상기 제2 역치 미만인 경우에 되묻기를 행하지 않는 결정을 하는 것을 특징으로 하는 전자 기기.
  2. 제1항에 있어서,
    상기 반응 결정 수단은, 상기 확신도에 기초하여 복수의 되묻기를 선택하는 것을 특징으로 하는 전자 기기.
  3. 제1항 또는 제2항에 있어서,
    상기 음성 데이터를 외부 장치에 대하여 송신함과 함께, 상기 음성 데이터에 포함되는 단어 또는 문장의 확신도를 상기 외부 장치로부터 수신하는 통신 수단을 더 구비하는 것을 특징으로 하는 전자 기기.
  4. 제1항 내지 제3항 중 어느 한 항에 기재된 전자 기기와,
    상기 전자 기기를 자주시키기 위한 자주 수단, 진애를 흡인하기 위한 송풍 수단 및/또는 바닥면을 쓸어서 청소하기 위한 청소 브러시 수단을 구비하는 것을 특징으로 하는 청소기.
  5. 제4항에 있어서,
    상기 반응 결정 수단은, 상기 자주 수단, 상기 송풍 수단 및/또는 상기 청소 브러시 수단의 구동 중에는, 상기 제2 역치를 변경하는 것을 특징으로 하는 청소기.
KR1020157016096A 2013-01-16 2013-12-03 전자 기기 및 청소기 KR101707359B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2013-005065 2013-01-16
JP2013005065A JP2014137430A (ja) 2013-01-16 2013-01-16 電子機器及び掃除機
PCT/JP2013/082441 WO2014112226A1 (ja) 2013-01-16 2013-12-03 電子機器及び掃除機

Publications (2)

Publication Number Publication Date
KR20150086339A true KR20150086339A (ko) 2015-07-27
KR101707359B1 KR101707359B1 (ko) 2017-02-15

Family

ID=51209336

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020157016096A KR101707359B1 (ko) 2013-01-16 2013-12-03 전자 기기 및 청소기

Country Status (6)

Country Link
US (1) US20150332675A1 (ko)
EP (1) EP2947651B1 (ko)
JP (1) JP2014137430A (ko)
KR (1) KR101707359B1 (ko)
CN (1) CN104871239B (ko)
WO (1) WO2014112226A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6659514B2 (ja) * 2016-10-12 2020-03-04 東芝映像ソリューション株式会社 電子機器及びその制御方法
CN106710592B (zh) * 2016-12-29 2021-05-18 北京奇虎科技有限公司 一种智能硬件设备中的语音识别纠错方法和装置
JP6941856B2 (ja) * 2017-03-31 2021-09-29 国立大学法人大阪大学 対話ロボットおよびロボット制御プログラム
CN108231069B (zh) * 2017-08-30 2021-05-11 深圳乐动机器人有限公司 清洁机器人的语音控制方法、云服务器、清洁机器人及其存储介质
TWI672690B (zh) * 2018-03-21 2019-09-21 塞席爾商元鼎音訊股份有限公司 人工智慧語音互動之方法、電腦程式產品及其近端電子裝置
CN111369989B (zh) * 2019-11-29 2022-07-05 添可智能科技有限公司 清洁设备的语音交互方法及清洁设备
JP7331933B2 (ja) * 2019-09-10 2023-08-23 日本電気株式会社 言語推定装置、言語推定方法、およびプログラム
KR20210047173A (ko) * 2019-10-21 2021-04-29 엘지전자 주식회사 오인식된 단어를 바로잡아 음성을 인식하는 인공 지능 장치 및 그 방법
JP6858336B2 (ja) * 2020-02-06 2021-04-14 Tvs Regza株式会社 電子機器及びその制御方法
JP6858335B2 (ja) * 2020-02-06 2021-04-14 Tvs Regza株式会社 電子機器及びその制御方法
JP6858334B2 (ja) * 2020-02-06 2021-04-14 Tvs Regza株式会社 電子機器及びその制御方法
JP7471921B2 (ja) 2020-06-02 2024-04-22 株式会社日立製作所 音声対話装置、音声対話方法、および音声対話プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008052178A (ja) 2006-08-28 2008-03-06 Toyota Motor Corp 音声認識装置と音声認識方法
JP2008233305A (ja) * 2007-03-19 2008-10-02 Toyota Central R&D Labs Inc 音声対話装置、音声対話方法及びプログラム
KR20120114670A (ko) * 2011-04-07 2012-10-17 엘지전자 주식회사 로봇 청소기 및 이의 제어 방법

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03248199A (ja) * 1990-02-26 1991-11-06 Ricoh Co Ltd 音声認識方式
US5758322A (en) * 1994-12-09 1998-05-26 International Voice Register, Inc. Method and apparatus for conducting point-of-sale transactions using voice recognition
US6292782B1 (en) * 1996-09-09 2001-09-18 Philips Electronics North America Corp. Speech recognition and verification system enabling authorized data transmission over networked computer systems
JPH11143488A (ja) * 1997-11-10 1999-05-28 Hitachi Ltd 音声認識装置
JP2000135186A (ja) * 1998-10-30 2000-05-16 Ym Creation:Kk 掃除玩具
JP2001075595A (ja) * 1999-09-02 2001-03-23 Honda Motor Co Ltd 車載用音声認識装置
JP2001175276A (ja) * 1999-12-17 2001-06-29 Denso Corp 音声認識装置及び記録媒体
JP2003036091A (ja) * 2001-07-23 2003-02-07 Matsushita Electric Ind Co Ltd 電化情報機器
JP2003079552A (ja) * 2001-09-17 2003-03-18 Toshiba Tec Corp 掃除装置
US20030061053A1 (en) * 2001-09-27 2003-03-27 Payne Michael J. Method and apparatus for processing inputs into a computing device
JP2006205497A (ja) * 2005-01-27 2006-08-10 Canon Inc 音声認識手段を持つ複合機
ES2346343T3 (es) * 2005-02-18 2010-10-14 Irobot Corporation Robot autonomo de limpieza de superficies para una limpieza en seco y en mojado.
JP2008009153A (ja) * 2006-06-29 2008-01-17 Xanavi Informatics Corp 音声対話システム
JP4709887B2 (ja) * 2008-04-22 2011-06-29 株式会社エヌ・ティ・ティ・ドコモ 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム
US9934780B2 (en) * 2012-01-17 2018-04-03 GM Global Technology Operations LLC Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008052178A (ja) 2006-08-28 2008-03-06 Toyota Motor Corp 音声認識装置と音声認識方法
JP2008233305A (ja) * 2007-03-19 2008-10-02 Toyota Central R&D Labs Inc 音声対話装置、音声対話方法及びプログラム
KR20120114670A (ko) * 2011-04-07 2012-10-17 엘지전자 주식회사 로봇 청소기 및 이의 제어 방법

Also Published As

Publication number Publication date
JP2014137430A (ja) 2014-07-28
WO2014112226A1 (ja) 2014-07-24
CN104871239B (zh) 2018-05-01
EP2947651A1 (en) 2015-11-25
EP2947651B1 (en) 2017-04-12
US20150332675A1 (en) 2015-11-19
CN104871239A (zh) 2015-08-26
EP2947651A4 (en) 2016-01-06
KR101707359B1 (ko) 2017-02-15

Similar Documents

Publication Publication Date Title
KR101707359B1 (ko) 전자 기기 및 청소기
US10586534B1 (en) Voice-controlled device control using acoustic echo cancellation statistics
US11516040B2 (en) Electronic device and method for controlling thereof
US11037561B2 (en) Method and apparatus for voice interaction control of smart device
JP6844608B2 (ja) 音声処理装置および音声処理方法
JP4837917B2 (ja) 音声に基づく装置制御
US9940949B1 (en) Dynamic adjustment of expression detection criteria
JP5996603B2 (ja) サーバ、発話制御方法、発話装置、発話システムおよびプログラム
EP2267695B1 (en) Controlling music players using environment audio analysis
WO2017168936A1 (ja) 情報処理装置、情報処理方法、及びプログラム
CN108681440A (zh) 一种智能设备音量控制方法及系统
JP2005084253A (ja) 音響処理装置、方法、プログラム及び記憶媒体
TWI711035B (zh) 方位角估計的方法、設備、語音交互系統及儲存介質
US20150310878A1 (en) Method and apparatus for determining emotion information from user voice
JP2014191029A (ja) 音声認識システムおよび音声認識システムの制御方法
US20200051580A1 (en) Method and apparatus for sound processing
EP3982359A1 (en) Electronic device and method for recognizing voice by same
US9799332B2 (en) Apparatus and method for providing a reliable voice interface between a system and multiple users
US20220335937A1 (en) Acoustic zoning with distributed microphones
JP2019219509A (ja) ロボット、ロボットの制御方法及びプログラム
KR20210098250A (ko) 전자 장치 및 이의 제어 방법
JP4539313B2 (ja) 音声認識辞書作成システム、音声認識辞書作成方法、音声認識システムおよびロボット
JP7131362B2 (ja) 制御装置、音声対話装置及びプログラム
JP7429107B2 (ja) 音声翻訳装置、音声翻訳方法及びそのプログラム
KR20210080788A (ko) 전자장치 및 그 제어방법

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant