WO2020096193A1

WO2020096193A1 - 전자 장치 및 그 제어 방법

Info

Publication number: WO2020096193A1
Application number: PCT/KR2019/011636
Authority: WO
Inventors: 박지선; 노민진
Original assignee: 삼성전자주식회사
Priority date: 2018-11-08
Filing date: 2019-09-09
Publication date: 2020-05-14
Also published as: US20210398529A1; KR20200053290A

Abstract

전자 장치가 개시된다. 본 전자 장치는 음성 수신부 및 음성 수신부를 통해 사용자 음성이 수신되면, 사용자 음성의 특성에 대응되는 발화 이력 정보의 축적도 레벨을 판단하고, 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 미만이면, 사용자 음성의 특성과 관련된 사용자 정보에 기초하여 사용자 음성에 대응되는 응답 정보를 제공하고, 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 이상이면, 사용자 정보 및 발화 이력 정보에 기초하여 사용자 음성에 대응되는 응답 정보를 제공하는 프로세서를 포함한다.

Description

전자 장치 및 그 제어 방법

본 개시는 전자 장치 및 그 제어 방법에 관한 것으로, 보다 상세하게는 사용자의 음성을 인식할 수 있는 전자 장치 및 그 제어 방법에 관한 것이다.

최근 전자 기술의 발달로 다양한 전자 장치가 개발되고 있다. 특히, 최근에는 사용자의 음성을 인식하고, 사용자의 음성에 따라 동작하는 AI(Artificial Intelligence) 스피커, 스마트 폰, 스마트 TV 등의 음성 인식 장치가 개발되고 있다.

그런데, 종래의 음성 인식 장치는 사용자 음성이 수신되면, 정형화 된 형태의 응답 정보를 제공할 뿐이었다.

예를 들어, 사용자가 “오늘 서울 날씨 어때?”와 같은 음성을 발화한 경우, 종래의 음성 인식 장치는 “오늘 서울의 날씨는, 영하 2도 입니다. 강수랑은 10mm로 예상됩니다”와 같이, 정형화 된 형태의 응답 정보를 제공하였다.

이는, 개인화 된 형태의 응답 정보를 제공받길 원하는 사용자 니즈에 부합하지 못하는 문제가 있다.

본 개시는 상술한 문제점을 해결하기 위해 안출된 것으로, 본 개시의 목적은 사용자 음성의 특성에 기초하여 개인화 된 응답 정보를 제공하는 전자 장치 및 그 제어 방법을 제공함에 있다.

상기 목적을 달성하기 위한 본 개시의 일 실시 예에 따른 전자 장치는 음성 수신부 및 상기 음성 수신부를 통해 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 발화 이력 정보의 축적도 레벨을 판단하고, 상기 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 미만이면, 상기 사용자 음성의 특성과 관련된 사용자 정보에 기초하여 상기 사용자 음성에 대응되는 응답 정보를 제공하고, 상기 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 이상이면, 상기 사용자 정보 및 상기 발화 이력 정보에 기초하여 상기 사용자 음성에 대응되는 응답 정보를 제공하는 프로세서를 포함한다.

여기에서, 상기 사용자 정보는, 상기 사용자 음성을 발화한 사용자의 성별에 관한 정보 및 연령대에 관한 정보 중 적어도 하나를 포함하고, 상기 프로세서는, 상기 사용자 음성이 수신되면, 상기 사용자 음성에 대응되는 응답 정보를 획득하고, 상기 성별에 관한 정보 및 연령대에 관한 정보 중 적어도 하나에 따라, 상기 획득된 응답 정보를 변경하여 제공할 수 있다.

그리고, 상기 프로세서는, 상기 연령대가 기설정된 임계 나이 이상이면, 상기 전자 장치의 음성 인식 모드를 트리거 하기 위한 사용자 음성이 수신된 때로부터, 기설정된 시간 동안 음성 인식 모드로 동작하고, 상기 연령대가 상기 기설정된 임계 나이 미만이면, 상기 기설정된 시간을 연장할 수 있다.

그리고, 상기 발화 이력 정보는, 컨텐츠와 관련된 사용자 음성에 관한 정보를 포함하고, 상기 프로세서는, 상기 사용자 음성에 대응되는 응답 정보를 상기 발화 이력 정보에 포함된 컨텐츠를 이용하여 제공할 수 있다.

그리고, 상기 발화 이력 정보는, 상기 전자 장치의 음성 인식 모드를 트리거 하기 위한 사용자 음성이 수신된 때로부터, 기설정된 시간 내 후속 음성이 수신되지 않은 횟수에 관한 정보를 포함하고, 상기 프로세서는, 상기 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 상기 발화 이력 정보에 기초하여 상기 후속 음성이 수신되지 않은 횟수를 판단하고, 상기 후속 음성이 수신되지 않은 횟수가 기설정된 횟수 이상이면, 상기 기설정된 시간을 연장할 수 있다.

그리고, 상기 발화 이력 정보는, 상기 사용자 음성의 인식이 실패함에 따라 제공된 에러 횟수에 관한 정보를 포함하고, 상기 프로세서는, 상기 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 상기 발화 이력 정보에 기초하여 상기 에러 횟수를 판단하고, 상기 에러 횟수가 기설정된 횟수 이상이면, 음성 인식 성공을 위한 가이드 정보를 제공할 수 있다.

그리고, 상기 프로세서는, 상기 응답 정보 제공 후, 후속 음성의 발화를 유도하는 가이드 정보를 제공할 수 있다.

한편, 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법은, 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 발화 이력 정보의 축적도 레벨을 판단하는 단계 및 상기 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 미만이면, 상기 사용자 음성의 특성과 관련된 사용자 정보에 기초하여 상기 사용자 음성에 대응되는 응답 정보를 제공하고, 상기 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 이상이면, 상기 사용자 정보 및 상기 발화 이력 정보에 기초하여 상기 사용자 음성에 대응되는 응답 정보를 제공하는 단계를 포함한다.

여기에서, 상기 사용자 정보는, 상기 사용자 음성을 발화한 사용자의 성별에 관한 정보 및 연령대에 관한 정보 중 적어도 하나를 포함하고, 상기 제공하는 단계는, 상기 사용자 음성이 수신되면, 상기 사용자 음성에 대응되는 응답 정보를 획득하고, 상기 성별에 관한 정보 및 연령대에 관한 정보 중 적어도 하나에 따라, 상기 획득된 응답 정보를 변경하여 제공할 수 있다.

그리고, 본 제어 방법은 상기 연령대가 기설정된 임계 나이 이상이면, 상기 전자 장치의 음성 인식 모드를 트리거 하기 위한 사용자 음성이 수신된 때로부터, 기설정된 시간 동안 음성 인식 모드로 동작하고, 상기 연령대가 상기 기설정된 임계 나이 미만이면, 상기 기설정된 시간을 연장하는 단계를 더 포함할 수 있다.

그리고, 상기 발화 이력 정보는, 컨텐츠와 관련된 사용자 음성에 관한 정보를 포함하고, 상기 제공하는 단계는, 상기 사용자 음성에 대응되는 응답 정보를 상기 발화 이력 정보에 포함된 컨텐츠를 이용하여 제공할 수 있다.

그리고, 상기 발화 이력 정보는, 상기 전자 장치의 음성 인식 모드를 트리거 하기 위한 사용자 음성이 수신된 때로부터, 기설정된 시간 내 후속 음성이 수신되지 않은 횟수에 관한 정보를 포함하고, 상기 제어 방법은, 상기 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 상기 발화 이력 정보에 기초하여 상기 후속 음성이 수신되지 않은 횟수를 판단하고, 상기 후속 음성이 수신되지 않은 횟수가 기설정된 횟수 이상이면, 상기 기설정된 시간을 연장하는 단계를 더 포함할 수 있다.

그리고, 상기 발화 이력 정보는, 상기 사용자 음성의 인식이 실패함에 따라 제공된 에러 횟수에 관한 정보를 포함하고, 상기 제공하는 단계는, 상기 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 상기 발화 이력 정보에 기초하여 상기 에러 횟수를 판단하고, 상기 에러 횟수가 기설정된 횟수 이상이면, 음성 인식 성공을 위한 가이드 정보를 제공할 수 있다.

그리고, 본 제어 방법은 상기 응답 정보 제공 후, 후속 음성의 발화를 유도하는 가이드 정보를 제공하는 단계를 더 포함할 수 있다.

이상과 같은 본 개시의 다양한 실시 예에 따르면, 음성을 발화한 사용자의 연령대, 나이 및/또는 발화 이력 정보에 기초하여 개인화 된 응답 정보를 사용자에게 제공할 수 있다.

또한, AI 스피커 등의 전자 장치를 능숙하게 사용하지 못하는 사용자에게 가이드 정보 등을 제공함으로써, 전자 장치의 사용 능숙도를 향상시킬 수 있다.

도 1은 본 개시의 일 실시 예에 따른 전자 장치를 설명하기 위한 블록도이다.

도 2는 본 개시의 일 실시 예에 따른 사용자 음성의 특성에 기초하여 응답 정보를 제공하는 방법을 설명하기 위한 순서도이다.

도 3a 및 도 3b는 본 개시의 일 실시 예에 따른 사용자 음성의 특성과 관련된 사용자 정보에 기초하여, 사용자 음성에 대응되는 응답 정보를 제공하는 실시 예를 설명하기 위한 도면이다.

도 4a 및 도 4b는 본 개시의 일 실시 예에 따른 사용자 음성의 특성과 관련된 사용자 정보 및 발화 이력 정보에 기초하여, 사용자 음성에 대응되는 응답 정보를 제공하는 실시 예를 설명하기 위한 도면이다.

도 5는 본 개시의 일 실시 예에 따른 전자 장치를 설명하기 위한 상세 블록도이다.

도 6은 본 개시의 일 실시 예에 따른 전자 장치의 제어 방법을 설명하기 위한 순서도이다.

먼저, 본 명세서 및 청구범위에서 사용되는 용어는 본 개시의 기능을 고려하여 일반적인 용어들을 선택하였다. 하지만, 이러한 용어들은 당 분야에 종사하는 기술자의 의도나 법률적 또는 기술적 해석 및 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 일부 용어는 출원인이 임의로 선정한 용어도 있다. 이러한 용어에 대해서는 본 명세서에서 정의된 의미로 해석될 수 있으며, 구체적인 용어 정의가 없으면 본 명세서의 전반적인 내용 및 당해 기술 분야의 통상적인 기술 상식을 토대로 해석될 수도 있다.

또한, 본 개시를 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 개시의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우, 그에 대한 상세한 설명은 축약하거나 생략한다.

나아가, 이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 개시의 실시 예를 상세하게 설명하지만, 본 개시가 실시 예들에 의해 제한되거나 한정되는 것은 아니다.

이하, 첨부된 도면을 참조하여 본 개시를 상세히 설명한다.

도 1을 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 음성 수신부(110) 및 프로세서(120)를 포함한다.

음성 수신부(110)는 사용자 음성을 수신할 수 있다. 구체적으로, 음성 수신부(110)는 사용자 음성에 대응되는 아날로그 신호를 수신할 수 있다.

음성 수신부(110)는 마이크로 구현될 수 있다. 이 경우, 음성 수신부(110)는 전자 장치(100)의 일 측면에 구비될 수 있다.

한편, 음성 수신부(110)는 블루투스 칩, 와이파이 칩 등의 무선 통신 칩으로 구현될 수도 있다. 이 경우, 음성 수신부(110)는 외부 장치(예를 들어, 리모콘)의 마이크를 통해 입력된 사용자 음성을, 외부 장치로부터 수신할 수 있다.

구체적으로, 외부 장치의 마이크를 통해 사용자 음성이 입력되면, 음성 수신부(110)는 외부 장치로부터 사용자 음성에 대응되는 아날로그 신호 또는 디지털 신호로 변환된 사용자 음성을 수신할 수 있다.

이하에서는, 설명의 편의를 위해 음성 수신부(100)는 마이크로 구현되는 것으로 상정하여 설명한다.

프로세서(120)는 전자 장치(100)의 전반적인 동작을 제어한다. 이를 위해, 프로세서(120)는 중앙처리장치(central processing unit(CPU)), 어플리케이션 프로세서(application processor(AP)), 또는 커뮤니케이션 프로세서(communication processor(CP)) 중 하나 또는 그 이상을 포함할 수 있다.

프로세서(120)는 음성 수신부(110)를 통해 사용자 음성을 수신할 수 있다. 그리고, 프로세서(120)는 아날로그 신호인 사용자 음성을 디지털 신호로 변환할 수 있다. 이를 위해, 프로세서(120)는 아날로그/디지털 컨버터(미도시)를 이용할 수 있다.

프로세서(120)는 사용자 음성을 텍스트로 변환할 수 있다. 구체적으로, 프로세서(120)는 디지털 신호로 변환된 사용자 음성에 STT(Speech to Text) 알고리즘을 적용하여, 사용자 음성을 텍스트로 변환할 수 있다.

프로세서(120)는 텍스트에서 발화 요소를 추출할 수 있다. 여기에서, 발화 요소는 사용자 음성에 포함된 복수의 요소 중 적어도 하나로써, 사용자가 요청한 동작을 수행하기 위한 키워드를 의미한다. 예를 들어, "내일 서울 날씨 어때"와 같은 사용자 음성이 음성 수신부(110)로부터 수신된 경우, 프로세서(120)는 사용자 음성을 텍스트로 변환한 후, 변환된 텍스트에서 "내일", "서울", "날씨" 및 "어때?"라는 발화 요소를 추출할 수 있다.

그리고, 프로세서(120)는 추출한 발화 요소에 기초해서, 사용자 음성에 대응되는 응답 정보를 획득할 수 있다. 구체적으로, 프로세서(120)는 추출한 발화 요소에 대응되는 정보를 써치하고, 그 써치 결과를 응답 정보로 획득할 수 있다.

프로세서(120)는 획득한 응답 정보를 제공할 수 있다. 구체적으로, 프로세서(120)는 스피커(미도시) 및/또는 디스플레이(미도시) 등을 통해 응답 정보를 제공할 수 있다. 상술한 실시 예에서, 프로세서(120)는 내일의 서울 날씨에 관한 정보를 스피커(미도시)를 통해 음성으로 출력하거나, 디스플레이(미도시)를 통해 텍스트로 표시함으로써, 사용자에게 제공할 수 있다.

이와 같은 전자 장치(100)는 AI 스피커로 구현될 수 있다. 다만, 이는 일 실시 예일 뿐, 전자 장치(100)는 스마트 폰, 태블릿 PC, 노트북, 스마트 TV 등과 같이 사용자 음성을 인식할 수 있는 다양한 전자 장치로 구현될 수 있다. 또한, 전자 장치(100)는 스마트 워치 등의 웨어러블 디바이스로 구현될 수도 있다.

한편, 여기서는 전자 장치(100)가 사용자 음성을 텍스트로 변환하는 실시 예를 설명하였으나, 이는 외부 서버(미도시)에 의해 수행될 수도 있다. 구체적으로, 전자 장치(100)는 음성 수신부(110)를 통해 사용자 음성이 수신되면, 이를 외부 서버(미도시)로 전송하고, 상술한 STT 알고리즘의 적용 등은 외부 서버(미도시)에 의해 수행될 수 있다. 이 경우, 전자 장치(100)는 외부 서버(미도시)로부터 사용자 음성에 대응되는 응답 정보를 수신하고, 수신한 응답 정보를 사용자에게 제공할 수 있다.

한편, 프로세서(120)는 사용자 음성이 수신되면, 사용자 음성의 특성을 분석하고, 그 특성에 기초하여 응답 정보를 제공할 수 있다. 이하, 도 2 내지 도 4b를 참조하여 설명한다.

프로세서(120)는 음성 수신부(110)를 통해 사용자 음성을 수신(S210)할 수 있다. 전술한 바와 같이, 음성 수신부(110)가 마이크로 구현되는 경우, 프로세서(120)는 마이크를 통해 사용자 음성을 수신할 수 있다.

프로세서(120)는 사용자 음성의 특성을 판단(S220)할 수 있다. 구체적으로, 프로세서(120)는 사용자 음성이 수신되면, 사용자 음성의 에너지, 주파수 대역 및/또는 사용자 음성의 울림 값 (RT, reverberation time)과 같은 사용자 음성의 특성을 판단할 수 있다. 한편, 이와 같은 사용자 음성의 특성은 일 실시 예이고, 사용자 음성의 특성은 음성을 발화한 사용자를 다른 사용자와 구분할 수 있는 다양한 특성이 될 수 있다.

프로세서(120)는 사용자 음성의 특성에 대응되는 발화 이력 정보를 판단(S240)할 수 있다. 구체적으로, 프로세서(120)는 메모리(미도시)에 사용자 음성의 특성 별로 저장된 발화 이력 정보 중에서, 음성 수신부(110)를 통해 수신된 사용자 음성의 특성에 대응되는 발화 이력 정보를 판단할 수 있다.

보다 구체적으로, 프로세서(120)는 메모리(미도시)에 사용자 음성의 특성 별로 저장된 발화 이력 정보 중에서, 음성 수신부(110)를 통해 수신된 사용자 음성의 에너지, 주파수 대역 및/또는 사용자 음성의 울림 값과 기설정된 오차 범위 내에 있는 사용자 음성의 특성에 매칭된 발화 이력 정보를, 음성 수신부(110)를 통해 수신된 사용자 음성의 특성에 대응되는 발화 이력 정보로 판단할 수 있다.

여기에서, 발화 이력 정보는 사용자 음성과 관련된 다양한 정보를 포함할 수 있다. 구체적으로, 발화 이력 정보는 과거에 음성 수신부(110)를 통해 수신된 사용자 음성에 관한 정보, 음성 수신부(110)를 통해 사용자 음성이 수신된 횟수에 관한 정보, 사용자 음성의 인식이 실패함에 따라 제공된 에러 횟수에 관한 정보 및 사용자 음성의 발화 속도에 관한 정보 등을 포함할 수 있다.

프로세서(120)는 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 이상인지를 판단(S240)할 수 있다.

여기에서, 축적도 레벨은 발화 이력 정보에 포함된 사용자 음성이 수신된 횟수에 관한 정보에 기초하여 결정될 수 있다. 예를 들어, 프로세서(120)는 발화 이력 정보에 포함된 사용자 음성이 수신된 횟수가 0 내지 10회이면 발화 이력 정보의 축적도 레벨을 1로 결정하고, 11회 내지 20회이면 발화 이력 정보의 축적도 레벨을 2로 결정하는 등 사용자 음성이 수신된 횟수가 커질수록, 발화 이력 정보의 축적도 레벨을 높게 결정할 수 있다.

그리고, 임계 레벨은 사용자 명령에 따라 다양하게 설정될 수 있다. 예를 들어, 임계 레벨은 2로 설정될 수 있다.

이후, 프로세서(120)는 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 미만인 경우, 사용자 음성의 특성과 관련된 사용자 정보에 기초하여, 사용자 음성에 대응되는 응답 정보를 제공(S250)하고, 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 이상인 경우, 사용자 음성의 특성과 관련된 사용자 정보 및 발화 이력 정보에 기초하여 사용자 음성에 대응되는 응답 정보를 제공(S260)할 수 있다.

이하, 도 3a 내지 도 4b를 참조하여 설명한다.

전술한 바와 같이, 프로세서(120)는 사용자 음성이 수신되면, 사용자 음성에 대응되는 응답 정보를 획득할 수 있다.

그리고, 프로세서(120)는 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 미만인 경우, 사용자 음성의 특성과 관련된 사용자 정보에 기초하여, 사용자 음성에 대응되는 응답 정보를 제공할 수 있다.

여기에서, 사용자 음성의 특성과 관련된 사용자 정보는, 사용자 음성을 발화한 사용자의 성별에 관한 정보 및 연령대에 관한 정보 중 적어도 하나를 포함할 수 있다.

구체적으로, 프로세서(120)는 음성 수신부(110)를 통해 사용자 음성이 수신되면, 사용자 음성의 에너지, 주파수 대역 및/또는 사용자 음성의 울림 값과 같은 사용자 음성의 특성에 기초하여, 사용자 음성을 발화한 사용자의 성별 및 연령대 중 적어도 하나를 판단할 수 있다.

그리고, 프로세서(120)는 사용자의 성별 및 연령대 중 적어도 하나에 따라, 획득한 응답 정보를 변경하여 제공할 수 있다.

구체적으로, 프로세서(120)는 사용자의 연령대가 기설정된 그룹 중 어느 그룹에 속하는지에 따라, 획득한 응답 정보를 변경하여 제공할 수 있다. 여기에서, 기설정된 그룹의 제1 그룹은 만 10세 이상의 연령대를 포함하고, 제2 그룹은 만 0세부터 만 10세까지의 연령대를 포함할 수 있다. 다만, 이는 일 실시 예일 뿐, 기설정된 그룹은 사용자 명령에 따라 다양하게 설정될 수 있다.

예를 들어, 사용자가 “오늘 서울 날씨 어때”를 발화한 경우, 프로세서(120)는 전술한 STT 알고리즘 등을 통해, 오늘의 서울 날씨에 관한 정보를 획득할 수 있다. 그리고, 사용자 음성의 특성에 기초하여, 사용자의 연령대가 기설정된 제1 그룹에 속하는 것으로 판단되면, 프로세서(120)는 획득한 응답 정보를 변경 없이 제공하고, 사용자의 연령대가 기설정된 제2 그룹에 속하는 것으로 판단되면, 프로세서(120)는 획득한 응답 정보를 제2 그룹에 대응되도록 변경하여 제공할 수 있다.

도 3a를 참조하면, 획득한 응답 정보가 “오늘 서울의 날씨는, 영하 2도 입니다. 강수랑은 30mm로 예상됩니다”인 경우, 프로세서(120)는 사용자의 연령대가 약 26세로써 기설정된 제1 그룹에 속하는 것으로 판단되면, “오늘 서울의 날씨는, 영하 2도 입니다. 강수랑은 00mm로 예상됩니다”와 같은 응답 정보를 제공할 수 있다. 즉, 프로세서(120)는 획득한 응답 정보를 변경 없이 제공할 수 있다.

도 3b를 참조하면, 프로세서(120)는 사용자의 연령대가 약 6세로써 기설정된 제2 그룹에 속하는 것으로 판단되면, “오늘은 오들오들 추운 날씨에요. 콜록콜록 감기에 걸리지 않도록 조심 또 조심! 곧 비가 올 것 같으니 우산과 장화는 꼭 챙기세요~”와 같이, 획득한 응답 정보에 포함된 단어를 변경하여 제공하거나, 의성어 및 의태어 중 적어도 하나를 더 부가하여 제공할 수 있다.

다른 실시 예로, 음성 수신부(110)를 통해 “나 양치했어”와 같은 사용자 음성이 수신된 경우, 프로세서(120)는 사용자의 연령대가 제1 그룹에 속하는 것으로 판단되면, “잘 하셨네요”와 같이 과장되지 않은 응답 정보를 제공하고, 사용자의 연령대가 제2 그룹에 속하는 것으로 판단되면, “우와! 멋있어요! 충치 없는 멋쟁이네요!”와 같이 감탄사를 더 포함하는 등의 방법으로 표현을 과장하여 제공할 수 있다.

또한, 음성 수신부(110)를 통해 “나 추워”와 같은 사용자 음성이 수신된 경우, 프로세서(120)는 사용자의 연령대가 제1 그룹에 속하는 것으로 판단되면, “실내 온도를 2도 높여보는 건 어때요?”와 같이 주어진 문제를 해결하기 위한 응답 정보를 제공하고, 사용자의 연령대가 제2 그룹에 속하는 것으로 판단되면, “오들오들~ 추워요~ 추울 땐 옷을 꽁꽁 껴입어야 감기에 안 걸려요~”와 같이 사용자의 상황을 공감하면서, 주어진 문제를 해결하기 위한 응답 정보를 제공할 수 있다.

또한, 프로세서(120)는 사용자의 성별이 남성인지 또는 여성인지에 따라, 획득한 응답 정보를 변경하여 제공할 수 있다. 예를 들어, 프로세서(120)는 사용자가 만 6세의 여자라고 판단된 경우, 만 6세의 여자가 선호하는 컨텐츠를 이용하여 응답 정보를 제공할 수 있다.

예를 들어, 만 6세의 여자가 선호하는 컨텐츠가 펭귄인 것으로 판단되면, 프로세서(120)는 상술한 실시 예에서, “오늘은 오들오들 추운 날씨에요. 콜록콜록 감기에 걸리지 않도록 조심 또 조심! 곧 비가 올 것 같으니 우산과 장화는 꼭 챙기세요~ 펭귄도 비를 맞으면 슬퍼할 거에요~”와 같이, 펭귄이라는 단어를 이용한 응답 정보를 제공할 수 있다.

이를 위해, 프로세서(120)는 성별 및 연령대에 따라 사용자가 선호하는 컨텐츠에 관한 정보를 저장하고 있을 수 있다. 또는, 프로세서(120)는 외부 서버(미도시)로부터 수신된 컨텐츠에 관한 정보에 기초하여, 사용자 음성을 발화한 사용자가 선호하는 컨텐츠를 판단할 수 있다.

또한, 상술한 컨텐츠는 인공 지능 기술을 통해 획득될 수도 있다. 여기에서, 인공 지능 기술은 컴퓨터 기계가 스스로 학습하고 판단하는 기술로써, 프로세서(120)는 입력 데이터들의 특징을 스스로 분류/학습하는 알고리즘을 이용하는 딥러닝을 통해 해당 성별 및 연령대가 선호하는 컨텐츠에 관한 정보를 획득할 수 있다.

이와 같이, 음성을 발화한 사용자의 나이 및 연령대를 고려하여 응답 정보를 제공함으로써, 본 개시는 사용자에게 흥미를 유발시킬 수 있고, 사용자 연령 대에 따라 사용자가 이해하기 쉬운 언어로 정보를 전달할 수 있다.

한편, 프로세서(120)는 사용자의 연령대가 기설정된 그룹 중 어느 그룹에 속하는지에 따라 음성 대기 시간을 조절할 수 있다.

구체적으로, 프로세서(120)는 전자 장치(100)의 음성 인식 모드를 트리거 하기 위한 사용자 음성이 수신되면, 사용자 음성이 수신된 때로부터, 기설정된 시간 동안 음성 인식 모드로 동작할 수 있다. 예를 들어, “Hi, Bixby”와 같은 트리거 음성이 수신되면, 프로세서(120)는 기설정된 시간(가령, 5초)동안 음성 인식 모드로 동작할 수 있다.

이때, 프로세서(120)는 사용자의 연령대가 기설정된 그룹 중 어느 그룹에 속하는지에 따라 상술한 기설정된 시간, 즉 음성 대기 시간을 조절할 수 있다.

구체적으로, 프로세서(120)는 사용자의 연령대가 기설정된 임계 나이 이상이면, 상술한 기설정된 시간 동안 음성 인식 모드로 동작하고, 사용자의 연령대가 기설정된 임계 나이 미만이면, 상술한 기설정된 시간을 연장할 수 있다.

예를 들어, 임계 나이가 15세인 경우, 6세인 사용자가 음성을 발화한 것으로 판단되면, 프로세서(120)는 기설정된 시간을 10초로 연장할 수 있다.

이와 같이, 어린 연령 대의 사용자(또는, 높은 연령 대의 사용자)를 고려하여, 음성 대기 시간을 연장함으로써, 본 개시는 전자 장치(100)의 사용에 능숙하지 못한 사용자가 예기치 않게 음성 인식 모드가 종료되어 겪을 수 있는 불편함을 해소할 수 있다.

그리고, 프로세서(120)는 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 이상인 경우, 사용자 음성의 특성과 관련된 사용자 정보 및 발화 이력 정보에 기초하여, 사용자 음성에 대응되는 응답 정보를 제공할 수 있다.

여기에서, 발화 이력 정보는 컨텐츠와 관련된 사용자 음성에 관한 정보를 포함할 수 있다. 구체적으로, 발화 이력 정보는 특정 컨텐츠를 검색하기 위한 사용자 음성에 관한 정보 및 특정 컨텐츠를 재생하기 위한 사용자 음성에 관한 정보 등을 포함할 수 있다.

예를 들어, 사용자가 “펭귄 프로그램 찾아줘”, “펭귄은 언제 방송해?”와 같은 “펭귄” 컨텐츠와 관련된 사용자 음성을 기설정된 횟수 이상 발화한 경우, 프로세서(120)는 “펭귄” 컨텐츠를 이용하여, 사용자 음성에 대응되는 응답 정보를 제공할 수 있다.

도 4a는 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 미만인 경우, “오늘 서울 날씨 어때?”와 같은 사용자 음성이 수신될 때 제공되는 응답 정보이다. 도 4a를 참조하면, “오늘 서울 날씨 어때?”와 같은 사용자 음성에 대해, 프로세서(120)는 “오늘은 오들오들 추운 날씨에요. 콜록콜록 감기에 걸리지 않도록 조심 또 조심! 곧 비가 올 것 같으니 우산과 장화는 꼭 챙기세요~”와 같은 응답 정보를 제공할 수 있다.

도 4b는 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 이상인 경우, “오늘 서울 날씨 어때?”와 같은 사용자 음성이 수신될 때 제공되는 응답 정보이다. 프로세서(120)는 발화 이력 정보에 “펭귄” 컨텐츠와 관련된 사용자 음성이 기설정된 횟수 이상 수신된 것으로 판단되면, “오늘 서울 날씨 어때?”와 같은 사용자 음성에 대해, “펭귄” 컨텐츠를 이용하여, 사용자 음성에 대응되는 응답 정보를 제공할 수 있다. 예를 들어, 도 4b에 도시된 바와 같이, 프로세서(120)는 “오늘은 오들오들 추운 날씨에요. 콜록콜록 감기에 걸리지 않도록 조심 또 조심! 곧 비가 올 것 같으니 우산과 장화는 꼭 챙기세요~ 오늘은 펭귄도 우산을 들고 친구들을 만나러 갈 거에요~” 와 같은 응답 정보를 제공할 수 있다.

이와 같이, 음성을 발화한 사용자의 특성 및 발화 이력 정보를 함께 고려하여 응답 정보를 제공함으로써, 본 개시는 사용자에게 흥미를 유발시킬 수 있고, 사용자가 이해하기 쉽게 정보를 전달할 수 있다.

한편, 상술한 실시 예 외에도, 프로세서(120)는 발화 이력 정보에 포함된 다양한 정보에 기초하여, 다양한 기능을 수행할 수 있다.

일 예로, 발화 이력 정보에는 전자 장치(100)의 음성 인식 모드를 트리거 하기 위한 사용자 음성이 수신된 때로부터, 기설정된 시간 내 후속 음성이 수신되지 않은 횟수에 관한 정보가 포함될 수 있다.

이때, 프로세서(120)는 음성 인식 모드로 동작하는 동안 후속 음성이 수신되지 않으면 음성 인식 모드를 종료하고, 음성 대기 시간 내 후속 음성이 수신되지 않은 횟수에 관한 정보를 발화 이력 정보에 저장할 수 있다.

이후, 프로세서(120)는 사용자 음성이 수신되면, 발화 이력 정보에 기초하여 후속 음성이 수신되지 않은 횟수를 판단하고, 후속 음성이 수신되지 않은 횟수가 기설정된 횟수 이상이면, 상술한 기설정된 시간을 연장할 수 있다. 즉, 프로세서(120)는 후속 음성이 수신되지 않은 횟수가 기설정된 횟수 이상이면, 음성 대기 시간을 연장할 수 있다.

예를 들어, 기설정된 횟수가 5회이고 기설정된 시간이 5초인 경우, 프로세서(120)는 5회 이상 후속 음성 미수신에 의해 음성 인식 모드가 종료된 것으로 판단되면, 기설정된 시간을 10초로 연장할 수 있다.

이는, 전자 장치(100)의 사용 능숙도가 높지 않은 사용자를 고려한 것으로써, 이에 따라 본 개시는 전자 장치(100)의 사용에 능숙하지 못한 사용자가 예기치 않게 음성 인식 모드가 종료되어 겪을 수 있는 불편함을 해소할 수 있다.

한편, 발화 이력 정보는 사용자 음성의 인식이 실패함에 따라 제공된 에러 횟수에 관한 정보를 포함할 수 있다.

구체적으로, 프로세서(120)는 사용자 음성의 발화 속도가 제1 임계치 이상으로 빠르거나 제2 임계치 이하로 느린 경우, 사용자 음성에 임계치 이상의 복수의 단어가 포함된 경우 또는, 사용자 음성 및 후속 음성 사이 구간의 텀(term)이 임계치 이하로 짧은 경우 등에 있어서, 사용자 음성을 인식하지 못할 수 있다.

이 경우, 프로세서(120)는 사용자 음성의 인식이 실패함에 따라 에러 정보를 제공할 수 있다. 예를 들어, 프로세서(120)는 “음성 인식에 실패하였습니다. 다시 음성을 발화해 주세요”와 같은 에러 정보를 사용자에게 제공할 수 있다.

그리고, 프로세서(120)는 에러 정보를 제공한 횟수를 발화 이력 정보에 저장할 수 있다.

이후, 프로세서(120)는 사용자 음성이 수신되면, 발화 이력 정보에 기초하여 에러 정보를 제공한 횟수를 판단하고, 에러 횟수가 기설정된 횟수 이상이면, 음성 인식 성공을 위한 가이드 정보를 제공할 수 있다.

여기에서, 사용자 음성은 트리거 음성이 될 수 있다. 구체적으로, 프로세서(120)는 트리거 음성이 수신되면, 발화 이력 정보에 기초하여 에러 정보를 제공한 횟수를 판단하고, 에러 횟수가 기설정된 횟수 이상이면, 음성 인식 성공을 위한 가이드 정보를 제공할 수 있다.

예를 들어, 기설정된 횟수가 5회라고 가정하였을 때, 프로세서(120)는 트리거 음성이 수신되면, 발화 이력 정보에 기초하여 에러 정보를 제공한 횟수를 판단하고, 에러 횟수가 5회 이상이면, 음성 인식 성공을 위한 가이드 정보를 제공할 수 있다.

여기에서, 가이드 정보는 음성 인식을 실패한 이유에 기초하여 결정될 수 있다. 구체적으로, 프로세서(120)는 용자 음성의 발화 속도가 임계치 이상으로 빠른 이유에서 기설정된 횟수 이상 에러 정보를 제공한 경우, “천천히 말씀해주세요”와 같은 음성 인식 성공을 위한 가이드 정보를 제공할 수 있고, 사용자 음성에 임계치 이상의 복수의 단어가 포함된 이유에서 기설정된 횟수 이상 에러 정보를 제공한 경우, “짧은 문장으로 말씀해주세요”와 같은 음성 인식 성공을 위한 가이드 정보를 제공할 수 있다.

이후, 프로세서(120)는 사용자 음성이 수신되면, 사용자 음성에 대응되는 응답 정보를 제공할 수 있다.

한편, 프로세서(120)는 응답 정보 제공 후, 후속 음성의 발화를 유도하는 가이드 정보를 제공할 수 있다.

예를 들어, 프로세서(120)는 응답 정보 제공 후, “또, 궁금한 것이 있다면 빅스비를 힘차게 외쳐주세요”와 같은 후속 음성의 발화를 유도하는 가이드 정보를 제공할 수 있다.

이는, 전자 장치(100)의 사용 능숙도가 높지 않은 사용자를 고려한 것으로써, 이에 따라 본 개시는 전자 장치(100)의 사용에 능숙하지 못한 사용자의 후속 발화를 유도함으로써, 전자 장치(100)의 사용에 능숙해지도록 도움을 줄 수 있다.

도 5를 참조하면, 본 개시의 일 실시 예에 따른 전자 장치(100)는 음성 수신부(110), 통신부(130), 메모리(140), 디스플레이(150), 입력부(160), 스피커(170) 및 프로세서(120)를 포함할 수 있다. 이하, 상술한 부분과 중복되는 부분은 설명은 축약하거나 생략하여 설명한다.

통신부(130)는 외부 장치와 통신을 수행하여 다양한 데이터를 송수신할 수 있다. 특히, 통신부(130)는 사용자 음성에 대응되는 신호를 외부 서버로 전송할 수 있다. 여기에서, 신호는 사용자 음성에 대응되는 아날로그 신호가 될 수 있음은 물론, 아날로그 신호를 변환한 디지털 신호가 될 수 있다. 또한, 통신부(130)는 외부 서버로부터 사용자 음성에 대응되는 응답 정보를 수신할 수 있다.

이를 위해, 통신부(130)는 무선 통신 칩, 와이 파이 칩, 블루투스 칩 등을 포함할 수 있다.

메모리(140)는 전자 장치(100)의 구성요소의 전반적인 동작을 제어하기 위한 운영체제(Operating System: OS) 및 전자 장치(100)의 구성요소와 관련된 명령 또는 데이터를 저장할 수 있다.

이에 따라, 프로세서(120)는 저장부(140)에 저장된 다양한 명령 또는 데이터 등을 이용하여 전자 장치(100)의 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어할 수 있고, 다른 구성요소들 중 적어도 하나로부터 수신된 명령 또는 데이터를 휘발성 메모리에 로드(load)하여 처리하고, 다양한 데이터를 비휘발성 메모리에 저장(store)할 수 있다.

특히, 메모리(140)는 사용자 음성의 특성 별로 발화 이력 정보를 저장할 수 있다. 여기에서, 발화 이력 정보는 음성 수신부(110)를 통해 수신된 사용자 음성에 관한 정보, 음성 수신부(110)를 통해 사용자 음성이 수신된 횟수에 관한 정보, 사용자 음성의 인식이 실패함에 따라 제공된 에러 횟수에 관한 정보 및 사용자 음성의 발화 속도에 관한 정보 등을 포함할 수 있다.

디스플레이(150)는 다양한 화면을 표시할 수 있다. 예를 들어, 디스플레이(150)는 사용자 음성에 대응되는 응답 정보를 포함하는 화면을 표시할 수 있다.

이러한 디스플레이(150)는 LCD(Liquid Crystal Display), PDP(Plasma Display Panel) 등과 같은 다양한 형태의 디스플레이로 구현될 수 있다. 디스플레이(150) 내에는 a-si TFT, LTPS(low temperature poly silicon) TFT, OTFT(organic TFT) 등과 같은 형태로 구현될 수 있는 구동 회로, 백라이트 유닛 등도 함께 포함될 수 있다. 한편, 디스플레이(150)는 터치 감지부와 결합되어 터치 스크린으로 구현될 수 있다.

입력부(160)는 사용자 입력을 수신할 수 있다. 입력부(160)는 버튼, 터치 스크린을 포함할 수 있다.

스피커(170)는 오디오 처리부(미도시)에 의해 디코딩이나 증폭, 노이즈 필터링과 같은 다양한 처리 작업이 수행된 각종 오디오 데이터를 출력하는 구성이다.

본 개시의 일 실시 예에 따르면, 스피커(170)는 사용자 음성에 대응되는 응답 정보를 오디오로 출력할 수 있다.

본 개시의 일 실시 예에 따른 전자 장치(100)는 사용자 음성이 수신되면, 사용자 음성의 특성에 대응되는 발화 이력 정보의 축적도 레벨을 판단(S610)할 수 있다.

구체적으로, 전자 장치(100)는 사용자 음성이 수신되면, 사용자 음성의 에너지, 주파수 대역 및/또는 사용자 음성의 울림 값과 같은 사용자 음성의 특성을 판단하고, 메모리에 저장된 발화 이력 중 수신된 사용자 음성의 특성에 대응되는 발화 이력 정보의 축적도 레벨을 판단할 수 있다.

그리고, 전자 장치(100)는 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 미만이면, 사용자 음성의 특성과 관련된 사용자 정보에 기초하여 사용자 음성에 대응되는 응답 정보를 제공(S620)할 수 있다.

구체적으로, 전자 장치(100)는 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 미만이면, 음성을 발화한 사용자의 성별 및 연령대 중 적어도 하나에 기초하여 사용자 음성에 대응되는 응답 정보를 제공할 수 있다.

그리고, 전자 장치(100)는 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 이상이면, 사용자 정보 및 발화 이력 정보에 기초하여 사용자 음성에 대응되는 응답 정보를 제공(S630)할 수 있다.

구체적으로, 전자 장치(100)는 상술한 사용자의 성별 및 연령대 중 적어도 하나뿐만 아니라, 발화 이력 정보에 포함된 과거에 수신된 사용자 음성에 관한 정보, 사용자 음성이 수신된 횟수에 관한 정보, 사용자 음성의 인식이 실패함에 따라 제공된 에러 횟수에 관한 정보 및 사용자 음성의 발화 속도에 관한 정보 등을 더 고려하여 사용자 음성에 대응되는 응답 정보를 제공할 수 있다.

한편, 상술한 본 발명의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 설치 가능한 소프트웨어 또는 어플리케이션 형태로 구현될 수 있다.

또한, 상술한 본 발명의 다양한 실시 예들에 따른 방법들은, 기존 전자 장치에 대한 소프트웨어 업그레이드, 또는 하드웨어 업그레이드만으로도 구현될 수 있다.

또한, 상술한 본 발명의 다양한 실시 예들은 전자 장치에 구비된 임베디드 서버, 또는 전자 장치 외부의 서버를 통해 수행되는 것도 가능하다.

한편, 본 발명에 따른 전자 장치의 제어 방법을 순차적으로 수행하는 프로그램이 저장된 비일시적 판독 가능 매체(non-transitory computer readable medium)가 제공될 수 있다.

한편, 비일시적 판독 가능 매체란 레지스터, 캐시, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상술한 다양한 어플리케이션 또는 프로그램들은 CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등과 같은 비일시적 판독 가능 매체에 저장되어 제공될 수 있다.

또한, 이상에서는 본 발명의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.

Claims

전자 장치에 있어서,

음성 수신부; 및

상기 음성 수신부를 통해 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 발화 이력 정보의 축적도 레벨을 판단하고,

상기 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 미만이면, 상기 사용자 음성의 특성과 관련된 사용자 정보에 기초하여 상기 사용자 음성에 대응되는 응답 정보를 제공하고,

상기 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 이상이면, 상기 사용자 정보 및 상기 발화 이력 정보에 기초하여 상기 사용자 음성에 대응되는 응답 정보를 제공하는 프로세서;를 포함하는, 전자 장치.
제1항에 있어서,

상기 사용자 정보는, 상기 사용자 음성을 발화한 사용자의 성별에 관한 정보 및 연령대에 관한 정보 중 적어도 하나를 포함하고,

상기 프로세서는,

상기 사용자 음성이 수신되면, 상기 사용자 음성에 대응되는 응답 정보를 획득하고, 상기 성별에 관한 정보 및 연령대에 관한 정보 중 적어도 하나에 따라, 상기 획득된 응답 정보를 변경하여 제공하는, 전자 장치.
제2항에 있어서,

상기 프로세서는,

상기 연령대가 기설정된 임계 나이 이상이면, 상기 전자 장치의 음성 인식 모드를 트리거 하기 위한 사용자 음성이 수신된 때로부터, 기설정된 시간 동안 음성 인식 모드로 동작하고,

상기 연령대가 상기 기설정된 임계 나이 미만이면, 상기 기설정된 시간을 연장하는, 전자 장치.
제1항에 있어서,

상기 발화 이력 정보는,

컨텐츠와 관련된 사용자 음성에 관한 정보를 포함하고,

상기 프로세서는,

상기 사용자 음성에 대응되는 응답 정보를 상기 발화 이력 정보에 포함된 컨텐츠를 이용하여 제공하는, 전자 장치.
제1항에 있어서,

상기 발화 이력 정보는,

상기 전자 장치의 음성 인식 모드를 트리거 하기 위한 사용자 음성이 수신된 때로부터, 기설정된 시간 내 후속 음성이 수신되지 않은 횟수에 관한 정보를 포함하고,

상기 프로세서는,

상기 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 상기 발화 이력 정보에 기초하여 상기 후속 음성이 수신되지 않은 횟수를 판단하고, 상기 후속 음성이 수신되지 않은 횟수가 기설정된 횟수 이상이면, 상기 기설정된 시간을 연장하는, 전자 장치.
제1항에 있어서,

상기 발화 이력 정보는,

상기 사용자 음성의 인식이 실패함에 따라 제공된 에러 횟수에 관한 정보를 포함하고,

상기 프로세서는,

상기 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 상기 발화 이력 정보에 기초하여 상기 에러 횟수를 판단하고, 상기 에러 횟수가 기설정된 횟수 이상이면, 음성 인식 성공을 위한 가이드 정보를 제공하는, 전자 장치.
제6항에 있어서,

상기 프로세서는,

상기 응답 정보 제공 후, 후속 음성의 발화를 유도하는 가이드 정보를 제공하는, 전자 장치.
전자 장치의 제어 방법에 있어서,

사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 발화 이력 정보의 축적도 레벨을 판단하는 단계; 및

상기 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 미만이면, 상기 사용자 음성의 특성과 관련된 사용자 정보에 기초하여 상기 사용자 음성에 대응되는 응답 정보를 제공하고, 상기 발화 이력 정보의 축적도 레벨이 기설정된 임계 레벨 이상이면, 상기 사용자 정보 및 상기 발화 이력 정보에 기초하여 상기 사용자 음성에 대응되는 응답 정보를 제공하는 단계;를 포함하는, 전자 장치의 제어 방법.
제8항에 있어서,

상기 사용자 정보는, 상기 사용자 음성을 발화한 사용자의 성별에 관한 정보 및 연령대에 관한 정보 중 적어도 하나를 포함하고,

상기 제공하는 단계는,

상기 사용자 음성이 수신되면, 상기 사용자 음성에 대응되는 응답 정보를 획득하고, 상기 성별에 관한 정보 및 연령대에 관한 정보 중 적어도 하나에 따라, 상기 획득된 응답 정보를 변경하여 제공하는, 전자 장치의 제어 방법.
제9항에 있어서,

상기 연령대가 기설정된 임계 나이 이상이면, 상기 전자 장치의 음성 인식 모드를 트리거 하기 위한 사용자 음성이 수신된 때로부터, 기설정된 시간 동안 음성 인식 모드로 동작하고, 상기 연령대가 상기 기설정된 임계 나이 미만이면, 상기 기설정된 시간을 연장하는 단계;를 더 포함하는, 전자 장치의 제어 방법.
제8항에 있어서,

상기 발화 이력 정보는,

컨텐츠와 관련된 사용자 음성에 관한 정보를 포함하고,

상기 제공하는 단계는,

상기 사용자 음성에 대응되는 응답 정보를 상기 발화 이력 정보에 포함된 컨텐츠를 이용하여 제공하는, 전자 장치의 제어 방법.
제8항에 있어서,

상기 발화 이력 정보는,

상기 전자 장치의 음성 인식 모드를 트리거 하기 위한 사용자 음성이 수신된 때로부터, 기설정된 시간 내 후속 음성이 수신되지 않은 횟수에 관한 정보를 포함하고,

상기 제어 방법은,

상기 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 상기 발화 이력 정보에 기초하여 상기 후속 음성이 수신되지 않은 횟수를 판단하고, 상기 후속 음성이 수신되지 않은 횟수가 기설정된 횟수 이상이면, 상기 기설정된 시간을 연장하는 단계;를 더 포함하는, 전자 장치의 제어 방법.
제8항에 있어서,

상기 발화 이력 정보는,

상기 사용자 음성의 인식이 실패함에 따라 제공된 에러 횟수에 관한 정보를 포함하고,

상기 제공하는 단계는,

상기 사용자 음성이 수신되면, 상기 사용자 음성의 특성에 대응되는 상기 발화 이력 정보에 기초하여 상기 에러 횟수를 판단하고, 상기 에러 횟수가 기설정된 횟수 이상이면, 음성 인식 성공을 위한 가이드 정보를 제공하는, 전자 장치의 제어 방법.
제8항에 있어서,

상기 응답 정보 제공 후, 후속 음성의 발화를 유도하는 가이드 정보를 제공하는 단계;를 더 포함하는, 전자 장치의 제어 방법.