WO2019160396A2

WO2019160396A2 - 안내 로봇 및 안내 로봇의 동작 방법

Info

Publication number: WO2019160396A2
Application number: PCT/KR2019/004336
Authority: WO
Inventors: 신원호; 맹지찬
Original assignee: 엘지전자 주식회사
Priority date: 2019-04-11
Filing date: 2019-04-11
Publication date: 2019-08-22
Also published as: WO2019160396A3; KR20210138181A; US20200005787A1; US11276399B2

Abstract

본 발명은 안내 로봇 및 안내 로봇의 동작방법을 개시한다. 본 발명에 따른 안내 로봇은, 음성을 수신하도록 형성된 음성 수신부, 수신된 음성에 기 설정된 시동어가 포함되어 있는지 여부를 판단하는 제어부, 기 설정된 시동어에 의하여 활성화되도록 설정된 인공 지능 서버와 통신하는 무선 통신부를 포함한다. 이때, 제어부는, 수신된 음성에 기 설정된 시동어가 포함된 경우에는 수신된 음성을 상기 인공 지능 서버로 전송하고, 인공 지능 서버로부터 결과 정보를 수신하여 수신된 결과 정보를 출력한다. 그리고, 수신된 음성에 기 설정된 시동어가 미포함된 경우에는, 기설정된 기준에 따라 선택된 응답 음성을 출력한다.

Description

안내 로봇 및 안내 로봇의 동작 방법

본 발명은 인공 지능 서버와 통신이 가능한 안내 로봇에 관한 것이다.

최근 하드웨어의 발전과 함께, 인간의 사고 과정, 즉 인지, 추론, 학습 등을 컴퓨팅 기술로 구현하는 인공 지능 기술이 비약적으로 발전하고 있다.

인공 지능 기술은 그 자체로 연구 대상이 될 뿐만 아니라, 컴퓨터 과학의 다른 분야와 직간접으로 결합되어, 다양한 기능들을 제공할 수 있다. 특히, 정보기술의 여러 분야에서 인공지능적 요소를 도입하여, 그 분야의 문제 풀이에 활용하려는 시도가 매우 활발하게 이루어지고 있다.

인공 지능 기술은 강한 인공지능과 약한 인공지능으로 구분된다. 강한 인공지능은 인간과 유사한 사고 및 의사 결정을 내릴 수 있는 기술 방식으로, 스스로 학습하여, 스스로 판단을 내리는 수준의 기술이다. 약한 인공지능은 계산 모델을 통하여, 지각, 추론 등의 인지 과정을 수행하여, 최적의 솔루션을 제공하는 수준의 기술이다.

이러한 개술 개발의 일환으로, 사용자에게 다양한 안내 서비스를 제공하는 안내 로봇에 인공 지능 기술을 적용하고자 하는 시도와 연구들이 증가하고 있다.

이러한 안내로봇에 명령을 내리거나 안내 로봇과 대화를 하기 위해서는, 먼저 시동어를 호출하고, 그에 대한 인식이 필요하다. 이와 관련하여WO 2017/217978 A1 특허문헌에는 적어도 하나의 시동어(wake-up word)를 통해 음성 앱을 활성화하는 것과, 스피커에 의해 발화된 음성에 시동어가 포함되어 있는지를 판단하여, 자동화된 음성 인식의 정보 표시를 수행하는 구성을 개시한다.

그러나, 안내 로봇을 마치 사람처럼 생각하는 아이의 경우, 간단한 인사말을 포함한 채팅 수준의 대화를 더 선호한다. 또, 시동어 호출을 자연스럽게 수행하기 어려운 노인, 장애인의 경우도, 시동어 발화를 통해 로봇과 인터페이스를 연계시키기 어려운 문제가 있다. 그러나, 일상적으로 사용하는 인사말을 시동어로 하게 되면 오인식률이 높아져서, 안내 로봇의 성능과 사용성이 크게 감소될 것이다.

또, 사용자에 따라서는 특정 정보를 획득하기 위한 목적 보다는 안내 로봇과 단순히 인사만 나누고 싶은 경우가 있다. 이러한 경우, 사용자는 안내 로봇이 사용자에게 보다 친근감 있게 응답하기를 기대할 것이다.

앞서 설명한 문제점을 해결하기 위하여, 본 발명의 일 목적은 사용자에게 보다 친근감을 주면서 사용성은 향상되도록 구현한 안내 로봇 및 그 동작방법을 제공하는데 있다.

또한, 본 발명의 또 다른 목적은 사용자가 특정 목적을 가지고 질의하지 않은 경우에도, 사용자의 다양한 특징 및 사용 어휘에 맞는 맞춤형 응답을 지속적으로 수행하는 안내 로봇 및 그 동작방법을 제공하는데 그 목적이 있다.

또한, 본 발명의 또 다른 목적은, 사용자가 단순히 인사만 하고 싶은지 또는 보다 구체적인 정보를 제공받기를 원하는지 여부를 구별하여 응답을 수행할 수 있는 안내 로봇 및 그 동작방법을 제공하는데 있다.

이를 위해, 본 발명에 따른 안내 로봇은, 음성을 수신하도록 형성된 음성 수신부; 수신된 음성에 기 설정된 시동어가 포함되어 있는지 여부를 판단하는 제어부; 기 설정된 시동어에 의하여 활성화되도록 설정된 인공 지능 서버와 통신하는 무선 통신부;를 포함하고, 상기 제어부는, 상기 수신된 음성에 기 설정된 시동어가 포함된 경우, 상기 수신된 음성을 상기 인공 지능 서버로 전송하고, 상기 인공 지능 서버로부터 결과 정보를 수신하여 수신된 결과 정보를 출력하며, 상기 수신된 음성에 기 설정된 시동어가 미포함된 경우, 기설정된 기준에 따라 선택된 응답 음성을 출력하는 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 제어부는, 상기 수신된 음성에 기 설정된 시동어가 미포함된 경우 인사말 인식 동작을 수행하며, 상기 인사말 인식 동작에서는, 적어도 하나 이상의 센서로부터 수신된 감지신호에 근거하여 인사말로 인식되는지 여부를 판단하는 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 제어부는, 상기 인사말 인식 동작에 따라 인사말이 인식된 경우, 인식된 인사말에 하나 이상의 요청사항이 포함되어 있는지를 추가로 판단하고, 판단 결과에 근거하여 응답 음성을 선택하는 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 제어부는, 판단 결과, 인식된 인사말에 하나 이상의 요청사항이 포함된 경우이면, 인식된 요청 사항에 따른 가이드 음성을 출력하고, 판단 결과, 인식된 인사말에 하나 이상의 요청사항이 미포함된 경우이면, 상기 인식된 인사말에 매칭되는 응답 음성을 출력하는 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 제어부는, 상기 인사말 인식 동작에서 인사말이 인식되지 않은 경우, 상기 수신된 음성에 근거하여 오인식 동작 및 인사말 학습을 수행하는 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 기설정된 기준에 따라 선택되는 응답 음성은, 상기 수신된 음성에 매칭되는 인사말 음성 및 상기 기 설정된 시동어의 발화를 안내하는 가이드 음성 중 어느 하나인 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 제어부는, 상기 수신된 음성에 기 설정된 시동어가 미포함된 경우 인사말 인식 동작을 개시하고, 상기 인사말 인식 동작에 따라 상기 수신된 음성에 매칭되는 응답 음성을 출력하고, 상기 응답 음성의 출력 후 정해진 조건을 만족하는 것에 응답하여 상기 기 설정된 기동어의 발화를 안내하는 가이드 음성을 출력하는 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 정해진 조건은 수신된 음성의 볼륨이 증가하는 경우, 소정시간내의 입력된 음성 횟수가 일정 횟수 이상인 경우, 응답 음성의 발화 후 소정 시간 내에 새로운 음성이 수신된 경우 중 적어도 하나를 포함하는 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 제어부는, 상기 응답 음성의 출력 후 상기 정해진 조건을 만족하지 않고 일정 시간 내에 새로운 음성이 수신되면, 새로운 음성에 매칭되는 응답 음성을 출력하고, 상기 응답 음성의 출력 후 정해진 조건을 만족하지 않고 일정 시간이 경과하면 상기 인사말 인식 동작을 종료하는 것을 특징으로 한다.

또한, 일 실시 예에서, 안내 로봇 본체에 접근하는 사용자를 감지하는 센서;를 더 포함하고, 상기 제어부는, 상기 수신된 음성에 기 설정된 시동어가 미포함된 경우 인사말 인식 동작을 개시하고, 상기 센서를 통해 접근하는 사용자가 감지되면, 접근한 사용자를 확인하여 사용자 특징을 분류하고, 분류된 사용자 특징에 적합하도록 인사말을 가공하여 응답 음성으로 출력하는 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 제어부는, 상기 센서를 통해 접근하는 사용자가 감지되면, 카메라를 활성화하여 접근한 사용자의 얼굴 이미지를 획득하고, 획득된 얼굴 이미지를 분석하여 사용자 특징을 추출하여 분류하는 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 제어부는, 상기 수신된 음성에 기 설정된 시동어가 미포함된 경우, 상기 수신된 음성에 정해진 키워드가 포함되었는지 여부를 판단하고, 판단 결과 정해진 키워드가 포함된 경우이면 해당 키워드가 포함된 음성을 음성 인식 서버로 전송하여 키워드에 대응되는 상황정보를 수신하고, 수신된 상황정보에 근거하여 생성된 응답 음성을 출력하는 것을 특징으로 한다.

또, 본 발명의 실시 예에 따른 안내 로봇의 동작 방법은, 음성을 출력할 수 있는 안내 로봇의 동작 방법으로서, 사용자의 음성을 수신하는 단계; 수신된 음성에 기 설정된 시동어가 포함되어 있는지 여부를 판단하는 단계; 상기 수신된 음성에 기 설정된 시동어가 포함된 경우, 수신된 음성을 상기 기 설정된 시동어에 의하여 활성화되도록 설정된 인공 지능 서버로 전송하고, 상기 인공 지능 서버로부터 결과 정보를 수신하여 수신된 결과 정보를 출력 단계; 및 상기 수신된 음성에 기 설정된 시동어가 미포함된 경우, 기설정된 기준에 따라 선택된 응답 음성을 출력하는 단계를 포함하여 이루어진다.

또한, 일 실시 예에서, 상기 기설정된 기준에 따라 선택된 응답 음성을 출력하는 단계는, 상기 수신된 음성에 기 설정된 시동어가 미포함된 경우 인사말 인식 동작을 수행하는 단계; 상기 인사말 인식 동작에서, 적어도 하나 이상의 센서로부터 수신된 감지신호에 근거하여 인사말로 인식되는지 여부를 판단하는 단계; 및 상기 인사말 인식 동작에 따라 인사말이 인식된 경우, 인식된 인사말에 하나 이상의 요청사항이 포함되어 있는지를 추가로 판단하고, 판단 결과에 근거하여 응답 음성을 선택하는 단계를 포함하는 것을 특징으로 한다.

또한, 일 실시 예에서, 상기 동작방법은, 하나 이상의 요청사항이 포함되어 있는지의 판단 결과, 인식된 인사말에 하나 이상의 요청사항이 포함된 경우이면, 인식된 요청 사항에 따른 가이드 음성을 출력하는 단계; 및 하나 이상의 요청사항이 포함되어 있는지의 판단 결과, 인식된 인사말에 하나 이상의 요청사항이 미포함된 경우이면, 상기 인식된 인사말에 매칭되는 응답 음성을 출력하는 단계를 더 포함하는 것을 특징으로 한다.

이상에서 살펴본 본 발명의 실시 예에 따른 안내 로봇은, 사용자에게 보다 친근감을 주면서 자연스럽게 인터페이스 연계가 가능하도록 안내함으로써, 사용성을 더욱 향상시킬 수 있다.

또, 일상 어휘의 인식률이 높지 않은 점을 고려하여, 다양한 상황 수집을 통해 사용자가 실제로 발화한 것인지 여부를 인식하여, 상황에 맞는 자연스러운 대화를 이어나갈 수 있다.

또한, 사용자가 특정 목적을 가지고 질의하지 않은 경우에도, 발화한 것으로 추정되는 사용자의 특징을 파악하여 어울리는 맞춤형 응답을 수행할 수 있고, 새로운 일상 어휘를 지속적으로 학습할 수 있다. 또, 사용자가 시동어를 발화하지 않더라도, 목적없이 단순히 인사만 하고 싶은 경우와 구체적인 정보를 제공받기를 원하는지 여부를 구별하여, 적절한 응답을 수행할 수 있다. 그에 따라, 확장된 일상 대화가 가능해지므로, 높은 친근감과 감성을 느낄 수 있다.

도 1은 본 발명과 관련된 안내 로봇의 예시를 보여주는 도면이다.

도 2 본 발명과 관련된 안내 로봇의 예시 구성을 보인 블록도이다.

도 3은 본 발명과 관련된 안내 로봇의 음성 인식 과정을 설명하기 위한 도면이다.

도 4는 본 발명과 관련된 안내 로봇의 동작방법을 설명하기 위한 대표 흐름도이다.

도 5는 본 발명과 관련된 안내 로봇에서, 인사말에 요청사항이 포함되어있는지 여부에 따라 서로 다른 응답을 출력하는 과정을 설명하기 위한 흐름도이다.

도 6은 본 발명과 관련된 안내 로봇에서, 기 설정된 조건의 만족 여부에 따라 시동어 가이드 음성의 출력 여부를 결정하는 과정을 설명하기 위한 흐름도이다.

도 7a 및 도 7b는 도 6과 관련된 서로 다른 응답 음성을 출력하는 예시 도면들이다.

도 8, 도 9a, 도 9b는 본 발명과 관련된 안내 로봇에서, 접근한 사용자의 특징에 적합한 인사말 음성을 출력하는 것을 설명하기 위한 도면들이다.

도 10은 본 발명과 관련된 안내 로봇에서, 수신된 음성에 기 설정된 시동어가 아닌 정해진 키워드가 포함된 경우의 처리 동작을 설명하기 위한 흐름도이다.

이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.

제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.

본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

한편, 본 명세서에 개시된 "안내 로봇"은 공항, 백화점 등 안내 로봇을 이용하는 사용자에게 길 안내, 상품안내, 공항 정보 등의 다양한 정보를 제공할 수 있는 로봇을 의미한다.

또, 본 명세서에 개시된 "안내로봇"은, 길, 특정 장소 등을 사용자에게 안내하기 위하여, 스스로 자율주행을 수행하는 것이 가능한 로봇을 의미할 수 있다.

또, 본 명세서에 개시된 "안내 로봇"은, 사용자에게 다양한 정보나 안내를 제공하기 위하여, 화면, 음성, LED 외에, 지속적인 대화를 통한 인터랙션, 및 이동을 수행할 수 있다.

이하, 도 1은 본 발명과 관련된 안내 로봇의 예시를 보여주는 도면이다. 도 1을 참조하면, 본 발명에 따른 안내 로봇(100)은, 헤드(102), 카메라(121), 스피커(152), 음성인식부(미도시), 디스플레이부(151), 및 주행부(130)를 포함하여 이루어질 수 있다. 다만, 경우에 따라서는 여기에 개시된 수단 중 일부를 제거하거나 또는 다른 수단을 더 포함하여, 본 발명에 따른 안내 로봇(100)이 구현될 수도 있다.

본 발명에 따른 안내 로봇(100)의 외관은 크게, 헤드(102)와 디스플레이부(151)를 포함하는 상부모듈과 주행부(130)를 포함하는 하부모듈을 포함하여 이루어질 수 있다.

이때에, 상부모듈과 하부모듈은 상호간에 탈착 가능하도록 구비될 수 있다. 상기 상부모듈은, 서비스 환경에 따라 변경 가능한 사용자 인터페이스(User Interface)를 제공한다. 상기 하부모듈은 안내 로봇 본체의 이동을 위한 주행기능을 제공한다.

상기 상부모듈은, 다시 몸체를 형성하며, 디스플레이부(151)가 구비된 바디부와, 카메라(121) 등이 구비된 헤드부(102)로 구분될 수 있다. 그러나, 경우에 따라서는 바디부에 카메라가 구비되거나 헤드부(102)에 디스플레이부가 배치되는 형태로 구현될 수도 있다.

카메라(121)는 헤드부(102)의 케이스 일측 또는 바디부의 케이스 일측에 구비될 수 있다. 또, 상기 카메라(121)는 복수 개 구비될 수 있다. 이러한 경우, 하나는 본체의 전면에 구비되어 전방을 향하도록 설치되고, 다른 하나는 측면 또는 후면에 구비되어 측방/후방을 향하도록 설치될 수 있다. 그에 따라, 360 범위의 화각을 형성할 수 있다.

카메라(121)가 복수 개 구비되는 경우, 제1카메라는 예를 들어 3D 스테레오 카메라를 포함할 수 있다. 상기 3D 스테레오 카메라는 장애물 감지, 사용자 얼굴인식, 입체영상 획득 등의 기능을 수행할 수 있다. 안내 로봇(100)은 제1카메라를 이용하여 자신의 이동방향에 존재하는 장애물을 감지하여 회피할 수 있고, 사용자를 인식하여 각종 제어동작을 수행할 수 있다. 또, 제2카메라는 예를 들어 슬램(Simultaneous Localization And Mapping) 카메라를 포함할 수 있다. 상기 슬램카메라는 특징점 매칭을 통하여 카메라의 현 위치를 추적하고 이를 기초로 3차원 지도를 작성하는 기능을 수행한다. 안내 로봇(100)은 제2카메라를 이용하여 자신의 현재 위치를 파악할 수 있다.

스피커(152)는 사용자에게 제공될 정보를 음성으로 알려주는 기능을 수행한다. 구체적으로, 안내 로봇(100)에 구비된 마이크(미도시)와 음성인식부(미도시)를 통해 수신된 사용자 음성에 대응되는 응답이나 검색 결과는 스피커(152)를 통해 음성으로 출력된다. 이러한 스피커는 헤드부(102)나 디스플레이부(151)가 구비된 바디부의 외주면에 마련될 수 있다.

디스플레이부(151)는 바디부의 일 방향에 길이방향으로 위치할 수 있고, 시각적인 정보, 예를 들어 안내 정보를 제공하기 위하여 화면을 표시할 수 있다. 또, 상기 디스플레이부(151)는 디스플레이모듈, 터치센서, 압력센서를 포함하여 이루어질 수 있다.

또, 상기 디스플레이부(151)는 예를 들어 이동가이드수단과 결합하여 바디부의 내부를 개폐하도록 구현될 수 있다. 또, 상기 디스플레이부(151)는 예를 들어 고정부재를 사용하여 바디부에 결속되어 고정되도록 구현될 수도 있다.

또, 비록 자세히 도시되지는 않았지만, 안내 로봇(100)이 사용자에게 길을 안내하기 위하여 설정된 경로로 선 이동하는 경우를 고려하여, 상기 디스플레이부(151)는 헤드(102)를 기준으로 후방에 구비되거나, 또는 전방 외에 후방에도 추가로 구비될 수 있다. 또는, 설정된 경로로 선 이동하기에 앞서 헤드(102)가 180도 회전하여, 디스플레이부(151)가 후방에 위치한 것처럼 외관을 변형시킬 수도 있다.

이러한 경우 디스플레이부(151)에는 현재 제공되는 서비스와 관련된 시각정보(예, 길 안내 정보, 질의 정보)를 표시하는 기능을 수행한다. 사용자는 안내 로봇(100)을 따라 이동하면서, 안내 로봇(100)의 후방에 설치된 디스플레이부(151)를 볼 수 있다.

주행부(130)는 안내 로봇(100) 본체의 이동, 회전을 수행한다. 이를 위해, 주행부(130)는 복수의 휠 및 구동 모터를 포함하여 이루어질 수 있다. 주행부(130)의 구동은 제어부에 의해 수신된 제어명령에 따라 제어되며, 구동 전 후에 LED 등의 출력수단을 통한 알림이 제공될 수 있다.

본 발명에 따른 안내 로봇(100)은 통신부(110), 입력부(120), 주행부(130), 센싱부(140), 출력부(150), 러닝데이터부(160), 메모리(170), 제어부(180) 및 전원부(190) 등을 포함할 수 있다. 도 2에 도시된 구성요소들은 안내 로봇을 구현하는데 있어서 필수적인 것은 아니어서, 본 명세서 상에서 설명되는 안내 로봇은 위에서 열거된 구성요소들 보다 많거나, 또는 적은 구성요소들을 가질 수 있다.

통신부(110)는, 안내 로봇(100)과 외부서버, 예를 들어 인공 지능 서버, 또는 외부단말 사이의 무선 통신을 가능하게 하는 하나 이상의 모듈을 포함할 수 있다. 또, 상기 통신부(110)는, 안내 로봇(100)을 하나 이상의 네트워크에 연결하는 하나 이상의 모듈을 포함할 수 있다.

상기 통신부(110)는, 예를 들어 WLAN(Wireless LAN), Wi-Fi(Wireless-Fidelity), Wi-Fi(Wireless Fidelity) Direct, DLNA(Digital Living Network Alliance), WiBro(Wireless Broadband), WiMAX(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access), HSUPA(High Speed Uplink Packet Access), LTE(Long Term Evolution), LTE-A(Long Term Evolution-Advanced) 등의 무선 인터넷 통신 기술을 사용하여 인공지능 서버 등과 통신을 수행할 수 있다.

또, 상기 통신부(110)는 블루투스(Bluetooth™), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication) 등의 근거리 통신 기술을 사용하여 외부 단말 등과 통신을 수행할 수 있다.

입력부(120)는, 영상 신호 입력을 위한 카메라(121) 또는 영상 입력부, 오디오 신호 입력을 위한 마이크(microphone, 122), 사용자로부터 정보를 입력받기 위한 사용자 입력부(미도시, 예를 들어, 터치키(touch key), 푸시키(mechanical key) 등)를 포함할 수 있다. 입력부(120)에서 수집한 신호데이터, 음성 데이터, 이미지 데이터는 분석되어 사용자의 제어명령으로 처리될 수 있다.

센싱부(140)는 안내 로봇 내 정보, 안내 로봇을 둘러싼 주변 환경 정보 및 사용자 정보 중 적어도 하나를 센싱하기 위한 하나 이상의 센서를 포함할 수 있다. 예를 들어, 센싱부(140)는 근접센서(141, proximity sensor), 조도 센서(illumination sensor), 터치 센서(touch sensor), 가속도 센서(acceleration sensor), 자기 센서(magnetic sensor), 중력 센서(G-sensor), 자이로스코프 센서(gyroscope sensor), 모션 센서(motion sensor), RGB 센서, 적외선 센서(IR 센서: infrared sensor), 지문인식 센서(finger scan sensor), 초음파 센서(ultrasonic sensor), 광 센서(optical sensor, 예를 들어, 카메라(121 참조)), 마이크로폰(microphone, 122 참조), 배터리 게이지(battery gauge), 환경 센서(예를 들어, 기압계, 습도계, 온도계, 방사능 감지 센서, 열 감지 센서, 가스 감지 센서 등), 화학 센서(예를 들어, 전자 코, 헬스케어 센서, 생체 인식 센서 등) 중 적어도 하나를 포함할 수 있다. 한편, 본 명세서에 개시된 안내 로봇은, 이러한 센서들 중 적어도 둘 이상의 센서에서 센싱되는 정보들을 조합하여 활용할 수 있다.

근접 센서(141)의 예로는 투과형 광전 센서, 직접 반사형 광전 센서, 미러 반사형 광전 센서, 고주파 발진형 근접 센서, 정전 용량형 근접 센서, 자기형 근접 센서, 적외선 근접 센서 등이 있다. 또, 근접 센서(141)는 초음파 센서의 초음파를 이용하여, 감지대상의 위치정보를 인식할 수 있다.

출력부(150)는 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 디스플레이부(151), 음향출력모듈(152), 광 출력부(153) 중 적어도 하나를 포함할 수 있다. 디스플레이부(151)는 터치 센서와 상호 레이어 구조를 이루거나 일체형으로 형성됨으로써, 터치 스크린을 구현할 수 있다. 이러한 터치 스크린은, 안내 로봇(100)과 사용자 사이의 입력 인터페이스를 제공하는 사용자 입력부로써 기능함과 동시에, 출력 인터페이스를 제공할 수 있다.

광 출력부(153)는 광원의 빛을 이용하여 안내 로봇(100)의 이벤트 발생을 알리기 위한 신호를 출력한다. 예를 들어, 안내 로봇(100)의 주행부(130)에 이동명령이 전달된 경우, 이동을 알리기 위한 신호가 광 출력부(153)를 통해 출력된다.

러닝데이터부(160)는 데이터 마이닝(data mining), 데이터 분석, 지능형 의사결정 및 머신 러닝 알고리즘 및 기술을 위해 이용될 정보를 수신, 분류, 저장 및 출력하도록 구성될 수 있다. 러닝데이터부(160)는 안내 로봇을 통해 수신, 검출, 감지, 생성, 사전 정의된 정보 또는 상기 안내 로봇을 통해 다른 방식으로 출력된 정보를 저장하거나, 다른 구성, 장치 및 단말기에 의하여 수신, 검출, 감지, 생성, 사전 정의 또는 출력된 데이터를 저장하도록 구성된 하나 이상의 메모리 유닛을 포함할 수 있다.

러닝데이터부(160)는 안내 로봇에 통합되거나, 메모리를 포함할 수 있다. 일 실시 예에서, 러닝데이터부(160)는 메모리(170)를 통해 구현될 수 있다. 다만 이에 한정되지 않고, 러닝데이터부(160)는 안내 로봇(100)과 관련된 외부 메모리에 구현되거나, 안내 로봇(100)과 통신 가능한 서버에 포함된 메모리를 통해 구현될 수 있다. 다른 일 실시 예에서, 러닝데이터부(160)는 클라우드 컴퓨팅 환경에서 유지되는 메모리, 또는 네트워크와 같은 통신 방식을 통해 안내 로봇에 의해 액세스 가능한 다른 원격 메모리를 통해 구현될 수 있다.

러닝데이터부(160)는 일반적으로 감독 또는 감독되지 않은 학습, 데이터 마이닝, 예측 분석 또는 다른 머신 러닝 기술에서 사용하기 위한 데이터를 식별, 색인화, 분류, 조작, 저장, 검색 및 출력하기 위해, 상기 데이터를 하나 이상의 데이터베이스에 저장하도록 이루어진다. 러닝데이터부(160)에 저장된 정보는 서로 다른 유형의 데이터 분석, 기계 학습 알고리즘 및 기계 학습 기술 중 적어도 하나를 사용하는 제어부(180) 또는 안내 로봇에 포함된 복수의 제어부들(프로세서들)에 의하여 이용될 수 있다. 이러한 알고리즘 및 기법의 예로는 K 최근접 이웃 시스템(k-Nearest neighbor system), 퍼지 논리(fuzzy logic)(예를 들어, 가능성 이론(possibility theory)), 신경 회로망(neural networks), 볼츠만 머신(Boltzmann machines), 벡터 양자화, 펄스 신경망(pulsed neural nets), 서포트 벡터 머신(support vector machines), 최대-마진 분류기(maximum margin classifiers), 힐 클라이밍(hill-climbing), 유도 논리 시스템(inductive logic systems), 베이지안 네트워크(baysian networks), 페트리 네트(petri nets) (예를 들어, 유한 상태 기계(finite state machines), 밀리 머신(mealy machines), 무어 유한 상태 머신(moore finite state machines)), 분류 트리(classifier trees)(예를 들어, 퍼셉트론 트리(perceptron trees), 서포트 벡터 트리(support vector trees), 마코브 트리(markov trees), 트리-숲 결정(decision tree forests), 랜덤 숲(random forests)), 목마전 모형 및 시스템(pandemonium models and systems), 클러스터링(clustering), 인공 지능 플래닝(artificially intelligent planning), 인공 지능 예측(artificially intelligent forecasting), 데이터 퓨전(data fusion), 센서 퓨전(sensor fusion), 이미지 퓨전(image fusion), 강화 학습(reinforcement learning), 증강 현실(augmented reality), 패턴 인식(pattern recognition), 자동 플래닝(automated planning) 등이 있다.

제어부(180)는 데이터 분석, 머신 러닝 알고리즘 및 머신 러닝 기술을 사용하여 결정 또는 생성된 정보에 기초하여, 안내 로봇의 실행 가능한 동작을 결정 또는 예측할 수 있다. 이를 위하여, 제어부(180)는 러닝데이터부(160)의 데이터를 요청, 검색, 수신 또는 활용할 수 있다. 제어부(180)는 지식 기반 시스템, 추론 시스템 및 지식 획득 시스템 등을 구현하는 다양한 기능을 수행할 수 있으며, 불확실한 추론을 위한 시스템(예를 들어, 퍼지 논리 시스템), 적응 시스템, 기계 학습 시스템, 인공 신경망 등을 포함하는 다양한 기능을 수행할 수 있다.

또한, 제어부(180)는 I/O 처리 모듈, 환경 조건 모듈, 음성-텍스트(STT) 처리 모듈, 자연 언어 처리 모듈, 작업 흐름 처리 모듈 및 서비스 처리 모듈 등과 같은 음성 및 자연 언어 처리를 가능하게 하는 서브 모듈들을 포함할 수 있다. 서브 모듈들 각각은 안내 로봇에서 하나 이상의 시스템 또는 데이터 및 모델, 또는 이들의 서브셋 또는 수퍼셋에 대한 접근권한을 가질 수 있다. 여기서, 서브 모듈들 각각이 접근권한을 가지는 대상은 스케줄링, 어휘 인덱스, 사용자 데이터, 태스크 플로우 모델, 서비스 모델 및 자동 음성 인식(ASR) 시스템을 포함할 수 있다. 다른 일 실시 예에 있어서, 제어부(180) 또는 안내 로봇은 상기 서브 모듈, 시스템, 또는 데이터 및 모델로 구현 될 수 있다.

일부 실시 예에서, 러닝데이터부(160)에서의 데이터에 기초하여, 제어부(180)는 사용자 입력 또는 자연 언어 입력으로 표현된 문맥 조건 또는 사용자의 의도에 기초하여 사용자가 요구하는 것을 검출하고 감지하도록 구성될 수도 있다.

러닝데이터부(160)는 데이터 분석, 머신 러닝 알고리즘 및 머신 러닝기술을 바탕으로, 안내 로봇의 동작이 결정되면, 제어부(180)는 이러한 결정된 동작을 실행하기 위하여, 안내 로봇의 구성 요소들을 제어할 수 있다. 제어부(180)는 제어 명령에 근거하여, 안내 로봇을 제어함으로써, 결정된 동작을 실행할 수 있다.

메모리(170)는 안내 로봇(100)의 다양한 기능을 지원하는 데이터를 저장한다. 메모리(170)는 안내 로봇(100)에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application))과, 안내 로봇(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다.

메모리(170)는, 예를 들어 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), SSD 타입(Solid State Disk type), SDD 타입(Silicon Disk Drive type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(random access memory; RAM), SRAM(static random access memory), 롬(read-only memory; ROM), EEPROM(electrically erasable programmable read-only memory), PROM(programmable read-only memory), 자기 메모리, 자기 디스크 및 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.

제어부(180)는 상기 응용 프로그램과 관련된 동작 외에, 통상적으로 안내 로봇(100)의 전반적인 동작을 제어한다. 제어부(180)는 위에서 살펴본 구성요소들을 통해 입력 또는 출력되는 신호, 데이터, 정보 등을 처리하거나 메모리(170)에 저장된 응용 프로그램을 구동하거나, 주행부(130)를 제어함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.

전원부(190)는 제어부(180)의 제어 하에서, 외부의 전원, 내부의 전원을 인가 받아 안내 로봇(100)에 포함된 각 구성요소들에 전원을 공급한다. 이러한 전원부(190)는 배터리를 포함하며, 상기 배터리는 내장형 배터리 또는 교체가능한 형태의 배터리가 될 수 있다.

상기 각 구성요소들 중 적어도 일부는, 이하에서 설명되는 다양한 실시 예들에 따른 안내 로봇의 동작, 제어, 또는 제어방법을 구현하기 위하여 서로 협력하여 동작할 수 있다. 또한, 상기 안내 로봇의 동작, 제어, 또는 제어방법은 상기 메모리(170)에 저장된 적어도 하나의 응용 프로그램의 구동에 의하여 안내 로봇상에서 구현될 수 있다.

한편, 이하에서 다양한 실시 예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 장치로 읽을 수 있는 기록매체 내에서 구현될 수 있다.

이하 도 3은 본 발명과 관련된 안내 로봇의 음성 인식 과정을 설명하기 위한 도면이다. 도 3을 참조하면, 본 발명에 따른 안내 로봇은 대기 상태(210) 또는 음성 인식 상태(220)로 설정될 수 있다.

대기 상태(210)는 음성 인식 기능의 실행 전, 안내 로봇 주변에 음성 인식 기능의 실행과 관련된 음성이 존재하는지 여부를 감지하는 상태이다. 이를 위하여, 상기 대기 상태(210)에서, 안내 로봇의 제어부(180)는, 마이크(122)를 통하여 지속적으로 특정 음량(loudness) 이상의 소리가 감지되는지 여부를 감시(또는 모니터링)할 수 있다.

상기 대기 상태(210)에서는 음성 분석이 수행되지 않으므로, 저전력, 예를 들어, 4.4mA 정도의 전류만을 소모할 수 있다. 이러한 대기 상태(210)는 "리스닝 상태(listening phase)"로 명명될 수 있다.

안내 로봇의 제어부(180)는 대기 상태(210)에서 특정 음량 이상의 소리가 감지되면, 대기 상태(210)에서 음성 인식 상태(220)로 전환할 수 있다.

음성 인식 상태(220)는 제어부(180)가 마이크를 통해 입력된 음성을 분석하는 상태이다. 음성 인식 상태(220)는 음성 분석을 수행하기 때문에, 대기 상태(210)에서보다 더 많은 전류를 소모하게 된다. 예를 들어, 기 설정된 시동어가 수신되기 이전에는, 안내 로봇이 음성 분석을 수행하지 않는 대기 상태(210)로 존재하여, 소모 전류를 감소시킬 수 있다.

제어부(180)는 음성 분석 전, 상기 음성 인식 상태(220)에서 음성 인식을 시작하는 기 설정된 시동어가 수신되었는지 여부를 판단할 수 있다.

상기 시동어는, 음성 분석을 시작하기 위한 제어 명령으로, 장치마다 다양한 단어로 설정될 수 있다. 예를 들어, 시동어는, "Hello, my phone", "Alexa", "OK, google", "air star" 등과 같이 설정될 수 있다. 제어부(180)는 기 설정된 시동어 이후에 발화된 음성에 대하여, 정확한 음성 분석을 시작할 수 있다.

상기 제어부(180)는 음성 인식 상태(220)에서, 음성 인식 알고리즘을 이용하여, 음성 정보를 분석할 수 있다. 또한, 상기 제어부(180)는 상기 분석 결과에 근거하여, 음성 정보에 대응되는 음성 명령에 따라, 안내 로봇을 제어할 수 있다. 이러한 음성 분석은 안내 로봇에 설치된 별도의 써드 파티 애플리케이션(3rd party application)을 이용하여 수행될 수도 있다.

상기 제어부(180)는 인공 지능 알고리즘을 통하여 음성 분석된 분석 정보를 처리하기 위하여, 기 설정된 인공 지능 서버에 전송할 수 있다.

상기 인공 지능 서버는, 인공 지능 알고리즘을 이용하여 방대한 량의 정보를 학습하고, 학습된 정보를 바탕으로 최적의 결과 정보를 도출하는 기능을 제공하는 서버이다. 인공 지능 서버는, 안내 로봇과 통신 가능한 서버로써, 학습된 데이터를 저장하는 러닝데이터부(160)를 포함할 수 있다. 이러한 경우, 도 2에 도시된 러닝데이터부(160)는 후술되는 일상 어휘 학습을 위한 기능만 수행할 수 있다.

또는 제어부(180)는 러닝데이터부(160)에 저장된 데이터들을 바탕으로, 입력된 음성 정보에 응답한 결과 정보를 생성할 수도 있다. 이하의 설명에서는, 안내 로봇(100)이 인공 지능 서버와의 통신을 통하여, 결과 정보를 수신하도록 설정되어 있음을 바탕으로 설명한다.

한편, 제어부(180)는 음성 인식 상태(220)에서, 기 설정된 시동어가 수신되지 않거나, 또는 기 설정된 시간 동안 음성이 수신되지 않는 경우, 음성 인식 상태(220)를 다시 대기 상태(210)로 전환할 수 있다. 이상에서는, 음성 인식 기능과 관련된 안내 로봇의 동작 상태에 대하여 설명하였다.

이하에서는, 이러한 음성 인식 기능을 전제로, 사용자에게 친근감을 제공하고 안내 로봇과의 인터페이스를 자연스럽게 연계시키기 위한 동작 과정을 구체적으로 설명하겠다.

본 발명에서는, 사용자가 자연스럽게 시동어를 발화하여 원하는 안내를 받을 수 있도록, 사용자와 안내 로봇 간의 인터페이스를 연계시키는 동작 과정을 구현하였다. 또, 본 발명에서는 사용자가 단순히 인사말을 건네고 싶은 경우, 이를 인식하여 자연스럽게 응답을 수행할 수 있는 동작 과정을 구현하였다.

이하, 도 4는 본 발명과 관련된 안내 로봇의 동작방법을 설명하기 위한 대표 흐름도이다. 도 4를 참조하면, 먼저, 외부로부터 음성을 수신하는 단계(S10)가 수행된다.

여기에서, 상기 외부로부터 수신되는 음성은 도 3에서 설명한 대기 상태(210)를 음성 인식 상태(220)로 전환시킬 수 있는 음량을 갖는 사용자 음성을 의미한다. 또한, 이러한 사용자 음성은 STT(Speech To Text) 기능을 통해 텍스트 변환되어, 안내 로봇의 디스플레이부(151)에 출력될 수도 있다.

이와 같이 음성이 수신되면, 안내 로봇(100)의 제어부(180)는, 수신된 음성에 기 설정된 시동어가 포함되어 있는지 여부를 판단한다(S20). 여기에서, 상기 기 설정된 시동어는 안내 로봇(100)과 연동된 인공 지능 서버 또는 러닝데이터부(160)를 활성화시킬 수 있는 정해진 키워드(key word) 의미한다. 예를 들어, '에어 스타(air start)', '오케이 구글(ok google)', '하이 클로바(hi clova)' 등이 있을 수 있다.

판단 결과, 기 설정된 시동어가 포함된 경우, 수신된 음성에 포함된 명령을 처리하기 위하여, 상기 수신된 음성을 상기 기 설정된 시동어에 의하여 활성화되는 인공 지능 서버로 전송한다(S30). 이때, 상기 수신된 음성은 기 설정된 시동어만 포함하거나, 기 설정된 시동어와 명령어를 함께 포함할 수 있다.

전자의 경우, 인공 지능 서버가 활성화된 상태에서 후속하는 음성 수신 대기 상태를 유지한다. 후자의 경우는, 인공 지능 서버의 활성화 후 상기 명령어의 분석 결과에 대응되는 결과를 검색한다.

이 후, 안내 로봇은, 상기 인공 지능 서버로부터 결과 정보를 수신하고, 수신된 결과 정보를 출력한다(S40). 이때에, 수신된 결과 정보는, 안내 로봇의 디스플레이부(151)를 통해 출력되거나, 스피커(152)를 통해 출력될 수 있다. 또는, 디스플레이부와 스피커를 통해 동시에 출력되거나, 연관된 서로 다른 정보가 스피커와 디스플레이부를 통해 동시에 출력될 수도 있다.

한편, 단계(S20)에서의 판단 결과 수신된 음성에 기 설정된 시동어가 미포함된 경우이면, 기 설정된 기준에 따라 선택된 응답 음성을 출력한다(S50).

이를 위해, 안내 로봇의 제어부(180)는 수신된 음성에 기 설정된 시동어가 미포함된 경우 인사말 인식 동작 모드에 진입할 수 있다. 상기 인사말 인식 동작 모드에서는, 수신된 음성이 실제 사용자가 발화한 인사말인지 여부를 결정하는 것과, 인사말을 발화한 사용자의 특징을 확인하는 것과, 사용자가 특정 정보를 제공받고자 하는지를 추정하는 것을 포함할 수 있다.

또, 여기에서, 상기 기 설정된 기준에 따라 선택된 응답 음성은, 크게 안내 로봇에 수신된 음성에 매칭되는 인사말 타입의 음성이거나 또는 인공 지능 서버를 활성화시키는 기 설정된 시동어를 발화하도록 안내하는 가이드 타입의 음성일 수 있다. 또는, 인사말 타입의 음성과 가이드 타입의 음성의 결합 타입일 수도 있다.

상기 기 설정된 기준은, 수신된 음성의 분석 결과, 음성이 수신되는 동안 센싱된 감지 신호, 이전에 출력된 응답 음성과 연관되어, 능동적으로 설정 또는 가변될 수 있다. 예를 들어, 수신된 음성의 분석에 따른 특정 키워드(예, where, when)의 포함 여부가 기 설정된 기준으로 설정될 수 있다. 이러한 경우, 수신된 음성에 특정 키워드가 포함된 것으로 감지되면, 가이드 타입의 음성을 출력할 수 있다.

한편, 수신된 음성에 기 설정된 시동어가 미포함되고 인사말의 의미로 인식되지 않는 경우이면, 제어부(180)는 인사말 어휘와 관련된 오인식 동작을 수행할 수 있다.

여기서, 상기 오인식 동작은 두 과정으로 구분될 수 있다. 제1과정은 오인식된 인사말에 적합한 응답 음성을 출력하는 과정이다. 그리고, 제2과정은 오인식된 인사말을 새로운 어휘로 학습할지 여부를 결정하여, 데이터베이스를 업데이트하는 과정이다. 그리고, 상기 제2과정에서는 다시 오인식된 인사말이 새로운 어휘인지 또는 의미없는 어휘인지를 판단하는 과정이 추가로 수반된다.

또한, 상기 기 설정된 기준에 따라 선택된 응답 음성은, 수신된 음성이 실제로는 사용자가 발화한 것이 아닌 경우를 고려하여, 어떤 상황에도 자연스럽게 수용할 수 있는 인사말 및 가이드 음성으로 채택된다.

이를 위해, 수신된 음성에 기 설정된 시동어가 미포함된 것으로 판단된 후, 추가 수단(element)(예, 카메라, 인사말 데이터베이스 연동)을 활성화하여 사용자의 발화 여부와 인사말인지 인식하기 위한 추가 동작이 수행될 수 있다.

또한, 상기 기 설정된 기준에 따라 선택된 응답 음성은, 사용자에게 보다 친근감을 전달할 수 있는 맞춤형 인사말 및 가이드 어휘를 구성될 수 있다. 이를 위해, 음성을 발화한 사용자를 확인하여 특징을 추출하거나, 일정 시간 내에 재방문한 사용자를 기억하기 위한 추가 동작이 수행될 수 있다.

이하에서는, 안내 로봇에 수신된 음성이 기 설정된 시동어를 미포함한 상태에서, 맞춤형 응답 음성을 생성하는 다양한 방법을 보다 구체적으로 설명하겠다.

이하, 도 5는 본 발명과 관련된 안내 로봇에서, 인사말에 요청사항이 포함되어있는지 여부에 따라 서로 다른 응답을 출력하는 과정을 설명하기 위한 흐름도이다.

도 5의 흐름도는, 안내 로봇에 수신된 음성에 기 설정된 시동어가 미검출된 상태에서 동작된다. 여기에서, 수신된 음성에 기 설정된 시동어가 미검출된 상태란, 안내 로봇에 수신된 음성이 도 3에서 설명한 '대기 상태'에서 '음성 인식 상태'로 전환될 정도의 음량 크기를 가지면서 동시에 의미를 갖는 음성인 것을 의미한다.

여기에서, 의미를 갖는 음성은, 특정 의미를 나타내는 단어, 문자, 표현 외에, '야', '하하' 등의 의성어 등을 포함할 수 있다.

도 5를 참조하면, 먼저 안내 로봇에 수신된 음성에 기 설정된 시동어가 미검출된 상태에서, 인사말 인식 동작이 개시된다(S501).

인사말 인식 동작이 개시되면, 안내 로봇의 제어부는, 본체에 구비된 하나 이상의 센서를 통해 센싱된 감지신호에 근거하여, 인사말의 인식 여부를 판단한다(S502).

이와 같이 센싱된 감지신호에 근거하여 인사말 여부를 인식하는 이유는, 수신된 음성이 주변 소음에 해당하는지 사용자가 실제 발화한 것인지를 파악하기 위함이다.

여기에서, 하나 이상의 센서는, 적외선 등을 이용한 근접 센서(proximity sensor), 카메라 센서, 모션 센서, RGB 센서, 적외선 센서(infrared sensor), 지문인식 센서(finger scan sensor), 환경 센서, 음성 인식 센서, 및 터치 센서 중 하나 이상을 포함한다.

예를 들어, 제어부(180)는 안내 로봇 본체에 특정 음량 이상의 음성이 수신되고 본체 일측에 터치가 가해진 경우, 터치에 의해 생성된 감지신호에 근거하여 수신된 음성을 인사말로 인식할 수 있다.

또, 예를 들어, 제어부(180)는 안내 로봇 본체에 특정 음량 이상의 음성이 수신되고 카메라 센서를 통해 확인 결과 사용자가 본체 가까이에 근접한 경우이면, 접근에 의해 발생된 감지신호에 근거하여 수신된 음성을 인사말로 인식할 수 있다.

단계(S502)의 판단 결과, 수신된 음성이 인사말이 아닌 것으로 인식되면, 인사말 오인식 동작 및 인사말 학습을 수행할 수 있다(S503).

여기에서, 상기 인사말 오인식 동작은 수신된 음성을 인사말로 인식하도록 처리하는 과정을 포함할 수 있다. 또, 상기 인사말 학습은, 새로 인식된 인사말을 인사말 관련 데이터베이스에 입력하여 업데이트하는 과정을 포함할 수 있다.

또, 본 발명에 따른 안내 로봇의 제어부(180)는 러닝데이터부(160)와 연동하여, 상기 새로 인식된 인사말을 인사말 어휘로 그대로 학습하거나 새로 인식된 인사말에 매칭되는 응답 어휘를 검색하여 확장된 학습을 수행할 수도 있다.

한편, 단계(S502)의 판단 결과, 수신된 음성이 인사말인 것으로 인식되면, 안내 로봇의 제어부는, 인식된 인사말에 하나 이상의 요청 사항이 포함되어 있는지를 추가로 판단한다(S504).

여기에서, 하나 이상의 요청 사항이란, 수신된 음성에 질의 정보, 예를 들어 질의 관련 키워드(예, 여기, 거기, 무엇, 어디, 장소, 가다, 가지?, 뭐니? 등)를 포함하는 것을 의미할 수 있다.

판단 결과, 인식된 인사말에 하나 이상의 요청 사항이 포함된 경우이면, 요청 사항에 따른 가이드 음성을 출력한다(S505).

구체적으로, 요청 사항에 대한 응답 가이드가 안내 로봇의 메모리에 미리 저장된 정보로 충분한 정도이면, 메모리로부터 적절한 응답 가이드를 검출하여 출력할 수 있다. 예를 들어, "안녕, 이름이 뭐니?" 라는 인사말 음성이 수신된 경우, 제어부(180)는 인식된 인사말에 요청사항이 포함된 것으로 인식하고, 인사말 응답 음성과 이름(시동어)이 결합된 형태의 응답 음성, 예를 들어 "안녕하세요, 제 이름은 000이에요"을 출력할 수 있다.

반면, 요청 사항에 대한 응답 가이드가 안내 로봇의 메모리에 미리 저장된 정보로 충분하지 않은 경우이면, 인공 지능 서버와의 연결이 필요하므로, 상기 기 설정된 시동어의 발화를 안내하는 가이드 음성을 출력할 수 있다.

또, 일 실시 예에서는, 요청 사항에 따른 가이드 음성이 출력된 후, 소정 시간 내에 상기 기설정된 시동어를 포함한 음성이 입력되는지를 판단하고, 미입력시 상기 가이드 음성을 이어서 출력할 수도 있다. 예를 들어, 요청 사항+시동어 발화 안내의 결합된 형태의 가이드 음성을 출력할 수 있을 것이다.

한편, 단계(S504)의 판단 결과, 인식된 인사말에 요청 사항이 미포함된 경우이면, 인식된 인사말에 매칭되는 적절한 응답 음성을 출력한다(S506).

이때, 인식된 인사말에 매칭되는 적절한 응답 음성이란, 센서에 의해 감지된 발화 사용자의 특징 외에, 오늘의 날씨, 시간대 등의 상황정보를 기초로 가공된 응답 음성을 의미한다.

이상에서 살펴본 바와 같이, 본 발명에서는 사용자가 기 설정된 시동어를 발화하지 않은 경우에도 인사말로 인식되는지를 판단하고, 인사말로 인식된 경우 추가 요청 사항이 포함되어 있는지를 추가로 판단하여, 판단 결과에 대응되는 적절한 응답을 수행함으로써, 사용성을 더욱 향상시킬 수 있다.

도 6을 참조하면, 먼저, 안내 로봇에 음성이 수신됨에 따라 인사말 인식 동작이 개시된다(S601). 여기에서, 상기 인사말 인식 동작은 수신된 음성에 기 설정된 시동어가 미포함된 경우에 실행될 수 있다.

또, 비록 도시되지 않았지만, 전술한 인사말 인식 동작의 개시 조건이 추가될 수 있다. 예를 들어, 안내 로봇이 수신한 음성이 일정 볼륨 이상이면서 기 설정된 시동어를 포함하지 않는 경우에, '인사말 인식 동작'이 개시될 수 있다. 또, 비록 도시되지는 않았지만, 아무런 음성이 수신되지 않더라도, 안내 로봇의 특정 부분, 예를 들어 디스플레이부/헤드에 터치가 감지된 경우에도, '인사말 인식 동작'이 개시될 수 있다.

또한, 인사말 인식 동작의 개시 조건에 대응되는 종료 조건이 추가될 수도 있다. 예를 들어, 인사말 인식 동작의 개시 후 일정 볼륨 이하의 음성만 수신되거나 음성 수신 후 소정 시간이 경과하도록 사용자 음성/사용자 입력(터치입력, 특정 모션)/사용자 접근이 감지되지 않으면, '인사말 인식 동작'이 종료될 수 있다.

인사말 인식 동작에 따라, 안내 로봇은 적절한 인사말 음성을 출력한다(S602). 여기에서, 적절한 인사말 음성이란, 수신된 음성의 분석 결과에 따라 선택된 단어, 어휘, 의성어, 의태어, 성조, 성별 등을 포함하여 구성될 수 있다.

인사말 음성이 출력된 후, 안내 로봇의 제어부는, 정해진 조건을 만족하는지 여부를 판단한다(S603).

여기에서, 정해진 조건이란, 수신된 음성의 볼륨이 증가한 경우, 소정시간내의 입력된 음성 횟수가 일정 횟수 이상인 경우, 응답 음성의 발화 후 소정 시간 내에 새로운 음성이 수신된 경우, 일정 시간 내의 인사말 음성의 출력 횟수 중 적어도 하나일 수 있다.

예를 들어, 인사말 음성의 출력 후 일정 시간 내(예, 3초 이내)에 사용자의 추가 음성이 수신된 경우에 정해진 조건을 만족한 것으로 보고, 이후의 단계 S604를 수행할 수 있다. 반면, 추가 음성이 일정 시간을 경과한 뒤에 수신된 경우에는 정해진 조건을 만족하지 못한 것으로 보고 S605단계를 수행할 수 있다.

상기 정해진 조건을 만족하는 경우, 안내 로봇은 시동어 가이드 음성을 출력한다(S604). 여기에서, 상기 시동어 가이드 음성은, 기 설정된 기동어를 발화하도록 안내하는 가이드 음성을 의미한다.

이때에, 일 실시 예에서는 정해진 조건 중 어느 조건을 만족하였는지 여부를 연관시켜서 시동어 가이드 음성을 변형하여 출력할 수 있다.

한편, 상기 정해진 조건을 만족하지 못하는 경우, 안내 로봇의 제어부는 새로운 음성이 수신되었는지 여부를 판단한다(S605).

다시 말해, 일정 시간이 경과한 후에도 도 3의 음성 인식 상태를 유지하여, 인사말로 인식되는 새로운 음성이 수신되는지 여부를 판단한다. 다만, 이때에도 임계 시간이 경과한 경우에는, 배터리 소모를 고려하여, 안내 로봇의 제어부가 음성 인식 상태를 리스닝 상태, 즉 대기 상태(도 3 참조)로 전환하도록 제어할 수 있을 것이다.

정해진 조건은 만족하지 못했지만 새로운 음성이 수신된 경우, 대응되는 인사말 음성을 출력한다(S602). 즉, 새로운 음성에 매칭되는 응답 음성이 출력된다.

한편, 비록 도시되지는 않았지만, 인사말 음성의 출력(S602) 후 정해진 조건(S603)은 만족하지 못하였으나, 새로운 음성이 수신(S605)됨에 따라, 다시 인사말 음성이 출력(S602)된 경우, 일정 시간 내의 인사말 음성의 출력 횟수가 1회 증가로 카운팅된다. 따라서, 기설정된 조건(S603)을 자동 만족하게 되어, 인사말 음성의 출력(S602) 후에, 이어서 시동어 가이드 음성이 출력된다(S604).

한편, 인사말 음성의 출력(S602) 후에, 정해진 조건(S603)을 만족하지 않고 일정 시간이 경과되면, 인사말 인식 동작이 종료될 수 있다.

또 다른 예에서는, 제어부(180)는 기 설정된 시동어를 미포함한 음성이 수신된 후 일정 시간 내에 다른 음성의 입력이 없는 경우에, 자동으로 시동어의 발화를 안내하는 가이드 음성을 출력할 수도 있다.

또는, 상기 제어부(180)는 기 설정된 시동어를 미포함한 음성이 수신된 후 일정 시간 내에 다른 음성의 입력이 없는 경우, 카메라 등의 센서를 통해 음성을 발화한 사용자가 본체에 근접한 상태를 유지하고 있는지를 확인한 후에, 상기 가이드 음성의 출력 여부를 결정할 수도 있다.

도 7a 및 도 7b는 도 6과 관련된 서로 다른 응답 음성을 출력하는 예시 도면들이다. 도 7a는 인식된 인사말에 대응되는 인사말 타입의 응답 음성(이하, '제1타입의 응답음성'이라 함)(710)의 예시이고, 도 7b는 사용자의 시동어 발화를 안내하는 가이드 타입의 응답 음성(이하, '제2타입의 응답음성')(720)의 예시이다.

일 실시 예에서는, 제1타입의 응답음성과 제2타입의 응답음성이 교번하여 출력될 수도 있다. 예를 들어, 제1타입의 응답음성과 제2타입의 응답음성이 순서를 정하여 출력될 수 있다.

또 다른 실시 예에서는, 음성이 수신된 횟수 및 간격에 기초하여 제1타입의 응답음성과 제2타입의 응답음성 중 어느 하나만 출력되거나 결합된 형태로 출력될 수 있다.

한편, 제1타입의 응답음성과 제2타입의 응답음성의 어휘, 어조, 음량은 사용자 특징 외에도, 안내 로봇 본체의 현재 위치 정보, 현재 시간대 정보, 날씨 정보 등의 상황정보에 기초하여 변형될 수 있다. 예를 들어, 사람의 이동이 많은 낮 시간대에 어린이가 인사말을 건넨 경우, 음량을 크게 하고 친근하고 짧은 인사말 어휘로 응답 음성을 변형하여 출력할 수 있을 것이다.

도 8을 참조하면, 먼저, 안내 로봇에 기 설정된 시동어가 미포함된 음성이 수신됨에 따라, 인사말 인식 동작이 개시된다(S801). 다음, 안내 로봇의 제어부는, 사용자가 안내 로봇 본체에 접근하는지 여부를 감지하고, 사용자 접근이 감지된 경우, 접근한 사용자를 확인하여 특징을 분류하는 동작을 수행한다(S802).

구체적으로, 사용자의 접근을 감지하기 위하여, 안내 로봇의 센싱부(140)의 하나 이상의 센서를 활성화하여 사용자의 접근, 점진적으로 접근하는지 멀어지는지 여부를 시간의 흐름에 따라 감지할 수 있다.

사용자의 접근이 감지되면, 접근한 사용자를 확인하기 위한 센서, 예를 들어 카메라 센서가 활성화될 수 있다. 또, 사용자의 접근이 감지됨에 따라, 음성이 수신된 방향 및/또는 사용자의 접근이 감지된 방향을 향하여 안내 로봇의 헤드가 자동 회전될 수 있다. 그런 다음, 활성화된 카메라 센서를 통하여, 접근한 사용자의 존재와 얼굴을 확인하는 동작을 수행할 수 있다.

카메라 센서를 통해 사용자의 존재가 인식되면, 사용자의 얼굴을 포함하여 촬영하고, 촬영된 이미지를 분석하여 사용자 특징을 파악할 수 있다.

이러한 사용자 특징은, 예를 들어, 사용자의 성별, 나이, 동반자 포함 여부 등과 같은 객관적 사항을 포함할 수 있다.

또, 이러한 사용자 특징은, 알려진 알고리즘을 이용하여 분석된 사용자의 얼굴 표정에 매칭되는 감정 상태를 포함할 수 있다. 이를 위해, 촬영된 이미지로부터 얼굴 영역을 검출하는 과정이 포함될 수 있다. 얼굴 표정에 매칭되는 감정 상태로는, '기쁨', '화남', '슬픔', '보통', '긴장' 등으로 분류될 수 있다.

이와 같이 음성을 발화한 사용자의 감정 상태가 추정되면, 안내 로봇의 헤드(102)의 전면에 구비된 제2디스플레이를 통해 동일 또는 대응되는 표정을 출력해줄 수 있다. 그에 따라, 사용자에게 더욱 친근감을 전달할 수 있다.

이와 같이, 사용자의 특징이 분류되면, 분류된 특징에 적합한 인사말을 메모리 또는 연동된 데이터베이스로부터 검출할 수 있다(S803).

이를 위해, 본 발명에 따른 안내 로봇은, 다양한 사용자 특징에 대응되는 복수의 인사말 데이터베이스와 연동하여 동작할 수 있다.

예를 들어, 제1데이터베이스가 성별에 따른 인사말 데이터베이스이고, 제2데이터베이스가 감정에 따른 인사말 데이터베이스라고 전제하자. 촬영된 이미지의 분석 결과, 기쁜 감정의 30대 여성으로 특징 분류된 경우, 제1데이터베이스에서 30대 여성이 주로 사용하는 인사말 어휘를 추출하고, 제2데이터베이스에서 기쁜 감정에 매치되는 인사말 어휘를 추출한 다음, 이들을 결합하여 분류된 특징에 적합한 인사말로 가공할 수 있을 것이다.

여기에서, 적합한 인사말의 가공은, 높임말 적용 여부, 성조, 음의 높이, 음량, 발화 속도, 추가 어휘 적용 여부 등을 포함할 수 있다. 이와 같이 검출 또는 가공된 인사말은 음성으로 출력된다(S804). 또, 상기 가공된 인사말은, 음성으로 출력되는 동안 디스플레이부(151)에도 함께 출력될 수 있다.

도 9a와 도 9b는 동일한 인사말 어휘가 음성으로 수신된 경우, 사용자 특징에 따라 서로 다른 응답 음성이 출력되는 예시를 보여주고 있다. 구체적으로, 도 9a는 '노인'이 '안녕'이라고 발화한 상황이고, 도 9b는 '아이'가 '안녕'이라고 발화한 상황이다.

안내 로봇은 헤드(또는, 바디부)에 구비된 카메라(121)를 활성화하여, 인사말을 발화한 사용자를 확인하고, 사용자의 특징을 분류한다.

그에 따라, 서로 다른 데이터베이스로부터 검출된 어휘를 사용하여, 도 9a에서는 높임말 인사말 응답(예, '안녕하세요, 어르신')이 출력되고, 도 9b에서는 짧고 친근한 인사말 응답(예, '안녕, 반가워')이 출력된다.

또한, 비록 도시되지는 않았지만, 이와 같이 인사말 응답이 출력된 후, 기 설정된 시동어의 발화를 안내하는 가이드 음성에도 처음에 매칭된 서로 다른 데이터베이스가 적용된다. 예를 들어, 도 9a의 상황에서는, '더 많은 정보를 원하시면 000이라고 말씀해주세요, 어르신'이라는 가이드 음성이 출력될 수 있다. 그리고, 도 9b의 상황에서는, '묻고 싶은 것이 있으면, 000이라고 불러줘'라는 가이드 음성이 출력될 수 있다.

이와 같이, 사용자의 특징에 따라 적절한 응답을 수행함으로써, 보다 높은 친근감과 감성을 느낄 수 있다.

도 10을 참조하면, 먼저 안내 로봇에 사용자의 음성이 수신되면(S1001), 안내 로봇의 제어부가, 상기 수신된 음성에 기 설정된 시동어가 포함되어 있는지를 판단한다(S1002).

판단 결과, 기 설정된 시동어가 포함된 경우이면, 수신된 음성을 연동된 인공 지능 서버로 전송한다(S1003). 반면, 판단 결과, 기 설정된 시동어가 미포함된 경우이면, 수신된 음성에 정해진 키워드(keyword)가 포함되어 있는지를 추가 판단한다(S1004).

수신된 음성에 정해진 키워드(keyword)가 포함되지 않은 경우이면, 정해진 응답 음성을 출력하고, 인사말 어휘 학습을 수행한다(S1005). 이때에, 인사말 어휘 학습은 수신된 음성을 새로운 인사말 어휘로 학습하는 과정을 포함한다.

수신된 음성에 정해진 키워드(keyword)가 포함된 경우이면, 정해진 키워드가 포함된 음성을 음성 인식 서버(STT 서버, Speech-To-Text)로 전송한다(S1006).

상기 음성 인식 서버는, 수신된 키워드 음성을 텍스트로 변환하고, 변환된 텍스트에 대응되는 상황정보를 검색할 수 있다. 여기에서, 상기 상황정보는, 키워드에 매칭되어 저장된 질의 안내 정보를 포함할 수 있다. 예를 들어, '길/ 장소/어디(where)'가 키워드로 정해진 경우, '길 찾기를 원하시는 경우~'가 매칭된 상황정보로 검색될 수 있다.

다음, 안내 로봇의 제어부는, 음성 인식 서버로부터 수신된 상황정보에 기초하여 응답 음성을 생성하여 출력한다(S1007).

구체적으로, 안내 로봇은 음성 인식 서버로부터 수신된 상황정보에 근거하여 가공된 가이드 음성을 출력할 수 있다. 예를 들어, '길 찾기를 원하시는 경우'가 상황정보로 수신된 경우, 수신된 상황정보에 대응되는 텍스트와 기 설정된 시동어를 합성시켜서 생성한 가이드 음성(예, '길 찾기를 원하시는 경우 000라고 부른 뒤에 물어보세요')을 출력할 수 있다.

이상에서 살펴본 바와 같이, 본 발명에 따른 안내 로봇은, 사용자에게 보다 친근감을 주면서 자연스럽게 인터페이스 연계가 가능하도록 안내함으로써, 사용성을 더욱 향상시킬 수 있다. 또, 일상 어휘의 인식률이 높지 않은 점을 고려하여, 다양한 상황 수집을 통해 사용자가 실제로 발화한 것인지 여부를 인식하여, 상황에 맞는 자연스러운 대화를 이어나갈 수 있다. 나아가, 사용자가 특정 목적을 가지고 질의하지 않은 경우에도, 발화한 것으로 추정되는 사용자의 특징을 파악하여 어울리는 맞춤형 응답을 수행할 수 있고, 새로운 일상 어휘를 지속적으로 학습할 수 있다. 또, 사용자가 시동어를 발화하지 않더라도, 목적없이 단순히 인사만 하고 싶은 경우와 구체적인 정보를 제공받기를 원하는지 여부를 구별하여, 적절한 응답을 수행할 수 있다. 그에 따라, 확장된 일상 대화가 가능해지므로, 높은 친근감과 감성을 느낄 수 있다.

전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 컴퓨터는 단말기의 제어부(180)를 포함할 수도 있다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.

Claims

음성을 수신하도록 형성된 음성 수신부;

수신된 음성에 기 설정된 시동어가 포함되어 있는지 여부를 판단하는 제어부;

상기 기 설정된 시동어에 의하여 활성화되도록 설정된 인공 지능 서버와 통신하는 무선 통신부;를 포함하고,

상기 제어부는,

상기 수신된 음성에 기 설정된 시동어가 포함된 경우, 상기 수신된 음성을 상기 인공 지능 서버로 전송하고, 상기 인공 지능 서버로부터 결과 정보를 수신하여 수신된 결과 정보를 출력하며,

상기 수신된 음성에 기 설정된 시동어가 미포함된 경우, 기설정된 기준에 따라 선택된 응답 음성을 출력하는 것을 특징으로 하는 안내 로봇.
제1항에 있어서,

상기 제어부는

상기 수신된 음성에 기 설정된 시동어가 미포함된 경우 인사말 인식 동작을 수행하며, 상기 인사말 인식 동작에서는, 적어도 하나 이상의 센서로부터 수신된 감지신호에 근거하여 인사말로 인식되는지 여부를 판단하는 것을 특징으로 하는 안내 로봇
제2항에 있어서,

상기 제어부는,

상기 인사말 인식 동작에 따라 인사말이 인식된 경우, 인식된 인사말에 하나 이상의 요청사항이 포함되어 있는지를 추가로 판단하고, 판단 결과에 근거하여 응답 음성을 선택하는 것을 특징으로 하는 안내 로봇.
제3항에 있어서,

상기 제어부는,

판단 결과, 인식된 인사말에 하나 이상의 요청사항이 포함된 경우이면, 인식된 요청 사항에 따른 가이드 음성을 출력하고,

판단 결과, 인식된 인사말에 하나 이상의 요청사항이 미포함된 경우이면, 상기 인식된 인사말에 매칭되는 응답 음성을 출력하는 것을 특징으로 하는 안내 로봇.
제2항에 있어서,

상기 제어부는,

상기 인사말 인식 동작에서 인사말이 인식되지 않은 경우, 상기 수신된 음성에 근거하여 오인식 동작 및 인사말 학습을 수행하는 것을 특징으로 하는 안내 로봇.
제1항에 있어서,

상기 기설정된 기준에 따라 선택되는 응답 음성은, 상기 수신된 음성에 매칭되는 인사말 음성 및 상기 기 설정된 시동어의 발화를 안내하는 가이드 음성 중 어느 하나인 것을 특징으로 하는 안내 로봇.
제1항에 있어서,

상기 제어부는,

상기 수신된 음성에 기 설정된 시동어가 미포함된 경우 인사말 인식 동작을 개시하고, 상기 인사말 인식 동작에 따라 상기 수신된 음성에 매칭되는 응답 음성을 출력하고,

상기 응답 음성의 출력 후 정해진 조건을 만족하는 것에 응답하여 상기 기 설정된 기동어의 발화를 안내하는 가이드 음성을 출력하는 것을 특징으로 하는 안내 로봇.
제7항에 있어서,

상기 정해진 조건은 수신된 음성의 볼륨이 증가하는 경우, 소정시간내의 입력된 음성 횟수가 일정 횟수 이상인 경우, 응답 음성의 발화 후 소정 시간 내에 새로운 음성이 수신된 경우 중 적어도 하나를 포함하는 것을 특징으로 하는 안내 로봇.
제7항에 있어서,

상기 제어부는,

상기 응답 음성의 출력 후 상기 정해진 조건을 만족하지 않고 일정 시간 내에 새로운 음성이 수신되면, 새로운 음성에 매칭되는 응답 음성을 출력하고,

상기 응답 음성의 출력 후 정해진 조건을 만족하지 않고 일정 시간이 경과하면 상기 인사말 인식 동작을 종료하는 것을 특징으로 하는 안내 로봇.
제1항에 있어서,

안내 로봇 본체에 접근하는 사용자를 감지하는 센서;를 더 포함하고,

상기 제어부는,

상기 수신된 음성에 기 설정된 시동어가 미포함된 경우 인사말 인식 동작을 개시하고, 상기 센서를 통해 접근하는 사용자가 감지되면, 접근한 사용자를 확인하여 사용자 특징을 분류하고, 분류된 사용자 특징에 적합하도록 인사말을 가공하여 응답 음성으로 출력하는 것을 특징으로 하는 안내 로봇.
제10항에 있어서,

상기 제어부는,

상기 센서를 통해 접근하는 사용자가 감지되면, 카메라를 활성화하여 접근한 사용자의 얼굴 이미지를 획득하고, 획득된 얼굴 이미지를 분석하여 사용자 특징을 추출하여 분류하는 것을 특징으로 하는 안내 로봇.
제1항에 있어서,

상기 제어부는,

상기 수신된 음성에 기 설정된 시동어가 미포함된 경우, 상기 수신된 음성에 정해진 키워드가 포함되었는지 여부를 판단하고,

판단 결과 정해진 키워드가 포함된 경우이면 해당 키워드가 포함된 음성을 음성 인식 서버로 전송하여 키워드에 대응되는 상황정보를 수신하고, 수신된 상황정보에 근거하여 생성된 응답 음성을 출력하는 것을 특징으로 하는 안내 로봇.
음성을 출력할 수 있는 안내 로봇의 동작 방법으로서,

사용자의 음성을 수신하는 단계;

수신된 음성에 기 설정된 시동어가 포함되어 있는지 여부를 판단하는 단계;

상기 수신된 음성에 기 설정된 시동어가 포함된 경우, 수신된 음성을 상기 기 설정된 시동어에 의하여 활성화되도록 설정된 인공 지능 서버로 전송하고, 상기 인공 지능 서버로부터 결과 정보를 수신하여 수신된 결과 정보를 출력 단계; 및

상기 수신된 음성에 기 설정된 시동어가 미포함된 경우, 기설정된 기준에 따라 선택된 응답 음성을 출력하는 단계를 포함하여 이루어지는 안내 로봇의 동작 방법.
제13항에 있어서,

상기 기설정된 기준에 따라 선택된 응답 음성을 출력하는 단계는,

상기 수신된 음성에 기 설정된 시동어가 미포함된 경우 인사말 인식 동작을 수행하는 단계;

상기 인사말 인식 동작에서, 적어도 하나 이상의 센서로부터 수신된 감지신호에 근거하여 인사말로 인식되는지 여부를 판단하는 단계; 및

상기 인사말 인식 동작에 따라 인사말이 인식된 경우, 인식된 인사말에 하나 이상의 요청사항이 포함되어 있는지를 추가로 판단하고, 판단 결과에 근거하여 응답 음성을 선택하는 단계를 포함하는 것을 특징으로 하는 안내 로봇의 동작 방법.
제14항에 있어서,

하나 이상의 요청사항이 포함되어 있는지의 판단 결과, 인식된 인사말에 하나 이상의 요청사항이 포함된 경우이면, 인식된 요청 사항에 따른 가이드 음성을 출력하는 단계; 및

하나 이상의 요청사항이 포함되어 있는지의 판단 결과, 인식된 인사말에 하나 이상의 요청사항이 미포함된 경우이면, 상기 인식된 인사말에 매칭되는 응답 음성을 출력하는 단계를 포함하는 것을 특징으로 하는 안내 로봇의 동작 방법.