WO2023027433A1

WO2023027433A1 - 로봇 및 그 제어 방법

Info

Publication number: WO2023027433A1
Application number: PCT/KR2022/012422
Authority: WO
Inventors: 김기훈; 국중갑; 이상경
Original assignee: 삼성전자주식회사
Priority date: 2021-08-25
Filing date: 2022-08-19
Publication date: 2023-03-02
Also published as: KR20230030433A; EP4331781A1; US20230251632A1

Abstract

로봇이 개시된다. 본 개시에 따른 로봇은, 카메라; 스피커; 구동부; 메모리; 및 프로세서;를 포함하고, 프로세서는, 카메라를 통해 획득된 이미지에 기초하여 사용자를 감지하고, 로봇이 사용자에게 발화할 복수의 문장을 획득하고, 복수의 문장 중 로봇이 발화하는 동안 수행할 모션이 할당되지 않은 제1 문장을 식별하고, 제1 문장이 발화될 제1 시간 구간과 인접한 제2 시간 구간에서 발화될 제2 문장을 식별하고, 메모리에 미리 저장된 복수의 모션 중 제2 문장에 할당된 제2 모션과 상이한 제1 모션을 제1 문장에 대응되는 모션으로 획득하고, 제1 문장에 대응되는 음성을 출력하도록 스피커를 제어하고, 음성이 출력되는 동안 제1 모션을 수행하도록 구동부를 제어한다.

Description

로봇 및 그 제어 방법

본 개시는 로봇 및 그 제어 방법으로, 보다 상세하게는, 발화하면서 모션을 수행할 수 있는 로봇 및 그 제어 방법에 관한 것이다.

전자 기술의 발달에 힘입어 다양한 서비스 로봇이 이용되고 있다. 예를 들어, 미술관에서 미술품을 설명해주거나 매장에서 제품을 설명해주는 서비스 로봇이 이용되고 있다.

한편, 종래의 서비스 로봇은 발화할 문장에서 키워드를 추출하고, 추출된 키워드에 대응되는 모션을 획득하였다. 이 경우, 연속되는 문장에서 유사한 키워드가 추출되면, 로봇은 유사한 모션을 연속으로 수행하게 된다. 로봇이 유사하거나 동일한 모션을 연속으로 수행하게 되면, 사용자는 로봇이 오작동하거나 로봇의 모션이 부자연스럽다고 느끼게 된다.

이에 따라, 로봇이 동일한 모션을 연속으로 수행하지 않으며 보다 자연스럽게 모션을 수행하도록 하기 위한 기술이 필요하다.

본 발명이 해결하고자 하는 일 기술적 과제는, 로봇이 현재 시간 구간에서 발화할 문장에 대응되는 모션으로서, 현재 시간 구간과 인접한 시간 구간에서 수행되는 모션과 상이한 모션을 획득하는 것이다.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명의 기술분야에서의 통상의 기술자에게 명확하게 이해 될 수 있을 것이다.

상술한 기술적 과제를 해결하기 위한 본 개시의 예시적인 일 실시 예에 따르면, 로봇에 있어서, 카메라; 스피커; 구동부; 적어도 하나의 인스트럭션을 저장하는 메모리; 및 프로세서;를 포함하고, 상기 프로세서는, 상기 카메라를 통해 획득된 이미지에 기초하여 사용자를 감지하고, 상기 로봇이 상기 사용자에게 발화할 복수의 문장을 획득하고, 상기 복수의 문장 중 상기 로봇이 발화하는 동안 수행할 모션이 할당되지 않은 제1 문장을 식별하고, 상기 제1 문장이 발화될 제1 시간 구간과 인접한 제2 시간 구간에서 발화될 제2 문장을 식별하고, 상기 메모리에 미리 저장된 복수의 모션 중 상기 제2 문장에 할당된 제2 모션과 상이한 제1 모션을 상기 제1 문장에 대응되는 모션으로 식별하고, 상기 제1 문장에 대응되는 음성을 출력하도록 상기 스피커를 제어하고, 상기 음성이 출력되는 동안 상기 제1 모션을 수행하도록 상기 구동부를 제어하는 로봇이 제공될 수 있다.

상기 프로세서는, 상기 미리 저장된 복수의 모션 중 상기 제2 모션과의 유사도가 기설정된 값보다 작은 적어도 하나의 모션을 식별하고, 상기 적어도 하나의 모션 중 하나를 무작위로 식별하여 상기 제1 모션으로 획득할 수 있다.

상기 프로세서는, 상기 미리 저장된 복수의 모션에 대응되는 히스토그램과 상기 제2 모션에 대응되는 히스토그램을 비교하여 상기 미리 저장된 복수의 모션과 상기 제2 모션의 유사도를 획득할 수 있다.

상기 메모리는, 상기 제2 모션을 포함하는 상기 미리 저장된 복수의 모션 간의 유사도를 포함하는 유사도 테이블을 저장하고, 상기 프로세서는, 상기 유사도 테이블에 기초하여 상기 제1 모션을 획득할 수 있다.

상기 프로세서는, 상기 제1 시간 구간과 인접하며 상기 제2 시간 구간과 상이한 제3 시간 구간에서 발화될 제3 문장에 할당된 제3 모션을 식별하고, 상기 미리 저장된 복수의 모션 각각과 상기 제2 모션의 제1 유사도를 획득하고, 상기 미리 저장된 복수의 모션 각각과 상기 제3 모션의 제2 유사도를 획득하고, 상기 미리 저장된 복수의 모션 각각에 대응되는 상기 제1 유사도 및 상기 제2 유사도의 복수의 평균값을 획득하고, 상기 복수의 평균값 중 기설정된 값보다 작은 적어도 하나의 평균값을 식별하고, 상기 미리 저장된 복수의 모션 중 상기 적어도 하나의 평균값에 대응되는 적어도 하나의 모션을 식별하고, 상기 적어도 하나의 모션 중 하나를 무작위로 식별하여 상기 제1 모션으로 획득할 수 있다.

상기 프로세서는, 상기 제2 모션에 대한 정보에 기초하여 상기 제2 모션의 크기를 획득하고, 상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율이 임계값보다 크면, 상기 제1 모션의 크기 및 상기 제2 모션의 크기에 기초하여 상기 제1 모션의 크기를 조절하고, 상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율이 상기 임계값 이하이면, 상기 제1 모션의 크기를 유지할 수 있다.

상기 프로세서는, 상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율에 기초하여 가중치를 산출하고, 상기 제1 모션의 크기가 상기 제2 모션의 크기보다 작아지도록 상기 가중치에 기초하여 상기 제1 모션의 크기를 조절할 수 있다.

상술한 기술적 과제를 해결하기 위한 본 개시의 예시적인 일 실시 예에 따르면, 로봇의 제어 방법에 있어서, 사용자를 감지하는 단계; 상기 로봇이 상기 감지된 사용자에게 발화할 복수의 문장을 획득하는 단계; 상기 복수의 문장 중 상기 로봇이 발화하는 동안 수행할 모션이 할당되지 않은 제1 문장을 식별하는 단계; 상기 제1 문장이 발화될 제1 시간 구간과 인접한 제2 시간 구간에서 발화될 제2 문장을 식별하고, 미리 저장된 복수의 모션 중 상기 제2 문장에 할당된 제2 모션과 상이한 제1 모션을 상기 제1 문장에 대응되는 모션으로 식별하는 단계; 및 상기 제1 문장을 발화하면서 상기 제1 모션을 수행하는 단계;를 포함하는 제어 방법이 제공될 수 있다.

상기 제1 모션을 획득하는 단계는, 상기 미리 저장된 복수의 모션 중 상기 제2 모션과의 유사도가 기설정된 값보다 작은 적어도 하나의 모션을 식별하는 단계 및 상기 적어도 하나의 모션 중 하나를 무작위로 식별하여 상기 제1 모션으로 획득하는 단계를 포함할 수 있다.

상기 적어도 하나의 모션을 식별하는 단계는, 상기 미리 저장된 복수의 모션에 대응되는 히스토그램과 상기 제2 모션에 대응되는 히스토그램을 비교하여 상기 미리 저장된 복수의 모션과 상기 제2 모션의 유사도를 획득하는 단계를 포함할 수 있다.

상기 로봇은, 상기 제2 모션을 포함하는 상기 미리 저장된 복수의 모션 간의 유사도를 포함하는 유사도 테이블을 저장하고, 상기 제1 모션을 획득하는 단계는, 상기 유사도 테이블에 기초하여 상기 제1 모션을 획득할 수 있다.

상기 제1 모션을 획득하는 단계는, 상기 제1 시간 구간과 인접하며 상기 제2 시간 구간과 상이한 제3 시간 구간에서 발화될 제3 문장에 할당된 제3 모션을 식별하는 단계, 상기 미리 저장된 복수의 모션 각각과 상기 제2 모션의 제1 유사도를 획득하고, 상기 미리 저장된 복수의 모션 각각과 상기 제3 모션의 제2 유사도를 획득하는 단계, 상기 미리 저장된 복수의 모션 각각에 대응되는 상기 제1 유사도 및 상기 제2 유사도의 복수의 평균값을 획득하는 단계, 상기 복수의 평균값 중 기설정된 값보다 작은 적어도 하나의 평균값을 식별하고, 상기 미리 저장된 복수의 모션 중 상기 적어도 하나의 평균값에 대응되는 적어도 하나의 모션을 식별하는 단계 및 상기 적어도 하나의 모션 중 하나를 무작위로 식별하여 상기 제1 모션으로 획득하는 단계를 포함할 수 있다.

상기 제어 방법은, 상기 제2 모션에 대한 정보에 기초하여 상기 제2 모션의 크기를 획득하는 단계; 상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율이 임계값보다 크면, 상기 제1 모션의 크기 및 상기 제2 모션의 크기에 기초하여 상기 제1 모션의 크기를 조절하는 단계; 및 상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율이 상기 임계값 이하이면, 상기 제1 모션의 크기를 유지하는 단계;를 더 포함할 수 있다.

상기 제1 모션의 크기를 조절하는 단계는, 상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율에 기초하여 가중치를 산출하는 단계, 상기 제1 모션의 크기가 상기 제2 모션의 크기보다 작아지도록 상기 가중치에 기초하여 상기 제1 모션의 크기를 조절하는 단계를 포함할 수 있다.

본 개시의 과제의 해결 수단이 상술한 해결 수단들로 제한되는 것은 아니며, 언급되지 아니한 해결 수단들은 본 명세서 및 첨부된 도면으로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

이상과 같은 본 개시의 다양한 실시 예에 따르면, 로봇은 다양한 모션을 자연스럽게 수행할 수 있다. 이에 따라, 사용자의 만족감이 향상될 수 있다.

그 외에 본 개시의 실시 예로 인하여 얻을 수 있거나 예측되는 효과에 대해서는 본 개시의 실시 예에 대한 상세한 설명에서 직접적 또는 암시적으로 개시하도록 한다. 예컨대, 본 개시의 실시 예에 따라 예측되는 다양한 효과에 대해서는 후술될 상세한 설명 내에서 개시될 것이다.

본 개시의 다른 양상, 이점 및 두드러진 특징들은 첨부된 도면과 관련하여 본 발명의 다양한 실시 예들을 개시하는 다음의 상세한 설명으로부터 당업자에게 명백해질 것이다.

본 개시의 특정 실시 예의 양상, 특징 및 이점은 첨부된 도면들을 참조하여 후술되는 설명을 통해 보다 명확해질 것이다.

도 1은 본 개시의 일 실시 예에 따른 로봇의 동작을 설명하기 위한 도면이다.

도 2는 본 개시의 일 실시 예에 따른 로봇의 구성을 도시한 블록도이다.

도 3은 본 개시의 일 실시 예에 따른 모션 획득 방법을 설명하기 위한 도면이다.

도 4는 본 개시의 일 실시 예에 따른 모션 획득 방법을 설명하기 위한 도면이다.

도 5는 본 개시의 일 실시 예에 따른 모션 간 유사도 판단 방법을 설명하기 위한 도면이다.

도 6은 본 개시의 일 실시 예에 따른 모션 크기 제어 방법을 설명하기 위한 도면이다.

도 7은 본 개시의 일 실시 예에 따른 로봇의 제어 방법을 도시한 순서도이다.

도 8은 본 개시의 일 실시 예에 따른 로봇의 제어 방법을 나타내는 순서도이다.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 개시에 대해 구체적으로 설명하기로 한다.　

본 개시의 실시 예에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 개시의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.

본 개시의 실시 예들은 다양한 변환을 가할 수 있고 여러 가지 실시 예를 가질 수 있는바, 특정 실시 예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 특정한 실시 형태에 대해 범위를 한정하려는 것이 아니며, 개시된 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 실시 예들을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구성되다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

아래에서는 첨부한 도면을 참고하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.　그러나 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 개시를 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

도 1을 참조하면, 로봇(100)은 사용자(1)에게 복수의 문장을 발화할 수 있다. 예를 들어, 로봇(100)은 제품(2)을 설명하기 위한 제1 문장(11), 자신을 소개하기 위한 제2 문장(12)을 발화할 수 있다.

로봇(100)은 문장을 발화하는 동안 모션을 수행할 수 있다. 예를 들어, 로봇(100)은 제2 문장(12)을 발화하는 동안 고개를 좌우로 흔드는 모션을 수행할 수 있다. 한편, 로봇(100)이 발화할 문장 중 적어도 일부에는 로봇(100)이 수행할 모션이 미리 할당되어 있을 수 있다. 예를 들어, 고개를 좌우로 흔드는 모션은 로봇(100) 설계자에 의해 선택되어 제2 문장(12)에 미리 할당되어 있을 수 있다.

로봇(100)이 발화할 문장 중에서는 모션이 할당되지 않은 문장이 있을 수 있다. 예를 들어, 제1 문장(11)에는 모션이 할당되어 있지 않을 수 있다. 로봇(100)은 모션이 할당되지 않은 문장을 식별하고, 식별된 문장에 대응되는 모션을 획득할 수 있다. 그리고, 로봇(100)은 식별된 문장을 발화하는 동안 획득된 모션을 수행할 수 있다. 예를 들어, 로봇(100)은 제1 문장(11)에 대응되는 모션으로 고개를 제품(2)을 향해 회전하는 모션을 획득할 수 있다. 그리고, 로봇(100)은 제1 문장(11)을 발화하면서 제품(2)을 향해 고개를 회전하는 모션을 수행할 수 있다.

한편, 인접한 시간 구간에서 발화되는 제1 문장(11)에 대응되는 제1 모션과 및 제2 문장(12)에 할당된 제2 모션이 동일하거나 유사하면, 제1 모션 및 제2 모션이 명확히 구분되지 않을 수 있다. 이에 따라, 사용자(1)는 로봇(100)이 오작동하거나 부자연스럽게 동작한다고 느낄 수 있다.

이를 방지하기 위해, 로봇(100)은 제2 문장(12)에 할당된 제2 모션과 상이한 모션을 제1 문장(11)에 대응되는 제1 모션으로 획득할 수 있다. 예를 들어, 로봇(100)은 미리 저장된 복수의 모션 중 제2 모션과의 유사도가 기설정된 값보다 낮은 적어도 하나의 모션을 획득할 수 있다. 그리고, 로봇(100)은 식별된 적어도 하나의 모션 중 무작위로 하나의 모션을 식별하고, 식별된 하나의 모션을 제1 모션으로 획득할 수 있다.

제1 모션과 제2 모션의 유사도는 기설정된 값보다 낮으므로, 제1 모션 및 제2 모션은 명확히 구분될 수 있다. 이에 따라, 사용자(1)는 로봇(100)이 자연스럽게 동작한다고 느낄 수 있다. 또한, 제1 모션은 무작위로 선별되므로, 로봇(100)이 제1 문장(11)을 발화할 때마다 수행하는 모션이 달라질 수 있다. 즉, 로봇(100)의 모션이 다양해질 수 있다. 이에 따라, 사용자(1)는 로봇(100)이 보다 자연스럽게 동작한다고 느끼며, 사용자(1)의 만족감이 향상될 수 있다.

도 2를 참조하면, 로봇(100)은 센서부(110), 터치 스크린(120), 마이크(130), 스피커(140), 발광부(150), 구동부(160), 통신 인터페이스(170), 메모리(180) 및 프로세서(190)를 포함할 수 있다. 예를 들어, 로봇(100)은 서비스 로봇일 수 있다. 한편, 전자 장치(100)의 구성이 도 2에 도시된 구성으로 한정되는 것은 아니며, 당업자에게 자명한 구성이 추가될 수도 있다.

센서부(110)는 카메라(111), 뎁스 센서(112) 및 IMU 센서(113)를 포함할 수 있다. 카메라(111)는 로봇(100) 주변을 촬영한 이미지를 획득하기 위한 구성이다. 프로세서(190)는 카메라(111)를 통해 획득된 촬영 이미지를 분석하여 사용자를 인식할 수 있다. 예를 들어, 프로세서(190)는 오브젝트 인식 모델에 촬영 이미지를 입력하여 촬영 이미지에 포함된 사용자를 인식할 수 있다. 여기서, 오브젝트 인식 모델은 이미지에 포함된 오브젝트를 인식하도록 학습된 인공 신경망 모델로서, 메모리(180)에 저장되어 있을 수 있다. 한편, 카메라(111)는 다양한 유형의 이미지 센서를 포함할 수 있다. 예로, 카메라(111)는 CMOS(Complementary Metal Oxide Semiconductor) 이미지 센서 및 CCD(Charge Coupled Device) 이미지 센서 중 적어도 하나를 포함할 수 있다.

뎁스 센서(112)는 로봇(100) 주변의 장애물을 감지하기 위한 구성이다. 프로세서(190)는 뎁스 센서(112)의 센싱값에 기초하여 로봇(100)으로부터 장애물까지의 거리를 획득할 수 있다. 예를 들어, 뎁스 센서(112)는 라이다(light detection and ranging, LiDAR) 센서를 포함할 수 있다. 또는, 뎁스 센서(112)는 레이더(Radar) 센서 및 뎁스 카메라를 포함할 수 있다.

IMU 센서(113)는 로봇(100)의 자세 정보를 획득하기 위한 구성이다. IMU 센서(113)는 자이로 센서 및 지자기 센서를 포함할 수 있다.

터치 스크린(120)은 사용자의 터치 입력을 획득하고 사용자 명령에 대응되는 응답 메시지를 표시할 수 있다. 예를 들어, 터치 스크린(120)은 제품 설명 요청에 대응되는 UI 엘리먼트를 표시할 수 있다. 터치 스크린(120)은 UI 엘리먼트를 터치하는 사용자의 터치 입력을 획득할 수 있다. 사용자의 터치 입력이 획득되면, 터치 스크린(120)은 제품 설명을 위한 텍스트를 포함하는 응답 메시지를 표시할 수 있다.

마이크(130)는 사용자의 음성 명령을 획득할 수 있다. 프로세서(190)는 마이크(130)를 통해 획득되는 사용자의 음성 명령에 기초하여 로봇(100)의 동작을 제어할 수 있다. 예를 들어, 마이크(130)는 제품 설명을 요청하는 사용자의 음성 명령("제품 설명해줘")을 획득할 수 있다. 이 때, 프로세서(190)는 제품을 설명하는 문자 메시지를 표시하도록 터치 스크린(120)을 제어할 수 있다. 또는, 프로세서(190)는 제품을 설명하는 음성 메시지를 출력하도록 스피커(140)를 제어할 수 있다.

스피커(140)는 음성 메시지를 출력할 수 있다. 예를 들어, 스피커(140)는 로봇(100)을 소개하는 문장("안녕하세요, 저는 삼성봇입니다")에 대응되는 음성 메시지를 출력할 수 있다.

발광부(150)는 로봇(100)의 얼굴이나 표정을 나타내기 위한 광을 출력할 수 있다. 발광부(150)는 적어도 하나의 LED 모듈을 포함할 수 있다.

구동부(160)는 로봇(100)의 각종 모션을 수행하기 위한 구성이다. 예를 들어, 구동부(160)는 로봇(100)을 이동 시키는 바퀴 및 바퀴를 회전시키는 바퀴 구동 모터를 포함할 수 있다. 또는, 구동부(160)는 로봇(100)의 헤드(head), 암(arm) 또는 핸드(hand)를 이동시키기 위한 모터를 포함할 수 있다. 구동부(160)는 각종 모터에 구동 전류를 공급하는 모터 구동 회로, 모터의 회전 변위 및 회전 속도를 검출하는 회전 감지 센서를 포함할 수 있다.

통신 인터페이스(170)는 적어도 하나의 회로를 포함하며 다양한 유형의 외부 기기와 통신을 수행할 수 있다. 통신 인터페이스(170)는 BLE(Bluetooth Low Energy) 모듈, 와이파이 통신 모듈, 셀룰러 통신모듈, 3G(3세대) 이동통신 모듈, 4G(4세대) 이동통신 모듈, 4세대 LTE(Long Term Evolution) 통신 모듈, 5G(5세대) 이동통신 모듈 중 적어도 하나를 포함할 수 있다.

메모리(180)는 로봇(100)의 구성요소들의 전반적인 동작을 제어하기 위한 운영체제(OS: Operating System) 및 로봇(100)의 구성요소와 관련된 명령 또는 데이터를 저장할 수 있다. 예를 들어, 메모리(180)는 로봇(100)이 사용자에게 발화할 문장이 저장된 문장 데이터베이스(181), 로봇(100)이 수행할 모션에 대한 정보가 저장된 모션 데이터베이스(182)를 저장할 수 있다. 문장 데이터베이스(181)는 문장을 구성하는 토큰, 문장에 대응되는 텍스트에 관한 정보를 저장할 수 있다. 모션이 할당된 문장의 경우, 모션의 식별 정보가 문장과 함께 매칭되어 저장되어 있을 수 있다. 모션 데이터베이스(182)는 모션에 대한 정보를 저장할 수 있다. 모션에 대한 정보는, 로봇(100)의 각 구성요소(예로, 헤드)에 대응되는 축 별 회전 각도를 포함할 수 있다. 예를 들어, 회전 각도는 롤(roll) 축, 피치(pitch) 축 및 요(yaw) 축 각각에 대응되는 각도를 포함할 수 있다.

메모리(180)는 로봇(100)의 동작을 제어하기 위한 모듈이 각종 동작을 수행하기 위해 필요한 데이터를 저장할 수 있다. 로봇(100)의 동작을 제어하기 위한 모듈은 사용자 명령 획득 모듈(191), 문장 획득 모듈(192), 모션 획득 모듈(193), 모션 크기 제어 모듈(194) 및 동작 제어 모듈(195)을 포함할 수 있다. 한편, 메모리(180)는 비휘발성 메모리(ex: 하드 디스크, SSD(Solid state drive), 플래시 메모리), 휘발성 메모리 등으로 구현될 수 있다.

프로세서(190)는 메모리(180)와 전기적으로 연결되어 로봇(100)의 전반적인 기능 및 동작을 제어할 수 있다. 프로세서(190)는 비휘발성 메모리에 저장되어 있는 모듈(191 내지 195)이 각종 동작을 수행하기 위한 데이터를 휘발성 메모리로 로딩(loading)할 수 있다. 여기서, 로딩이란 프로세서(190)가 데이터에 액세스할 수 있도록 비휘발성 메모리에 저장된 데이터를 휘발성 메모리에 불러들여 저장하는 동작을 의미한다.

사용자 명령 획득 모듈(191)은 각종 사용자 명령을 획득할 수 있다. 예를 들어, 사용자 명령 획득 모듈(191)은 터치 스크린(120)을 통해 제품 설명을 요청하기 위한 사용자의 터치 입력을 획득할 수 있다. 또는, 사용자 명령 획득 모듈(191)은 마이크(130)를 통해 제품 설명을 요청하는 음성 명령을 획득할 수 있다.

문장 획득 모듈(192)은 로봇(100)이 사용자에게 발화할 문장을 획득할 수 있다. 로봇(100)이 사용자에게 발화할 수 있는 복수의 문장들은 문장 데이터베이스(181)에 저장되어 있을 수 있다. 복수의 문장들은 로봇(100)의 태스크에 따라 문장 셋(set)으로 그룹화되어 있을 수 있다. 예를 들어, 냉장고를 설명하는 태스크에 대응되는 복수의 문장이 하나의 문장 셋을 구성할 수 있다.

문장 획득 모듈(192)은 트리거 이벤트가 감지되면 기설정된 문장을 획득할 수 있다. 예를 들어, 트리거 이벤트는 로봇(100)으로부터 기설정된 거리 이내에서 사용자가 인식되는 이벤트를 포함할 수 있다. 로봇(100)이 특정 제품(예로, 냉장고)을 설명하기 위한 로봇인 경우, 문장 획득 모듈(192)은 특정 제품을 설명하는 문장을 획득할 수 있다.

문장 획득 모듈(192)은 사용자 명령에 기초하여 사용자 명령에 응답할 문장을 획득할 수 있다. 예를 들어, 냉장고 설명을 요청하는 사용자 명령이 획득되면, 사용자 명령에 기초하여 냉장고 설명을 위한 복수의 문장을 획득할 수 있다.

문장 획득 모듈(192)은 사용자 음성에 대해 자연어 처리(NLP: Natural Language Processing)를 수행하여 사용자 음성에 응답하는 문장을 획득할 수 있다. 이를 위해, 메모리(180)에는 자연어 처리 모듈이 저장되어 있을 수 있다. 자연어 처리 모듈은, 음성 인식 모듈(Speech Recognition module), 언어 이해 모듈(Natural Language Understanding module), 대화 관리 모듈(Dialog Management module), 언어 생성 모듈(Natural Language Generation module) 및 음성 합성 모듈(Speech Synthesis module)을 포함할 수 있다.

모션 획득 모듈(193)은 문장 획득 모듈(192)을 통해 획득된 복수의 문장에 대응되는 모션을 획득할 수 있다. 문장 획득 모듈(192)을 통해 획득된 복수의 문장은, 모션이 할당된 문장과 모션이 할당되지 않은 문장을 포함할 수 있다. 모션 획득 모듈(193)은 모션이 할당되지 않은 문장에 대응되는 모션을 획득할 수 있다. 예를 들어, 복수의 문장은 모션이 할당되지 않은 제1 문장, 제2 모션이 할당된 제2 문장을 포함할 수 있다. 이 때, 모션 획득 모듈(193)은 제1 문장에 대응되는 제1 모션을 획득할 수 있다.

모션 획득 모듈(193)은 모션이 할당되지 않은 제1 문장을 식별할 수 있다. 모션 획득 모듈(193)은 제1 문장이 발화될 제1 시간 구간과 인접한 제2 시간 구간에서 발화될 제2 문장을 식별할 수 있다. 모션 획득 모듈(193)은 모션 데이터베이스(182)에 저장된 복수의 모션 중 제2 문장에 할당된 제2 모션과 상이한 모션을 제1 모션으로 획득할 수 있다.

모션 획득 모듈(193)은 모션 데이터베이스(182)에 저장된 복수의 모션 중 제2 모션과의 유사도가 기설정된 값(예로, 0.45)보다 작은 적어도 하나의 모션을 식별할 수 있다. 모션 획득 모듈(193)은 식별된 적어도 하나의 모션 중 하나를 무작위로 선택하여 제1 모션으로 획득할 수 있다.

모션 획득 모듈(193)은 메모리(180)에 저장된 유사도 테이블에 기초하여 적어도 하나의 모션을 식별할 수 있다. 유사도 테이블은, 모션 데이터베이스(182)에 저장된 복수의 모션 간의 유사도를 포함할 수 있다. 모션 획득 모듈(193)은 모션 데이터베이스(182)에 저장된 복수의 모션 각각에 대응되는 복수의 히스토그램을 서로 비교하여 복수의 모션 간의 유사도를 획득할 수 있다.

한편, 제1 문장이 발화될 제1 시간 구간과 인접한 시간 구간에서 발화될 복수의 문장이 존재하고, 복수의 문장 각각에 대해 모션이 할당되어 있을 수 있다. 예를 들어, 제1 시간 구간의 이전 시간 구간인 제2 시간 구간에서 발화될 제2 문장에 제2 모션이 할당되어 있고, 제1 시간 구간의 이후 시간 구간인 제3 시간 구간에서 발화될 제3 문장에 제3 모션이 할당되어 있을 수 있다.

이 때, 모션 획득 모듈(193)은 모션 데이터베이스(182)에 저장된 복수의 모션 각각과 제2 모션의 제1 유사도를 획득하고, 저장된 복수의 모션 각각과 제3 모션의 제2 유사도를 획득할 수 있다. 모션 획득 모듈(193)은 저장된 복수의 모션 각각에 대응되는 제1 유사도 및 제2 유사도의 복수의 평균값을 획득할 수 있다. 모션 획득 모듈(193)은 획득된 복수의 평균값중 기설정된 값보다 작은 적어도 하나의 평균값을 식별할 수 있다. 모션 획득 모듈(193)은 저장된 복수의 모션 중 식별된 적어도 하나의 평균값에 대응되는 적어도 하나의 모션을 식별할 수 있다. 모션 획득 모듈(193)은 식별된 적어도 하나의 모션 중 하나를 무작위로 선택하여 제1 모션을 획득할 수 있다.

한편, 모션 획득 모듈(193)은 모션이 할당되지 않은 모든 문장에 대응되는 모션을 획득하는 것이 아니라, 일부 문장에 대해서만 대응되는 모션을 획득할 수 있다. 예를 들어, 모션 획득 모듈(193)은 모션이 할당되지 않은 복수의 문장 중 발화하는데 소요되는 시간이 기설정된 값(예로, 5초)보다 큰 문장을 식별하고, 식별된 문장에 대응되는 모션을 획득할 수 있다. 즉, 모션 획득 모듈(193)은, 발화하는데 소요되는 시간이 기설정된 값 이하인 문장에 대해서는 대응되는 모션을 획득하지 않을 수 있다. 이는, 문장이 지나치게 짧으면, 로봇(100)이 문장을 발화하는 동안 모션 수행을 끝마칠 수 없을 수도 있기 때문이다.

동작 크기 제어 모듈(194, 또는 모션 크기 제어 모듈)은 제1 모션의 크기 및 제2 모션의 크기에 기초하여 제1 모션의 크기를 조절할 수 있다. 동작 크기 제어 모듈(194)은 제1 모션의 크기 및 제2 모션의 크기를 비교하여 제1 모션의 크기를 조절할 지 여부를 결정할 수 있다. 예를 들어, 제2 모션의 크기에 대한 제1 모션의 크기의 비율이 임계값(예로, 0.5)보다 크면, 동작 크기 제어 모듈(194)은 제1 모션의 크기를 조절할 수 있다. 반면에, 제2 모션의 크기에 대한 제1 모션의 크기의 비율이 임계값 이하이면, 동작 크기 제어 모듈(194)은 제1 모션의 크기를 유지할 수 있다.

동작 크기 제어 모듈(194)은 모션에 대응되는 로봇(100) 또는 로봇(100)의 구성요소(예로, 헤드)의 회전 각도에 기초하여 모션의 크기를 획득할 수 있다. 동작 크기 제어 모듈(194)은 각 축별 회전 각도의 크기의 최대 값을 모션의 크기로 획득할 수 있다. 예를 들어, 제1 모션에 대응되는 로봇(100)의 롤 축에 따른 회전 범위가 -10도에서 +10도이고, 피치 축에 따른 회전 범위가 -30도에서 +30도이고, 요 축에 따른 회전 범위가 -5도에서 +5도인 경우, 제1 모션의 크기는 30도일 수 있다. 따라서, 모션에 대응되는 로봇(100)의 회전 각도가 클수록 모션의 크기가 클 수 있다.

동작 크기 제어 모듈(194)은 제1 모션의 크기 및 제2 모션의 크기에 기초하여 가중치를 획득하고, 가중치에 기초하여 제1 모션의 크기가 제2 모션의 크기보다 작아지도록 제1 모션의 크기를 조절할 수 있다. 예를 들어, 동작 크기 제어 모듈(194)은 제2 모션의 크기에 대한 제1 모션의 크기의 비율을 가중치로 획득할 수 있다. 동작 크기 제어 모듈(194)은 가중치를 제1 모션에 대응되는 각 축 별 회전 각도에 곱하여 제1 모션의 크기를 조절할 수 있다.

동작 제어 모듈(195)은 제1 문장 및 제1 모션에 기초하여 로봇(100)의 동작을 제어할 수 있다. 동작 제어 모듈(195)은 제1 문장에 대응되는 제1 음성 메시지를 출력하도록 스피커(140)를 제어할 수 있다. 동작 제어 모듈(195)은 제1 음성 메시지가 출력되는 동안 제1 모션을 수행하도록 구동부(160)를 제어할 수 있다. 동작 제어 모듈(195)은 제1 음성 메시지가 출력되는 시간과 제1 모션이 수행되는 시간을 동기화할 수 있다. 예를 들어, 동작 제어 모듈(195)은 제1 음성 메시지가 출력되기 시작하는 시점과 제1 모션이 수행되기 시작하는 시점이 대응되도록, 제1 음성 메시지 출력 타이밍 및 제1 모션 수행 타이밍을 제어할 수 있다. 또한, 동작 제어 모듈(195)은 제1 음성 메시지 출력이 완료되는 시점과 제1 모션 수행이 완료되는 시점이 대응되도록, 제1 음성 메시지 출력 타이밍 및 제1 모션 수행 타이밍을 제어할 수 있다.

도 3을 참조하면, 로봇(100)은 사용자에게 발화할 복수의 문장 중 모션이 할당되지 않은 문장을 식별할 수 있다. 그리고, 로봇(100)은 식별된 문장 중 발화하는데 소요되는 시간이 기설정된 시간보다 큰 문장을 획득할 수 있다. 예를 들어, 로봇(100)은 모션이 할당되지 않은 제1 문장(31) 및 제3 문장(33)을 식별할 수 있다. 그리고, 로봇(100)은 발화하는데 소요되는 시간이 기설정된 시간보다 큰 제1 문장(31)을 획득할 수 있다.

로봇(100)은 제1 문장(31)에 대응되는 제1 문장을 획득할 수 있다. 예를 들어, 로봇(100)은 제1 문장(31)을 발화할 제1 시간 구간(T1)과 인접한 제2 시간 구간(T2)에서 발화되는 제2 문장(32)을 식별할 수 있다. 로봇(100)은 제2 문장(32)에 할당된 제2 모션(M-Intro)의 식별 정보(ID 1)를 획득할 수 있다.

로봇(100)은 제2 모션(M-Intro)의 식별 정보(ID 1) 및 유사도 테이블(ST)에 기초하여 제1 모션을 획득할 수 있다. 유사도 테이블(ST)은 로봇(100)이 수행할 수 있는 미리 정해진 모션들 간의 유사도를 포함할 수 있다. 유사도 테이블(ST)에서, 숫자가 클수록 유사도가 높다는 것을 의미한다. 예를 들어, 유사도가 1이란 것은, 모션이 완전히 동일하다는 것을 의미한다.

로봇(100)은 제2 모션(M-Intro)의 식별 정보(ID 1)에 기초하여, 제2 모션(M-Intro)과의 유사도가 기설정된 값(예로, 0.5)보다 작은 적어도 하나의 모션을 식별할 수 있다. 그리고, 로봇(100)은 식별된 적어도 하나의 모션 중 하나를 무작위로 식별하여 제1 모션으로 획득할 수 있다. 예를 들어, 로봇(100)은 ID 2, ID N-1을 비롯한 복수의 식별 정보에 대응되는 복수의 모션 중 하나를 제1 모션으로 획득할 수 있다.

도 4를 참조하면, 로봇(100)은 사용자에게 발화할 제1 문장(41), 제2 문장(42) 및 제3 문장(43)을 획득할 수 있다. 제1 문장(41), 제2 문장(42) 및 제3 문장(43) 각각은 제1 시간 구간(T1), 제2 시간 구간(T2) 및 제3 시간 구간(T3)에서 발화될 수 있다. 제1 시간 구간(T1)은 제2 시간 구간(T2) 및 제3 시간 구간(T3)과 인접할 수 있다. 제2 문장(42)에는 제2 모션(M-Intro)가 할당되어 있으며, 제3 문장(43)에는 제3 모션(M-Left)가 할당되어 있을 수 있다.

로봇(100)은 모션이 할당되지 않은 제1 문장(41)에 대응되는 제1 모션을 획득할 수 있다. 로봇(100)은 미리 저장된 복수의 모션과 제2 모션(42)의 제1 유사도 및 미리 저장된 복수의 모션과 제3 모션(43)의 제2 유사도에 기초하여 적어도 하나의 모션을 식별할 수 있다. 유사도 테이블(ST)은, 미리 저장된 복수의 모션 간의 유사도를 포함할 수 있다. 로봇(100)은 복수의 모션 각각에 대응되는 복수의 모션과 제2 모션(42) 간의 제1 유사도(S1)와 복수의 모션과 제3 모션(43) 간의 제2 유사도(S2)를 획득할 수 있다. 로봇(100)은 제1 유사도(S1) 및 제2 유사도(S2)의 평균값(Avg)을 획득할 수 있다. 로봇(100)은 평균값(Avg)이 기설정된 값(예로, 0.5)보다 작은 적어도 하나의 모션을 획득할 수 있다. 그리고, 로봇(100)은 식별된 적어도 하나의 모션 중 하나를 무작위로 식별하여 제1 모션으로 획득할 수 있다. 예를 들어, 로봇(100)은 ID 2, ID N-1을 비롯한 복수의 식별 정보에 대응되는 복수의 모션 중 하나를 제1 모션으로 획득할 수 있다.

도 5를 참조하면, 로봇(100)은 제1 모션에 대한 정보(51)를 획득할 수 있다. 로봇(100)은 제1 모션에 대한 정보(51)에 대응되는 제1 히스토그램(52)을 획득할 수 있다. 로봇(100)은 3축(롤, 피치, 요)에 각각 대응되는 제1 히스토그램(52)을 획득할 수 있다. 이와 같이, 로봇(100)은 미리 저장된 복수의 모션 각각에 대응되는 히스토그램을 획득할 수 있다.

로봇(100)은 각 모션에 대응되는 히스토그램을 비교하여 모션 간 유사도를 획득할 수 있다. 예를 들어, 로봇(100)은 제1 모션에 대응되는 제1 히스토그램(52) 및 제2 모션에 대응되는 제2 히스토그램(53)을 비교하여, 제1 모션 및 제2 모션의 유사도를 획득할 수 있다. 로봇(100)은 각 축에 대응되는 히스토그램을 비교하여 각 축에 대응되는 유사도를 산출하고, 각 축에 대응되는 유사도들의 평균에 기초하여 최종 유사도를 획득할 수있다. 예를 들어, 로봇(100)은 제1 히스토그램(52) 및 제2 히스토그램(53)의 롤 축에 대한 제1 유사도를 획득할 수 있다. 로봇(100)은 제1 히스토그램(52) 및 제2 히스토그램(53)의 피치 축에 대한 제2 유사도를 획득할 수 있다. 로봇(100)은 제1 히스토그램(52) 및 제2 히스토그램(53)의 요 축에 대한 제2 유사도를 획득할 수 있다. 로봇(100)은 제1 유사도, 제2 유사도 및 제3 유사도의 평균에 기초하여 제1 모션 및 제2 모션 간의 최종 유사도를 획득할 수 있다. 이와 같은 방법에 따라 도 3 및 4의 유사도 테이블(ST)이 획득되어 메모리(180)에 저장될 수 있다.

도 6을 참조하면, 로봇(100)은 제1 문장(61)에 대응되는 제1 모션 정보(63), 제2 문장(62)에 대응되는 제2 모션 정보(64)를 획득할 수 있다. 각 모션 정보는, 각 모션에 대응되는 로봇(100) 또는 로봇(100)의 구성의 회전 각도를 포함할 수 있다.

로봇(100)은 제1 모션 정보(63) 및 제2 모션 정보(64)에 기초하여 제1 모션의 크기를 조절할 지 판단할 수 있다. 로봇(100)은 제1 모션 정보(63)에 기초하여 제1 모션에 대응되는 회전 각도의 크기의 제1 최대값(RMAX-a)를 획득할 수 있다. 로봇(100)은 제2 모션 정보(64)에 기초하여 제2 모션에 대응되는 회전 각도의 크기의 제2 최대값(RMAX-b)를 획득할 수 있다. 제2 최대값(RMAX-b)에 대한 제1 최대값(RMAX-a)의 비율(즉, RMAX-a/RMAX-b)이 임계값(예로, 0.5)보다 크면, 로봇(100)은 제1 모션의 크기를 조절할 수 있다. 제2 최대값(RMAX-b)에 대한 제1 최대값(RMAX-a)의 비율이 임계값(예로, 0.5) 이하이면, 로봇(100)은 제1 모션의 크기를 조절하지 않을 수 있다.

로봇(100)은 제1 모션의 크기 및 제2 모션의 크기에 기초하여 제1 모션의 크기를 조절할 수 있다. 예를 들어, 로봇(100)은 제2 최대값(RMAX-b)에 대한 제1 최대값(RMAX-a)의 비율(즉, RMAX-a/RMAX-b)을 가중치(w)로 획득할 수 있다. 로봇(100)은 제1 모션 정보(63) 및 가중치(w)에 기초하여 제1 모션의 크기를 조절할 수 있다. 로봇(100)은 제1 모션에 대응되는 회전 각도에 가중치(w)를 곱하여 제3 모션 정보(65)를 획득할 수 있다. 제3 모션 정보(65)는 제1 문장(61)에 대응될 수 있다.

로봇(100)은 사용자를 감지할 수 있다(S710). 예를 들어, 로봇(100)은 카메라를 통해 획득된 촬영 이미지를 분석하여 사용자를 인식할 수 있다.

로봇(100)은 사용자에게 발화할 복수의 문장을 획득할 수 있다(S720). 로봇(100)은 메모리(180)에 미리 저장된 복수의 문장을 획득할 수 있다. 로봇(100)은 사용자 명령에 기초하여 복수의 문장을 획득할 수 있다. 예를 들어, 로봇(100)은 사용자 명령("이 냉장고에 대해 설명해줘")에 기초하여 냉장고를 설명하기 위한 복수의 문장을 획득할 수 있다.

로봇(100)은 획득된 복수의 문장 중 로봇(100)이 발화하는 동안 수행할 모션이 할당되지 않은 제1 문장을 식별할 수 있다(S730). 예를 들어, 로봇(100)은 도 1의 제1 문장(11)을 식별할 수 있다.

로봇(100)은 제1 문장이 발화될 제1 시간 구간과 인접한 제2 시간 구간에서 발화될 제2 문장을 식별하고, 미리 저장된 복수의 모션 중 제2 문장에 할당된 제2 모션과 상이한 제1 모션을 제1 문장에 대응되는 모션으로 획득할 수 있다(S740). 로봇(100)은 미리 저장된 복수의 모션 중 제2 모션과의 유사도가 기설정된 값보다 작은 적어도 하나의 모션을 식별할 수 있다. 로봇(100)은 미리 저장된 복수의 모션에 대응되는 히스토그램과 제2 모션에 대응되는 히스토그램을 비교하여 미리 저장된 복수의 모션과 제2 모션의 유사도를 획득할 수 있다. 로봇(100)은 미리 저장된 복수의 모션 간의 유사도를 포함하는 유사도 테이블에 기초하여 적어도 하나의 모션을 식별할 수 있다.

한편, 제1 시간 구간과 인접한 시간 구간이 복수일 수 있다. 예를 들어, 제1 시간 구간은 제2 시간 구간 및 제3 시간 구간과 인접할 수 있다. 로봇(100)은 제3 시간 구간에서 발화될 제3 문장에 할당된 제3 모션을 식별할 수 있다. 로봇(100)은 미리 저장된 복수의 모션 각각과 제2 모션의 제1 유사도를 획득하고, 미리 저장된 복수의 모션 각각과 제3 모션의 제2 유사도를 획득할 수 있다. 로봇(100)은 미리 저장된 모션 각각에 대응되는 제1 유사도 및 제2 유사도의 복수의 평균값을 획득할 수 있다. 로봇(100)은 복수의 평균값 중 기설정된 값보다 작은 적어도 하나의 평균값을 식별하고, 미리 저장된 복수의 모션 중 식별된 적어도 하나의 평균값에 대응되는 적어도 하나의 모션을 식별할 수 있다.

로봇(100)은 식별된 적어도 하나의 모션 중 하나를 무작위로 선택하여 제1 모션으로 획득할 수 있다. 그리고, 로봇(100)은 제1 문장을 발화하면서 제1 모션을 수행할 수 있다(S750).

로봇(100)은 제1 모션의 크기를 조절할 수 있다. 로봇(100)은 제2 모션에 대한 정보에 기초하여 제2 모션의 크기를 획득할 수 있다. 로봇(100)은 제2 모션의 크기에 대한 제1 모션의 크기의 비율이 임계값보다 크면, 제1 모션의 크기 및 제2 모션의 크기에 기초하여 제1 모션의 크기를 조절할 수 있다. 로봇(100)은 제2 모션의 크기에 대한 제1 모션의 크기의 비율에 기초하여 가중치를 산출할 수 있다. 로봇(100)은 제1 모션의 크기가 제2 모션의 크기보다 작아지도록 가중치에 기초하여 제1 모션의 크기를 조절할 수 있다. 제2 모션의 크기에 대한 제1 모션의 크기의 비율이 임계값 이하이면, 로봇(100)은 제1 모션의 크기를 유지할 수 있다.

한편, 로봇(100)은 트리거 이벤트가 감지되거나 사용자 명령이 획득되는 경우, 일괄적으로 복수의 문장 셋을 획득할 수도 있으나, 사용자와의 인터랙션을 수행하면서 실시간으로 문장을 생성할 수도 있다.

도 8을 참조하면, 로봇(100)은 사용자에게 발화할 문장을 획득할 수 있다(S810). 로봇(100)은 트리거 이벤트가 발생하거나 사용자 명령이 획득되면 사용자에게 발화할 문장을 획득할 수 있다. 로봇(100)은 트리거 이벤트 또는 사용자 명령에 기초하여 메모리(180)에 미리 저장된 문장을 획득할 수 있다. 또는, 로봇(100)은 트리거 이벤트 또는 사용자 명령에 기초하여 사용자에게 발화할 문장을 생성할 수 있다. 예를 들어, 사용자 음성 명령("화장실 어디있어?")이 획득되면, 응답 문장("이쪽으로 20m 직진하시면 됩니다")을 획득할 수 있다.

로봇(100)은 획득된 문장에 모션이 할당되어 있는 지 식별할 수 있다(S820). 예를 들어, 모션이 할당되어 있는 문장은 할당된 모션의 식별 정보와 함께 매칭되어 메모리(180)에 저장되어 있을 수 있다. 로봇(100)은 획득된 문장과 매칭되어 저장된 모션의 식별 정보의 존재 여부를 식별하여 획득된 문장에 모션이 할당되어 있는 지 판단할 수 있다. 로봇(100)이 문장을 생성한 경우, 로봇(100)은 생성된 문장이 메모리(180)에 저장되어 있는 지 식별할 수 있다. 생성된 문장이 메모리(180)에 저장되어 있는 경우, 로봇(100)은 생성된 문장과 매칭되어 저장된 모션의 식별 정보가 존재하는 지 식별하여 생성된 문장에 모션이 할당되어 있는 지 판단할 수 있다.

획득된 문장에 모션이 할당되어 있는 경우(S820-Y), 로봇(100)은 획득된 문장에 대응되는 모션을 획득하지 않을 수 있다(S850).

획득된 문장에 모션이 할당되어 있지 않은 경우(S820-N), 로봇(100)은 획득된 문장을 발화하는 데 소요되는 시간이 기설정된 시간보다 큰 지 식별할 수 있다(S830). 로봇(100)은 TTS(Text To Speech) 모듈에 기초하여 획득된 문장에 대응되는 음성 메시지를 획득할 수 있다. 로봇(100)은 음성 메시지의 길이가 기설정된 시간보다 큰 지 판단할 수 있다.

획득된 문장을 발화하는 데 소요되는 시간이 기설정된 시간보다 큰 경우(S830-Y), 로봇(100)은 획득된 문장에 대응되는 모션을 획득할 수 있다(S840). 로봇(100)은 획득된 문장이 발화될 시간 구간과 인접한 시간 구간에서 발화된 문장에 대응되는 모션을 식별하고, 식별된 모션과의 유사도가 기설정된 값보다 작은 모션을 획득할 수 있다.

획득된 문장을 발화하는 데 소요되는 시간이 기설정된 시간 이하인 경우 (S830-N), 로봇(100)은 획득된 문장에 대응되는 모션을 획득하지 않을 수 있다(S850). 로봇(100)이 연속으로 여러 문장에 대응되는 음성 메시지를 발화하는 경우, 기설정된 시간 보다 짧은 길이를 갖는 음성 메시지에 대응되는 모션을 수행하면, 로봇(100)의 부자연스러운 모션이 연출될 수 있다. 이를 방지하기 위하여, 로봇(100)은 획득된 문장을 발화하는 데 소요되는 시간이 기설정된 시간 이하인 경우에는 획득된 문장에 대응되는 모션을 획득하지 않을 수 있다. 예를 들어, 도 1의 "안녕하세요"의 길이(1초)가 기설정된 시간(5초) 이하이면, 로봇(100)은 "안녕하세요"를 발화할 때는 모션을 수행하지 않을 수 있다.

한편, 상술한 본 개시의 다양한 실시 예들에 따른 처리 동작을 수행하기 위한 컴퓨터 명령어(computer instructions)는 비일시적 컴퓨터 판독 가능 매체(non-transitory computer-readable medium) 에 저장될 수 있다. 이러한 비일시적 컴퓨터 판독 가능 매체에 저장된 컴퓨터 명령어는 프로세서에 의해 실행되었을 때 상술한 다양한 실시 예에 따른 처리 동작을 특정 기기가 수행하도록 할 수 있다.

비일시적 컴퓨터 판독 가능 매체란 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 비일시적 컴퓨터 판독 가능 매체의 구체적인 예로는, CD, DVD, 하드 디스크, 블루레이 디스크, USB, 메모리카드, ROM 등이 있을 수 있다.

이상에서는 본 개시의 바람직한 실시 예에 대하여 도시하고 설명하였지만, 본 개시는 상술한 특정의 실시 예에 한정되지 아니하며, 청구범위에서 청구하는 본 개시의 요지를 벗어남이 없이 당해 개시에 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 개시의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.

Claims

로봇에 있어서,

카메라;

스피커;

구동부;

적어도 하나의 인스트럭션을 저장하는 메모리; 및

프로세서;를 포함하고,

상기 프로세서는,

상기 카메라를 통해 획득된 이미지에 기초하여 사용자를 감지하고,

상기 로봇이 상기 사용자에게 발화할 복수의 문장을 획득하고,

상기 복수의 문장 중 상기 로봇이 발화하는 동안 수행할 모션이 할당되지 않은 제1 문장을 식별하고,

상기 제1 문장이 발화될 제1 시간 구간과 인접한 제2 시간 구간에서 발화될 제2 문장을 식별하고, 상기 메모리에 미리 저장된 복수의 모션 중 상기 제2 문장에 할당된 제2 모션과 상이한 제1 모션을 상기 제1 문장에 대응되는 모션으로 획득하고,

상기 제1 문장에 대응되는 음성을 출력하도록 상기 스피커를 제어하고, 상기 음성이 출력되는 동안 상기 제1 모션을 수행하도록 상기 구동부를 제어하는

로봇.
제1 항에 있어서,

상기 프로세서는,

상기 미리 저장된 복수의 모션 중 상기 제2 모션과의 유사도가 기설정된 값보다 작은 적어도 하나의 모션을 식별하고,

상기 적어도 하나의 모션 중 하나를 무작위로 식별하여 상기 제1 모션으로 획득하는

로봇.
제2 항에 있어서,

상기 프로세서는,

상기 미리 저장된 복수의 모션에 대응되는 히스토그램과 상기 제2 모션에 대응되는 히스토그램을 비교하여 상기 미리 저장된 복수의 모션과 상기 제2 모션의 유사도를 획득하는

로봇.
제2 항에 있어서,

상기 메모리는,

상기 제2 모션을 포함하는 상기 미리 저장된 복수의 모션 간의 유사도를 포함하는 유사도 테이블을 저장하고,

상기 프로세서는,

상기 유사도 테이블에 기초하여 상기 제1 모션을 획득하는

로봇.
제1 항에 있어서,

상기 프로세서는,

상기 제1 시간 구간과 인접하며 상기 제2 시간 구간과 상이한 제3 시간 구간에서 발화될 제3 문장에 할당된 제3 모션을 식별하고,

상기 미리 저장된 복수의 모션 각각과 상기 제2 모션의 제1 유사도를 획득하고, 상기 미리 저장된 복수의 모션 각각과 상기 제3 모션의 제2 유사도를 획득하고,

상기 미리 저장된 복수의 모션 각각에 대응되는 상기 제1 유사도 및 상기 제2 유사도의 복수의 평균값을 획득하고,

상기 복수의 평균값 중 기설정된 값보다 작은 적어도 하나의 평균값을 식별하고, 상기 미리 저장된 복수의 모션 중 상기 적어도 하나의 평균값에 대응되는 적어도 하나의 모션을 식별하고,

상기 적어도 하나의 모션 중 하나를 무작위로 식별하여 상기 제1 모션으로 획득하는

로봇.
제1 항에 있어서,

상기 프로세서는,

상기 제2 모션에 대한 정보에 기초하여 상기 제2 모션의 크기를 획득하고,

상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율이 임계값보다 크면, 상기 제1 모션의 크기 및 상기 제2 모션의 크기에 기초하여 상기 제1 모션의 크기를 조절하고,

상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율이 상기 임계값 이하이면, 상기 제1 모션의 크기를 유지하는

로봇.
제6 항에 있어서,

상기 프로세서는,

상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율에 기초하여 가중치를 산출하고,

상기 제1 모션의 크기가 상기 제2 모션의 크기보다 작아지도록 상기 가중치에 기초하여 상기 제1 모션의 크기를 조절하는

로봇.
로봇의 제어 방법에 있어서,

사용자를 감지하는 단계;

상기 로봇이 상기 감지된 사용자에게 발화할 복수의 문장을 획득하는 단계;

상기 복수의 문장 중 상기 로봇이 발화하는 동안 수행할 모션이 할당되지 않은 제1 문장을 식별하는 단계;

상기 제1 문장이 발화될 제1 시간 구간과 인접한 제2 시간 구간에서 발화될 제2 문장을 식별하고, 미리 저장된 복수의 모션 중 상기 제2 문장에 할당된 제2 모션과 상이한 제1 모션을 상기 제1 문장에 대응되는 모션으로 획득하는 단계; 및

상기 제1 문장을 발화하면서 상기 제1 모션을 수행하는 단계;를 포함하는

제어 방법.
제8 항에 있어서,

상기 제1 모션을 획득하는 단계는,

상기 미리 저장된 복수의 모션 중 상기 제2 모션과의 유사도가 기설정된 값보다 작은 적어도 하나의 모션을 식별하는 단계 및

상기 적어도 하나의 모션 중 하나를 무작위로 식별하여 상기 제1 모션으로 획득하는 단계를 포함하는

제어 방법.
제9 항에 있어서,

상기 적어도 하나의 모션을 식별하는 단계는,

상기 미리 저장된 복수의 모션에 대응되는 히스토그램과 상기 제2 모션에 대응되는 히스토그램을 비교하여 상기 미리 저장된 복수의 모션과 상기 제2 모션의 유사도를 획득하는 단계를 포함하는

제어 방법.
제9 항에 있어서,

상기 로봇은,

상기 제2 모션을 포함하는 상기 미리 저장된 복수의 모션 간의 유사도를 포함하는 유사도 테이블을 저장하고,

상기 제1 모션을 획득하는 단계는,

상기 유사도 테이블에 기초하여 상기 제1 모션을 획득하는

제어 방법.
제8 항에 있어서,

상기 제1 모션을 획득하는 단계는,

상기 제1 시간 구간과 인접하며 상기 제2 시간 구간과 상이한 제3 시간 구간에서 발화될 제3 문장에 할당된 제3 모션을 식별하는 단계,

상기 미리 저장된 복수의 모션 각각과 상기 제2 모션의 제1 유사도를 획득하고, 상기 미리 저장된 복수의 모션 각각과 상기 제3 모션의 제2 유사도를 획득하는 단계,

상기 미리 저장된 복수의 모션 각각에 대응되는 상기 제1 유사도 및 상기 제2 유사도의 복수의 평균값을 획득하는 단계,

상기 복수의 평균값 중 기설정된 값보다 작은 적어도 하나의 평균값을 식별하고, 상기 미리 저장된 복수의 모션 중 상기 적어도 하나의 평균값에 대응되는 적어도 하나의 모션을 식별하는 단계 및

상기 적어도 하나의 모션 중 하나를 무작위로 식별하여 상기 제1 모션으로 획득하는 단계를 포함하는

제어 방법.
제8 항에 있어서,

상기 제2 모션에 대한 정보에 기초하여 상기 제2 모션의 크기를 획득하는 단계;

상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율이 임계값보다 크면, 상기 제1 모션의 크기 및 상기 제2 모션의 크기에 기초하여 상기 제1 모션의 크기를 조절하는 단계; 및

상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율이 상기 임계값 이하이면, 상기 제1 모션의 크기를 유지하는 단계;를 더 포함하는

제어 방법.
제13 항에 있어서,

상기 제1 모션의 크기를 조절하는 단계는,

상기 제2 모션의 크기에 대한 상기 제1 모션의 크기의 비율에 기초하여 가중치를 산출하는 단계,

상기 제1 모션의 크기가 상기 제2 모션의 크기보다 작아지도록 상기 가중치에 기초하여 상기 제1 모션의 크기를 조절하는 단계를 포함하는

제어 방법.
제8 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.