WO2020256160A1

WO2020256160A1 - 인공지능 홈 로봇 및 그의 제어 방법

Info

Publication number: WO2020256160A1
Application number: PCT/KR2019/007258
Authority: WO
Inventors: 김남건
Original assignee: 엘지전자 주식회사
Priority date: 2019-06-17
Filing date: 2019-06-17
Publication date: 2020-12-24
Also published as: KR20190104935A; US20210331328A1

Abstract

본 발명은 내부 수납 공간을 형성하는 바디(body); 상기 바디의 하측에 배치되어 상기 바디를 지지하는 지지부; 영상을 표시할 수 있는 디스플레이; 상기 바디의 상측에 위치하고, 상기 디스플레이가 전면에 배치되는 헤드(head); 음성 신호가 수신되는 복수의 마이크(MIC)를 포함하는 음성 입력부; 및 사용자로부터 결제 명령을 수신하면, 보안 코드의 발화를 요청하고, 상기 사용자로부터 상기 보안 코드의 발화를 수신하고, 상기 보안 코드와 비교하고, 기 저장된 상기 사용자의 음성과 비교하여 본인 인증을 수행하는 제어부를 포함하는 인공지능 홈 로봇을 제공한다. 따라서, 음성 입력을 통해 보안 인증을 수행함으로써 사용자 편의성을 증대시킬 수 있는 인공 지능 홈 로봇을 제공할 수 있다.

Description

인공지능 홈 로봇 및 그의 제어 방법

본 발명은 인공지능 홈 로봇 및 이를 포함하는 스마트 홈 시스템의 제어 방법에 관한 것이다. 더욱 상세하게는 인공지능 홈 로봇을 이용하여 결제 등을 진행하면서 사용자의 음성 입력에 따라 보안 인증을 수행하여 결제 서비스를 제공할 수 있는 홈 로봇 및 그 제어 방법에 관한 것이다.

종래에는 가정이나 사무실 등의 소정 공간에서 사용되는 세탁기, 공기조화기, 청소기 등 홈 어플라이언스(Home appliance)들은 각각 개별적으로 고유의 기능과 동작을 수행하였다.

예를 들어, 냉장고는 음식물을 저장하고, 세탁기는 세탁물을 처리하며, 공기조화기는 실내 온도를 조정하고, 조리기기는 음식물을 조리하는 기능 등을 수행한다.

근래에는, 다양한 통신 기술의 발달에 따라, 다수의 홈 어플라이언스들이 유/무선 통신으로 네트워크 연결되고 있다.

네트워크를 구성하는 홈 어플라이언스들은, 어느 하나의 기기에서 다른 기기로 데이터를 전송할 수 있고, 어느 하나의 기기에서 다른 기기의 정보를 확인할 수 있다.

또한, 휴대 단말기 등 스마트 기기(smart device)를 포함하여 네트워크를 구성함으로써, 사용자는 언제 어디서든 자신의 스마트 기기를 이용하여, 홈 어플라이언스들의 정보를 확인하고 제어할 수 있다.

이러한 가정 내 기기들의 네트워크는 스마트 홈(smart home)으로 불리기도 한다.

스마트 홈 기술과 관련하여 종래기술(출원번호 10-2003-0093196)은, 세탁기 등을 포함하는 홈 네트워크를 구성한다.

종래기술은 세탁 종료 후에 일정 시간이 지나면 세탁물의 존재 여부 및 습도를 기준으로 세탁기 스스로가 사용자와의 커뮤니케이션을 하고 그 결과에 따라 후속 조치를 하므로 세탁물의 장시간 방치에 의한 손상을 원천적으로 억제할 수 있다.

즉, 세탁 종료 후에 사용자의 휴대 단말기로 세탁물 방치에 관한 정보 및 후속 조치의 진행 여부를 묻는 질문 메시지를 전송하고, 이에 대한 응답이 수신되면 응답에 따라 후속 조치를 수행하게 된다.

상기 종래기술과 같이, 종래의 스마트 홈 기술은 사용자가 가정 내에 있을 때에도 휴대 단말기를 통하여 특정 기기의 정보를 사용자에게 제공하거나 제어하는 수준에 머물러 있다. 또한, 사용자가 매번 휴대 단말기를 조작해야 하는 불편함이 있었다.

한편, 로봇은 산업용으로 개발되어 공장 자동화의 일 부분을 담당하여 왔다. 최근에는 로봇을 응용한 분야가 더욱 확대되어, 의료용 로봇, 우주 항공 로봇 등이 개발되고, 일반 가정에서 사용할 수 있는 가정용 홈 로봇도 만들어지고 있다.

이와 같은 가정용 홈 로봇을 이용하여 다양한 홈 어플라이언스들을 구동하고자 하고 있다.

그러나, 이와 같은 홈 어플라이언스 들을 구동하거나 쇼핑 등을 진행하고자 하는 경우, 결제를 위한 본인 인증을 수행하여야 하는 어려움이 있다.

홈 로봇의 경우, 음성 인식으로부터 사용자를 인식하고 본인 인증을 수행하여야 하나, 아직 음성만으로 사용자를 구분하는데 오인식이 많이 발생한다. 또한, 다른 생체 인식, 예를 들어 지문, 홍체 등을 통한 인식은 아직까지 개인정보보호의 문제가 존재하고 있다.

[선행기술문헌]

[특허문헌]

출원번호 10-2003-0093196 (출원일 2003년 12월 18일)

본 발명의 목적은, 음성 입력을 통해 보안 인증을 수행함으로써 사용자 편의성을 증대시킬 수 있는 홈 로봇 및 그 제어 방법을 제공함에 있다.

본 발명의 목적은, 랜덤하게 발생하는 보안 코드에 대하여 사용자 음성을 분석하여 확인함으로써 음성만으로도 정확한 인증이 가능한 홈 로봇을 이용한 결제 시스템을 제공하는 것이다.

본 발명에 따르면, 사용자로부터 결제 명령을 수신하는 단계; 보안 코드의 발화 요청을 상기 사용자에게 제공하는 단계; 상기 사용자로부터 상기 보안 코드의 발화를 소정 시간 내에 수신하는 단계; 및 수신된 발화 데이터를 분석하여 상기 보안 코드와 비교하고, 기 저장된 상기 사용자의 음성과 비교하여 본인 인증을 수행하는 단계를 포함하는 홈 로봇의 제어 방법을 제공한다.

상기 보안 코드의 발화 요청 전에, 상기 보안 코드를 랜덤으로 생성하여 상기 사용자에게 제공하는 단계를 더 포함할 수 있다.

상기 보안 코드를 제공하는 단계는, 상기 홈 로봇의 디스플레이를 통해 시각적으로 제공할 수 있다.

상기 본인 인증을 수행하는 단계는, 수신된 상기 발화 데이터를 음성 인식 전처리를 수행하고, 전처리된 발화 데이터의 의도 분석을 수행하여 상기 보안 코드와 동일성 여부를 판단할 수 있다.

상기 전처리된 발화 데이터에 대하여 기 저장된 사용자의 음성 데이터와 비교하여 사용자의 음성 데이터와 일치하는지 판단하는 단계를 더 포함할 수 있다.

상기 보안 코드를 제공하는 단계는, 상기 사용자에게 청각적으로 제공할 수 있다.

상기 보안 코드 발화를 요청하는 단계는, 암호 모션을 요청하는 단계를 더 포함할 수 있다.

상기 암호 모션 및 상기 보안 코드는 기 설정될 수 있다.

상기 본인 인증을 수행하는 단계는, 상기 사용자가 제공하는 암호 모션을 영상 데이터로 수득하는 단계, 상기 사용자가 발화하는 보안 코드를 발화 데이터로 수득하는 단계, 상기 영상 데이터를 기초로 모션 인식을 수행하여 상기 암호 모션과 상기 영상 데이터의 모션이 일치하는지 판단하고, 상기 발화 데이터가 기 설정된 상기 보안 코드와 동일한지 판단하는 단계를 포함할 수 있다.

상기 본인 인증이 성공하지 않고, 소정 횟수만큼 반복되었는지 판단하여 소정 횟수 이상인 경우, 결제 요청에 대한 동작을 중단하는 것을 더 포함할 수 있다.

한편, 본 발명에 따르면, 내부 수납 공간을 형성하는 바디(body); 상기 바디의 하측에 배치되어 상기 바디를 지지하는 지지부; 영상을 표시할 수 있는 디스플레이; 상기 바디의 상측에 위치하고, 상기 디스플레이가 전면에 배치되는 헤드(head); 음성 신호가 수신되는 복수의 마이크(MIC)를 포함하는 음성 입력부; 및 사용자로부터 결제 명령을 수신하면, 보안 코드의 발화를 요청하고, 상기 사용자로부터 상기 보안 코드의 발화를 수신하고, 상기 보안 코드와 비교하고, 기 저장된 상기 사용자의 음성과 비교하여 본인 인증을 수행하는 제어부를 포함하는 홈 로봇을 제공한다.

상기 제어부는 상기 보안 코드의 발화 요청 전에, 상기 보안 코드를 랜덤으로 생성하여 상기 사용자에게 제공할 수 있다.

상기 제어부는 상기 디스플레이를 통해 상기 보안 코드를 시각적으로 제공할 수 있다.

상기 제어부는 수신된 상기 발화 데이터를 음성 인식 전처리를 수행하고, 전처리된 발화 데이터의 의도 분석을 수행하여 상기 보안 코드와 동일성 여부를 판단할 수 있다.

상기 제어부는, 상기 전처리된 발화 데이터에 대하여 기 저장된 사용자의 음성 데이터와 비교하여 사용자의 음성 데이터와 일치하는지 판단할 수 있다.

상기 보안 코드는 상기 사용자에게 청각적으로 제공될 수 있다.

상기 제어부는 상기 보안 코드 발화를 요청과 함께 암호 모션을 요청하는 것을 더 포함할 수 있다.

상기 암호 모션 및 상기 보안 코드는 기 설정될 수 있다.

상기 제어부는, 상기 사용자가 제공하는 암호 모션을 영상 데이터로 수득하고, 상기 사용자가 발화하는 보안 코드를 발화 데이터로 수득하고, 상기 영상 데이터를 기초로 모션 인식을 수행하여 상기 암호 모션과 상기 영상 데이터의 모션이 일치하는지 판단하고, 상기 발화 데이터가 기 설정된 상기 보안 코드와 동일한지 판단할 수 있다.

상기 제어부는 본인 인증이 성공하지 않고, 소정 횟수만큼 반복되었는지 판단하여 소정 횟수 이상인 경우, 결제 요청에 대한 동작을 중단하는 것을 더 포함할 수 있다.

본 발명의 실시예들 중 적어도 하나에 의하면, 음성 입력을 통해 보안 인증을 수행함으로써 사용자 편의성을 증대시킬 수 있는 홈 로봇을 제공할 수 있다.

또한, 랜덤하게 발생하는 보안 코드에 대하여 사용자 음성을 분석하여 확인함으로써 사용자의 음성만으로도 정확한 인증이 가능하다.

도 1은 본 발명의 일 실시예에 따른 홈 로봇을 포함하는 스마트 홈 시스템 구성도이다.

도 2는 본 발명의 일 실시예에 따른 홈 로봇의 외관을 도시하는 정면도이다.

도 3은 본 발명의 일 실시예에 따른 홈 로봇의 간략한 내부 블록도의 일예이다.

도 4는 본 발명의 일 실시예에 따른 홈 로봇의 제어 방법을 도시한 순서도이다.

도 5a 및 도 5b는 도 4의 제어 방법에 따른 동작을 나타내는 도면이다.

도 6은 본 발명의 다른 실시예에 따른 홈 로봇의 제어 방법을 도시한 순서도이다.

도 7은 도 6의 제어 방법에 따른 동작을 나타내는 도면이다.

도 8은 본 발명의 또 다른 실시예에 따른 홈 로봇의 제어 방법을 도시한 순서도이다.

도 9a 내지 도 9c는 도 8의 제어 방법에 따른 동작을 나타내는 도면이다.

이하에서 언급되는 “전(F)/후(R)/좌(Le)/우(Ri)/상(U)/하(D)” 등의 방향을 지칭하는 표현은 도면에 표시된 바에 따라 정의하나, 이는 어디까지나 본 발명이 명확하게 이해될 수 있도록 설명하기 위한 것이며, 기준을 어디에 두느냐에 따라 각 방향들을 다르게 정의할 수도 있음은 물론이다.

이하에서 언급되는 구성요소 앞에 ‘제1, 제2’ 등의 표현이 붙는 용어 사용은, 지칭하는 구성요소의 혼동을 피하기 위한 것일 뿐, 구성요소 들 사이의 순서, 중요도 또는 주종관계 등과는 무관하다. 예를 들면, 제1 구성요소 없이 제2 구성요소 만을 포함하는 발명도 구현 가능하다.

도면에서 각 구성의 두께나 크기는 설명의 편의 및 명확성을 위하여 과장되거나 생략되거나 또는 개략적으로 도시되었다. 또한 각 구성요소의 크기와 면적은 실제크기나 면적을 전적으로 반영하는 것은 아니다.

또한, 본 발명의 구조를 설명하는 과정에서 언급하는 각도와 방향은 도면에 기재된 것을 기준으로 한다. 명세서에서 구조에 대한 설명에서, 각도에 대한 기준점과 위치관계를 명확히 언급하지 않은 경우, 관련 도면을 참조하도록 한다.

도 1은 본 발명의 일 실시예에 따른 인공지능 로봇 시스템의 구성도이고, 도 2는 도 1의 홈로봇(100)을 바라본 도면이며, 도 3은 본 발명의 일 실시예에 따른 홈 로봇의 간략한 내부 블록도의 일 예이다.

도 1 내지 도 3을 참고하면, 본 발명의 실시예에 따른 로봇 시스템은, 하나 이상의 로봇(100)을 구비하여 집 등의 규정된 장소에서 서비스를 제공할 수 있다. 예를 들어, 로봇 시스템은 가정 등에서 사용자와 인터랙션(interaction)하며, 사용자에게 다양한 엔터테이징을 제공하는 홈 로봇(100)을 포함할 수 있다. 또한 이러한 홈 로봇(100)은 사용자의 요청에 따라 온라인 쇼핑 또는 온라인 주문 등을 진행하여 결제서비스를 제공할 수 있다.

바람직하게는, 본 발명의 일 실시예에 따른 로봇 시스템은, 복수의 인공지능 로봇(100) 및 복수의 인공지능 로봇(100)을 관리하고 제어할 수 있는 서버(2)를 포함할 수 있다. 서버(2)는 원격에서 복수의 로봇(1)의 상태를 모니터링하고, 제어할 수 있고, 로봇 시스템은 복수의 로봇(1)을 이용하여 더 효과적인 서비스 제공이 가능하다.

복수의 로봇(100) 및 서버(2)는 하나 이상의 통신 규격을 지원하는 통신 수단(미도시)을 구비하여, 상호 통신할 수 있다. 또한, 복수의 로봇(100) 및 서버(2)는 PC, 이동 단말기, 외부의 다른 서버(2)와 통신할 수 있다.

예를 들어, 복수의 로봇(100) 및 서버(2)는 IEEE 802.11 WLAN, IEEE 802.15 WPAN, UWB, Wi-Fi, Zigbee, Z-wave, Blue-Tooth 등과 같은 무선 통신 기술로 무선 통신하게 구현될 수 있다. 로봇(100)은 통신하고자 하는 다른 장치 또는 서버(2)의 통신 방식이 무엇인지에 따라 달라질 수 있다.

특히, 복수의 로봇(100)은 5G 네트워크를 통해 다른 로봇(100) 및/또는 서버(2)와 무선통신을 구현할 수 있다. 로봇(100)이 5G 네트워크를 통해 무선 통신하는 경우, 실시간 응답 및 실시간 제어가 가능하다.

사용자는 PC, 이동 단말기 등의 사용자 단말(3)을 통하여 로봇 시스템 내의 로봇들(100)에 관한 정보를 확인할 수 있다.

서버(2)는 클라우드(cloud) 서버(2)로 구현되어, 로봇(100)에 클라우드 서버(2)가 연동되어 로봇(100)을 모니터링, 제어하고 다양한 솔루션과 콘텐츠를 원격으로 제공할 수 있다.

서버(2)는, 로봇(100), 기타 기기로부터 수신되는 정보를 저장 및 관리할 수 있다. 상기 서버(2)는 로봇(100)의 제조사 또는 제조사가 서비스를 위탁한 회사가 제공하는 서버(2)일 수 있다. 상기 서버(2)는 로봇(100)을 관리하고 제어하는 관제 서버(2)일 수 있다.

상기 서버(2)는 로봇(100)을 일괄적으로 동일하게 제어하거나, 개별 로봇(100) 별로 제어할 수 있다. 한편, 상기 서버(2)는, 복수의 서버로 정보, 기능이 분산되어 구성될 수도 있고, 하나의 통합 서버로 구성될 수도 있을 것이다.

로봇(100) 및 서버(2)는 하나 이상의 통신 규격을 지원하는 통신 수단(미도시)을 구비하여, 상호 통신할 수 있다.

로봇(100)은 공간(space), 사물(Object), 사용(Usage) 관련 데이터(Data)를 서버(2)로 전송할 수 있다.

여기서, 데이터는 공간(space), 사물(Object) 관련 데이터는 로봇(100)이 인식한 공간(space)과 사물(Object)의 인식 관련 데이터이거나, 영상획득부가 획득한 공간(space)과 사물(Object)에 대한 이미지 데이터일 수 있다.

실시예에 따라서, 로봇(100) 및 서버(2)는 사용자, 음성, 공간의 속성, 장애물 등 사물의 속성 중 적어도 하나를 인식하도록 학습된 소프트웨어 또는 하드웨어 형태의 인공신경망(Artificial Neural Networks: ANN)을 포함할 수 있다.

본 발명의 일 실시예에 따르면, 로봇(100) 및 서버(2)는 딥러닝(Deep Learning)으로 학습된 CNN(Convolutional Neural Network), RNN(Recurrent Neural Network), DBN(Deep Belief Network) 등 심층신경망(Deep Neural Network: DNN)을 포함할 수 있다. 예를 들어, 로봇(100)의 제어부(140)에는 CNN(Convolutional Neural Network) 등 심층신경망 구조(DNN)가 탑재될 수 있다.

서버(2)는 로봇(100)으로부터 수신한 데이터, 사용자에 의해 입력되는 데이터 등에 기초하여, 심층신경망(DNN)을 학습시킨 후, 업데이트된 심층신경망(DNN) 구조 데이터를 로봇(1)으로 전송할 수 있다. 이에 따라, 로봇(100)이 구비하는 인공지능(artificial intelligence)의 심층신경망(DNN) 구조를 업데이트할 수 있다.

또한, 사용(Usage) 관련 데이터(Data)는 로봇(100)의 사용에 따라 획득되는 데이터로, 사용 이력 데이터, 센서부(110)에서 획득된 감지 신호 등이 해당될 수 있다.

학습된 심층신경망 구조(DNN)는 인식용 입력 데이터를 입력받고, 입력 데이터에 포함된 사람, 사물, 공간의 속성을 인식하여, 그 결과를 출력할 수 있다.

또한, 상기 학습된 심층신경망 구조(DNN)는 인식용 입력 데이터를 입력받고, 로봇(100)의 사용(Usage) 관련 데이터(Data)를 분석하고 학습하여 사용 패턴, 사용 환경 등을 인식할 수 있다.

한편, 공간(space), 사물(Object), 사용(Usage) 관련 데이터(Data)는 통신부(190)를 통하여 서버(2)로 전송될 수 있다.

서버(2)는 수신한 데이터에 기초하여, 심층신경망(DNN)을 학습시킨 후, 업데이트된 심층신경망(DNN) 구조 데이터를 인공지능 로봇(100)으로 전송하여 업데이트하게 할 수 있다.

이에 따라, 로봇(100)이 점점 스마트하게 되며, 사용할수록 진화되는 사용자 경험(UX)을 제공할 수 있다.

로봇(100) 및 서버(2)는 외부 정보(external information)도 이용할 수 있다. 예를 들어, 서버(2)가 다른 연계 서비스 서버(도시하지 않음)로부터 획득한 외부 정보를 종합적으로 사용하여 우수한 사용자 경험을 제공할 수 있다.

또한, 본 발명에 따르면, 로봇(100)이 능동적으로 먼저 정보를 제공하거나 기능, 서비스를 추천하는 음성을 출력함으로써 사용자에게 더욱 다양하고 적극적인 제어 기능을 제공할 수 있다.

도 2는 사용자에게 복약 서비스를 제공할 수 있는 홈 로봇(100)의 외관을 도시하는 정면도이다.

도 2를 참조하면, 홈 로봇(100)은, 외관을 형성하고 그 내부에 각종 부품을 수납하는 본체(101,102)를 포함한다.

본체(101,102)는 홈 로봇(100)을 구성하는 각종 부품들이 수용되는 공간을 형성하는 바디(body, 111)와 상기 바디(111)의 하측에 배치되어 상기 바디(111)를 지지하는 지지부(112)를 포함할 수 있다.

홈 로봇(100)은 본체(101,102)의 상측에 배치되는 헤드(head, 110)를 포함할 수 있다. 헤드(110)의 전면에는 영상을 표시할 수 있는 디스플레이(182)가 배치될 수 있다.

본 명세서에서 전면 방향은 +y 축 방향을 의미하고, 상하 방향은 z축 방향, 좌우 방향은 x축 방향을 의미할 수 있다.

상기 헤드(110)는 x축을 중심으로 소정 각도 범위 내에서 회전할 수 있다.

이에 따라, 전면에서 봤을 때, 상기 헤드(110)는 사람이 고개를 상하 방향으로 끄덕거리는 것처럼 상하 방향으로 움직이는 노딩(Nodding) 동작이 가능하다. 예를 들어, 상기 헤드(110)는 사람이 머리를 상하 방향으로 끄덕거리는 것처럼 소정 범위 내에서 회전 후 원위치 복귀 동작을 1회 이상 수행할 수 있다.

한편, 실시예에 따라서는, 헤드(110) 중 사람의 안면에 대응할 수 있는 디스플레이(182)가 배치되는 전면 중 적어도 일부가 노딩되도록 구현될 수 있다.

따라서, 상기 헤드(110) 전체가 상하 방향으로 움직이는 실시예를 중심으로 기술하지만, 특별히 설명하지 않는 한, 헤드(110)가 상하 방향으로 노딩(Nodding)하는 동작은, 디스플레이(182)가 배치되는 전면 중 적어도 일부가 상하 방향으로 노딩하는 동작으로 대체 가능할 것이다.

상기 바디(111)는 좌우 방향으로 회전 가능하도록 구성될 수 있다. 즉, 상기 바디(111)는 z축을 중심으로 360도 회전 가능하도록 구성될 수 있다.

또한, 실시예에 따라서는, 상기 바디(111)도 x축을 중심으로 소정 각도 범위 내에서 회전가능하게 구성됨으로써, 상하 방향으로도 끄덕거리는 것처럼 움직일 수 있다. 이 경우에, 상기 바디(111)가 상하 방향으로 회전함에 따라, 상기 바디(111)가 회전하는 축을 중심으로 상기 헤드(110)도 함께 회전할 수 있다.

한편, 홈 로봇(100)은 본체(101,102) 주변, 적어도 본체(101,102) 전면을 중심으로 소정 범위를 촬영할 수 있는 영상 획득부(120)를 포함할 수 있다.

영상 획득부(120)는 본체(101,102) 주변, 외부 환경 등을 촬영하는 것으로, 카메라 모듈을 포함할 수 있다. 이러한 카메라는 촬영 효율을 위해 각 부위별로 여러 개가 설치될 수도 있다. 바람직하게, 영상 획득부(120)는, 본체(101,102) 전면의 영상을 획득하도록 헤드(110)의 전면에 구비되는 전면 카메라를 포함할 수 있다.

또한, 홈 로봇(100)은 사용자의 음성 입력을 수신하는 음성 입력부(125)를 포함할 수 있다.

음성 입력부(125)는 아날로그 소리를 디지털 데이터로 변환하는 처리부를 포함하거나 처리부에 연결되어 사용자 입력 음성 신호를 서버(2) 또는 제어부(140)에서 인식할 수 있도록 데이터화할 수 있다.

음성 입력부(125)는 사용자 음성 입력 수신의 정확도를 높이고, 사용자의 위치를 판별하기 위해, 복수의 마이크를 포함할 수 있다.

예를 들어, 음성 입력부(125)는 적어도 2이상의 마이크를 포함할 수 있다.

복수의 마이크(MIC)는, 서로 다른 위치에 이격되어 배치될 수 있고, 음성 신호를 포함한 외부의 오디오 신호를 획득하여 전기적인 신호로 처리할 수 있다.

한편, 입력 장치인 마이크는 음향을 발생시킨 음원, 사용자의 방향 추정을 위하여 최소 2개가 필요하며, 마이크 사이의 간격은 물리적으로 멀리 떨어져 있을수록 방향 검출의 해상도(각도)가 높다. 실시예에 따라서는 2개의 마이크가 상기 헤드(110)에 배치될 수 있다. 또한, 상기 헤드(110)의 후면에 2개의 마이크를 더 포함함으로써, 사용자의 3차원 공간상의 위치를 판별할 수 있다.

또한, 음향 출력부(181)가 헤드(110)의 좌우측면에 배치되어, 소정 정보를 음향으로 출력할 수 있다.

한편, 도 2에 예시된 로봇(100)의 외관 및 구조는 예시적인 것으로 본 발명은 이에 한정되지 않는다. 예를 들어, 도 2에서 예시된 로봇(100)의 회전 방향과 달리 로봇(100) 전체가 특정 방향으로 기울어지거나 흔들리는 동작도 가능하다.

한편, 홈 로봇(100)은 가정 내 콘센트에 연결되어 홈 로봇(100) 내로 전원을 공급하는 전원 공급부(미도시)를 포함할 수 있다.

또는, 홈 로봇(100)은 충전 가능한 배터리(미도시)를 구비하여 홈 로봇(100) 내로 전원을 공급하는 전원 공급부(미도시)를 포함할 수 있다. 실시예에 따라서는 전원 공급부(미도시)는 상기 배터리를 무선 충전하기 위한 무선전력 수신부를 구비할 수 있다.

한편, 홈 로봇(100)은 본체(101, 102) 주변, 적어도 본체(101, 102) 전면을 중심으로 소정 범위를 촬영할 수 있는 영상 획득부(120)를 포함할 수 있다.

영상 획득부(120)는 본체(101, 102) 주변, 외부 환경 등을 촬영하는 것으로, 카메라 모듈을 포함할 수 있다. 상기 카메라 모듈은 디지털 카메라를 포함할 수 있다. 디지털 카메라는 적어도 하나의 광학렌즈와, 광학렌즈를 통과한 광에 의해 상이 맺히는 다수개의 광다이오드(photodiode, 예를 들어, pixel)를 포함하여 구성된 이미지센서(예를 들어, CMOS image sensor)와, 광다이오드들로부터 출력된 신호를 바탕으로 영상을 구성하는 디지털 신호 처리기(DSP: Digital Signal Processor)를 포함할 수 있다. 디지털 신호 처리기는 정지영상은 물론이고, 정지영상으로 구성된 프레임들로 이루어진 동영상을 생성하는 것도 가능하다.

이러한 카메라는 촬영 효율을 위해 각 부위별로 여러 개가 설치될 수도 있다. 바람직하게, 영상 획득부(120)는, 본체(101, 102) 전면의 영상을 획득하도록 헤드(110)의 전면에 구비되는 전면 카메라를 포함할 수 있다. 하지만, 영상 획득부(120)가 구비하는 카메라의 개수, 배치, 종류, 촬영범위가 반드시 이에 한정되어야 하는 것은 아니다.

영상 획득부(120)는, 홈 로봇(100)의 전면 방향을 촬영할 수 있고, 사용자 인식용 영상을 촬영할 수 있다.

또한, 상기 영상 획득부(120)가 촬영하여 획득된 영상은 저장부(130)에 저장될 수 있다.

음성 입력부(125)는 아날로그 소리를 디지털 데이터로 변환하는 처리부를 포함하거나 처리부에 연결되어 사용자 입력 음성 신호를 서버(70) 또는 제어부(140)에서 인식할 수 있도록 데이터화할 수 있다.

한편, 입력 장치인 마이크는 음향을 발생시킨 음원, 사용자의 방향 추정을 위하여 최소 2개가 필요하며, 마이크 사이의 간격은 물리적으로 멀리 떨어져 있을수록 방향 검출의 해상도(각도)가 높다.

실시예에 따라서는 2개의 마이크가 상기 헤드(110)에 배치될 수 있다.

또한, 상기 헤드(110)의 후면에 2개의 마이크를 더 포함함으로써, 사용자의 3차원 공간상의 위치를 판별할 수 있다.

도 3을 참조하면, 홈 로봇(100)은 전반적인 동작을 제어하는 제어부(140), 각종 데이터를 저장하는 저장부(130), 서버(2) 등 다른 기기와 데이터를 송수신하는 통신부(190)를 포함할 수 있다.

또한, 홈 로봇(100)은 상기 헤드(110), 상기 바디(101)를 회전하는 구동부(160)를 더 포함할 수 있다. 구동부(160)는 바디(101) 및 헤드(110)를 회전 및/또는 이동시키는 복수의 구동 모터(미도시)를 포함할 수 있다.

제어부(140)는 홈 로봇(100)을 구성하는 영상 획득부(120), 구동부(160), 디스플레이(182) 등을 제어하여, 홈 로봇(100)의 동작 전반을 제어한다.

저장부(130)는 홈 로봇(100)의 제어에 필요한 각종 정보들을 기록하는 것으로, 휘발성 또는 비휘발성 기록 매체를 포함할 수 있다. 기록 매체는 마이크로 프로세서(micro processor)에 의해 읽힐 수 있는 데이터를 저장한 것으로, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등을 포함할 수 있다.

또한, 제어부(140)는 통신부(190)를 통해 홈 로봇(100)의 동작상태 또는 사용자 입력 등을 서버(2) 등으로 전송할 수 있다.

통신부(190)는 적어도 하나의 통신모듈을 포함하여 홈 로봇(100)이 인터넷, 또는 소정의 네트워크에 연결되도록 한다.

또한, 통신부(190)는 홈 어플라이언스(미도시)에 구비되는 통신 모듈과 연결하여 홈 로봇(100)과 홈 어플라이언스(미도시) 간의 데이터 송수신을 처리한다.

한편, 저장부(130)에는 음성 인식을 위한 데이터가 저장될 수 있고, 제어부(140)는 음성 입력부(125)를 통하여 수신되는 사용자의 음성 입력 신호를 처리하고 음성 인식 과정을 수행할 수 있다.

음성 인식 과정은 공지된 다양한 음성 인식 알고리즘을 사용할 수 있으며, 특히 자연어 처리 알고리즘(NLP: Natural language processing)을 수행하여 수신되는 음성으로부터 토큰화, POS Tagging, Stopword 처리 등의 전처리를 수행하고, 전처리된 데이터를 바탕으로 특징 추출, 모델링 및 추론을 통해 음성 데이터가 의미하는 정확한 의미를 찾아갈 수 있다.

이때, 제어부(140)는 RNN, CNN 등의 딥러닝 알고리즘을 수행하거나, 다양한 기계학습 모델링을 적용할 수 있다.

한편, 제어부(140)는 음성 인식 결과에 기초하여 홈 로봇(100)이 소정 동작을 수행하도록 제어할 수 있다.

예를 들어, 제어부(140)는 음성 신호에 포함되는 명령이 소정 홈 어플라이언스의 동작을 제어하는 명령인 경우, 상기 음성 신호에 포함되는 명령에 기초한 제어 신호를 제어 대상 홈 어플라이언스로 전송하도록 제어할 수 있다.

또한, 제어부(140)는 사용자의 음성 신호에 포함되는 명령이 결제 등의 본인 인증을 수행하여야 하는 경우, 보안 시스템을 시작하여 본인 인증을 진행하고, 판매 업체로 결제 정보를 전송할 수 있다.

한편, 실시예에 따라서는, 제어부(140)는 영상 획득부(120)를 통하여 획득되는 사용자 영상을 저장부(130)에 기저장된 정보와 비교하여 등록된 사용자인지 여부를 판별할 수 있다.

한편, 음성 인식 과정은 홈 로봇(100) 자체에서 실시되지 않고 서버(2)에서 수행될 수 있다.

이 경우에, 제어부(140)는 사용자 입력 음성 신호가 상기 서버(2)로 송신되도록 통신부(190)를 제어할 수 있다. 또는, 간단한 음성 인식은 홈 로봇(100)이 수행하고, 자연어 처리 등 고차원의 음성 인식은 서버(2)에서 수행될 수 있다.

또한, 제어부(140)는 등록된 사용자의 음성 입력에 대해서만 특정 동작을 수행하도록 제어할 수 있다.

또한, 제어부(140)는 홈 로봇(100)에 대한 제어 권한을 가지는 사용자를 식별할 수 있으며, 제어 권한을 가지는 사용자가 식별되면, 헤드(110)가 노딩되도록 제어할 수 있다. 이에 따라, 사용자는 홈 로봇(100)이 자신을 식별했음을 직관적으로 알 수 있다.

한편, 상기 제어부(140)는, 상기 영상 획득부(120)를 통하여 획득된 사용자 영상 정보에 기초하여, 상기 바디(101) 및/또는 상기 헤드(111)를 회전하도록 제어할 수 있다.

상기 제어부(140)는, 상기 사용자 영상 정보에 기초하여, 바디(101)를 좌우 방향으로 회전할 수 있다. 예를 들어, 상기 사용자 영상 정보에 포함되는 얼굴의 개수가 하나인 경우에, 상기 사용자 영상 정보에 포함되는 얼굴이 상기 영상 획득부(120)의 카메라 중심에 오도록 상기 바디(101)를 좌우 방향으로 회전할 수 있다.

또한, 상기 제어부(140)는, 디스플레이(182)가 상기 사용자 영상 정보에 포함되는 얼굴을 향하도록 상기 헤드(111)를 상하 방향으로 회전하도록 제어함으로써, 사용자가 더욱 쉽게 디스플레이(182)에 표시되는 정보를 확인하게 할 수 있다.

또한, 홈 로봇(100)의 사용자 식별, 이후의 사진 촬영 등의 특정 동작 수행에도 유리한 장점이 있다.

이에 따라, 사용자와 홈 로봇(100) 상호 간의 인터랙션(interaction)과 커뮤니케이션(communication)이 용이하게 할 수 있다.

한편, 상기 제어부(140)는, 상기 사용자 영상 정보에 포함되는 얼굴의 개수가 복수인 경우에, 상기 사용자 영상 정보에 포함되는 복수의 얼굴 위치의 평균값이 상기 영상 획득부(120)의 카메라 중심에 오도록 상기 홈 로봇(100)의 바디(101)를 회전하도록 제어할 수 있다.

홈 로봇(100)은 가정 내에서 사용되므로, 복수의 가족 구성원이 함께 홈 로봇(100)을 사용할 수 있다. 이 경우에, 홈 로봇(100)은 가족 구성원 중 어느 한 사람을 향하는 것이 아니라, 말하고 있는 사용자와 인접해서 다른 사람이 있는 경우에 복수의 사용자들의 위치의 평균값을 향하는 것이 더 자연스러울 수 있다.

또한, 복수 사용자의 식별, 가족 구성원 등 복수의 사용자들을 위한 단체 사진 촬영 등의 특정 동작 수행에도 유리한 장점이 있다.

한편, 실시예에 따라서는, 복수의 사용자가 인식되더라도 음성을 발화한 화자를 향하도록 설정될 수 있다.

한편, 상기 제어부(140)는, 상기 획득된 사용자 영상 정보에 포함되는 얼굴의 개수, 얼굴의 위치 정보, 및 면적 정보 중 적어도 하나에 기초하여 바디(101)를 회전하도록 제어할 수 있다.

사용자와 홈 로봇(100)의 거리에 따라, 영상 획득부(120)가 획득한 영상 내의 얼굴 크기가 달라지게 된다. 따라서, 홈 로봇(100)은, 영상 획득부(120)가 획득한 영상에 포함되는 사용자의 수, 위치뿐만 아니라, 얼굴의 면적 정보를 고려함으로써, 최적화된 위치를 향해 바라보도록 제어할 수 있다.

한편, 홈 로봇(100)은 출력부(180)를 포함하여, 소정 정보를 영상으로 표시하거나 음향으로 출력할 수 있다.

출력부(180)는 사용자의 명령 입력에 대응하는 정보, 사용자의 명령 입력에 대응하는 처리 결과, 동작모드, 동작상태, 에러상태 등을 영상으로 표시하는 디스플레이(182)를 포함할 수 있다.

상기 디스플레이(182)는 상술한 것과 같이 헤드(110)의 전면에 배치될 수 있다.

실시예에 따라서는, 상기 디스플레이(182)는 터치패드와 상호 레이어 구조를 이루어 터치스크린으로 구성될 수 있다. 이 경우에, 상기 디스플레이(182)는 출력 장치 이외에 사용자의 터치에 의한 정보의 입력이 가능한 입력 장치로도 사용될 수 있다.

또한, 출력부(180)는 오디오 신호를 출력하는 음향 출력부(181)를 더 포함할 수 있다. 음향 출력부(181)는 제어부(140)의 제어에 따라 경고음, 동작모드, 동작상태, 에러상태 등의 알림 메시지, 사용자의 명령 입력에 대응하는 정보, 사용자의 명령 입력에 대응하는 처리 결과 등을 음향으로 출력할 수 있다. 음향 출력부(181)는, 제어부(140)로부터의 전기 신호를 오디오 신호로 변환하여 출력할 수 있다. 이를 위해, 스피커 등을 구비할 수 있다.

도 2를 참조하면, 음향 출력부(181)는 헤드(110)의 좌우측면에 배치되어, 소정 정보를 음향으로 출력할 수 있다.

한편, 도 2에 예시된 홈 로봇의 외관 및 구조는 예시적인 것으로 본 발명은 이에 한정되지 않는다. 예를 들어, 음성 입력부(125), 영상 획득부(120), 음향 출력부(181)의 위치, 개수 등은 설계 사양에 따라 달라질 수 있고, 각 구성 부품의 회전 방향과 각도도 달라질 수 있다.

이러한 홈 로봇(100)은 다양한 엔터테이닝 기능뿐만 아니라, 사용자가 가정 내에서 다양한 쇼핑 또는 주문이 가능하도록 서비스를 제공할 수 있다.

이때, 홈 로봇(100)은 사용자의 본인 인증을 수행할 수 있으며, 사용자가 홈 로봇으로 쇼핑 또는 주문 등의 서비스를 요청하는 경우, 홈 로봇(100)은 정해진 보안 시스템을 가동하여 본인 인증을 수행한다.

구체적으로, 사용자는 홈 로봇(100)을 이용하여 특정 쇼핑몰에 접속할 것을 명령하고, 특정 물품을 담을 것을 명령하고, 결제할 것을 명령할 수 있다. 이때, 홈 로봇(100)은 사용자의 결제 명령에 따라 보안 시스템을 가동하여 본인 인증을 수행할 수 있다.

이하에서는 도 4 내지 도 9를 참고하여 본 발명의 다양한 실시예에 따른 인공지능 홈 로봇의 보안 시스템 구동에 대하여 설명한다.

도 4는 본 발명의 일 실시예에 따른 홈 로봇의 제어 방법을 도시한 순서도이고, 도 5a 및 도 5b는 도 4의 제어 방법에 따른 동작을 나타내는 도면이다.

도 4를 참조하면, 본 발명의 일 실시예에 따른 홈 로봇(100)은, 음성 입력부(125)에 포함되는 복수의 마이크(MIC)를 통하여, 사용자로부터 결제 명령을 수신하면, 보안 시스템을 가동한다(S10).

보안 시스템이 가동되면, 제어부(140)는 현재 가동된 보안 시스템 가동이 m회 미만으로 가동된 것인지 판단한다(S11).

즉, 소정 횟수 이상으로 보안 시스템을 연속 가동하여 결제가 복수회에 걸쳐 미진행된 경우, 보안 시스템을 종료하고 디스플레이(182) 또는 음향 출력부(181)를 통해 보안 시스템이 거부되었음을 사용자에게 알림한다.

m회 미만으로 보안 시스템이 연속 가동된 경우에는 제어부(140)는 보안 코드를 랜덤하게 생성한다(S12).

이러한 보안 코드는 난수 결합으로서, 소정 개수 이하의 한글, 알파벳, 숫자의 조합일 수 있으며, 복수의 방법으로 읽힐 수 있는 기호를 제외할 수 있다.

이때, 보안 코드의 글자 개수가 임의로 정해져 있을 수 있으며, 정해진 글자 갯수에 따라 난수 결합이 진행된다.

제어부(140)는 이와 같이 생성된 보안 코드를 디스플레이(182)에 출력하여 사용자에게 제공한다(S13).

이때, 도 5a와 같이 홈 로봇(100)은 음향 출력부(125)로부터 사용자에게 “보안코드를 소리내어 읽어주세요” 와 같은 발화 요청을 함께 제공할 수 있다.

이와 같이 시각적, 청각적 안내를 통해 사용자에게 보안 코드를 제공하고 그에 대한 피드백을 요청할 수 있다.

제어부(140)는 사용자에게 음향출력부(181)의 요청을 출력한 이후로 n초 이내에 사용자로부터의 발화가 수신되는지 판단한다(S14).

이때, n초는 바람직하게는 5초, 더욱 바람직하게는 3초 이내의 발화만을 인정할 수 있으며, 이보다 긴 시간인 경우, 보안 코드 습득에 실패한 것으로 보아 다시 보안 시스템의 가동을 진행한다.

한편, 도 5b와 같이, n초 내의 발화, 즉 사용자로부터 해당 보안 코드를 읽어내는 발화가 입력되면(S15), 제어부(140)는 음성 인식을 위한 전처리를 진행한다(S16).

이러한 전처리는 자연어 처리 알고리즘(NLP: Natural language processing)을 수행하여 수신되는 보안 코드의 발화로부터 토큰화, POS Tagging, Stopword 처리를 수행하여 해당 발화 데이터를 필터링할 수 있다.

다음으로, 제어부(140)는 음성 인식 의도 분석을 수행함으로써 전처리된 발화 데이터로부터 특징 추출, 모델링 및 추론을 통해 발화 데이터가 의미하는 정확한 의도를 분석한다(S17).

또한, 제어부(140)는 전처리된 발화 데이터가 기 저장되어 있는 사용자의 음성과 매칭되는지 주파수 매칭 등을 수행하여 화자를 인식할 수 있다. 전처리된 발화 데이터가 기 저장되어 있는 사용자의 음성과 매칭된다고 판단되면, 제어부(140)는 제어부(140)는 RNN, CNN 등의 딥러닝 알고리즘을 수행하거나, 다양한 기계학습 모델링을 적용하여 발화 데이터의 정확한 의도를 분석할 수 있다.

다음으로, 분석된 발화 데이터의 의도 분석 결과와 현재 보안 시스템에서 생성된 보안 코드와 동일한지 비교한다(S18).

이때, 두 개의 값이 동일한지 여부는 동일성이 100%를 충족하는 경우 외에도 80% 이상인 경우, 바람직하게는 90% 이상인 경우까지를 동일한 것으로 판단할 수 있다.

다음으로, 보안 코드와 발화 데이터의 의도 분석 결과가 동일하다고 판단되면, 결제를 승인하고, 본인 인증이 성공한 것으로 사용자에게 알림한다(S19).

다음으로, 홈 로봇(100)은 서버로 사용자가 선택한 물품의 매매의사 및 결제 관련 데이터를 전송하고, 이러한 물품의 매매의사 및 결제 관련 데이터는 판매 업체의 서버 및 금융회사 서버에 전송되고, 기 저장된 카드 정보 또는 계좌 정보를 통해 결제가 가능하다(S20).

이와 같이, 사용자의 음성 데이터를 기 저장된 음성과 매칭하여 물리적으로 사용자 인증을 수행하면서, 사용자에게 난수 코드인 보안 코드를 랜덤 생성하여 제공하고 이를 사용자가 발화하여 이러한 발화 데이터를 매칭시켜 강화된 사용자 본인 인증이 가능하다.

도 6은 본 발명의 다른 실시예에 따른 홈 로봇(100)의 제어 방법을 도시한 순서도이고, 도 7은 도 6의 제어 방법에 따른 동작을 나타내는 도면이다.

도 6을 참조하면, 본 발명의 다른 실시예에 따른 홈 로봇(100)은, 음성 입력부(125)에 포함되는 복수의 마이크(MIC)를 통하여, 사용자로부터 결제 명령을 수신하면, 보안 시스템을 가동한다(S30).

보안 시스템이 가동되면, 제어부(140)는 현재 가동된 보안 시스템 가동이 m회 미만으로 가동된 것인지 판단한다(S31).

m회 미만으로 보안 시스템이 연속 가동된 경우에는 제어부(140)는 보안 코드를 랜덤하게 생성한다(S32).

제어부(140)는 이와 같이 생성된 보안 코드를 음성으로 변환하여 음향출력부(181)에 출력하여 사용자에게 제공한다(S33).

일 예로 보안 코드가 “아리랑 386”인 경우, 도 7과 같이 음향출력부(181)를 통해 사용자에게 음성으로 보안 코드가 제공된다.

이때, 도 7과 같이 홈 로봇(100)은 연속적으로 음향출력부(181)로부터 사용자에게 “보안코드를 따라 읽어주세요” 와 같은 발화 요청을 함께 제공할 수 있다.

이와 같이 청각적 안내를 통해 사용자에게 보안 코드를 제공하고 그에 대한 피드백을 요청할 수 있다.

제어부(140)는 사용자에게 음향출력부(181)의 요청을 출력한 이후로 n초 이내에 사용자로부터의 발화가 수신되는지 판단한다(S34).

이때, n초는 바람직하게는 5초, 더욱 바람직하게는 3초 이내의 발화만을 인정할 수 있으며, 이보다 긴 시간인 경우, 보안코드 습득에 실패한 것으로 보아 다시 보안 시스템의 가동을 진행한다.

한편, n초 내의 발화, 즉 사용자로부터 해당 보안 코드를 읽어내는 발화가 입력되면(S35), 제어부(140)는 음성 인식을 위한 전처리를 진행한다(S36).

다음으로, 제어부(140)는 음성 인식 의도 분석을 수행함으로써 전처리된 발화 데이터로부터 특징 추출, 모델링 및 추론을 통해 발화 데이터가 의미하는 정확한 의도를 분석한다(S37).

다음으로, 분석된 발화 데이터의 의도 분석 결과와 현재 보안 시스템에서 생성된 보안 코드와 동일한지 비교한다(S38).

다음으로, 보안 코드와 발화 데이터의 의도 분석 결과가 동일하다고 판단되면, 결제를 승인하고, 본인 인증이 성공한 것으로 사용자에게 알림한다(S39).

다음으로, 홈 로봇(100)은 서버로 사용자가 선택한 물품의 매매의사 및 결제 관련 데이터를 전송하고, 이러한 물품의 매매의사 및 결제 관련 데이터는 판매 업체의 서버 및 금융회사 서버에 전송되고, 기 저장된 카드 정보 또는 계좌 정보를 통해 결제가 가능하다(S40).

도 8은 본 발명의 또 다른 실시예에 따른 홈 로봇(100)의 제어 방법을 도시한 순서도이고, 도 9a 내지 도 9c는 도 8의 제어 방법에 따른 동작을 나타내는 도면이다.

도 8을 참조하면, 본 발명의 또 다른 실시예에 따른 홈 로봇(100)은, 음성 입력부(125)에 포함되는 복수의 마이크(MIC)를 통하여, 사용자로부터 결제 명령을 수신하면, 보안 시스템을 가동한다(S50).

이때, 또 다른 실시예에 따르면 사용자와 홈 로봇(100) 사이에 기 설정되어 있는 보안 코드 및 암호 모션이 존재하는 것으로 가정한다. 이러한 기 설정은 홈 로봇(100)의 초기 설정 시에 진행할 수 있으며, 홈 로봇(100)의 설정 메뉴에서 간단하게 설정 가능하다.

보안 시스템이 가동되면, 제어부(140)는 현재 가동된 보안 시스템 가동이 m회 미만으로 가동된 것인지 판단한다(S51).

즉, 소정 횟수 이상으로 보안 시스템을 연속 가동하여 결제가 복수회에 걸쳐 미진행된 경우, 보안 시스템을 종료하고 디스플레이(182) 또는 음향 출력부를 통해 보안 시스템이 거부되었음을 사용자에게 알림한다.

m회 미만으로 보안 시스템이 연속 가동된 경우에는 제어부(140)도 9a와 같이 사용자에게 “암호 모션을 보여주세요” 라는 암호 모션 요청 음성을 제공하고, “보안 코드를 말해주세요”라는 보안 코드 발화 요청 음성을 연속적으로 제공할 수 있다.

제어부(140)는 도 9b와 같이 영상획득부(125)를 통해 사용자의 암호 모션을 수득한다(S52).

기 설정되어 있는 암호 모션으로는, 손 흔들기, 고개 숙이기, 양손 흔들기, 손 들기 등의 단순하고 판별이 비교적 용이한 모션일 수 있다.

상기 제어부(140)는, 얼굴 인식(Face Recognition) 기술 또는 모션 인식 기술을 이용하여 상기 영상 획득부(120)를 통하여 획득한 영상 내의 모션 정보를 판별할 수 있다.

모션 인식을 위하여 다양한 기술들이 공개되어 있고, 본 발명에서는 기존에 제안된 다양한 모션 인식 알고리즘들을 사용할 수 있다. 기하학적인 인체 특징 요소를 검출하는 방법, 에지(edge) 정보를 검출하고 그 주위 데이터를 판별하여 얼굴을 인식하는 방법 등도 가능하다.

예를 들어, 빠른 인식 속도가 요구되는 경우, 얼굴의 기하학적인 특징들을 이용한 얼굴 인식 기술이 사용될 수 있다. 이 기술은 다양한 얼굴 인식 기술들 중에서 보편적으로 사용되는 방법 중 하나이다. 이 기술은, 눈, 코, 입과 같은 얼굴의 특징점들의 위치, 크기, 및 이들 사이의 거리와 같은 기하학적 인자, 요소들을 사용하여 개인들 각각의 얼굴 또는 형태를 인식하는 것이다.

이와 같이 모션 정보가 입력되면, 제어부(140)는 사용자로부터의 발화를 유도하여 보안 코드를 수득할 수 있다(S53).

즉, 도 9c와 같이 기 설정된 보안 코드가 “아리랑 386”인 경우, 이에 대한 사용자의 발화를 음성입력부(125)를 통해 수득한다.

다음으로, 제어부(140)는 사용자에게 음향출력부(181)의 요청을 출력한 이후로 n초 이내에 사용자로부터의 모션 입력 및 발화가 수신되는지 판단한다(S54).

이때, n초는 바람직하게는 10초, 더욱 바람직하게는 5초 이내의 모션 입력 및발화만을 인정할 수 있으며, 이보다 긴 시간인 경우, 보안코드 습득에 실패한 것으로 보아 다시 보안 시스템의 가동을 진행한다.

한편, n초 내의 모션 입력이 수행된 경우, 제어부(140)는 모션 인식 전처리를 진행한다(S55). 즉, 각 프레임의 특징점 들을 추출하여 해당 모션을 분석하고 분석된 모션이 기 설정된 암호 모션과 일치하는지 판단한다.

다음으로, 제어부(140)는 보안 코드의 발화 데이터에 대하여 음성 인식을 위한 전처리를 진행한다(S56). 이러한 전처리는 자연어 처리 알고리즘(NLP: Natural language processing)을 수행하여 수신되는 보안 코드의 발화로부터 토큰화, POS Tagging, Stopword 처리를 수행하여 해당 발화 데이터를 필터링할 수 있다.

다음으로, 제어부(140)는 음성 인식 의도 분석을 수행함으로써 전처리된 발화 데이터로부터 특징 추출, 모델링 및 추론을 통해 발화 데이터가 의미하는 정확한 의도를 분석한다(S57).

다음으로, 분석된 발화 데이터의 의도 분석 결과와 현재 보안 시스템에서 기설정된 보안 코드와 동일한지 비교한다(S58).

다음으로, 암호 모션이 일치하고, 보안 코드와 발화 데이터의 의도 분석 결과가 동일하다고 판단되면, 결제를 승인하고, 본인 인증이 성공한 것으로 사용자에게 알림한다(S59).

다음으로, 홈 로봇(100)은 서버로 사용자가 선택한 물품의 매매의사 및 결제 관련 데이터를 전송하고, 이러한 물품의 매매의사 및 결제 관련 데이터는 판매 업체의 서버 및 금융회사 서버에 전송되고, 기 저장된 카드 정보 또는 계좌 정보를 통해 결제가 가능하다(S60).

이와 같이, 사용자의 음성 데이터를 기 저장된 음성과 매칭하여 물리적으로 사용자 인증을 수행하면서, 사용자에게 보안 코드를 음성으로 요청하는 한편, 모션 암호를 부가적으로 요청하여 강화된 사용자 본인 인증이 가능하다.

본 발명에 따른 홈 로봇(100)은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

한편, 본 발명의 실시예에 따른 홈 로봇(100) 및 이를 포함하는 스마트 홈 시스템의 동작 방법은, 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.

또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.

[부호의 설명]

서버: 2

홈 로봇: 100

디스플레이 182

음향출력부181

제어부 140

Claims

사용자로부터 결제 명령을 수신하는 단계;

보안 코드의 발화 요청을 상기 사용자에게 제공하는 단계;

상기 사용자로부터 상기 보안 코드의 발화를 소정 시간 내에 수신하는 단계; 및

수신된 발화 데이터를 분석하여 상기 보안 코드와 비교하고, 기 저장된 상기 사용자의 음성과 비교하여 본인 인증을 수행하는 단계

를 포함하는 홈 로봇의 제어 방법.
제1항에 있어서,

상기 보안 코드의 발화 요청 전에, 상기 보안 코드를 랜덤으로 생성하여 상기 사용자에게 제공하는 단계를 더 포함하는 것을 특징으로 하는 홈 로봇의 제어 방법.
제2항에 있어서,

상기 보안 코드를 제공하는 단계는,

상기 홈 로봇의 디스플레이를 통해 시각적으로 제공되는 것을 특징으로 하는 홈 로봇의 제어 방법.
제1항에 있어서,

상기 본인 인증을 수행하는 단계는,

수신된 상기 발화 데이터를 음성 인식 전처리를 수행하고, 전처리된 발화 데이터의 의도 분석을 수행하여 상기 보안 코드와 동일성 여부를 판단하는 것을 특징으로 하는 홈 로봇의 제어 방법.
제4항에 있어서,

상기 전처리된 발화 데이터에 대하여 기 저장된 사용자의 음성 데이터와 비교하여 사용자의 음성 데이터와 일치하는지 판단하는 단계를 더 포함하는 것을 특징으로 하는 홈 로봇의 제어 방법.
제2항에 있어서,

상기 보안 코드를 제공하는 단계는,

상기 사용자에게 청각적으로 제공되는 것을 특징으로 하는 홈 로봇의 제어 방법.
제1항에 있어서,

상기 보안 코드 발화를 요청하는 단계는,

암호 모션을 요청하는 단계를 더 포함하는 것을 특징으로 하는

홈 로봇의 제어 방법.
제7항에 있어서,

상기 암호 모션 및 상기 보안 코드는 기 설정되어 있는 것을 특징으로 하는 홈 로봇의 제어 방법.
제8항에 있어서,

상기 본인 인증을 수행하는 단계는,

상기 사용자가 제공하는 암호 모션을 영상 데이터로 수득하는 단계,

상기 사용자가 발화하는 보안 코드를 발화 데이터로 수득하는 단계,

상기 영상 데이터를 기초로 모션 인식을 수행하여 상기 암호 모션과 상기 영상 데이터의 모션이 일치하는지 판단하고, 상기 발화 데이터가 기 설정된 상기 보안 코드와 동일한지 판단하는 단계

를 포함하는 것을 특징으로 하는 홈 로봇의 제어 방법.
제1항에 있어서,

상기 본인 인증이 성공하지 않고, 소정 횟수만큼 반복되었는지 판단하여 소정 횟수 이상인 경우, 결제 요청에 대한 동작을 중단하는 것을 더 포함하는 것을 특징으로 하는 홈 로봇의 제어 방법.
내부 수납 공간을 형성하는 바디(body);

상기 바디의 하측에 배치되어 상기 바디를 지지하는 지지부;

영상을 표시할 수 있는 디스플레이;

상기 바디의 상측에 위치하고, 상기 디스플레이가 전면에 배치되는 헤드(head);

음성 신호가 수신되는 복수의 마이크(MIC)를 포함하는 음성 입력부; 및

사용자로부터 결제 명령을 수신하면, 보안 코드의 발화를 요청하고, 상기 사용자로부터 상기 보안 코드의 발화를 수신하고, 상기 보안 코드와 비교하고, 기 저장된 상기 사용자의 음성과 비교하여 본인 인증을 수행하는 제어부

를 포함하는 홈 로봇.
제11항에 있어서,

상기 제어부는 상기 보안 코드의 발화 요청 전에, 상기 보안 코드를 랜덤으로 생성하여 상기 사용자에게 제공하는 홈 로봇.
제12항에 있어서,

상기 제어부는 상기 디스플레이를 통해 상기 보안 코드를 시각적으로 제공하는 것을 특징으로 하는 홈 로봇.
제11항에 있어서,

상기 제어부는

수신된 상기 발화 데이터를 음성 인식 전처리를 수행하고, 전처리된 발화 데이터의 의도 분석을 수행하여 상기 보안 코드와 동일성 여부를 판단하는 것을 특징으로 하는 홈 로봇.
제14항에 있어서,

상기 제어부는,

상기 전처리된 발화 데이터에 대하여 기 저장된 사용자의 음성 데이터와 비교하여 사용자의 음성 데이터와 일치하는지 판단하는 것을 특징으로 하는 홈 로봇.
제12항에 있어서,

상기 보안 코드는 상기 사용자에게 청각적으로 제공되는 것을 특징으로 하는 홈 로봇.
제11항에 있어서,

상기 제어부는 상기 보안 코드 발화를 요청과 함께 암호 모션을 요청하는 것을 더 포함하는 것을 특징으로 하는

홈 로봇.
제17항에 있어서,

상기 암호 모션 및 상기 보안 코드는 기 설정되어 있는 것을 특징으로 하는 홈 로봇.
제18항에 있어서,

상기 제어부는, 상기 사용자가 제공하는 암호 모션을 영상 데이터로 수득하고, 상기 사용자가 발화하는 보안 코드를 발화 데이터로 수득하고, 상기 영상 데이터를 기초로 모션 인식을 수행하여 상기 암호 모션과 상기 영상 데이터의 모션이 일치하는지 판단하고, 상기 발화 데이터가 기 설정된 상기 보안 코드와 동일한지 판단하는 것을 특징으로 하는 홈 로봇.
제11항에 있어서,

상기 제어부는 본인 인증이 성공하지 않고, 소정 횟수만큼 반복되었는지 판단하여 소정 횟수 이상인 경우, 결제 요청에 대한 동작을 중단하는 것을 더 포함하는 것을 특징으로 하는 홈 로봇.