KR20220086262A

KR20220086262A - 음성 호를 통한 인공지능 비서 서비스 제공 방법 및 장치

Info

Publication number: KR20220086262A
Application number: KR1020200176554A
Authority: KR
Inventors: 최승진
Original assignee: 주식회사 아이큐브온
Priority date: 2020-12-16
Filing date: 2020-12-16
Publication date: 2022-06-23
Also published as: WO2022131576A1; KR102426288B1

Abstract

실시예들은 음성 통화를 통해 질의 응답을 수행하는 제 1 단말의 동작 방법을 제공할 수 있다. 이때, 제 1 단말의 동작 방법은 제 2 단말로부터 음성 통화를 수신하고, 자동 연결을 수행하는 단계, 자동 연결이 수행된 후 제 2 단말로부터 제 1 질의 요청 메시지를 수신하는 단계, 제 1 질의 요청 메시지에 기초한 제 2 질의 요청 메시지를 AI 서버로 전송하는 단계, AI 서버로부터 제 2 질의 요청 메시지에 기초한 제 1 질의 응답 메시지를 수신하는 단계 및 제 1 질의 응답 메시지에 기초한 제 2 질의 응답 메시지를 제 2 단말로 전달하는 단계를 포함할 수 있다.

Description

음성 호를 통한 인공지능 비서 서비스 제공 방법 및 장치{METHOD AND APPARATUS FOR PROVIDING ARTIFICIAL INTELLIGENCE ASSISTANT SERVICE USING VOICE CALL}

실시예들은 음성 호를 통한 인공지능 비서 서비스 제공 방법 및 장치에 대한 것이다. 보다 상세하게는, 자동수신에 기초하여 음성 호를 통해 인공지능 비서 서비스를 제공하는 방법에 대한 것이다.

최근 비대면 서비스가 증가하고 있으며, 비대면 서비스를 위한 ARS 응답이나 자동응답에 대한 활용도 증가하고 있다. 다만, ARS 응답이나 자동응답은 사전에 정해진 선택지를 기준으로 진행되기 때문에 서비스를 이용하는 소비자가 원하는 답변을 얻기가 쉽지 않을 수 있다. 이러한 이유로 소비자들은 ARS 응답이나 자동응답 대신 상담원을 통해 원하는 답변을 획득하는 경우가 많으나, 상담원 수도 제한되어 있어 원하는 답변을 얻기까지 많은 시간이 소요되어 서비스 제공에 한계가 존재하는 실정이다.

상술한 점을 고려하여, 하기에서는 인공지능을 활용하여 소비자의 다양한 요청에 대하여 유연하게 대처할 수 있도록 인공지능을 이용하여 서비스를 제공하는 방법 및 장치에 대해 서술한다.

한국특허출원공개 제10-2018-0112349호

본 명세서는 음성 호를 통한 인공지능 비서 서비스 제공 방법 및 장치를 제공할 수 있다.

본 명세서는 음성 호를 통해 수신자 단말이 발신자 단말에게 인공지능에 기초하여 자동응답을 제공할 수 있다.

본 명세서는 발신자 단말의 요청에 기초하여 인공지능을 통해 응답을 생성하고, 생성된 응답을 발신자 단말에게 제공할 수 있다.

본 명세서는 음성 통화에 기초한 인공지능 비서 서비스를 데이터 통화로 전환하여 제공할 수 있다.

본 명세서의 해결하고자 하는 과제는 상술한 바에 한정되지 아니하고, 하기에서 설명하는 발명의 실시예들에 의해 도출될 수 있는 다양한 사항들로 확장될 수 있다.

본 명세서의 일 실시예에 따라, 음성 통화를 통해 질의 응답을 수행하는 제 1 단말의 동작 방법을 제공할 수 있다. 이때, 제 1 단말의 동작 방법은 제 2 단말로부터 음성 통화를 수신하고, 자동 연결을 수행하는 단계, 상기 자동 연결이 수행된 후 상기 제 2 단말로부터 제 1 질의 요청 메시지를 수신하는 단계, 상기 제 1 질의 요청 메시지에 기초한 제 2 질의 요청 메시지를 AI 서버로 전송하는 단계, 상기 AI 서버로부터 상기 제 2 질의 요청 메시지에 기초한 제 1 질의 응답 메시지를 수신하는 단계 및 상기 제 1 질의 응답 메시지에 기초한 제 2 질의 응답 메시지를 상기 제 2 단말로 전달하는 단계를 포함할 수 있다.

또한, 본 명세서의 일 실시예에 따라, 상기 제 1 질의 요청 메시지는 상기 음성 통화에 기초하여 음성으로 상기 제 1 단말로 전달되고, 상기 제 1 단말이 상기 AI 서버로 전달하는 상기 제 2 질의 요청 메시지는 상기 제 1 질의 요청 메시지에 STT(Speech To Text) 처리를 수행하여 전환된 텍스트 정보 및 상기 제 1 질의 요청 메시지에 기초하여 생성된 음성 파일 정보 중 적어도 어느 하나를 포함할 수 있다.

또한, 본 명세서의 일 실시예에 따라, 상기 AI 서버가 상기 제 1 단말로 전달하는 상기 제 1 질의 응답 메시지는 상기 제 2 질의 요청 메시지에 기초하여 생성되는 텍스트 정보 및 상기 제 2 질의 요청 메시지에 기초하여 생성되는 음성 파일 정보 중 적어도 어느 하나를 포함하고, 상기 제 1 단말은 상기 AI 서버로부터 수신한 상기 제 1 질의 응답 메시지에 기초하여 상기 제 2 질의 응답 메시지를 생성하고, 상기 생성된 제 2 질의 응답 메시지를 상기 음성 통화에 기초하여 음성으로 상기 제 2 단말로 제공할 수 있다.

또한, 본 명세서의 일 실시예에 따라, 상기 제 2 단말로 상기 음성 통화를 데이터 통화로 전환하는 요청 메시지를 전송하는 단계, 상기 제 2 단말부터 상기 요청 메시지에 대한 응답으로 수락 메시지를 수신하는 단계, 및 상기 수락 메시지에 기초하여 상기 음성 통화를 상기 데이터 통화로 전환하는 단계를 더 포함할 수 있다.

또한, 본 명세서의 일 실시예에 따라, 상기 제 2 단말과 자동 연결이 수행된 후 기 설정된 시간이 도과하는지 여부를 판단하는 단계를 더 포함하되, 상기 제 2 단말과 자동 연결이 수행된 후 상기 설정된 시간이 도과하면 상기 요청 메시지를 상기 제 2 단말로 전송할 수 있다.

또한, 본 명세서의 일 실시예에 따라, 상기 제 1 단말이 데이터 처리 능력에 기초하여 상기 데이터 통화 전환 필요 여부를 판단하는 단계를 더 포함하되, 상기 제 1 단말이 상기 데이터 처리 능력에 기초하여 상기 데이터 통화 전환이 필요하다고 판단한 경우, 상기 요청 메시지를 상기 제 2 단말로 전송할 수 있다.

또한, 본 명세서의 일 실시예에 따라, 상기 데이터 통화는 제 3 메신저 플랫폼에 기초하여 수행되되, 상기 데이터 통화는 상기 제 1 단말의 상기 제 3 메신저 플랫폼에서의 식별 정보 및 상기 제 2 단말의 상기 제 3 메신저 플랫폼에서의 식별 정보에 기초하여 수행될 수 있다.

또한, 본 명세서의 일 실시예에 따라, 상기 제 1 단말이 상기 제 3 메신저 플랫폼에 기초하여 상기 데이터 통화를 수행하는 경우, 상기 제 3 메신저 플랫폼으로 데이터 통화 제공 요청 메시지를 전송하는 단계 및 상기 제 3 메신저 플랫폼으로부터 상기 데이터 통화에 대한 수락 메시지를 수신하는 단계를 더 포함하고, 상기 수락 메시지가 수신되면 상기 제 3 메신저 플랫폼에 기초하여 상기 데이터 통화가 수행될 수 있다.

또한, 본 명세서의 일 실시예에 따라, 상기 자동 연결이 수행된 후 상기 제 1 단말과 관련된 적어도 어느 하나의 관련 콘텐츠 정보를 상기 제 2 단말로 전송하는 단계, 상기 적어도 어느 하나의 관련 콘텐츠 정보에 기초하여 상기 제 2 단말이 선택한 관련 콘텐츠 정보를 수신하는 단계를 더 포함하되, 상기 제 1 질의 요청 메시지는 상기 제 2 단말에 의해 선택된 상기 관련 콘텐츠 정보에 기초하여 생성될 수 있다.

본 명세서는 음성 호를 통해 수신자 단말의 콘텐츠를 고려하여 발신자 단말에게 인공지능을 통해 응답을 제공하는 효과가 있다.

본 명세서는 발신자 단말의 요청을 인공지능을 통해 분석하여 요청에 대응되는 응답을 생성하여 제공함으로서 유연한 응답을 제공하는 효과가 있다.

본 명세서는 음성 통화에 기초한 인공지능 비서 서비스를 데이터 통화로 전환하여 구체적인 응답 정보를 제공하는 효과가 있다.

도 1은 본 명세서의 일실시예에 따른 시스템의 동작 환경의 예를 도시한 도면이다.
도 2는 본 명세서의 일실시예에 있어서 컴퓨팅 장치(200)의 내부 구성을 설명하기 위한 블록도이다.
도 3은 본 명세서의 일실시예에 있어서 음성 호를 통한 발신자 단말의 요청에 대한 응답을 인공지능에 기초하여 제공하는 방법을 나타낸 도면이다.
도 4a는 본 명세서의 일실시예에 있어서 발신자 단말의 요청에 대한 응답을 제공하는 방법을 나타내 도면이다.
도 4b는 본 명세서의 일실시예에 있어서 관련 콘텐츠에 기초하여 발신자 단말의 요청에 대한 응답을 제공하는 방법을 나타내 도면이다.
도 4c는 본 명세서의 일실시예에 있어서 관련 콘텐츠에 기초하여 발신자 단말의 요청에 대한 응답을 제공하는 방법을 나타내 도면이다.
도 4d는 본 명세서의 일실시예에 있어서 관련 콘텐츠에 기초하여 발신자 단말의 요청에 대한 응답을 제공하는 방법을 나타내 도면이다.
도 5a는 본 명세서의 일실시예에 있어서 음성 통화를 데이터 통화로 전환하는 방법을 나타낸 도면이다.
도 5b는 본 명세서의 일실시예에 있어서 기 설정된 시간에 기초하여 음성 통화를 데이터 통화로 전환하는 방법을 나타낸 도면이다.
도 5c는 본 명세서의 일실시예에 있어서 인공지능에 기초하여 음성 통화를 데이터 통화로 전환하는 방법을 나타낸 도면이다.
도 6a는 본 명세서의 일실시예에 있어서 제 3 메신저 플랫폼에 기초하여 음성 통화를 데이터 통화로 전환하는 방법을 나타낸 도면이다.
도 6b는 본 명세서의 일실시예에 있어서 제 3 메신저 플랫폼에 기초하여 음성 통화를 데이터 통화로 전환하는 방법을 나타낸 도면이다.
도 7a은 본 명세서의 일실시예에 있어서 발신자 단말로 응답을 제공하는 방법을 나타낸 도면이다.
도 7b는 본 명세서의 일실시예에 있어서 발신자 단말로 응답을 제공하는 방법을 나타낸 도면이다.
도 8은 본 명세서의 일실시예에 있어서 음성 호를 통한 인공지능 비서 서비스를 제공하는 방법을 나타낸 순서도이다.

본 명세서의 실시예를 설명함에 있어서 공지 구성 또는 기능에 대한 구체적인 설명이 본 명세서의 실시예의 요지를 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다. 그리고, 도면에서 본 명세서의 실시예에 대한 설명과 관계없는 부분은 생략하였으며, 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

본 명세서의 실시예에 있어서, 어떤 구성요소가 다른 구성요소와 "연결", "결합" 또는 "접속"되어 있다고 할 때, 이는 직접적인 연결관계뿐만 아니라, 그 중간에 또 다른 구성요소가 존재하는 간접적인 연결관계도 포함할 수 있다. 또한 어떤 구성요소가 다른 구성요소를 "포함한다" 또는 "가진다"고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 배제하는 것이 아니라 또 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

본 명세서의 실시예에 있어서, 제1, 제2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용되며, 특별히 언급되지 않는 한 구성요소들 간의 순서 또는 중요도 등을 한정하지 않는다. 따라서, 본 명세서의 실시예의 범위 내에서 실시예에서의 제1 구성요소는 다른 실시예에서 제2 구성요소라고 칭할 수도 있고, 마찬가지로 실시예에서의 제2 구성요소를 다른 실시예에서 제1 구성요소라고 칭할 수도 있다.

본 명세서의 실시예에 있어서, 서로 구별되는 구성요소들은 각각의 특징을 명확하게 설명하기 위함 이며, 구성요소들이 반드시 분리되는 것을 의미하지는 않는다. 즉, 복수의 구성요소가 통합되어 하나의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있고, 하나의 구성요소가 분산되어 복수의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있다. 따라서, 별도로 언급하지 않더라도 이와 같이 통합된 또는 분산된 실시예도 본 명세서의 실시예의 범위에 포함된다.

본 명세서에서 네트워크는 유무선 네트워크를 모두 포함하는 개념일 수 있다. 이때, 네트워크는 디바이스와 시스템 및 디바이스 상호 간의 데이터 교환이 수행될 수 있는 통신망을 의미할 수 있으며, 특정 네트워크로 한정되는 것은 아니다.

본 명세서에 기술된 실시예는 전적으로 하드웨어이거나, 부분적으로 하드웨어이고 부분적으로 소프트웨어이거나, 또는 전적으로 소프트웨어인 측면을 가질 수 있다. 본 명세서에서 "부(unit)", "장치" 또는 "시스템" 등은 하드웨어, 하드웨어와 소프트웨어의 조합, 또는 소프트웨어 등 컴퓨터 관련 엔티티(entity)를 지칭한다. 예를 들어, 본 명세서에서 부, 모듈, 장치 또는 시스템 등은 실행중인 프로세스, 프로세서, 객체(object), 실행 파일(executable), 실행 스레드(thread of execution), 프로그램(program), 및/또는 컴퓨터(computer)일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 컴퓨터에서 실행중인 애플리케이션(application) 및 컴퓨터의 양쪽이 모두 본 명세서의 부, 모듈, 장치 또는 시스템 등에 해당할 수 있다.

또한, 본 명세서에서 디바이스는 스마트폰, 태블릿 PC, 웨어러블 디바이스 및 HMD(Head Mounted Display)와 같이 모바일 디바이스뿐만 아니라, PC나 디스플레이 기능을 구비한 가전처럼 고정된 디바이스일 수 있다. 또한, 일 예로, 디바이스는 차량 내 클러스터 또는 IoT (Internet of Things) 디바이스일 수 있다. 즉, 본 명세서에서 디바이스는 어플리케이션 동작이 가능한 기기들을 지칭할 수 있으며, 특정 타입으로 한정되지 않는다. 하기에서는 설명의 편의를 위해 어플리케이션이 동작하는 기기를 디바이스로 지칭한다.

본 명세서에 있어서 네트워크의 통신 방식은 제한되지 않으며, 각 구성요소간 연결이 동일한 네트워크 방식으로 연결되지 않을 수도 있다. 네트워크는, 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망, 위성망 등)을 활용하는 통신 방식뿐만 아니라 기기들 간의 근거리 무선 통신 역시 포함될 수 있다. 예를 들어, 네트워크는, 객체와 객체가 네트워킹 할 수 있는 모든 통신 방법을 포함할 수 있으며, 유선 통신, 무선 통신, 3G, 4G, 5G, 혹은 그 이외의 방법으로 제한되지 않는다. 예를 들어, 유선 및/또는 네트워크는 LAN(Local Area Network), MAN(Metropolitan Area Network), GSM(Global System for Mobile Network), EDGE(Enhanced Data GSM Environment), HSDPA(High Speed Downlink Packet Access), W-CDMA(Wideband Code Division Multiple Access), CDMA(Code Division Multiple Access), TDMA(Time Division Multiple Access), 블루투스(Bluetooth), 지그비(Zigbee), 와이-파이(Wi-Fi), VoIP(Voice over Internet Protocol), LTE Advanced, IEEE802.16m, WirelessMAN-Advanced, HSPA+, 3GPP Long Term Evolution (LTE), Mobile WiMAX (IEEE 802.16e), UMB (formerly EV-DO Rev. C), Flash-OFDM, iBurst and MBWA (IEEE 802.20) systems, HIPERMAN, Beam-Division Multiple Access (BDMA), Wi-MAX(World Interoperability for Microwave Access) 및 초음파 활용 통신으로 이루어진 군으로부터 선택되는 하나 이상의 통신 방법에 의한 통신 네트워크를 지칭할 수 있으나, 이에 한정되는 것은 아니다.

다양한 실시예에서 설명하는 구성요소들이 반드시 필수적인 구성요소들은 의미하는 것은 아니며, 일부는 선택적인 구성요소일 수 있다. 따라서, 실시예에서 설명하는 구성요소들의 부분집합으로 구성되는 실시예도 본 명세서의 실시예의 범위에 포함된다. 또한, 다양한 실시예에서 설명하는 구성요소들에 추가적으로 다른 구성요소를 포함하는 실시예도 본 명세서의 실시예의 범위에 포함된다.

이하에서, 도면을 참조하여 본 명세서의 실시예들에 대하여 상세히 살펴본다.

도 1은 본 명세서의 일실시예에 따른 시스템의 동작 환경의 예를 도시한 도면이다. 도 1을 참조하면 사용자 디바이스(110), 하나 이상의 서버(120, 130, 140)가 네트워크(1)를 통해 연결되어 있다. 이러한 도 1은 발명의 설명을 위한 일례로 사용자 디바이스의 수나 서버의 수가 도 1과 같이 한정되는 것은 아니다.

사용자 디바이스(110)는 컴퓨터 시스템으로 구현되는 고정형 단말이거나 이동형 단말일 수 있다. 사용자 디바이스(110)는 예를 들면, 스마트폰(smart phone), 휴대폰, 내비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC, 게임 콘솔(game console), 웨어러블 디바이스(wearable device), IoT(internet of things) 디바이스, VR(virtual reality) 디바이스, AR(augmented reality) 디바이스 등이 있다. 일례로 실시예들에서 사용자 디바이스(110)는 실질적으로 무선 또는 유선 통신 방식을 이용하여 네트워크(1)를 통해 다른 서버들(120 - 140)과 통신할 수 있는 다양한 물리적인 컴퓨터 시스템들 중 하나를 의미할 수 있다.

각 서버는 사용자 디바이스(110)와 네트워크(1)를 통해 통신하여 명령, 코드, 파일, 콘텐츠, 서비스 등을 제공하는 컴퓨터 장치 또는 복수의 컴퓨터 장치들로 구현될 수 있다. 예를 들어, 서버는 네트워크(1)를 통해 접속한 사용자 디바이스(110)로 각각의 서비스를 제공하는 시스템일 수 있다. 보다 구체적인 예로, 서버는 사용자 디바이스(110)에 설치되어 구동되는 컴퓨터 프로그램으로서의 어플리케이션을 통해, 해당 어플리케이션이 목적하는 서비스(일례로, 정보 제공 등)를 사용자 디바이스(110)로 제공할 수 있다. 다른 예로, 서버는 상술한 어플리케이션의 설치 및 구동을 위한 파일을 사용자 디바이스(110)로 배포하고 사용자 입력 정보를 수신해 대응하는 서비스를 제공할 수 있다. 일 예로, 하기에서 인공지능(Artificial Intelligence, AI) 서버는 도 1의 서버 중 어느 하나일 수 있다. 또한, AI 서버와 데이터 통신을 수행하는 수신자 단말 및 수신자 단말과 음성 통화 및/또는 데이터 통신을 수행하는 발신자 단말은 도 1의 사용자 중 하나일 수 있다. 또한, 하기에서 제 3 메신저 플랫폼은 도 1의 서버 중 어느 하나일 수 있으며, 상술한 실시예로 한정되지 않는다.

도 2는 본 명세서의 일실시예에 있어서 컴퓨팅 장치(200)의 내부 구성을 설명하기 위한 블록도이다. 이러한 컴퓨팅 장치(200)는 도1을 참조하여 상술한 하나 이상의 사용자 디바이스(110-1, 110-2) 또는 서버(120-140)에 적용될 수 있으며, 각 장치와 서버들은 일부 구성요소를 더 하거나 제외하여 구성됨으로써 동일하거나 유사한 내부 구성을 가질 수 있다.

도 2를 참조하면 컴퓨팅 장치(200)는 메모리(210), 프로세서(220), 통신 모듈(230) 그리고 송수신부(240)를 포함할 수 있다. 메모리(210)는 비-일시적인 컴퓨터 판독 가능한 기록매체로서, RAM(random access memory), ROM(read only memory), 디스크 드라이브, SSD(solid state drive), 플래시 메모리(flash memory) 등과 같은 비소멸성 대용량 저장 장치(permanent mass storage device)를 포함할 수 있다. 여기서 ROM, SSD, 플래시 메모리, 디스크 드라이브 등과 같은 비소멸성 대용량 저장 장치는 메모리(210)와는 구분되는 별도의 영구 저장 장치로서 상술한 장치나 서버에 포함될 수도 있다. 또한, 메모리(210)에는 운영체제와 적어도 하나의 프로그램 코드(일례로 사용자 디바이스(110) 등에 설치되어 구동되는 브라우저나 특정 서비스의 제공을 위해 사용자 디바이스(110) 등에 설치된 어플리케이션 등을 위한 코드)가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 메모리(210)와는 별도의 컴퓨터에서 판독 가능한 기록매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록매체를 포함할 수 있다.

다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록매체가 아닌 통신 모듈(230)을 통해 메모리(210)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 어플리케이션의 설치 파일을 배포하는 파일 배포 시스템(일례로, 상술한 서버)이 네트워크(1)를 통해 제공하는 파일들에 의해 설치되는 컴퓨터 프로그램(일례로 상술한 어플리케이션)에 기반하여 메모리(210)에 로딩될 수 있다.

프로세서(220)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(210) 또는 통신 모듈(230)에 의해 프로세서(220)로 제공될 수 있다. 예를 들어 프로세서(220)는 메모리(210)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.

통신 모듈(230)은 네트워크(1)를 통해 사용자 기기(110)와 서버(120 -140)가 서로 통신하기 위한 기능을 제공할 수 있으며, 장치(110) 및/또는 서버(120 - 140) 각각이 다른 전자 기기와 통신하기 위한 기능을 제공할 수 있다.

송수신부(240)는 외부 입력/출력장치(미도시)와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 외부 입력장치는 키보드, 마우스, 마이크로폰, 카메라 등의 장치를, 그리고 외부 출력 장치는 디스플레이, 스피커, 햅틱 피드백 디바이스(haptic feedback device) 등과 같은 장치를 포함할 수 있다.

다른 예로 송수신부(240)는 터치스크린과 같이 입력과 출력을 위한 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수도 있다.

또한, 다른 실시예들에서 컴퓨팅 장치(200)는 적용되는 장치의 성질에 따라서 도 2의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 예를 들어, 컴퓨팅 장치(200)가 사용자 디바이스(110)에 적용되는 경우 상술한 입출력 장치 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), GPS(Global Positioning System) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다. 보다 구체적인 예로, 사용자 디바이스가 스마트폰인 경우, 일반적으로 스마트폰이 포함하고 있는 가속도 센서나 자이로 센서, 카메라 모듈, 각종 물리적인 버튼, 터치패널을 이용한 버튼, 입출력 포트, 진동을 위한 진동기 등의 다양한 구성요소들이 더 포함되도록 구현될 수 있다.

하기에서 각각의 단말 및 서버들은 도 2에 기초하여 다른 단말 또는 서버와 통신을 수행하는 장치일 수 있다. 즉, 하기에서 서술하는 단말 및 서버는 도 1에 기초하여 상호 간의 네트워크를 통해 연결되어 통신을 수행하는 주체일 수 있고, 각각의 단말 및 서버는 도 2에 기초한 메모리, 프로세서, 통신 모듈 및 송수신부와 그 밖의 구성을 구비하고, 동작하는 컴퓨팅 장치일 수 있다. 하기에서는 설명의 편의를 위해 단말 및 서버에 기초하여 서술하지만, 상기 구성들은 컴퓨팅 장치로서 다양한 구성들을 포함할 수 있으며, 특정 컴퓨팅 장치로 한정되는 것은 아닐 수 있다.

일 예로, 기존 스마트 폰에서 ARS 응답(또는 자동응답)을 제공하기 위해서는 음성 통화(또는 음성 호)를 수신하고, ARS 응답 서버를 통해 사전에 정해진 항목에 기초하여 서비스가 제공될 수 있었다. 이때, 카드 회사나 가전 회사 등 많은 매장 및 고객을 보유하고 다수의 상품을 판매하는 기업들은 ARS 응답을 위한 서버를 구축하여 제공할 수 있으나, 일반 소매 업체나 기타 소규모 영업을 수행하는 경우에는 이러한 서버를 구축하는데 한계가 존재할 수 있다. 상술한 점을 고려하여, 하기에서는 사용자 단말에 자동 수신을 수행하는 방법에 대해 서술한다. 나아가, 사용자 단말이 자동 수신을 수행하는 경우, 해당 사용자 단말은 AI 서버를 통해 기 설정된 항목이 아닌 요청에 의한 유연한 답변을 제공하는 방법에 대해 서술한다. 즉, 하기에서는 수신자 단말이 인공지능을 활용해서 발신자 단말의 다양한 요청과 반응에 대하여 유연하게 대응하는 인공지능 비서 서비스를 제공하는 방법에 대해 서술한다.

도 3은 본 명세서의 일실시예에 있어서 음성 호를 통한 발신자 단말의 요청에 대한 응답을 인공지능에 기초하여 제공하는 방법을 나타낸 도면이다.

수신자 단말(320)은 발신자 단말(310)로부터 전달되는 음성 통화에 대한 자동 수신을 설정할 수 있다. 일 예로, 수신자 단말(320)은 사업자 단말일 수 있으며, 스마트폰이나 그 밖의 디바이스일 수 있다. 즉, 수신자 단말(320)은 특정 서버로 구현되지 않고, 일반적으로 사용되는 모바일 디바이스일 수 있으며 특정 디바이스로 한정되지 않을 수 있다. 또한, 발신자 단말(310)은 사업자로부터 서비스를 제공받고자 하는 사용자의 디바이스일 수 있다. 즉, 발신자 단말(310)은 수신자 단말(320)에 기초한 사업자로부터 서비스를 제공받고자 하는 고객의 디바이스일 수 있다.

이때, 도 3을 참조하면, 수신자 단말(320)은 발신자 단말(310)로부터 음성 통화(또는 음성 호)를 수신할 수 있다. 발신자 단말(310)의 사용자는 식별 정보(e.g. 전화번호)에 기초하여 수신자 단말(320)과 음성 통화를 시도할 수 있다. 일 예로, 발신자 단말(310)과 수신자 단말(320)은 상호 간에 데이터 통신을 수행하여 데이터 교환을 수행할 수 있으며, 상술한 실시예로 한정되지 않는다. 또한, 수신자 단말(320)은 AI 서버(330)와 데이터 통신을 수행할 수 있다. 즉, 수신자 단말(320)은 별도의 서버가 아닌 일반 디바이스로 AI 서버(330)와 통신을 수행하여 데이터 교환을 수행하고, 이를 통해 원하는 정보를 획득할 수 있다. AI 서버(330)는 발신자 단말(310)의 요청을 처리하여 수신자 단말(320)에 제공하는 서버일 수 있다. 일 예로, AI 서버(330)는 학습모델을 구비하고, 복수의 발신자 단말(310)의 요청에 대한 응답을 통해 학습을 수행하여 지속적으로 업데이트되는 서버일 수 있다. 일 예로, AI 서버(330)의 입력은 발신자 단말(310)의 요청일 수 있고, 출력은 발신자 단말(310)의 요청에 대한 응답일 수 있다. AI 서버(330)는 상술한 입력과 출력에 기초하여 지속적으로 업데이트를 수행하고, 업데이트에 기초하여 발신자 단말(310)로 유연한 응답을 제공할 수 있다.

구체적인 일 예로, 수신자 단말(320)이 발신자 단말(310)로부터 음성 통화를 수신하는 경우, 수신자 단말(320)은 발신자 단말(310)에게 자동 응답을 제공하고, 자동 응답에 기초하여 발신자 단말(320)의 요청을 처리할 수 있다. 일 예로, 발신자 단말(310)은 수신자 단말(320)에 의해 음성 통화가 자동 수신되면 질의 요청을 음성 통화에 기초하여 수신자 단말(320)로 전송할 수 있다. 즉, 발신자 단말(310)의 사용자는 자동응답에 기초하여 음성으로 "질의 1A"를 수신자 단말(320)로 전송할 수 있다. 발신자 단말(310)로부터 "질의 1A"를 수신자 단말(320)은 STT(Speech to Text) 처리하여 텍스트로 전환된 질의 요청 메시지를 AI 서버(330)로 전송할 수 있다. 또한, 일 예로, 수신자 단말(320)은 발신자 단말(310)의 요청을 음성파일로 생성하고, 생성된 음성파일을 AI 서버(330)로 전송할 수 있으나 상술한 실시예로 한정되지 않는다. 즉, 수신자 단말(320)은 발신자 단말(310)로부터 수신한 "질의 1A"와 관련된 "질의 1B"를 텍스트 또는 음성 파일 형태로 생성하고, 이를 AI 서버(330)로 전송할 수 있다. "질의 1B"는 텍스트 또는 음성 파일 형태일 수 있으며 상술한 실시예로 한정되지 않는다. 그 후, 수신자 단말(320)은 AI 서버(330)로부터 "질의 1B"에 대한 응답인 "응답 1A"를 수신할 수 있다. 이때, "응답 1A"는 텍스트 또는 음성 파일 형태일 수 있다. 즉, AI 서버(330)는 텍스트 형태의 메시지나 음성 파일 형태의 메시지로 수신자 단말(320)로 "질의 1B"에 대한 응답을 수행할 수 있다. 이때, 일 예로, AI 서버(330)는 상술한 학습 모델에 기초하여 "질의 1B"를 입력으로 출력인 "응답 1A"를 획득할 수 있으며, 이를 통해 유연한 응답을 제공하도록 할 수 있다.

그 후, 수신자 단말(320)은 "응답 1A"에 기초하여 "응답 1B"를 발신자 단말(310)로 제공할 수 있다. 이때, AI 서버(330)로부터 수신한 "응답 1A"가 텍스트인 경우, TTS(Text to Speech) 처리를 통해 음성 파일로 전환 후 "응답 1B"를 발신자 단말(310)에게 제공할 수 있다. 반면, AI 서버(330)로부터 수신한 "응답 1A"가 음성 파일인 경우, 수신자 단말(320)은 음성으로 전환된 "응답 1B"를 음성 통화에 기초하여 발신자 단말(310)에게 제공될 수 있다.

또한, 발신자 단말(310)의 사용자가 추가 질의가 존재하는 경우, 상술한 바와 같이 수신자 단말(320)로 추가 질의 요청을 수행하고, 수신자 단말(320)은 AI 서버(330)에 기초하여 유연한 응답 정보를 생성하여 발신자 단말(310)로 제공할 수 있다.

여기서, 발신자 단말의 질의 정보를 특정하는 방법이 필요할 수 있다. 일 예로, 발신자 단말에 대한 질의에 기초하여 수신자 단말의 응답이 지연되는 경우에 서비스 품질 저하가 발생할 수 있다. 이때, 발신자 단말의 질의 정보에 대한 범위가 광범위한 경우, 수신자 단말로부터 관련 정보를 수신한 AI 서버의 정보처리 시간이 지연될 수 있으며, 이에 기초하여 서비스 제공에 지연이 발생할 수 있다.

상술한 점을 고려하여, 도 4a를 참조하면, 발신자 단말(410)과 수신자 단말(420)이 음성 통화에 기초하여 자동응답을 수행하는 경우, 수신자 단말(420)과 발신자 단말(410)은 관련 콘텐츠를 결정할 수 있다. 여기서, 관련 콘텐츠는 수신자 단말(420)의 특징 또는 콘텐츠에 기초하여 결정될 수 있다. 보다 구체적인 일 예로, 수신자 단말(420)의 사업자가 식품업에 기초하여 수신자 단말(420)를 설정한 경우, 관련 콘텐츠는 관련 정보에 기초하여 설정될 수 있다. 도 4b를 참조하면, 관련 콘텐츠는 주문 관련, 상담 관련 또는 영업 시간 관련 중 어느 하나로 설정될 수 있다. 다만, 이는 하나의 일 예일 뿐, 관련 콘텐츠는 다양하게 설정될 수 있으며, 상술한 실시예로 한정되지 않는다. 또한, 일 예로, 수신자 단말(420)의 사업자가 헬스 관련 영업에 기초하여 수신자 단말(420)를 설정한 경우, 관련 콘텐츠는 관련 정보에 기초하여 설정될 수 있다. 도 4c를 참조하면, 관련 콘텐츠는 운동 종목 관련, 상담 관련, 영업 시간 관련 또는 방문 방법 관련 중 어느 하나로 설정될 수 있다. 다만, 이는 하나의 일 예일 뿐, 관련 콘텐츠는 다양하게 설정될 수 있으며, 상술한 실시예로 한정되지 않는다. 또한, 일 예로, 수신자 단말(420)의 사업자가 제품 판매 관련 영업에 기초하여 수신자 단말(420)를 설정한 경우, 관련 콘텐츠는 관련 정보에 기초하여 설정될 수 있다. 도 4d를 참조하면, 관련 콘텐츠는 쇼핑 항목 관련, 상담 관련 또는 영업 시간 관련 중 어느 하나로 설정될 수 있다. 다만, 이는 하나의 일 예일 뿐, 관련 콘텐츠는 다양하게 설정될 수 있으며, 상술한 실시예로 한정되지 않는다.

즉, 상술한 바처럼 수신자 단말(420)의 특징 및 콘텐츠에 기초하여 관련 콘텐츠가 결정될 수 있으며, 복수 개의 관련 콘텐츠 중 특정 관련 콘텐츠는 발신자 단말(410)과 수신자 단말(420)의 협의에 기초하여 결정될 수 있다. 일 예로, 도 4a를 참조하면, 수신자 단말(420)은 자동 응답시 복수 개의 관련 콘텐츠 정보를 제공하고, 발신자 단말(410)은 특정 관련 콘텐츠를 결정하여 해당 정보를 수신자 단말(420)로 제공할 수 있다. 그 후, 수신자 단말(420)은 결정된 관련 콘텐츠 정보를 AI 서버(430)로 전송할 수 있다. 이때, AI 서버(430)는 관련 콘텐츠별로 분리하여 존재하거나 통합된 형태로서 관련 콘텐츠 각각을 처리할 수 있으며, 상술한 실시예로 한정되지 않는다. 다만, AI 서버(430)는 결정된 관련 콘텐츠에 기초한 정보를 기준으로 발신자 단말(410)의 질의 요청에 대한 응답을 확인할 수 있는바 정보 처리 시간이 줄어들 수 있다. 그 후, 발신자 단말(410)은 결정된 관련 콘텐츠에 기초한 질의를 수신자 단말(420)로 제공하고, 수신자 단말(420)은 발신자 단말(410)의 질의에 기초하여 AI 서버(430)를 통해 질의에 대한 응답을 획득하여 제공할 수 있으며, 구체적인 방법은 도 3과 동일할 수 있다.

또 다른 일 예로, 발신자 단말과 수신자 단말의 음성 통화가 자동 응답에 기초하여 수신된 후에 데이터 통화로 전환될 수 있다. 도 5a를 참조하면, 수신자 단말(520)은 발신자 단말(510)에게 데이터 통화 전환을 문의하고, 발신자 단말(510)이 수락하면 음성 통화를 종료하고, 데이터 통화(e.g. VOIP(Voice over Internet Protocol))로 전환할 수 있다. 여기서, 발신자 단말은 음성 응답 또는 키 입력의 방식에 기초하여 수락 여부에 대한 정보를 수신자 단말(520)로 제공할 수 있다.

일 예로, 수신자 단말(520)은 기존의 ARS 서버와 다르게 음성 통화를 발신자 단말(510)과 유지하는 경우, 다른 발신자 단말에 대한 음성 통화를 수신하지 못할 수 있다. 상술한 점을 고려하여, 수신자 단말(520)은 음성 통화를 데이터 통화로 전환할 필요성이 있다. 또한, 발신자 단말(510)의 질의에 기초하여 응답을 제공하는 경우, 데이터베이스에 관련 정보를 저장하고, 음성 인식이나 그 밖의 데이터 처리를 수행해야 할 필요성이 있으나, 음성 통화에 기초하여 정보를 제공하는 경우에는 데이터 처리에 한계가 존재할 수 있다. 즉, 수신자 단말(520)은 음성 통화에 기초하여 발신자 단말(510)의 질의를 처리하는데 한계가 존재하며 상술한 점을 고려하여 데이터 통화로 전환이 수행될 수 있다.

보다 구체적인 일 예로, 도 5b를 참조하면, 수신자 단말(520)은 발신자 단말(510)과 기 설정된 시간에 기초하여 데이터 통화 전환을 수행할 수 있다. 즉, 수신자 단말(520)은 짧은 답변 등 일정시간까지는 발신자 단말(510)의 질의를 처리하다가 자동 연결 후 기 설정된 시간이 도과하면 다른 발신자 단말(510)의 음성 통화를 고려하여 데이터 통화 전환을 시도할 수 있다. 일 예로, 수신자 단말(520)은 자동 연결 후 기 설정된 시간 이후에 발신자 단말(510)에게 음성 통화 기준 시간을 통보하고 데이터 통화 전환 여부에 대한 요청을 전달할 수 있다. 그 후, 발신자 단말(510)이 이를 수락하면 데이터 통화로 전환하여 발신자 단말(510)의 질의를 처리할 수 있다.

또한 일 예로 수신자 단말(520)은 발신자 단말의 질의 내용에 기초하여 데이터 통화 전환을 수행할 수 있다. 즉 질의 내용에 대한 응답을 위해서 소정의 시간이 필요하거나, 소정의 시각적 정보 제공이 필요한 경우 데이터 통화 전환을 수행할 수 있다. 예컨대 약관의 제공, 구체적인 사용자의 의견 수신, 특정 항목에 대한 명시적 확인, 계약의 체결, 송금, 환전, 정보의 공개범위 설정 등을 위해 데이터 통화 전환이 수행될 수 있으나 이에 본 발명이 제한되는 것은 아니다.

또 다른 일 예로, 도 5c를 참조하면, 수신자 단말(520)(또는 AI 서버(530))는 발신자 단말(510)의 질의 및 응답에 대한 데이터 처리를 고려하여 데이터 통화로 전환을 요청할 수 있다. 일 예로, AI 서버(530)는 발신자 단말(510)의 질의에 기초하여 응답을 제공하는 과정에서 데이터베이스에 관련 정보를 저장하거나 음성정보를 텍스트화 하는 등 데이터 처리 과정을 수행할 수 있다. 여기서, 음성 통화에 기초하여 정보를 처리하는데 한계가 존재할 수 있으며, 상술한 점을 고려하여 AI 서버(530)는 데이터 통화로 전환을 요청할 수 있다. 예컨대 음성 호 연결상태에서 수신하는 음성 데이터는 데이터 호 연결상태에서 수신하는 음성 데이터에 비하여 큰 용량을 갖거나, 데이터 처리가 복잡할 수 있다. 이러한 문제를 해결하기 위해서, AI 서버단 또는 수신자 단말단에서의 데이터처리 효율화를 위해서 데이터 통화 전환을 요청할 수 있다.

일 예로, AI 서버(530)는 질의에 대한 응답 또는 별도의 메시지를 통해 수신자 단말(520)에게 데이터 통화 전환 요청을 수행할 수 있다. 또한, 수신자 단말(520)도 응답 또는 별도의 메시지를 통해 발신자 단말(510)에게 데이터 통화 전환을 요청할 수 있다. 즉, 제공되는 응답이나 데이터 처리를 고려하여 데이터 통화로 전환될 수 있으며, 상술한 실시예로 한정되지 않는다. 여기서, 데이터 통화로 전환된 후에는 수신자 단말(520) 및 AI 서버(530)는 고용량의 데이터를 처리할 수 있다. 따라서, 데이터 통화로 전환된 후에 수신자 단말(520) 및 AI 서버(530)는 음성을 통한 정보 뿐만 아니라 이미지나 동영상 등 고용량 데이터를 처리하여 발신자 단말(510)에게 제공할 수 있으며, 발신자 단말은 보다 구체적인 응답을 획득할 수 있다.

또 다른 일 예로, 데이터 통화는 제 3 메신저 플랫폼에 기초하여 수행될 수 있다. 수신자 단말은 상술한 바와 동일하게 AI 서버와 데이터 통신에 기초하여 발신자 단말의 질의를 처리할 수 있다. 또한, 수신자 단말이 데이터 통화를 위해 자체적으로 플랫폼을 구축하는데 한계가 존재하므로 제 3자 메신저 플랫폼을 통해 데이터 통화가 수행되도록 할 수 있다.

보다 구체적인 일 예로, 도 6a를 참조하면, 수신자 단말(620)은 발신자 단말(610)로부터 데이터 통화 전환을 요청하고, 발신자 단말(610)로부터 데이터 통화에 대한 수락을 응답으로 수신할 수 있다. 그 후, 수신자 단말(620)은 발신자 단말(610)의 정보에 기초하여 제 3 메신저 플랫폼(640)으로 데이터 통화 제공 요청을 전달할 수 있다. 그 후, 제 3 메신저 플랫폼(640)은 데이터 통화 제공 요청에 기초하여 수락 여부를 판단하고, 이에 대한 정보를 수신자 단말(620)로 전달할 수 있다. 여기서, 제 3 메신저 플랫폼(640)에 의해 데이터 통화 제공이 수락된 경우, 수신자 단말(620)은 발신자 단말(610)과 제 3 메신저 플랫폼(640)에 기초하여 데이터 통화를 수행할 수 있다. 즉, 수신자 단말(620)은 발신자 단말(610)의 질의에 대해서는 AI 서버(630)를 통해 응답 정보를 획득하고, 데이터 통화는 제 3 메신저 플랫폼을 통해 수행할 수 있으며 이를 통해 발신자 단말(610)로 유연한 인공지능 비서 서비스를 제공할 수 있다.

또 다른 일 예로, 제 3 메신저 플랫폼을 통해 데이터 통화를 수행하는 경우, 발신자 단말과 수신자 단말은 제 3자 메신저 플랫폼에 대한 식별 정보를 확인할 필요성이 있다.(e.g. 친구 관계) 즉, 발신자 단말과 수신자 단말은 제 3 메신저 플랫폼에 기초한 상호 간의 식별 정보를 인지하고 있고, 식별 정보에 대한 승인이 존재하는 상태일 필요성이 있다. 일 예로, 제 3 메신저 플랫폼은 발신자 단말과 수신자 단말이 상호 간의 식별 정보를 인지하지 않은 경우에 데이터 통화 전환을 수락하지 않을 수 있다.

다만, 일 예로, 제 3 메신저 플랫폼은 발신자 단말과 수신자 단말이 상호 간의 식별 정보를 인지하고 있지 않더라도 발신자 단말과 수신자 단말의 기록 정보에 기초하여 데이터 통화를 수락할 수 있다. 제 3 메신저 플랫폼은 발신자 단말과 수신자 단말의 과거 통화 기록에 기초하여 상호 간의 확인을 수행하고, 이에 기초하여 데이터 통화를 수락하여 데이터 통화를 제공할 수 있다. 구체적인 일 예로, 수신자 단말은 발신자 단말의 전화번호를 제3 메신저 플랫폼에 전송할 수 있다. 이때, 제 3 메신저 플랫폼은 수신한 정보에 기초하여 발신자 단말로 데이터 통화 발신 가부를 요청하고, 발신자 단말의 수락에 기초하여 데이터 통화 연결을 수행할 수 있다. 즉, 제3 메신저 플랫폼은 발신자 단말과 수신자 단말이 제 3 메신저 플랫폼 내의 식별 정보에 기초하여 승인된 사용자이거나 수신자 단말이 해당 번호의 수신자인 점에 기초하여 데이터 통화 연결을 수락할 수 있다.

또한, 일 예로, 도 6b를 참조하면, 수신자 단말(620)은 발신자 단말(610)로 데이터 통화 전환 요청을 전달하면서 데이터 통화 관련 제 3 메신저 플랫폼 정보 제공 요청도 전달할 수 있다. 일 예로, 수신자 단말(620)이 상술한 바처럼 제 3 메신저 플랫폼의 식별 정보를 인지하고 있거나 과거 기록이 존재하는 경우라면 이에 기초하여 데이터 통화에 대한 수락이 수행될 수 있다. 반면, 수신자 단말(620)에 상술한 정보가 존재하지 않은 경우, 수신자 단말(620)은 데이터 통화 전환 요청을 발신자 단말(610)에게 전달하면서 데이터 통화를 위한 정보도 함께 요청할 수 있다. 일 예로, 발신자 단말(610)이 수신자 단말(620)로 처음 음성 통화를 시도한 경우, 수신자 단말(620)은 발신자 단말(610)과 관련된 정보를 가지고 있지 않을 수 있으며, 수신자 단말(620)은 데이터 통화를 위한 정보를 발신자 단말(610)로 요청할 수 있다. 일 예로, 데이터 통화를 위한 정보는 제 3 플랫폼(640)에 기초한 식별 정보 확인 및 승인 요청일 수 있다.(e.g. 친구 관계 동의 요청 후 응답 수신) 즉, 수신자 단말(620)은 제 3 메신저 플랫폼(640)을 통해 발신자 단말(610)과 데이터 통화를 수행할 수 있도록 관련 정보를 요청하고, 이에 대한 응답을 수신하여 데이터 통화를 위한 사전 준비를 수행할 수 있다. 그 후, 수신자 단말(620)은 데이터 통화 제공 요청을 제 3 메신저 플랫폼(640)에 전달하고, 제 3 메신저 플랫폼(640)의 수락에 기초하여 발신자 단말(610)과 데이터 통화 연결을 수행할 수 있다.

또한, 일 예로, 도 7a를 참조하면, 데이터 통화로 전환된 경우에 데이터 통화뿐만 아니라 메신저를 통해 관련 정보가 디스플레이될 수 있다. 데이터 통화로 전환된 경우, 발신자 단말에게 수신자 단말에 대한 정보와 함께 질의 내역에 대한 정보가 제 3 메신저 플랫폼을 통해 제공될 수 있다. 또한, 일 예로, 제 3 메신저 플랫폼을 통해 질의 내역에 대한 정보뿐만 아니라, 관련된 다양한 정보가 제공될 수 있다. 일 예로, 제공되는 정보는 이미지나 동영상 등일 수 있으며, 상술한 바를 통해 보다 구체적인 정보를 발신자 단말에게 제공할 수 있다.

또한, 일 예로, 도 7b를 참조하면, 발신자 단말은 제 3 메신저 플랫폼을 통해 관련 콘텐츠에 대한 정보도 확인할 수 있으며, 이에 대한 정보도 제 3 메신저 플랫폼을 통해 변경할 수 있다. 즉, 제 3 메신저 플랫폼을 통해 보다 구체적인 데이터 정보가 발신자 단말에게 제공될 수 있으며, 이를 통해 발신자 단말로 유연한 답변을 제공할 수 있다.

여기서, 보다 구체적인 실시예를 고려하면, 사용자A(발신자 단말)가 중국집B(수신자 단말)에 전화를 걸었을 때, 음성통화가 연결되고(착신되고), AI 서버에 기초하여 간단한 주문 대응이 수행될 수 있다. 일 예로, AI 서버는 통화가 지연되거나 데이터 처리 용량이 증가하는 경우를 판단하고, 데이터 통화 전환 여부를 문의할 수 있다. 이때, 사용자A가 수락하면 중국집B의 사업자의 메신저 계정이 사용자A 에게 메신저를 통해 데이터 통화를 연결하게 되며, 메신저를 통해 관련 데이터를 제공할 수 있다.

도 8은 본 명세서의 일실시예에 있어서 음성 통화(음성 호)를 통한 인공지능 비서 서비스를 제공하는 방법을 나타낸 순서도이다.

도 8을 참조하면, 제 1단말은 제 2 단말로부터 음성 통화를 수신하고, 자동 연결을 수행할 수 있다.(S810) 여기서, 제 1 단말은 수신자 단말이고, 제 2 단말은 발신자 단말일 수 있다. 다음으로 자동 연결이 수행된 후 제 1 단말은 제 2 단말로부터 제 1 질의 요청 메시지를 수신할 수 있다.(S820) 그 후, 제 1 단말은 제 1 질의 요청 메시지에 기초한 제 2 질의 요청 메시지를 AI 서버로 전송할 수 있다.(S830) 이때, 제 1 질의 요청 메시지는 음성 통화에 기초하여 음성으로 제 2 단말에서 제 1 단말로 전달될 수 있다. 여기서, 제 1 단말은 제 1 질의 요청 메시지에 STT(Speech To Text) 처리를 수행하여 전환된 텍스트 정보를 제 2 질의 요청 메시지로서 AI 서버로 전달할 수 있다. 또한, 일 예로, 제 1 단말은 제 1 질의 요청 메시지에 기초하여 생성된 음성 파일 정보를 제 2 질의 요청 메시지로서 AI 서버로 전달할 수 있으며, 상술한 실시예로 한정되지 않는다.

다음으로, 제 1 단말이 AI 서버로부터 제 2 질의 요청 메시지에 기초한 제 1 질의 응답 메시지를 수신할 수 있다.(S840) 그 후, 제 1 단말이 제 1 질의 응답 메시지에 기초한 제 2 질의 응답 메시지를 제 2 단말로 전달할 수 있다.(S850) 이때, AI 서버가 제 1 단말로 전달하는 제 1 질의 응답 메시지는 제 2 질의 요청 메시지에 기초하여 생성되는 텍스트 정보 및 제 2 질의 요청 메시지에 기초하여 생성되는 음성 파일 정보 중 적어도 어느 하나를 포함할 수 있다. 제 1 단말은 AI 서버로부터 수신한 제 1 질의 응답 메시지에 기초하여 제 2 질의 응답 메시지를 생성하고, 생성된 제 2 질의 응답 메시지를 음성 통화에 기초하여 음성으로 제 2 단말로 제공할 수 있다.

또한, 일 예로, 제 1 단말은 제 2 단말로 음성 통화를 데이터 통화로 전환하는 요청 메시지를 전송할 수 있다. 이때, 제 1 단말은 제 2 단말로부터 요청 메시지에 대한 응답으로 수락 메시지를 수신하고, 수락 메시지에 기초하여 음성 통화를 데이터 통화로 전환할 수 있다. 이때, 상술한 바와 같이, 제 1 단말은 제 2 단말과 자동 연결이 수행된 후 기 설정된 시간이 도과하는지 여부를 판단하고, 제 2 단말과 자동 연결이 수행된 후 설정된 시간이 도과하면 요청 메시지를 제 2 단말로 전송할 수 있으며, 이는 상술한 바와 같다. 또 다른 일 예로, 제 1 단말 또는 AI 서버는 데이터 처리 능력에 기초하여 데이터 통화 전환이 필요한지 여부를 판단할 수 있다. 이때, 제 1 단말 또는 AI 서버에 의해 음성 통화를 데이터 통화로 전환하고자 하는 경우, 제 1 단말은 요청 메시지를 제 2 단말로 전송할 수 있다.

또 다른 일 예로, 데이터 통화는 제 3 메신저 플랫폼에 기초하여 수행될 수 있다. 이때, 상술한 바와 같이, 데이터 통화는 제 1 단말의 제 3 메신저 플랫폼에서의 식별 정보 및 제 2 단말의 제 3 메신저 플랫폼에서의 식별 정보에 기초하여 수행될 수 있다. 일 예로, 상호 간의 식별 정보를 인지하고 승인된 경우에 데이터 통화 연결이 수행될 수 있으며, 이는 상술한 바와 같다.

또 다른 일 예로, 제 1 단말이 제 3 메신저 플랫폼에 기초하여 데이터 통화를 수행하는 경우, 제 3 메신저 플랫폼으로 데이터 통화 제공 요청 메시지를 전송하고, 제 3 메신저 플랫폼으로부터 데이터 통화에 대한 수락 메시지를 수신하면 데이터 통화를 수행할 수 있으며, 이는 상술한 바와 같다. 또한, 일 예로, 제 1 단말은 상술한 도 4a 내지 도 4d에 기초하여 자동 연결이 수행된 후 제 1 단말과 관련된 적어도 어느 하나의 관련 콘텐츠 정보를 제 2 단말로 전송할 수 있다. 여기서, 제 2 단말은 적어도 어느 하나의 관련 콘텐츠 정보에 기초하여 특정 콘텐츠를 선택하고, 이에 대한 정보를 제 1 단말로 전송할 수 있다. 또한, 제 2 단말은 상술한 제 1 질의 요청 메시지를 선택된 콘텐츠에 기초하여 생성할 수 있으며, 이는 상술한 바와 같다.

이상에서 설명한 실시예들은 적어도 부분적으로 컴퓨터 프로그램으로 구현되고 컴퓨터로 읽을 수 있는 기록매체에 기록될 수 있다. 실시예들을 구현하기 위한 프로그램이 기록되고 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터에 의하여 읽힐 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 광 데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 또한, 본 실시예를 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트(segment)들은 본 실시예가 속하는 기술 분야의 통상의 기술자에 의해 용이하게 이해될 수 있을 것이다.

이상에서 살펴본 본 명세서는 도면에 도시된 실시예들을 참고로 하여 설명하였으나 이는 예시적인 것에 불과하며 당해 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 실시예의 변형이 가능하다는 점을 이해할 것이다. 그러나, 이와 같은 변형은 본 명세서의 기술적 보호범위 내에 있다고 보아야 한다. 따라서, 본 명세서의 진정한 기술적 보호범위는 첨부된 청구범위의 기술적 사상에 의해서 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 포함하도록 정해져야 할 것이다.

Claims

음성 통화를 통해 질의 응답을 수행하는 제 1 단말의 동작 방법에 있어서,
제 2 단말로부터 음성 통화를 수신하고, 자동 연결을 수행하는 단계;
상기 자동 연결이 수행된 후 상기 제 2 단말로부터 제 1 질의 요청 메시지를 수신하는 단계;
상기 제 1 질의 요청 메시지에 기초한 제 2 질의 요청 메시지를 AI(Artificial Intelligence) 서버로 전송하는 단계;
상기 AI 서버로부터 상기 제 2 질의 요청 메시지에 기초한 제 1 질의 응답 메시지를 수신하는 단계; 및
상기 제 1 질의 응답 메시지에 기초한 제 2 질의 응답 메시지를 상기 제 2 단말로 전달하는 단계;를 포함하는, 제 1 단말의 동작 방법.
제 1 항에 있어서,
상기 제 1 질의 요청 메시지는 상기 음성 통화에 기초하여 음성으로 상기 제 1 단말로 전달되고,
상기 제 1 단말이 상기 AI 서버로 전달하는 상기 제 2 질의 요청 메시지는 상기 제 1 질의 요청 메시지에 STT(Speech To Text) 처리를 수행하여 전환된 텍스트 정보 및 상기 제 1 질의 요청 메시지에 기초하여 생성된 음성 파일 정보 중 적어도 어느 하나를 포함하는, 제 1 단말의 동작 방법.
제 2 항에 있어서,
상기 AI 서버가 상기 제 1 단말로 전달하는 상기 제 1 질의 응답 메시지는 상기 제 2 질의 요청 메시지에 기초하여 생성되는 텍스트 정보 및 상기 제 2 질의 요청 메시지에 기초하여 생성되는 음성 파일 정보 중 적어도 어느 하나를 포함하고,
상기 제 1 단말은 상기 AI 서버로부터 수신한 상기 제 1 질의 응답 메시지에 기초하여 상기 제 2 질의 응답 메시지를 생성하고, 상기 생성된 제 2 질의 응답 메시지를 상기 음성 통화에 기초하여 음성으로 상기 제 2 단말로 제공하는, 제 1 단말의 동작 방법.
제 1 항에 있어서,
상기 제 2 단말로 상기 음성 통화를 데이터 통화로 전환하는 요청 메시지를 전송하는 단계;
상기 제 2 단말부터 상기 요청 메시지에 대한 응답으로 수락 메시지를 수신하는 단계; 및
상기 수락 메시지에 기초하여 상기 음성 통화를 상기 데이터 통화로 전환하는 단계;를 더 포함하는, 제 1 단말의 동작 방법.
제 4 항에 있어서,
상기 제 2 단말과 자동 연결이 수행된 후 기 설정된 시간이 도과하는지 여부를 판단하는 단계;를 더 포함하되,
상기 제 2 단말과 자동 연결이 수행된 후 상기 설정된 시간이 도과하면 상기 요청 메시지를 상기 제 2 단말로 전송하는, 제 1 단말의 동작 방법.
제 4 항에 있어서,
상기 제 1 단말이 데이터 처리 능력에 기초하여 상기 데이터 통화 전환 필요 여부를 판단하는 단계;를 더 포함하되,
상기 제 1 단말이 상기 데이터 처리 능력에 기초하여 상기 데이터 통화 전환이 필요하다고 판단한 경우, 상기 요청 메시지를 상기 제 2 단말로 전송하는, 제 1 단말의 동작 방법.
제 4 항에 있어서,
상기 데이터 통화는 제 3 메신저 플랫폼에 기초하여 수행되되,
상기 데이터 통화는 상기 제 1 단말의 상기 제 3 메신저 플랫폼에서의 식별 정보 및 상기 제 2 단말의 상기 제 3 메신저 플랫폼에서의 식별 정보에 기초하여 수행되는, 제 1 단말의 동작 방법.
제 7 항에 있어서,
상기 제 1 단말이 상기 제 3 메신저 플랫폼에 기초하여 상기 데이터 통화를 수행하는 경우, 상기 제 3 메신저 플랫폼으로 데이터 통화 제공 요청 메시지를 전송하는 단계; 및
상기 제 3 메신저 플랫폼으로부터 상기 데이터 통화에 대한 수락 메시지를 수신하는 단계;를 더 포함하고,
상기 수락 메시지가 수신되면 상기 제 3 메신저 플랫폼에 기초하여 상기 데이터 통화가 수행되는, 제 1 단말의 동작 방법.
제 1 항에 있어서,
상기 자동 연결이 수행된 후 상기 제 1 단말과 관련된 적어도 어느 하나의 관련 콘텐츠 정보를 상기 제 2 단말로 전송하는 단계;
상기 적어도 어느 하나의 관련 콘텐츠 정보에 기초하여 상기 제 2 단말이 선택한 관련 콘텐츠 정보를 수신하는 단계;를 더 포함하되,
상기 제 1 질의 요청 메시지는 상기 제 2 단말에 의해 선택된 상기 관련 콘텐츠 정보에 기초하여 생성되는, 제 1 단말의 동작 방법.
하드웨어와 결합되어 제 1항 내지 제9항 중 어느 한 항에 따른 동작 방법을 실행하도록 컴퓨터로 판독 가능한 매체에 저장된 컴퓨터 프로그램.