WO2022060029A1

WO2022060029A1 - 응답이 변화된 이유에 관한 정보를 제공하는 전자 장치 및 그 동작 방법

Info

Publication number: WO2022060029A1
Application number: PCT/KR2021/012409
Authority: WO
Inventors: 최형탁; 류종엽; 이호정
Original assignee: 삼성전자 주식회사
Priority date: 2020-09-16
Filing date: 2021-09-13
Publication date: 2022-03-24
Also published as: KR20220036781A

Abstract

제1 입력에 따라, 적어도 하나의 모듈을 처리하여 제1 응답을 출력하고, 제1 입력의 의도와 동일한 의도를 가진 제2 입력에 따라, 제1 응답과 다른 제2 응답이 출력된 이력에 관한 정보를 획득하고, 획득된 정보에 기초하여, 제1 입력에 따라 동작된 적어도 하나의 모듈 중 제2 입력에 따라 동작된 적어도 하나의 모듈과 다르게 동작된 모듈을 변화된 모듈로 식별하고, 변화된 모듈에 기초하여, 제1 응답이, 제2 응답과 다르게 변화된 이유에 관한 정보를 제공하는, 전자 장치에서, 응답이 변화된 이유에 관한 정보를 제공하는 방법이 제공된다.

Description

응답이 변화된 이유에 관한 정보를 제공하는 전자 장치 및 그 동작 방법

본 출원은, 2020년 9월 16일자로 대한민국 특허청에 출원된 대한민국 특허출원 제 10-2020-0119379호에 기초하여 우선권을 주장하며, 그 전문이 여기에 참조로써 포함된다.

본 개시는, 응답이 변화된 이유에 관한 정보를 제공하는 전자 장치 및 그 동작 방법에 관한 것이다.

전자 장치는, 사용자의 변화된 주변 상황을 고려하여, 사용자의 입력에 대해 적응적으로 결정된 응답을 출력하거나, 새롭게 업데이트된 인공지능 모델을 이용하여 응답을 출력하는 등, 다양한 원인으로 인해, 이전 응답의 사용자 입력과 동일한 의도의 사용자 입력에 대해, 이전 응답과는 다른 새로운 응답을 제공할 수 있다.

그러나, 사용자는, 동일한 의도를 가진 사용자 입력이 입력되었음에도, 이전 응답과 현재 응답이 다른 이유를 알 수 없을수 있으므로, 사용자가 현재 응답보다 이전 응답을 더 선호하여도, 어떻게 전자 장치를 제어하여야 할지 알 수 없는 문제가 존재한다.

그러므로, 동일한 사용자 입력에 대해, 이전 응답과 현재 응답이 다른 이유를 사용자에게 제공하여, 사용자가 원하는 응답이 제공될 수 있도록 하는 방법이 필요하다.

본 개시의 실시 예들은 응답이 변화된 이유에 관한 정보를 생성하는 전자 장치 및 그 동작 방법을 제공한다.

또한, 본 개시의 실시 예들은 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다. 본 개시의 실시 예들은 상기된 바와 같은 실시 예들로 한정되지 않으며, 또 실시 예들이 존재할 수 있다.

본 개시의 예시적인 실시 예에 따르면, 전자 장치에서, 응답이 변화된 이유에 관한 정보를 제공하는 방법에 있어서, 제1 입력에 따라, 적어도 하나의 모듈을 처리하여 제1 응답을 출력하는 단계; 상기 제1 입력의 의도와 동일한 의도를 가진 제2 입력에 따라, 상기 제1 응답과 다른 제2 응답이 출력된 이력에 관한 정보를 획득하는 단계; 상기 획득된 정보에 기초하여, 상기 제1 입력에 따라 동작된 적어도 하나의 모듈 중 상기 제2 입력에 따라 동작된 적어도 하나의 모듈과 다르게 동작된 모듈을 변화된 모듈로 식별하는 단계; 및 상기 변화된 모듈에 기초하여, 상기 제1 응답이, 상기 제2 응답과 다르게 변화된 이유에 관한 정보를 제공하는 단계를 포함하는, 방법을 제공할 수 있다.

본 개시의 예시적인 실시 예에 따르면, 응답이 변화된 이유에 관한 정보를 제공하는 전자 장치에 있어서, 제1 입력에 따라, 적어도 하나의 모듈을 처리하여 제1 응답을 출력하는 출력 회로를 포함하는 출력부; 및 상기 제1 입력의 의도와 동일한 의도를 가진 제2 입력에 따라, 상기 제1 응답과 다른 제2 응답이 출력된 이력에 관한 정보를 획득하고, 상기 획득된 정보에 기초하여, 상기 제1 입력에 따라 동작된 적어도 하나의 모듈 중 상기 제2 입력에 따라 동작된 적어도 하나의 모듈과 다르게 동작된 모듈을 변화된 모듈로 식별하고, 상기 변화된 모듈에 기초하여, 상기 제1 응답이, 상기 제2 응답과 다르게 변화된 이유에 관한 정보를 제공하는 적어도 하나의 프로세서를 포함하는, 전자 장치를 제공할 수 있다.

본 개시의 예시적인 실시 예에 따르면, 다양한 실시 예들을 수행하도록 하는 프로그램이 저장된 기록매체를 제공할 수 있다.

본 개시 내용의 특정 실시예의 상기 및 다른 양태, 특징 및 이점은 첨부 도면과 함께 다음의 상세한 설명으로부터 더욱 명백해질 것이다.

도 1은 다양한 실시 예들에 의한 응답이 변화된 이유에 관한 정보를 제공하는 일 예를 나타낸 블록도이다.

도 2 는 다양한 실시 예들에 의한 전자 장치의 예시적인 구성을 나타내는 블록도이다.

도 3은 다양한 실시 예들에 의한 전자 장치의 예시적인 구성을 나타내는 블록도이다.

도 4는 다양한 실시 예들에 의한 응답이 변화된 이유에 관한 정보를 제공하는 예시적인 방법을 나타낸 순서도이다.

도 5는 다양한 실시 예들에 의한 응답이 변화된 이유에 관한 정보를 제공하는 일 예를 나타낸 도면이다.

도 6은 다양한 실시 예들에 의한 사용자의 음성 입력에 대하여 적어도 하나의 모듈이 동작되는 일 예를 나타낸 도면이다.

도 7은 다양한 실시 예들에 의한 제1 입력에 따라 동작된 모듈 중 변화된 모듈을 식별하는 예시적인 방법을 나타낸 순서도이다.

도 8은 다양한 실시 예들에 의한 제1 입력에 따라 동작된 모듈 중 변화된 모듈을 식별하는 예시적인 방법을 나타낸 순서도이다.

본 개시 내용 전반에 걸쳐, "a, b 또는 c 중 적어도 하나"라는 표현은 a만, b만, c만, a 및 b 둘, a 및 c 둘, b 및 c 둘, a, b 및 c 모두, 또는 이들의 변형을 나타낸다.

아래에서는 첨부한 도면을 참조하여 본 발명의 다양한 실시 예들을 더 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 예시적인 실시 예들에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 표시하지 않을 수 있으며, 본 개시 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호가 부여될 수 있다.

본 개시에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.

본 개시에 따른 인공지능과 관련된 기능은 프로세서와 메모리를 통해 동작된다. 프로세서는 하나 또는 복수의 프로세서로 구성될 수 있다. 예를 들면, 하나 또는 복수의 프로세서는 CPU, AP, DSP(Digital Signal Processor) 등과 같은 범용 프로세서, GPU, VPU(Vision Processing Unit)와 같은 그래픽 전용 프로세서, NPU와 같은 인공지능 전용 프로세서 등을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 하나 또는 복수의 프로세서는, 메모리에 저장된 기 정의된 동작 규칙 또는 인공지능 모델에 따라, 입력 데이터를 처리하도록 제어한다. 하나 또는 복수의 프로세서가 인공지능 전용 프로세서인 경우, 인공지능 전용 프로세서는, 특정 인공지능 모델의 처리에 특화된 하드웨어 구조로 설계될 수 있다.

기 정의된 동작 규칙 또는 인공지능 모델은 학습을 통해 만들어진 것을 특징으로 한다. 예를 들면, 학습을 통해 만들어진다는 것은, 기본 인공지능 모델이 학습 알고리즘에 의하여 다수의 학습 데이터들을 이용하여 학습됨으로써, 원하는 특성(또는, 목적)을 수행하도록 설정된 기 정의된 동작 규칙 또는 인공지능 모델이 만들어짐을 지칭할 수 있다. 이러한 학습은 본 개시에 따른 인공지능이 수행되는 기기 자체에서 이루어질 수도 있고, 별도의 서버 및/또는 시스템을 통해 이루어 질 수도 있다. 학습 알고리즘의 예로는, 지도형 학습(supervised learning), 비지도형 학습(unsupervised learning), 준지도형 학습(semi-supervised learning) 또는 강화 학습(reinforcement learning) 등을 포함할 수 있으나, 전술한 예에 한정되지 않는다.

인공지능 모델은, 복수의 신경망 레이어들로 구성될 수 있다. 복수의 신경망 레이어들 각각은 복수의 가중치들(weight values)을 갖고 있으며, 이전(previous) 레이어의 연산 결과와 복수의 가중치들 간의 연산을 통해 신경망 연산을 수행한다. 복수의 신경망 레이어들이 갖고 있는 복수의 가중치들은 인공지능 모델의 학습 결과에 의해 최적화될 수 있다. 예를 들어, 학습 과정 동안 인공지능 모델에서 획득한 로스(loss) 값 또는 코스트(cost) 값이 감소 또는 최소화되도록 복수의 가중치들이 갱신될 수 있다. 인공 신경망은 심층 신경망(DNN:Deep Neural Network)를 포함할 수 있으며, 예를 들어, CNN (Convolutional Neural Network), DNN (Deep Neural Network), RNN (Recurrent Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), BRDNN(Bidirectional Recurrent Deep Neural Network) 또는 심층 Q-네트워크 (Deep Q-Networks) 등을 포함할 수 있고, 전술한 예에 한정되지 않는다.

이하 첨부된 도면을 참고하여 본 발명을 더 상세히 설명하기로 한다.

도 1을 참조하면, 일 실시 예에 의한 전자 장치(1000)는 사용자 입력(110)에 따라 적어도 하나의 모듈(120)을 처리하고, 적어도 하나의 모듈(120)이 처리된 결과인 응답(130)을 출력할 수 있는 장치일 수 있다. 예를 들면, 모듈은 다양한 처리 회로 및/또는 실행 가능한 프로그램 명령을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 일 실시 예에 의한 전자 장치(1000)는, 현재 출력된 응답(130)에 대하여, 이전 응답과 다르게, 현재 응답이 변화된 이유에 관한 정보를 획득(140)하고, 획득된 정보를 사용자에게 제공(160)할 수 있다.

일 실시 예에 따른 전자 장치(1000)는 하나 이상의 다양한 형태로 구현될 수 있다. 예를 들어, 본 개시에서 기술되는 전자 장치(1000)는, 디지털 카메라, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), 태블릿 PC, 전자북 단말기, 디지털방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션, MP3 플레이어, 차량(vehicle), AI 스피커 등을 포함할 수 있으나, 이에 한정되는 것은 아니다. 본 개시에서 기술되는 전자 장치(1000)는 사용자에 의해 착용될 수 있는 장치(wearable device)일 수 있다. 웨어러블 디바이스는 액세서리 형 장치(예컨대, 시계, 반지, 팔목 밴드, 발목 밴드, 목걸이, 안경, 콘택트 렌즈), 머리 착용형 장치(head-mounted-device(HMD)), 직물 또는 의류 일체형 장치(예: 전자 의복), 신체 부착형 장치(예컨대, 스킨 패드(skin pad)), 또는 생체 이식형 장치(예: implantable circuit)등 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다.

일 실시 예에 의하면, 전자 장치(1000)는 대화형 인터페이스를 통해 사용자 입력(110)을 수신하고, 사용자 입력(110)에 대한 응답(130)을 출력하는 장치일 수 있다. 예를 들면, 대화형 인터페이스는 사용자로부터의 입력(예컨대, 음성 입력 또는 텍스트 입력)을 수신하고, 사용자로부터의 입력에 대한 응답을 제공하는 사용자를 위한 인터페이스를 포함 할 수 있다. 예를 들면, 일 실시 예에 의하면, 대화형 인터페이스는 가상 비서(Virtual assistant), 인공지능 비서 등을 포함할 수 있으나, 이에 한정되는 것은 아니다. 예를 들어, 가상 비서 또는 인공지능 비서는 사용자가 요구하는 작업을 처리하고 사용자에게 특화된 서비스를 제공하는 소프트웨어 에이전트를 포함할 수 있으나, 이에 한정되지 않는다.

일 실시 예에 의한 적어도 하나의 모듈(120)은, 사용자 입력(110)을 인식하고, 인식된 사용자 입력(110)에 대한 응답(130)을 생성하여 출력할 수 있다.

예를 들면, 모듈(120)은, 음성 인식(ASR; Automatic Speech Recognition) 모듈, 디바이스 선택(DD(Device Dispatcher) 또는, DS(Device Selector)) 모듈, 도메인 분류(DC; Domain Classifier) 모듈, 자연어 이해(NLU; Natural Language Understanding) 모듈, 다이얼로그 매니져(DM; Dialog manager) 모듈, 자연어 생성(NLG; Natural Language Generator) 모듈 등과 같은 다양한 처리 회로 및/또는 실행 가능한 프로그램 명령을 포함하는 다양한 모듈을 포함할 수 있으나, 전술한 예에 한정되지 않는다. 상술한 예에 한하지 않고, 일 실시 예에 의한 모듈(120)은, 사용자 입력(110)에 따른 응답(130)을 출력하는데 필요한 다양한 종류의 모듈을 포함할 수 있다.

일 실시 예에 의한 응답(130)은, 사용자 입력(110)에 기초하여 적어도 하나의 모듈(120)이 동작함에 따라 출력될 수 있다. 일 실시 예에 의하면, 응답(130)과 관련된 메시지가 전자 장치(1000) 또는 외부 장치(미도시)를 통하여 출력되거나, 응답(130)과 대응되는 액션이, 전자 장치(1000) 또는 외부 장치(미도시)에 의해 수행됨으로써, 응답(130)이 출력될 수 있다.

일 실시 예에 의한 응답(130)과 관련된 메시지는, 예를 들면, 스피커를 통해 음성 신호로서 출력되거나, 디스플레이를 통해 표시됨으로써, 출력될 수 있다. 또한, 일 실시 예에 의한 응답(130)과 대응되는 액션은, 전자 장치(1000) 또는 외부 장치(미도시)에 의해 수행될 수 있는 다양한 종류의 동작을 포함할 수 있다.

예를 들어, "방금 들은 음악 틀어줘"를 포함한 사용자 입력(110)에 따라서, 응답(130)과 대응되는 액션으로서, 외부의 스피커 장치에 의하여, 최근에 재생되었던 "음악 1"이 다시 재생될 수 있고, 응답(130)과 관련된 메시지로서, "음악 1이 재생되었습니다"가 음성으로 출력될 수 있다.

상술한 예에 한하지 않고, 응답(130)과 관련된 메시지는, 다양한 정보를 포함할 수 있으며, 음성 외에 사용자에게 상기 정보를 전달할 수 있는 다양한 형태로 출력될 수 있다. 상술한 예에 한하지 않고, 응답(130)과 대응되는 액션은, 응답(130)과 관련된 다양한 동작을 포함할 수 있다.

일 실시 예에 의한 사용자는 이전에 입력된 사용자 입력과 동일한 의도의 사용자 입력이 전자 장치(1000)에 입력되면, 이전 응답과 동일한 응답이 출력할 것을 기대할 수 있다. 그러나, 일 실시 예에 의하면, 이전에 출력되었던 응답과, 동일한 의도를 가진 사용자 입력에 대한 응답임에도 불구하고, 현재 출력된 응답(130)과, 이전 응답은 서로 다를 수 있다. 예를 들면, 사용자 입력을 처리하는 적어도 하나의 모듈(120)이, 여러가지 원인에 의하여, 이전의 사용자 입력에 대해 동작된 모듈과 다르게 동작함에 따라서, 이전 응답과 다른 현재 응답(130)이 출력될 수 있다.

따라서, 일 실시 예에 의한 사용자는 이전과 다른 응답(130)이 출력되는 경우, 자신이 의도한 응답이 출력되지 않은 것에 대해 의문을 가질 수 있다. 사용자는 자신이 의도하는 응답이 출력되도록 하려면 무엇을 해야 할지에 대해 의문을 가질 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 상술한 사용자의 의문에 대해 이해하고, 답변할 수 있도록, 미리 필요한 정보를 획득해두고, 획득된 정보를 이용하여, 사용자가 가진 의문에 대해 답변함으로써, 사용자에게 현재 응답(130)이 변화된 이유에 관한 정보를 제공할 수 있다. 전자 장치(1000)는 사용자가 원하는 응답을 파악하여, 사용자가 원하는 응답이 출력되도록 하는 사용자 입력에 대하여, 사용자에게 가이드할 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 140에서, 현재 사용자 입력(110)에 따라 동작된 적어도 하나의 모듈(120) 중 현재 사용자 입력(110)과 동일한 의도를 가진 이전 사용자 입력에 따라 동작된 모듈과는 다르게 동작된 모듈을 식별하고, 식별된 모듈에 기초하여, 현재 응답(130)이 변화된 이유에 대한 정보를 획득할 수 있다.

일 실시 예에 의하면, 현재 사용자 입력(110)에 따라 동작된 적어도 하나의 모듈(120)의 동작이 변화됨에 따라서, 현재 응답(130)이 이전 응답과 달라질 수 있다. 예를 들면, 각 모듈에서 이용되는 인공지능 모델 또는 엔진이 갱신되는 경우, 각 모듈은, 동일한 입력 정보가 수신되어도, 이전 응답에서의 동작과는 다르게 동작함에 따라, 다른 출력 정보를 출력할 수 있다. 따라서, 일 실시 예에 의한 현재 출력된 응답(130)이 변화된 이유에 관한 정보는, 현재 사용자 입력(110)에 따라 동작된 적어도 하나의 모듈(120) 중에서, 응답 이력(150)에 저장된 이전 사용자 입력에 따라 동작된 모듈에 관한 정보와의 비교를 통해, 변화된 모듈로 식별된 모듈에 기초하여 획득될 수 있다.

일 실시 예에 의한 현재 응답(130)이 변화된 이유에 대한 정보는, 상기 식별된 모듈의 변화와 대응될 수 있는, 변화 원인에 관한 정보가 추론됨으로써, 획득될 수 있다. 일 실시 예에 의한 전자 장치(1000)가, 상기 추론된 정보를 사용자에게 제공함으로써, 사용자는 현재 응답(130)이 변화된 원인에 대해 파악할 수 있다. 전자 장치(1000)는 상기 추론된 정보에 기초하여, 사용자가 원하는 응답을 판단할 수 있고, 상기 판단된 응답이 출력될 수 있는, 사용자 입력을 사용자에게 가이드할 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 응답 이력(150)으로 미리 저장된 정보 중, 현재 응답(130)의 사용자 입력(110)과 동일한 의도를 가지는 이전의 사용자 입력에 따라 동작된 적어도 하나의 모듈에 의해 처리된 정보와, 현재 사용자 입력(110)에 따라 동작된 적어도 하나의 모듈(120)에 의해 처리된 정보가 비교될 수 있다. 예를 들어, 각 모듈에 의해 처리된 정보는, 각 모듈이 동작할 때, 각 모듈로 입출력된 정보를 포함할 수 있다. 일 실시 예에 의하면, 모듈이 변화됨에 따라, 동일한 입력 정보에 대해 다른 출력 정보가 출력될 수 있으므로, 출력 정보가 서로 비교됨으로써, 변화된 모듈이 식별될 수 있다. 상술한 입출력 정보에 한하지 않고, 적어도 하나의 모듈에 관한 다양한 정보가 현재 응답(130) 및 이전 응답 간에 비교됨으로써, 현재 응답(130)에서 변화된 모듈이 식별될 수 있다.

따라서, 일 실시 예에 의하면, 동일한 의도의 사용자 입력(110)임에도 이전 응답과 달라진 현재 응답(130)이 변화된 이유에 관한 정보가, 응답 이력(150)의 정보에 기초하여, 획득될 수 있다.

일 실시 예에 의한 응답 이력(150)은, 전자 장치(1000)에서, 이전에 수신된 사용자 입력에 따라 출력된 응답의 이력에 관한 정보들을 포함할 수 있다. 일 실시 예에 의한 응답 이력(150)은, 전자 장치(1000)에서, 사용자 입력(110)에 따른 응답(130)이 출력될 때마다 새로운 응답에 관한 정보가 추가되어, 전자 장치(1000)의 메모리에 저장될 수 있다. 상술한 예에 한하지 않고, 응답 이력(150)은, 전자 장치(1000) 외의 외부 장치(미도시) 또는 서버(미도시)에 저장될 수도 있다. 일 실시 예에 의한 응답 이력(150)은, 전자 장치(1000)에서 출력된 응답(130)에 한하지 않고, 외부 장치(미도시)에서, 동일한 사용자에 의해 출력된 응답(130)의 이력에 관한 정보도 포함할 수 있다.

일 실시 예에 의한 응답 이력(150)으로 미리 저장된 정보들은, 각 응답이 출력되는데 이용된 적어도 하나의 모듈에 관한 정보를 포함할 수 있다. 일 실시 예에 의한 적어도 하나의 모듈에 관한 정보는, 각 모듈에 대한 입출력 정보를 포함할 수 있다.

일 실시 예에 의한 각 모듈에 대한 입출력 정보는, 각 모듈이 동작할 때, 각 모듈에 대해 입력된 정보와 출력된 정보를 포함할 수 있다. 일 실시 예에 의한 현재 사용자 입력(110)과 이전 사용자 입력 간의 모듈에 대한 비교는, 상술한 모듈의 입출력 정보의 비교에 기초하여, 수행될 수 있다.

일 실시 예에 의하면, 모듈 간 입력 정보가 동일함에도, 출력 정보가 다른 모듈이 변화된 모듈로 식별될 수 있다. 일 실시 예에 의하면, 모듈 간 입력 정보가 다르거나, 모듈들 간 입력 정보 및 출력 정보가 모두 같은 경우에는, 변화된 모듈로 식별되지 않을 수 있다.

예를 들어, 현재 사용자 입력(110)의 ASR 모듈에 대한 입력 정보와, 이전 사용자 입력의 ASR 모듈에 대한 입력 정보가 서로 동일하면서, 현재 사용자 입력(110)의 ASR 모듈에 대한 출력 정보와, 이전 사용자 입력의 ASR 모듈에 대한 출력 정보가 서로 동일한 경우, 현재 사용자 입력 (110)에서 이용된 ASR 모듈은 변화된 모듈이 아닌 것으로 판단될 수 있다. 현재 사용자 입력(110)의 모듈(120) 중 DC 모듈의 입력 정보와, 이전 사용자 입력의 DC 모듈의 입력 정보가 다른 경우, DC 모듈의 출력 정보에 대한 판단 없이, 현재 사용자 입력(110)의 DC 모듈은 변화된 모듈이 아닌 것으로 판단될 수 있다.

현재 사용자 입력(110)의 모듈(120) 중 DD 모듈의 입력 정보와, 이전 사용자 입력의 DD 모듈의 입력 정보가 서로 동일하면서, 현재 사용자 입력(110)의 DD 모듈의 출력 정보와, 이전 사용자 입력의 DD 모듈의 출력 정보가 서로 다른 경우, 현재 사용자 입력(110)의 DD 모듈은 변화된 모듈로 식별될 수 있다. 따라서, 변화된 모듈로 식별된 DD 모듈에 기초하여, 140에서, 현재 응답(130)이 변화된 이유에 관한 정보가 획득될 수 있다.

일 실시 예에 의하면, 현재 사용자 입력(110)에 따라 동작된 각 모듈(120)에 대한 입력 정보에 기초하여, 각 모듈과 대응되는 이전 사용자 입력에 따라 동작된 모듈에 관한 정보(ex. 입출력 정보)가 식별될 수 있다. 이전 사용자 입력의 의도와 동일한 의도의 사용자 입력이 수신된 경우, 동일한 모듈에 대하여는, 동일한 입력 정보가 수신될 수 있음을 고려하여, 입력 정보에 따라, 각 모듈과 대응되는 이전 응답의 모듈에 관한 정보가 식별될 수 있다. 이 경우, 응답 이력(150)에 저장된, 이전 사용자 입력에 따라 동작된 모듈에 관한 정보는, 각 모듈에 대한 입출력 정보를 포함하되, 각 모듈에 대한 식별 정보는 포함하지 않을 수 있다. 예를 들면, 각 모듈(120)에 대한 입력 정보가 변환된 해쉬 값과 동일한 해쉬 값을 가지는 입력 정보가 응답 이력(150)에서 검색됨으로써, 각 모듈과 대응되는 이전 사용자 입력의 모듈에 관한 정보가 식별될 수 있다.

상술한 예에 한하지 않고, 응답 이력(150)에 저장된, 이전 사용자 입력에 따라 동작된 모듈에 관한 정보는, 각 모듈(120)에 대한 식별 정보를 포함할 수 있고, 각 모듈(120)에 대한 식별 정보에 기초하여, 각 모듈과 대응되는 이전 사용자 입력의 모듈에 관한 정보가 식별될 수도 있다. 일 실시 예에 의한 모듈의 식별 정보는, 각 모듈이 어떤 모듈인지를 나타내는 정보를 포함하여, 140에서, 현재 사용자 입력(110)에 따라 동작된 적어도 하나의 모듈(120)과 각각 대응되는 이전 사용자 입력에 따라 동작된 적어도 하나의 모듈에 관한 정보가 식별되는데 이용될 수 있다.

예를 들어, 현재 사용자 입력(110)에 따라 동작된 모듈(120) 중 DD 모듈에서 처리된 정보는, 이전 사용자 입력에 따라 동작된 모듈 중 DD 모듈에서 처리된 정보와 비교될 수 있고, 비교 결과에 기초하여, 140에서, 응답 변화의 이유에 관한 정보가 획득될 수 있다. 일 실시 예에 의하면, DD 모듈에 한하지 않고, 사용자 입력을 처리하기 위해 이용된 다른 모듈들(ex. ASR 모듈, DC 모듈, NLU 모듈, DM 모듈, NLG 모듈등)도, 현재 사용자 입력과 이전 사용자 입력의 모듈들 간 비교될 수 있고, 이에 기초하여, 140에서, 응답 변화의 이유에 관한 정보가 획득될 수 있다.

일 실시 예에 의한 현재 사용자 입력(110)의 모듈(120) 중 변화된 모듈을 식별하기 위한 이전 사용자 입력의 모듈에 관한 정보와의 비교는, 적어도 하나의 모듈(120)에 대한 우선 순위에 따라 차례대로 수행될 수 있다.

일 실시 예에 의한 우선 순위는, 변화된 모듈로 식별될 가능성이 높은 모듈 순으로 결정될 수 있다. 예를 들어, 우선 순위는, 각각의 모듈(120)에서 이용되는 엔진이나 인공지능 모델이 갱신되거나 변경된 순서에 따라서, 결정될 수 있다. 일 예로, 가장 최근에 갱신된 인공지능 모델을 이용하는 모듈이 가장 높은 우선 순위로 결정될 수 있다. 따라서, 일 실시 예에 따른, 우선 순위에 따라, 모듈들이 비교되는 경우, 현재 사용자 입력(110)의 모듈(120) 중 변화된 모듈이 빠르게 식별될 수 있다.

일 실시 예에 의한 우선 순위는, 응답 이력(150)에 저장된 이전 응답과 현재 응답(130) 간의 차이에 기초하여, 결정될 수도 있다. 예를 들어, 현재 응답(130)은, TV에 의한 액션을 포함하나, 이전 응답은, AI 스피커에 의한 액션을 포함하는 경우, 선택된 디바이스에 있어서, 차이가 존재함에 기초하여, 모듈의 우선 순위가 결정될 수 있다. 일 예로, 디바이스 선택이 수행될 수 있는, DD 모듈이 최우선 순위로 결정될 수 있다.

상술한 예에 한하지 않고, 우선 순위는 다양한 기준에 따라서, 결정될 수 있다.

일 실시 예에 의하면, 우선 순위와는 상관 없이, 적어도 하나의 모듈(120)이 사용자 입력(110)을 처리하기 위해 수행되는 순서에 따라, 모듈에 대한 비교 동작이 차례대로 수행될 수 있다.

상술한 예에 한하지 않고, 비교 동작은 다양한 순서에 따라 적어도 하나의 모듈(120)에 대하여 수행될 수 있다.

일 실시 예에 의한 현재 응답(130)의 변화 이유에 관한 정보는, 변화된 모듈로 식별된 현재 사용자 입력(110)에 따라 동작된 모듈(120)에 기초하여, 현재 응답(130)이 변화된 이유가 추론됨으로써, 획득될 수 있다.

예를 들어, "음악 1 틀어줘"란 사용자 입력에 대해, 응답 이력(150)에 저장된 이전 응답에서는, 음악 1이 TV에서 출력되었으나, 현재 응답(130)에서는, AI 스피커에서 출력된 경우를 가정한다.

일 실시 예에 의하면, 현재 사용자 입력(110)에 따라 동작된 적어도 하나의 모듈(120) 중 변화된 모듈의 식별은, 이전 사용자 입력에 따라 동작된 모듈 간의 입출력 정보의 비교로 판단될 수 있다. 예를 들면, 현재 사용자 입력(110)에 따라 동작된 모듈(120) 중 DD 모듈의 입력 정보는 이전 사용자 입력에 따라 동작된 DD 모듈과 동일하나, 출력 정보는 응답 이력(150)의 출력 정보와 다른 것으로 판단된 경우, 현재 사용자 입력(110)에 따라 동작된 모듈(120) 중 DD 모듈이 변화된 모듈로서 식별될 수 있다. 일 예로, DD 모듈에서, TV 대신 AI 스피커가 선택됨에 따라, 동일한 입력 정보가 입력되어도, 이전과 다른 출력 정보가 출력될 수 있다.

일 실시 예에 의하면, 변화된 모듈에 기초하여, DD 모듈이 변화된 이유가 추론됨으로써, 상기 추론된 이유를 포함하는, 현재 응답(130)이 변화된 이유에 관한 정보가 획득될 수 있다. 예를 들어, DD 모듈의 출력 정보가, TV와 대응되는 정보에서 AI 스피커와 대응되는 정보로 변화되는 경우와 대응될 수 있는, 적어도 하나의 후보 이유(ex. AI 스피커가 이전 응답과는 달리 주변 환경에 새롭게 출현함, AI 스피커를 TV보다 더 자주 사용함)가 추론될 수 있다. 일 실시 예에 의하면, 각 후보 이유에 대한 확률에 기초하여, 현재 응답이 이전 응답과 다르게 변화된 이유가 추론될 수 있다.

일 실시 예에 의한 추론은, 변화된 모듈에 관한 정보에 기초하여 현재 응답이 변화된 이유를 추론하기 위하여 미리 학습된 인공지능 모델에 의해 수행될 수 있다. 일 실시 예에 의한 인공지능 모델은, 사용자의 현재 상황에 적합한, 현재 응답이 변화된 이유가 추론될 수 있도록, 실시간으로 변화하는 사용자의 상태 또는 주변 환경에 관한 정보에 기초하여, 지속적으로 갱신될 수 있다.

추론은, 사용자 입력을 처리하는 모듈들의 다양하게 변화되는 예와 각각 대응되는 원인이 미리 저장되어 있는 데이터 베이스(ex. KB(Knowledge Base), DB(Data base))에 의해 수행될 수 있다. 일 실시 예에 의한 데이터 베이스는, 실시간으로 변화하는 사용자의 상태 또는 주변 환경에 관한 정보에 따라 적절하게 추론 가능하도록, 지속적으로 갱신될 수 있다.

상술한 예에 한하지 않고, 일 실시 예에 의한 추론은 다양한 데이터에 기초한 다양한 방법에 따라서 수행될 수 있다.

일 실시 예에 의한, 데이터 베이스에 기초한 추론은, 단계적으로, 각각 대응되는 정보에 따라서, 거듭 수행됨으로써, 현재 응답(130)의 변화 이유에 대한 정보가 획득될 수 있다. 예를 들어, TV에서, AI 스피커로 DD 모듈의 출력 정보가 바뀐 것은, 이전 응답과는 달리, 현재에, AI 스피커가 이용 가능한 상태임이 추론될 수 있다. 예를 들면, AI 스피커가 이용 가능한 상태인 것은, AI 스피커가 사용자의 주변 환경에 새로 놓임에 따른 것임이, 추론될 수 있다. 따라서, 현재 응답(130)이 변화된 이유에 관한 정보는, 상기 최종적으로 추론된 정보인 AI 스피커가 사용자의 주변 환경에 새로 놓임에 따라, 현재 응답(130)이 변화되었음을 나타내는 정보를 포함할 수 있다. 일 실시 예에 의하면, AI 스피커가 사용자의 주변 환경에 놓인 현재 상태에 관한 정보가, 데이터 베이스에서 지속적으로 갱신되어 저장됨으로써, 사용자의 현재 상황에 맞는 추론이 수행될 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 140에서 획득된 응답 변화의 이유에 관한 정보를, 160에서, 사용자의 요청에 따라 사용자에게 제공할 수 있다.

예를 들면, 전자 장치(1000)는, 140에서 획득된 현재 응답(130)이 변화된 이유에 관한 정보에 기초하여, 이후에 수신될 수 있는, 사용자의 현재 응답(130)의 변화 이유와 관련된 질의를 이해하고 응답 메시지를 출력함으로써, 160에서, 응답 변화의 이유에 관한 정보를 사용자에게 제공할 수 있다.

따라서, 일 실시 예에 의한 전자 장치(1000)는, 사용자의 질의를 이해하고 응답 메시지를 출력할 수 있도록, 필요한 데이터를, 140에서 획득된 응답 변화의 이유에 관한 정보에 기초하여, 미리 구축할 수 있다. 예를 들어, 전자 장치(1000)는 사용자 입력(110)을 이해하고, 응답 메시지를 생성하는데 이용되는 인공지능 모델들을 상기 현재 응답(130)이 변화된 이유에 관한 정보에 기초하여 미리 갱신해둘 수 있다.

만약, 140에서 획득된, 응답 변화의 이유에 관한 정보가, AI 스피커가 사용자의 주변 환경에 새로 놓임에 따라, 현재 응답(130)이 변화되었음을 나타내는 정보를 포함하는 경우, 전자 장치(1000)는, 현재 응답(130)이 이전 응답과 왜 다른지를 문의하는 사용자의 질의를 이해할 수 있도록, 사용자의 질의를 이해하는데 이용되는 인공지능 모델(ex. NLU 모델)을, 상기 응답 변화의 이유에 관한 정보에 기초하여, 미리 갱신할 수 있다.

전자 장치(1000)는, 상기 사용자의 질의에 대한, 응답 메시지로, AI 스피커가 사용자의 주변 환경에 새로 놓임에 따라, 현재 응답(130)이 변화되었음을 나타내는 정보를 생성하여 출력할 수 있도록, 사용자에게 응답 메시지를 생성하는데 이용되는 인공지능 모델(ex. DM 모델)을 미리 갱신할 수 있다.

상술한 예에 한하지 않고, 전자 장치(1000)는, 현재 응답이 변화된 이유에 관한 정보를 다양한 방법에 따라서, 다양한 형태로 사용자에게 제공할 수 있다.

따라서, 일 실시 예에 의한 사용자는 응답(130)이 변화된 이유에 관한 정보를 전자 장치(1000)로부터 제공받음에 따라서, 이전 응답과 다른 현재 응답(130)이 출력된 이유를 이해할 수 있다.

일 실시 예에 의하면, 전자 장치(1000)가 실행할 수 있는 동작들은, 서버(미도시)에 의해 대신 수행될 수 있다. 예컨대, 서버(미도시)는 전자 장치(1000)로부터 수신되는 사용자 입력(110)에 기초하여 적어도 하나의 모듈(120)을 처리함으로써, 응답(130)을 생성하고, 생성된 응답(130)에 관한 정보를 전자 장치(1000)에 송신할 수 있다. 서버(미도시)는, 응답 이력(150)에 기초하여 현재 응답이 변화된 이유에 관한 정보를 획득하여, 전자 장치(1000)에 제공할 수 있다. 일 실시 예에 의한 전자 장치(1000)는 서버(미도시)로부터 수신된 현재 응답이 변화된 이유에 관한 정보를 사용자에게 제공할 수 있다.

일 실시 예에 의한 서버(미도시)는, 적어도 하나의 컴퓨터 장치로 구현될 수 있다. 예를 들면, 서버(미도시)는 클라우드 형태로 분산될 수 있으며, 명령, 코드, 파일, 컨텐츠 등을 제공할 수 있으나, 전술한 예에 한정되지 않는다.

도 2 는 다양한 실시 예들에 의한 전자 장치(1000)의 예시적인 구성을 나타내는 블록도이다.

도 3은 다양한 실시 예들에 의한 전자 장치(1000)의 예시적인 구성을 나타내는 블록도이다.

도 2를 참조하면, 전자 장치(1000)는, 프로세서(1300)(예를 들어, 처리 회로를 포함), 사용자 입력부(1100)(예를 들어, 입력 회로를 포함) 및 출력부(1200)(예를 들어, 출력 회로를 포함)을 포함할 수 있다. 그러나, 도 2에 도시된 구성 요소 모두가 전자 장치(1000)의 필수 구성 요소인 것은 아니다. 도 2에 도시된 구성 요소보다 많은 구성 요소에 의해 전자 장치(1000)가 구현될 수도 있고, 도 2에 도시된 구성 요소보다 적은 구성 요소에 의해 전자 장치(1000)가 구현될 수도 있다.

예를 들면, 전자 장치(1000)는 도 3에 도시된 바와 같이, 일 실시 예에 따른 전자 장치(1000)는, 프로세서(1300), 사용자 입력부(1100) 및 출력부(1200) 이외에 센싱부(1400), 통신부(1500)(예를 들어, 통신 회로를 포함), A/V 입력부(1600)(예를 들어 A/V 입력 회로를 포함) 및 메모리(1700)(예를 들어, 저장 장치)를 더 포함할 수도 있다.

사용자 입력부(1100)는, 사용자가 전자 장치(1000)를 제어하기 위한 데이터를 입력하는 다양한 입력 회로를 포함하도록 구성된 장치 일 수 있다.. 예를 들어, 사용자 입력부(1100)는 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(접촉식 정전 용량 방식, 압력식 저항막 방식, 적외선 감지 방식, 표면 초음파 전도 방식, 적분식 장력 측정 방식, 피에조 효과 방식 등), 조그 휠, 조그 스위치 등을 포함 할 수 있으나 이에 한정되는 것은 아니다.

일 실시 예에 의하면, 사용자 입력부(1100)는, 전자 장치(1000)의 응답을 요청하는데 필요한, 사용자의 입력을 수신할 수 있다. 일 실시 예에 의한 사용자 입력이, 음성 입력 및 제스처 입력을 포함하는 경우, 사용자 입력부(1100)는, 예를 들어, 마이크로폰(1620) 및 카메라(1610)를 통해, 사용자의 음성 입력 및 제스처 입력을 각각 수신할 수 있다. 상술한 예에 한하지 않고, 사용자 입력부(1100)는, 다양한 수단을 통하여, 다양한 형태의 사용자 입력을 수신할 수 있다.

출력부(1200)는, 다양한 출력 회로를 포함 할 수 있고, 오디오 신호 또는 비디오 신호 또는 진동 신호를 출력할 수 있으며, 예를 들어, 출력부(1200)는 디스플레이부(1210), 음향 출력부(1220), 및 진동 모터(1230)를 포함할 수 있으나, 전술한 예에 한정되지 않는다. 일 실시 예에 의한 출력부(1200)는 제1 사용자 입력에 따라 적어도 하나의 모듈을 처리하여, 제1 응답을 출력할 수 있다. 출력부(1200)는, 제1 응답이, 제1 사용자 입력과 동일한 의도를 가진 제2 사용자 입력에 따라 기 출력된 제2 응답과 다르게 변화된 이유에 관한 정보를 출력할 수 있다.

디스플레이부(1210)는 전자 장치(1000)에서 처리되는 정보를 표시 출력한다. 일 실시 예에 의하면, 디스플레이부(1210)는 사용자 입력에 따라 출력된 응답이 변화된 이유에 관한 정보를 출력할 수 있다.

디스플레이부(1210)가 터치패드를 포함하여 레이어 구조를 이루어 터치 스크린으로 구성되는 경우, 디스플레이부(1210)는 출력 장치 이외에 입력 장치로도 사용될 수 있다. 디스플레이부(1210)는, 예를 들어, 액정 디스플레이(liquid crystal display), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display), 유기 발광 다이오드(organic light-emitting diode), 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display), 전기영동 디스플레이(electrophoretic display) 등 중에서 적어도 하나를 포함할 수 있지만, 전술한 예에 한정되지 않는다. 전자 장치(1000)의 구현 형태에 따라 전자 장치(1000)는 디스플레이부(1210)를 2개 이상 포함할 수도 있다.

음향 출력부(1220)는 다양한 출력 회로를 포함할 수 있고, 통신부(1500)로부터 수신되거나 메모리(1700)에 저장된 오디오 데이터를 출력한다. 음향 출력부(1220)는, 예를 들어, 스피커를 포함할 수 있다.

진동 모터(1230)는 진동 신호를 출력할 수 있다. 또한, 진동 모터(1230)는 터치스크린에 터치가 입력되는 경우 진동 신호를 출력할 수도 있다. 일 실시 예에 의하면, 음향 출력부(1220) 및 진동 모터(1230)는 사용자 입력에 따라 출력된 응답이 변화된 이유에 관한 정보를 출력할 수 있다.

프로세서(1300)는, 다양한 처리 회로를 포함할 수 있고, 통상적으로 전자 장치(1000)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(1300)는, 메모리(1700)에 저장된 프로그램들을 실행함으로써, 사용자 입력부(1100), 출력부(1200), 센싱부(1400), 통신부(1500), A/V 입력부(1600) 등을 전반적으로 제어할 수 있다.

전자 장치(1000)는 적어도 하나의 프로세서(1300)를 포함할 수 있다. 예를 들면, 전자 장치(1000)는 CPU(Central Processing Unit), GPU(Graphics Processing Unit), NPU(Neural Processing Unit) 등의 다양한 종류의 프로세서와 같은, 예를 들어, 전용 프로세서를 포함할 수 있지만, 전술한 예에 한정되지 않는다.

프로세서(1300)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(1700)로부터 프로세서(1300)에 제공되거나, 통신부(1500)를 통해 수신되어 프로세서(1300)로 제공될 수 있다. 예를 들면 프로세서(1300)는 메모리와 같은 기록 장치에 저장된 프로그램 코드에 따라 명령을 실행하도록 구성될 수 있다.

일 실시 예에 의한 프로세서(1300)는 사용자 입력에 따라 출력된 응답이 변화된 경우, 상기 응답에 대해, 응답이 변화된 이유에 관한 정보를 사용자에게 제공할 수 있다. 일 실시 예에 의한 프로세서(1300)는, 현재 출력된 제1 응답에 대한 제1 사용자 입력과 동일한 의도를 가진 이전의 제2 사용자 입력에 따라서 이전에 출력된 응답인, 제2 응답의 이력 정보에 기초하여, 응답이 변화된 이유에 관한 정보를 획득할 수 있다. 일 실시 예에 의한 제2 응답은, 이전에 출력된 응답들 중에서, 제1 사용자 입력과 동일한 의도를 가진 이전의 제2 사용자 입력에 따라서, 이전에 출력된 응답이, 상기 제2 응답으로서 식별될 수 있다. 일 실시 예에 의하면, 제2 응답의 이력 정보에 기초하여, 제1 사용자 입력에 따라서 동작된 적어도 하나의 모듈 중에서, 제2 사용자 입력에 따라서 동작된 적어도 하나의 모듈과 다르게 동작된 모듈이 식별될 수 있고, 식별된 모듈에 기초하여, 응답이 변화된 이유에 관한 정보가 획득될 수 있다.

일 실시 예에 의한 프로세서(1300)는, 제1 사용자 입력에 따라서 동작된 적어도 하나의 모듈과 제2 사용자 입력에 따라서 동작된 적어도 하나의 모듈을 대응시키고, 서로 대응되는 모듈에서 처리된 정보들 간의 비교 결과에 기초하여, 변화된 모듈을 식별할 수 있다. 예를 들면, 제1 사용자 입력에 따라서 동작된 각 모듈과, 제2 사용자 입력에 따라서 동작된 각 모듈은, 각각 동일한 역할 및 처리를 수행하는지에 따라서, 서로 대응될 수 있다. 일 예로, 제1 사용자 입력에 따라서, 음성 인식을 수행하는 ASR 모듈과, 제2 사용자 입력에 따라서, 상기 ASR 모듈과, 동일한 처리를 수행하는 모듈인, 음성 인식을 수행하는 ASR 모듈이 서로 대응될 수 있다.

일 실시 예에 의한 프로세서(1300)는, 제1 사용자 입력에 따라서 동작된 적어도 하나의 모듈 중 제1 모듈의 입출력 정보를 획득하고, 제1 모듈의 입력 정보에 기초하여, 제2 사용자 입력에 따라서 동작된 적어도 하나의 모듈 중 제1 모듈과 대응되는 제1' 모듈에 관한 정보를 식별할 수 있다. 일 실시 예에 의한 제1 모듈과 제1' 모듈은, 서로 동일한 처리를 수행하는 모듈일 수 있으나, 모듈의 인공지능 모델 또는 엔진이 갱신되거나, 수정되는 등의 다양한 원인으로 인해, 서로 차이가 존재하는 모듈일 수 있다.

예를 들면, 제1 모듈의 입력 정보와 동일한 입력 정보를 가지는 제2 응답의 모듈에 관한 정보가 제1' 모듈에 관한 정보로 식별될 수 있다. 또한, 제1 모듈의 입력 정보가 변환된 해쉬 값과, 동일한 해쉬 값을 포함하는 제2 사용자 입력에 따라 동작된 모듈에 관한 정보가, 제1' 모듈에 관한 정보로서 식별될 수 있다. 프로세서(1300)는, 제1 모듈의 출력 정보와, 제1' 모듈에 대한 출력 정보가 다른 경우, 제1 모듈을 변화된 모듈로 식별할 수 있다.

일 실시 예에 의한 프로세서(1300)는 제1 사용자 입력에 따라서 동작된 적어도 하나의 모듈에 대해 우선 순위를 결정하고, 결정된 우선 순위에 따라서, 제1 사용자 입력에 따라서 동작된 적어도 하나의 모듈에서 처리된 정보와 제2 사용자 입력에 따라서 동작된 적어도 하나의 모듈에서 처리된 정보를 순차적으로 비교할 수 있다. 프로세서(1300)는, 비교 결과에 기초하여, 제1 응답에서, 변화된 모듈을 식별할 수 있다.

일 실시 예에 의한 프로세서(1300)는, 변화된 모듈에 기초하여, 제1 응답이 제2 응답과 다른 이유를 추론하고, 추론된 이유를 포함하는, 제1 응답이 변화된 이유에 관한 정보를 생성하여 사용자에게 제공할 수 있다.

일 실시 예에 의한 프로세서(1300)는, 제1 응답의 변화에 관련된 사용자의 질의에 대하여, 제1 응답이 변화된 이유에 관한 정보를 포함하는 응답이 생성될 수 있도록, 인공지능 모델을 미리 학습해둘 수 있다. 예를 들면, 프로세서(1300)는, 변화된 모듈에 기초하여, 사용자 입력에 대한 응답을 생성하는데 이용되는 적어도 하나의 인공지능 모델을 미리 학습해둘 수 있다. 프로세서(1300)는, 미리 학습된 인공지능 모델에 기초하여, 제1 응답의 변화에 관련된 질의를 포함하는 사용자 입력이 수신됨에 따라, 제1 응답이 변화된 이유에 관한 정보를 포함하는 응답을 출력함으로써, 사용자에게 제1 응답이 변화된 이유에 관한 정보를 사용자에게 제공할 수 있다.

센싱부(1400)는, 다양한 센서를 포함할 수 있고, 전자 장치(1000)의 상태 또는 전자 장치(1000) 주변의 상태를 감지하고, 감지된 상태 정보를 프로세서(1300)로 전달할 수 있다.

센싱부(1400)는, 예를 들어, 지자기 센서(Geomagnetic sensor)(1410), 가속도 센서(Acceleration sensor)(1420), 온/습도 센서(1430), 적외선 센서(1440), 자이로스코프 센서(1450), 위치 센서(예컨대, GPS)(1460), 기압 센서(1470), 근접 센서(1480), 및 RGB 센서(illuminance sensor)(1490) 중 적어도 하나를 포함할 수 있으나, 이에 한정되는 것은 아니다.

일 실시 예에 의한 센싱부(1400)는, 응답이 변화된 이유에 관한 정보를 제공하는데 있어 필요한 데이터를 감지할 수 있다. 예를 들어, 센싱부(1400)는 사용자 입력의 의도를 판단하는데 이용될 수 있는, 사용자에 관한 다양한 정보를 감지할 수 있다.

통신부(1500)는, 전자 장치(1000)가 서버(2000) 또는 외부 장치(미도시)와 통신을 하게, 각각이 다양한 통신 회로를 포함하는, 하나 이상의 구성요소를 포함할 수 있다. 예를 들어, 통신부(1500)는, 근거리 통신부(1510), 이동 통신부(1520), 방송 수신부(1530)를 포함할 수 있다.

근거리 통신부(short-range wireless communication unit)(1510)는, 블루투스 통신부, BLE(Bluetooth Low Energy) 통신부, 근거리 무선 통신부(Near Field Communication unit), WLAN(와이파이) 통신부, 지그비(Zigbee) 통신부, 적외선(IrDA, infrared Data Association) 통신부(미도시), WFD(Wi-Fi Direct) 통신부, UWB(ultra wideband) 통신부, Ant+ 통신부 등과 같이, 각각이 다양한 통신 회로를 포함하는, 다양한 통신부를 포함할 수 있으나, 이에 한정되는 것은 아니다.

이동 통신부(1520)는, 다양한 통신 회로를 포함 할 수 있고, 이동 통신망 상에서 기지국, 외부의 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 여기에서, 무선 신호는, 음성 호 신호, 화상 통화 호 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.

방송 수신부(1530)는, 다양한 회로를 포함할 수 있고, 방송 채널을 통하여 외부로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 구현 예에 따라서 전자 장치(1000)가 방송 수신부(1530)를 포함하지 않을 수도 있다.

일 실시 예에 의한, 통신부(1500)는 응답이 변화된 이유에 관한 정보를 제공하는데 필요한 데이터를 송수신할 수 있다.

A/V(Audio/Video) 입력부(1600)는 다양한 A/V 입력 회로를 포함할 수 있고, 오디오 신호 또는 비디오 신호 입력을 위한 것으로, 이에는 카메라(1610)와 마이크로폰(1620) 등이 예를 들면 포함될 수 있지만, 전술한 예에 한정되는 것은 아니다. 카메라(1610)는 화상 통화모드 또는 촬영 모드에서 이미지 센서를 통해 정지영상 또는 동영상 등의 화상 프레임을 얻을 수 있다. 이미지 센서를 통해 캡쳐된 이미지는 프로세서(1300) 또는 별도의 이미지 처리부(미도시)를 통해 처리될 수 있다. 예를 들어, 카메라(1610)는 사용자의 제스처 입력을 수신하는데 이용될 수 있다.

마이크로폰(1620)은, 외부의 음향 신호를 입력 받아 전기적인 음성 데이터로 처리한다. 예를 들어, 마이크로폰(1620)은 사용자의 음성 입력을 수신하는데 이용될 수 있다.

메모리(1700)는, 프로세서(1300)의 처리 및 제어를 위한 프로그램을 저장할 수 있고, 전자 장치(1000)로 입력되거나 전자 장치(1000)로부터 출력되는 데이터를 저장할 수도 있다.

일 실시 예에 의한 메모리(1700)는 응답이 변화된 이유에 관한 정보를 제공하는데 필요한 데이터를 저장할 수 있다. 예를 들면, 메모리(1700)는 전자 장치(1000)에서 출력된 다양한 응답에 대한 이력 정보를 저장할 수 있다.

메모리(1700)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM, Random Access Memory) SRAM(Static Random Access Memory), 롬(ROM, Read-Only Memory), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.

메모리(1700)에 저장된 프로그램들은 그 기능에 따라 복수 개의 모듈들로 분류할 수 있는데, 예를 들어, UI 모듈(1710), 터치 스크린 모듈(1720), 알림 모듈(1730) 등으로 분류될 수 있다.

UI 모듈(1710)은, 애플리케이션 별로 전자 장치(1000)와 연동되는 특화된 UI, GUI 등을 제공할 수 있다. 터치 스크린 모듈(1720)은 사용자의 터치 스크린 상의 터치 제스처를 감지하고, 터치 제스처에 관한 정보를 프로세서(1300)로 전달할 수 있다. 일부 실시 예에 따른 터치 스크린 모듈(1720)은 터치 코드를 인식하고 분석할 수 있다. 터치 스크린 모듈(1720)은 컨트롤러를 포함하는 별도의 하드웨어로 구성될 수도 있다.

터치스크린의 터치 또는 근접 터치를 감지하기 위해 터치스크린의 내부 또는 근처에 다양한 센서가 구비될 수 있다. 터치스크린의 터치를 감지하기 위한 센서의 일례로 촉각 센서가 있다. 촉각 센서는 사람이 느끼는 정도로 또는 그 이상으로 특정 물체의 접촉을 감지하는 센서를 말한다. 촉각 센서는 접촉면의 거칠기, 접촉 물체의 단단함, 접촉 지점의 온도 등의 다양한 정보를 감지할 수 있다.

사용자의 터치 제스처는 탭, 터치&홀드, 더블 탭, 드래그, 패닝, 플릭, 드래그 앤드 드롭, 스와이프 등을, 예를 들면, 포함할 수 있지만, 전술한 예에 한정되는 것은 아니다.

알림 모듈(1730)은 전자 장치(1000)의 이벤트 발생을 알리기 위한 신호를 발생할 수 있다.

도 4를 참조하면, 단계 410에서, 일 실시 예에 의한 전자 장치(1000)는 제1 사용자 입력에 따라, 적어도 하나의 모듈을 이용하여, 제1 응답을 출력할 수 있다.

예를 들어, 전자 장치(1000)는 사용자의 음성 입력이 수신됨에 따라, 음성 입력에 대해, 음성 인식을 수행하는 모듈(ex. ASR), 음성 인식 결과에 기초하여, 응답이 출력될 디바이스를 선택하는 모듈(ex. DD), 선택된 디바이스에 기초하여, 사용자의 음성 입력을 이해하는 모듈(ex. NLU), 이해 결과에 기초하여 응답을 생성하는 모듈(ex. NLG) 등을 이용함으로써, 사용자 입력에 대응하는 응답을 출력할 수 있다. 상술한 예에 한하지 않고, 전자 장치(1000)는 사용자 입력을 처리하기 위한 다양한 모듈을 이용하여, 응답을 출력할 수 있다.

단계 420에서, 전자 장치(1000)는, 제1 사용자 입력의 의도와 동일한 의도를 가진 제2 사용자 입력에 따라, 제1 응답과는 다른 제2 응답이 출력된 이력에 관한 정보를 획득할 수 있다.

일 실시 예에 의하면, 응답에 대한 이력 정보는, 각 모듈에 대한 입출력 정보를 포함할 수 있다. 상술한 예에 한하지 않고, 응답에 대한 이력 정보(이하, 응답 이력 정보)는, 응답과 관련된 다양한 종류의 정보를 포함할 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 제1 사용자 입력의 의도를 식별할 수 있다. 또한, 전자 장치(1000)는, 미리 저장된 응답 이력 정보에 포함된, 각 응답과 대응되는 사용자 입력의 의도를 식별할 수 있다.

예를 들면, 사용자 입력이 음성 입력인 경우, 의도는, 음성 입력을 이해하는 모듈(ex. NLU)의 출력 정보에 기초하여 식별될 수 있다. 사용자 입력에 대한 의도는, 사용자 입력의 특징을 추출하여, 의도를 획득할 수 있도록, 미리 학습된 인공지능 모델에 기초하여 식별될 수 있다. 상술한 예에 한하지 않고, 다양한 방법에 따라서, 제1 사용자 입력의 의도와 미리 저장된 응답 이력 정보에 포함된 사용자 입력의 의도가 식별될 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 응답 이력 정보에 포함된 각 모듈에 대한 입출력 정보 중 사용자 입력과 대응되는 정보, 예를 들면, 사용자 입력이 처리된 최초의 모듈(ex. ASR 모듈)에 대한 입력 정보에 기초하여, 제1 사용자 입력의 의도와 동일 유사한 의도를 가지고, 제1 응답과는 다른 응답이 출력된, 적어도 하나의 사용자 입력에 대해, 제2 사용자 입력으로 식별할 수 있다.

예를 들면, 제2 사용자 입력에 대응하는 제2 응답은, 제1 응답의 메시지와는 다른 메시지를 포함하거나, 제1 응답의 액션과는 다른 액션을 포함할 수 있다. 따라서, 일 실시 예에 의하면, 제1 사용자 입력의 의도와 동일 유사한 의도를 가지는 사용자 입력이어도, 응답이 제1 응답과 동일한 사용자 입력인 경우, 제2 사용자 입력으로 식별되지 않을 수 있다. 일 실시 예에 의한 응답 이력 정보에서, 제2 사용자 입력에 대응하는 제2 응답은, 제2 사용자 입력에 대응하는, 각 모듈에 대한 입출력 정보 중 제2 사용자 입력이 처리된 최후의 모듈(ex. NLG 모듈)에 대한 출력 정보에 기초하여, 식별될 수 있다.

상술한 예에 한하지 않고, 응답 이력 정보로서 저장된, 제2 사용자 입력 및 제2 응답은, 다양한 방법에 따라서, 식별될 수 있다.

단계 430에서, 일 실시 예에 의한 전자 장치(1000)는 단계 420에서 획득된 제2 응답이 출력된 이력에 관한 정보에 기초하여, 제1 사용자 입력에 따라서 동작된 적어도 하나의 모듈 중 제2 사용자 입력에 따라서 동작된 모듈과는 다르게 동작된, 변화된 모듈을 식별할 수 있다.

일 실시 예에 의한 전자 장치(1000)는 제2 응답의 이력 정보 중, 제2 사용자 입력에 따라서 동작된 적어도 하나의 모듈에 대한 입출력 정보 및 제1 사용자 입력에 따라서 동작된 적어도 하나의 모듈에 대한 입출력 정보를 비교함으로써, 제1 응답의 변화된 모듈을 식별할 수 있다. 일 실시 예에 의하면, 서로 대응되는 모듈들 간에, 출력 정보가 비교될 수 있다.

일 실시 예에 의하면, 제1 사용자 입력 및 제2 사용자 입력에 따라 동작된 모듈들에 관한 정보는, 각 모듈의 입력 정보가 동일한지 여부에 따라서 대응되거나, 각 모듈의 식별 정보에 따라서 대응될 수 있다.

예를 들면, 제1 사용자 입력에 따라 동작된 모듈 중 제1 모듈의 입력 정보에 기초하여, 제2 사용자 입력에 따라 동작된 모듈에 관한 정보 중 제1 모듈과 대응되는 제1' 모듈에 관한 정보가 식별될 수 있고, 제1 모듈의 출력 정보와 제1' 모듈에 대한 출력 정보가 다른 경우, 제1 모듈은 변화된 모듈로 판단될 수 있다.

일 실시 예에 의한 제1 모듈의 입력 정보는, 예를 들어, 해쉬 값으로 변환됨으로써, 제1' 모듈에 관한 정보가 식별될 수 있다. 일 실시 예에 의하면, 제2 응답의 모듈에 관한 정보 중 상기 변환된 해쉬 값과 동일한 해쉬 값을 포함하는 정보가 제1' 모듈에 관한 정보로서 식별될 수 있다.

일 실시 예에 의하면, 각 모듈에 대해 할당된 우선 순위에 따라서, 순차적으로 비교될 수 있으나, 이에 한하지 않고, 다양한 순서에 따라서, 비교될 수 있다.

일 실시 예에 의하면, 모듈들 간 입력 정보가 동일함에도, 출력 정보가 다른 모듈이 변화된 모듈로 식별될 수 있다. 일 실시 예에 의하면, 모듈들 간 입력 정보가 다르거나, 모듈들 간 입력 정보 및 출력 정보가 모두 같은 경우에는, 변화된 모듈로 식별되지 않을 수 있다. 상술한 예에 한하지 않고, 다양한 방법에 따라서, 제1 응답에서 이용된 모듈 중에서, 변화된 모듈이 식별될 수 있다.

단계 440에서, 일 실시 예에 의한 전자 장치(1000)는, 단계 430에서, 식별된 변화된 모듈에 기초하여, 제1 응답이 제2 응답과 다르게 변화된 이유에 관한 정보를 사용자에게 제공할 수 있다.

일 실시 예에 의하면, 제1 응답에서 변화된 모듈에 대하여, 제2 응답의 모듈과 다르게 변화된 이유가 추론될 수 있고, 추론된 결과에 따라서, 제1 응답이 제2 응답과 다르게 변화된 이유에 관한 정보가 사용자에게 제공될 수 있다.

일 실시 예에 의한 전자 장치(1000)는 제1 응답의 변화에 관련된 질의를 인식하고, 질의에 대한 적절한 응답이 생성될 수 있도록, 사용자 입력을 이해하거나, 응답을 생성하는데 이용되는 적어도 하나의 인공지능 모델을, 추론된 결과에 기초하여, 미리 학습해둘 수 있다. 일 실시 예에 의하면, 제1 응답의 변화와 관련된 정보에 기초하여, 질의를 이해하거나 응답을 생성하는 인공지능 모델이 미리 학습되어야, 제1 응답의 변화에 관련된 질의를 포함하는 사용자 입력을 이해하고, 상기 질의에 대한 적절한 응답 생성이 가능할 수 있다. 따라서, 일 실시 예에 의한 전자 장치(1000)는 미리 학습된 인공지능 모델을 이용하여, 사용자 입력에 포함된 제1 응답의 변화에 관련된 질의를 이해하고, 질의에 대한 응답을 생성할 수 있다.

도 5를 참조하면, 전자 장치(1000)는 사용자로부터 제1 사용자 입력(510)을 수신할 수 있다. 또한, 전자 장치(1000)는 제1 사용자 입력(510)에 따라 적어도 하나의 모듈을 이용하여 제1 응답(540)을 출력할 수 있다. 예를 들면, '음악 A 틀어줘'의 음성을 포함한, 제1 사용자 입력(510)에 따라서, '음악을 틀었습니다'를 포함하는 음성 메시지와, AI 스피커를 통해 음악 A를 재생하는 액션이 출력됨으로써, 제1 응답(540)이 출력될 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 541에서, 제1 사용자 입력(510)에 따른, 제1 응답이 출력됨에 따라서, 제1 사용자 입력에 따라 동작된 적어도 하나의 모듈 중 변화된 모듈을 식별할 수 있다. 일 실시 예에 의한 전자 장치(1000)는, 미리 저장된 응답 이력 정보에서, 제1 사용자 입력(510)의 의도와 동일한 의도를 가진 제2 사용자 입력을 식별하고, 제2 사용자 입력에 따라 동작된 적어도 하나의 모듈에 관한 정보와 제1 사용자 입력에 따라 동작된 적어도 하나의 모듈에 관한 정보를 비교함으로써, 제1 응답의 변화된 모듈을 식별할 수 있다.

예를 들어, '음악 A 틀어줘'를 포함한 제1 사용자 입력(510)의 의도는, "음악 A 재생"인 것으로 판단될 수 있다. 응답 이력 정보에서, 제1 사용자 입력(510)의 의도와 동일한 의도를 가진, "음악 A 재생"을 요청하는 적어도 하나의 사용자 입력이 식별될 수 있다. 상기 식별된 적어도 하나의 사용자 입력 중 제1 응답(540)과 다른 응답, 예를 들면, AI 스피커 대신 TV로 음악 A가 재생되는 액션이, 응답으로서 출력된 사용자 입력이 제2 사용자 입력으로 식별될 수 있다.

542에서, 전자 장치(1000)는, 541에서 식별된 변화된 모듈에 기초하여, 제1 응답이 변화된 이유에 대하여 추론할 수 있다. 예를 들어, 제1 사용자 입력에 따라 동작된 적어도 하나의 모듈 중 DD 모듈이 변화된 모듈로 식별된 경우, DD 모듈의 출력 정보에 기초하여, 제2 응답과는 다르게 변화된 이유가 추론될 수 있다.

일 예로, DD 모듈의 출력 정보가, 제2 응답과는 달리, 제1 응답에서는, TV에서, AI 스피커로 변경되었음이 식별될 수 있고, 이에 기초하여, 제1 응답이 변화된 이유가 추론될 수 있다. 예를 들면, AI 스피커 위치가 변경되어, TV보다 AI 스피커가 사용자에게 더 가까이에 위치하게 되었고, AI 스피커의 음질이 TV의 음질보다 더 좋아서, 음악을 재생하기에 AI 스피커가 더 적합한 장치인 것으로 판단되었음이 제1 응답이 변화된 이유로서, 추론될 수 있다.

543에서, 전자 장치(1000)는, 추론된 결과에 기초하여, 사용자 입력에 포함된 질의를 이해하거나, 응답을 생성하기 위한 적어도 하나의 인공지능 모델을 미리 학습해 둘 수 있다. 일 실시 예에 의하면, 변화된 제1 응답에 관한 정보가 질의를 이해하거나, 응답을 생성하는데 이용되는 적어도 하나의 인공지능 모델에 반영되도록, 적어도 하나의 인공지능 모델이 갱신되어야, 적어도 하나의 인공지능 모델에 기초한, 제1 응답이 변화된 이유에 관한 사용자의 질의를 이해하고, 질의에 대한 응답 생성이 가능할 수 있다.

일 실시 예에 의하면, 제1 응답(540)이 출력된 이후에, 제1 응답이 변화된 이유에 관한 질의를 포함하는, 사용자 입력(520)이, 추가로 수신될 수 있다. 전자 장치(1000)는, 미리 학습된 적어도 하나의 인공지능 모델에 기초하여, 사용자 입력(520)을 이해하고, 사용자 입력(520)에 대한 응답(550)을 생성하여 출력할 수 있다.

예를 들면, 사용자 입력(520)에 대하여, 제2 응답이 출력될 때와는 달리, 제1 응답이 출력될 때에는, AI 스피커의 위치가 변경되었고, AI 스피커의 성능이 TV보다 더 좋다고 판단됨에 따라서, TV 대신 AI 스피커를 통해 제1 응답이 출력되었음을 설명하는 취지의 응답(550)이 사용자에게 제공될 수 있다.

따라서, 530과 같이, 일 실시 예에 의한 사용자는, 응답(550)에 기초하여, 제1 응답이 제2 응답과는 다르게 변화된 이유를 이해할 수 있다.

도 6은 다양한 실시 예들에 의한 사용자의 음성 입력에 대하여 적어도 하나의 모듈이 이용되는 일 예를 나타낸 도면이다.

도 6을 참조하면, 일 실시 예에 의한 사용자의 제1 음성 입력은, ASR(610), DD(620), DC(630), NLU(640), DM(650) 및 NLG(660)의 모듈이 순차적으로 이용됨으로써, 처리될 수 있다. 제1 음성 입력이 처리됨에 따라, 제1 응답이 출력될 수 있다.

일 실시 예에 의하면, ASR(610), DD(620), DC(630), NLU(640), DM(650) 및 NLG(660) 순서로, 모듈이 처리될 수 있으나, 이에 한하지 않고, 다양한 순서로 모듈들이 처리될 수 있다. 예를 들면, ASR(610), DC(630), NLU(640), DM(650), DD(620) 및 NLG(660) 순서로, 처리될 수도 있다. 또한, ASR(610), DC(630), DD(620), NLU(640), DM(650) 및 NLG(660) 순서로, 처리될 수 있다. 또한, DD(620) 및 DC(630)의 모듈이 결합될 수도 있다.

이하에서는, ASR(610), DD(620), DC(630), NLU(640), DM(650) 및 NLG(660) 순서로, 처리되는 예시를 기준으로 설명하였다.

일 실시 예에 의하면, 사용자의 제1 음성 입력과 동일한 의도를 가진 다른 제2 사용자 입력에 따라서 제2 응답이 출력된 이력에 관한 정보에 기초하여, 제1 음성 입력에 대하여 수행된 ASR(610), DD(620), DC(630), NLU(640), DM(650) 및 NLG(660)의 모듈 중 제2 사용자 입력에 따른 모듈의 동작과 다르게 동작된 모듈이 식별될 수 있다. 변화된 모듈로 식별된 모듈에 기초하여, 제1 응답이 제2 응답과 다른 이유가 추론될 수 있다.

일 실시 예에 의하면, 제1 응답이 출력된 이후에 수신된, 제1 응답이 변화된 이유를 문의하는 사용자의 질의에 대응하여, 전자 장치(1000)는, 사용자의 질의에 대한 응답을 상기 판단된 결과에 기초하여 사용자에게 제공할 수 있다.

일 실시 예에 의하면, 제1 응답이 출력된 이후에 수신된, 사용자 입력에 대한 사용자 의도가, 이전에 출력된 제2 응답과 동일한 응답의 출력을 요청하는 것으로 판단된 경우, 전자 장치(1000)는 상기 추론된 결과에 기초하여, 제2 응답과 동일한 응답이 출력될 수 있는 추천 발화를 사용자에게 제공할 수 있다.

일 실시 예에 의한 ASR(610) 모듈은, 사용자의 음성 입력을 인식하여, 사용자의 음성 입력과 대응되는 텍스트를 획득할 수 있다. 예를 들어, 사용자의 음성 입력에 대해 ASR(610) 모듈이 처리된 결과, '음악 A 틀어줘'가 음성 인식 결과로 획득될 수 있다.

일 실시 예에 의하면, 제1 사용자 입력 및 제2 사용자 입력에 대해 각각 수행된 ASR(610) 모듈에 대한 입출력 정보가 서로 비교됨으로써, 제1 사용자 입력에 따라 동작된 모듈 중 변화된 모듈이 식별될 수 있다. 예를 들면, 제1 사용자 입력에 대해 수행된 ASR(610) 모듈의 입력 정보 및 제2 사용자 입력에 대해 수행된 ASR(610) 모듈의 입력 정보가 비교될 수 있다. 또한, 제1 사용자 입력에 대해 수행된 ASR(610) 모듈의 출력 정보 및 제2 사용자 입력에 대해 수행된 ASR(610) 모듈의 출력 정보가 비교될 수 있다.

일 실시 예에 의하면, 입력 정보가 서로 동일 유사하나, 출력 정보는 서로 다른 경우, ASR(610) 모듈이 변화된 모듈로 식별될 수 있다. 예를 들어, ASR(610)에 입력된 음성 입력이 각각 동일 유사하나, ASR(610)의 처리 결과 출력된 텍스트가 각각 다른 경우, ASR(610) 모듈이 변화된 모듈로 식별될 수 있다.

일 실시 예에 의하면, 변화된 모듈인, 제1 사용자 입력 및 제2 사용자 입력에 대해 수행된 ASR(610) 모듈에 기초하여, 제1 응답이 제2 응답과 다른 이유가 추론될 수 있다. 예를 들면, ASR(610) 모듈에 쓰인 음성 인식 모델이 업데이트됨이 제1 응답의 변화 이유로서 추론될 수 있다. 상술한 예에 한하지 않고, ASR(610) 모듈의 변화 이유로, 다양한 원인들이 추론될 수 있다.

일 실시 예에 의하면, 상기 추론된 이유에 기초하여, NLU(640)가 갱신됨으로써, 전자 장치(1000)는 제1 응답이 출력된 이후에 수신된, 제1 응답이 변화된 이유를 문의하는 사용자의 질의를 이해하고, 이에 대한 응답을 출력할 수 있다. 예를 들면, NLU(640)의 도메인 중, 사용자의 질의를 이해하는데 이용될 수 있는 질의응답(QA; question and answer) 도메인의 인공지능 모델이 갱신될 수 있다. 상술한 예에 한하지 않고, 전자 장치(1000)에서, 제1 응답이 변화된 이유를 문의하는 사용자의 질의에 대하여, 응답이 생성되는데 이용될 수 있는, 다양한 구성들, 예를 들면, DD(620), DC(630), DM(650) 등에서 이용되는 인공지능 모델들이, 상기 추론된 이유에 기초하여, 갱신될 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 제1 응답이 변화된 이유를 문의하는 사용자의 질의에 대해, 음성 인식 모델이 갱신됨에 따라, 제1 응답이 변화되었음을 나타내는 응답 메시지를 출력할 수 있다.

일 실시 예에 의하면, 제1 응답이 출력된 이후에 수신된, 사용자 입력에 대한 사용자 의도가, 이전에 출력된 제2 응답과 동일한 응답의 출력을 요청하는 것으로 판단된 경우, 전자 장치(1000)는 상기 추론된 이유에 기초하여, 제2 응답과 동일한 응답이 출력될 수 있는 추천 발화를 사용자에게 제공할 수 있다. 예를 들면, 제2 응답과 동일한 응답이 출력될 수 있는 추천 발화가 사용자에게 제공될 수 있다.

일 실시 예에 의한 DD(620) 모듈은, 사용자의 음성 입력과 대응되는 텍스트에 기초하여, 응답으로서의 액션이 수행될 디바이스를 선택할 수 있다. 예를 들어, 음성 입력과 대응되는 텍스트에 기초하여, DD(620) 모듈에 의해, 음악 A가 재생될 디바이스로서, AI 스피커가 선택될 수 있다.

일 실시 예에 의하면, 제1 사용자 입력 및 제2 사용자 입력에 대해 각각 수행된 DD(620) 모듈에 대한 입출력 정보가 서로 비교됨으로써, 제1 응답의 모듈 중 변화된 모듈이 식별될 수 있다. 예를 들어, DD(620) 모듈에 입력된 텍스트가 서로 동일하나, DD(620) 모듈의 수행 결과, 선택된 디바이스가 서로 다른 경우, DD(620) 모듈이 변화된 모듈로 식별될 수 있다.

일 실시 예에 의하면, 변화된 모듈인, 제1 사용자 입력 및 제2 사용자 입력에 따라 동작된 DD(620) 모듈에 기초하여, 제1 응답이 제2 응답과 다른 이유가 추론될 수 있다. 예를 들면, DD(620) 모듈에 쓰인 인공지능 모델의 변경 여부, 각 디바이스의 위치 변화, 사용자가 선호하는 디바이스의 변화 등이 제1 응답의 변화 이유로서 추론될 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 제1 응답이 변화된 이유를 문의하는 사용자의 질의에 대해, 인공지능 모델의 변경 여부, 각 디바이스의 위치 변화, 사용자가 선호하는 디바이스의 변화 등의 다양한 원인에 따라서, 제1 응답이 변화되었음을 나타내는 응답 메시지를 출력할 수 있다.

일 실시 예에 의하면, 제1 응답이 출력된 이후에 수신된, 사용자 입력에 대한 사용자 의도가, 이전에 출력된 제2 응답과 동일한 응답의 출력을 요청하는 것으로 판단된 경우, 전자 장치(1000)는 상기 추론된 이유에 기초하여, 제2 응답과 동일한 응답이 출력될 수 있는 추천 발화를 안내하는 가이드 메시지를 사용자에게 제공할 수 있다. 예를 들면, 음악 재생을 요청하는 사용자 입력이 음악이 재생될 장치(ex. TV)에 관한 정보를 포함하도록, 추천 발화를 안내하는 가이드 메시지가 사용자에게 제공될 수 있다.

일 실시 예에 의한 DC(630) 모듈은, 액션이 수행될 디바이스로 선택된 장치에 기초하여, 도메인을 선택할 수 있다. 일 실시 예에 의하면, 선택된 도메인에 기초하여, NLU(640) 모듈에서 사용자의 음성 입력과 대응되는 텍스트가 이해될 수 있다. 예를 들어, DD(620) 모듈에 의해, AI 스피커가 선택된 경우, AI 스피커와 관련하여, 텍스트를 이해할 수 있는 인공지능 모델에 기초하여, NLU(640) 모듈이 수행될 수 있다. 이 경우, AI 스피커에서 수행될 수 있는 모듈들 중 하나가 응답에 대한 액션으로서 출력될 수 있도록, DC(630) 모듈에서, 사용자의 음성 입력을 이해하기 위한 인공지능 모델을 선택하는데 이용되는 도메인이 선택될 수 있다.

일 실시 예에 의하면, 제1 사용자 입력 및 제2 사용자 입력에 대해 각각 수행된 DC(630) 모듈에 대한 입출력 정보가 서로 비교됨으로써, 제1 사용자 입력에 따라 동작된 모듈 중 변화된 모듈이 식별될 수 있다. 예를 들어, DC(630) 모듈에 입력된, 액션이 수행될 디바이스에 관한 정보가 동일하나, DC(630) 모듈의 수행 결과, 선택된 도메인이 서로 다른 경우, DC(630) 모듈이 변화된 모듈로 식별될 수 있다.

일 실시 예에 의하면, 변화된 모듈인, 제1 사용자 입력 및 제2 사용자 입력에 따라 동작된 DC(630) 모듈에 기초하여, 제1 응답이 제2 응답과 다른 이유가 추론될 수 있다. 예를 들면, DC(630) 모듈에서 도메인을 선택하는데 이용된 인공지능 모델의 변경 여부, 선택 가능한 도메인들의 변화 등이 제1 응답의 변화 이유로서 추론될 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 제1 응답이 변화된 이유를 문의하는 사용자의 질의에 대해, 도메인을 선택하는데 이용된 인공지능 모델의 변경 여부, 선택 가능한 도메인들의 변화 등의 다양한 원인에 따라서, 제1 응답이 변화되었음을 나타내는 응답 메시지를 출력할 수 있다.

일 실시 예에 의하면, 제1 응답이 출력된 이후에 수신된, 사용자 입력에 대한 사용자 의도가, 이전에 출력된 제2 응답과 동일한 응답의 출력을 요청하는 것으로 판단된 경우, 전자 장치(1000)는 DC(630) 모듈의 변화 이유에 기초하여, 제2 응답과 동일한 응답이 출력될 수 있는 추천 발화를 사용자에게 제공할 수 있다.

일 실시 예에 의한 NLU(640) 모듈은, 선택된 도메인에 기초하여, 사용자의 음성 입력과 대응되는 텍스트를 이해할 수 있다. 일 실시 예에 의하면, 각 도메인 별로 존재하는 텍스트를 이해하기 위한 복수 개의 인공지능 모델에 기초하여, NLU(640) 모듈이 수행될 수 있다. 예를 들어, NLU(640) 모듈에 의해, 텍스트로부터 이해되는 사용자의 의도가 판단될 수 있다. 일 실시 예에 의하면, NLU(640) 모듈에 의해 판단된 사용자의 의도에 따라서, 응답이 출력될 수 있다.

일 실시 예에 의하면, 제1 사용자 입력 및 제2 사용자 입력에 대해 각각 수행된 NLU(640) 모듈에 대한 입출력 정보가 서로 비교됨으로써, 제1 응답의 모듈 중 변화된 모듈이 식별될 수 있다. 예를 들어, NLU(640) 모듈에 입력된 도메인 선택 결과는 동일하나, NLU(640) 모듈의 수행 결과, 서로 다른, 텍스트의 이해된 결과가 출력된 다른 경우, NLU(640) 모듈이 변화된 모듈로 식별될 수 있다.

일 실시 예에 의하면, 변화된 모듈인, 제1 사용자 입력 및 제2 사용자 입력에 따라 동작된 NLU(640) 모듈에 기초하여, 제1 응답이 제2 응답과 다른 이유가 추론될 수 있다. 예를 들면, NLU(640) 모듈에서 텍스트를 이해하는데 쓰인 인공지능 모델의 변경 여부가 제1 응답의 변화 이유로서 추론될 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 제1 응답이 변화된 이유를 문의하는 사용자의 질의에 대해, 텍스트를 이해하는데 쓰인 인공지능 모델의 변경 여부 등의 다양한 원인에 따라서, 제1 응답이 변화되었음을 나타내는 응답 메시지를 출력할 수 있다.

일 실시 예에 의하면, 제1 응답이 출력된 이후에 수신된, 사용자 입력에 대한 사용자 의도가, 이전에 출력된 제2 응답과 동일한 응답의 출력을 요청하는 것으로 판단된 경우, 전자 장치(1000)는 NLU(640) 모듈의 변화 이유에 기초하여, 제2 응답과 동일한 응답이 출력될 수 있는 추천 발화를 사용자에게 제공할 수 있다.

일 실시 예에 의한 DM(650) 모듈은, 음성 입력과 대응되는 텍스트를 이해한 결과에 기초하여, 답변을 생성할 수 있다. 일 실시 예에 의하면, 대화를 생성하기 위한 인공지능 모델에 기초하여, DM(650) 모듈이 수행될 수 있다. 예를 들어, NLU(640) 모듈의 처리 결과에 기초하여 획득된 사용자의 의도에 기초하여, DM(650) 모듈에 의해, 사용자 입력에 대응하는 답변 정보가 생성될 수 있다.

일 실시 예에 의하면, 제1 사용자 입력 및 제2 사용자 입력에 대해 각각 수행된 DM(650) 모듈에 대한 입출력 정보가 서로 비교됨으로써, 제1 사용자 입력에 따라 동작된 모듈 중 변화된 모듈이 식별될 수 있다. 예를 들어, DM(650) 모듈에 입력된 음성 입력에 대한 사용자의 의도는 동일하나, DM(650) 모듈의 수행 결과, 사용자 입력에 대응하는 답변 정보가 서로 다른 경우, DM(650) 모듈이 변화된 모듈로 식별될 수 있다.

일 실시 예에 의하면, 변화된 모듈인, 제1 사용자 입력 및 제2 사용자 입력에 대한 DM(650) 모듈에 기초하여, 제1 응답이 제2 응답과 다른 이유가 추론될 수 있다. 예를 들면, DM(650) 모듈에서 답변 정보를 생성하는데 쓰인 인공지능 모델의 변경 여부가 응답의 변화 이유로서 추론될 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 제1 응답이 변화된 이유를 문의하는 사용자의 질의에 대해, 답변 정보를 생성하는데 쓰인 인공지능 모델의 변경 여부 등의 다양한 원인에 따라서, 제1 응답이 변화되었음을 나타내는 응답 메시지를 출력할 수 있다.

일 실시 예에 의하면, 제1 응답이 출력된 이후에 수신된, 사용자 입력에 대한 사용자 의도가, 이전에 출력된 제2 응답과 동일한 응답의 출력을 요청하는 것으로 판단된 경우, 전자 장치(1000)는 DM(650) 모듈의 변화 이유에 기초하여, 제2 응답과 동일한 응답이 출력될 수 있는 추천 발화를 사용자에게 제공할 수 있다.

일 실시 예에 의한 NLG(660) 모듈은, DM(650) 모듈의 처리 결과로 획득된 답변 정보에 기초하여, 응답 메시지를 생성할 수 있다. 일 실시 예에 의하면, 답변 정보에 따라서, 응답 메시지를 생성하기 위한 인공지능 모델에 기초하여, NLG(660) 모듈이 처리될 수 있다. 예를 들면, DM(650) 모듈의 처리 결과인 답변 정보에 기초하여, 자연어가 생성됨으로써, 응답 메시지가 생성될 수 있다.

일 실시 예에 의하면, 제1 사용자 입력 및 제2 사용자 입력에 대해 각각 수행된 NLG(660) 모듈에 대한 입출력 정보가 서로 비교됨으로써, 제1 사용자 입력에 따라 동작된 모듈 중 변화된 모듈이 식별될 수 있다. 예를 들어, NLG(660) 모듈에 입력된 답변 정보는 동일하나, NLG(660) 모듈의 수행 결과, 생성된 응답 메시지가 서로 다른 경우, NLG(660) 모듈이 변화된 모듈로 식별될 수 있다.

일 실시 예에 의하면, 변화된 모듈인, 제1 사용자 입력 및 제2 사용자 입력에 대한 각각의 NLG(660) 모듈에 기초하여, 제1 응답이 제2 응답과 다른 이유가 추론될 수 있다. 예를 들면, NLG(660) 모듈에서 응답 메시지를 생성하는데 쓰인 인공지능 모델의 변경 여부가 제1 응답의 변화 이유로서 추론될 수 있다.

일 실시 예에 의한 전자 장치(1000)는, 제1 응답이 변화된 이유를 문의하는 사용자의 질의에 대해, 응답 메시지를 생성하는데 쓰인 인공지능 모델의 변경 여부 등의 다양한 원인에 따라서, 제1 응답이 변화되었음을 나타내는 응답 메시지를 출력할 수 있다.

일 실시 예에 의하면, 제1 응답이 출력된 이후에 수신된, 사용자 입력에 대한 사용자 의도가, 이전에 출력된 제2 응답과 동일한 응답의 출력을 요청하는 것으로 판단된 경우, 전자 장치(1000)는 NLG(660) 모듈의 변화 이유에 기초하여, 제2 응답과 동일한 응답이 출력될 수 있는 추천 발화를 사용자에게 제공할 수 있다.

다만, 일 실시 예에 따라, DD(620)의 처리 순서가 변경된, ASR(610), DC(630), NLU(640), DM(650), DD(620) 및 NLG(660) 순서로 모듈이 처리되는 경우, DD(620)는, DM(650)에서 출력된 답변 정보에 기초하여 수행될 수 있다. 예를 들면, DD(620)에서는, 답변 정보에 따라서, 액션이 수행될 디바이스가 선택될 수 있다. NLG(660)에서는, DM(650)에서 출력된 답변 정보에 기초하여, DD(620)에서 선택된 디바이스에 적합한 응답 메시지가 생성될 수 있다.

도 7은 다양한 실시 예들에 의한 제1 사용자 입력에 따라 동작된 모듈 중 변화된 모듈을 식별하는 예시적인 방법을 나타낸 순서도이다.

도 7을 참조하면, 단계 710에서, 일 실시 예에 의한 전자 장치(1000)는, 제1 사용자 입력에 따라 동작된 모듈 중 어느 하나의 모듈인, 현재 모듈의 입력 정보를 해쉬 값으로 변환할 수 있다. 일 실시 예에 의하면, 우선 순위에 따라서, 각 모듈에 대해 변화된 모듈인지 여부가 판단될 수 있다. 일 실시 예에 의한 전자 장치(1000)는, 우선 순위에 따라 결정된 현재 모듈에 대해, 변화된 모듈인지 여부가 단계 720 이하의 과정을 통하여 판단될 수 있다.

일 실시 예에 의하면, 제1 응답이 출력되는데 이용된 모듈 중, 우선 순위에 따라 결정된 현재 모듈에 대한 입력 정보가 해쉬 값으로 변환될 수 있다. 일 실시 예에 의한 해쉬 값은, 입력 정보와 동일한 입력 정보를 보다 쉽게 검색하기 위한 형태로 변환된 값이다. 예를 들어, 해쉬 값은 문자와 숫자를 함께 포함할 수 있는 입력 정보와는 달리 숫자 값만을 포함할 수 있다. 상술한 예에 한하지 않고, 입력 정보는, 해쉬 값 대신 다른 값으로 변환되어, 이전 응답에서 대응되는 모듈을 찾는데 이용될 수 있다.

일 실시 예에 의한 제2 응답은, 제1 응답의 사용자 입력과 동일한 의도를 가진 사용자 입력인, 제2 사용자 입력에 따라 출력된 응답으로, 제1 응답과는 다른 액션 또는 다른 메시지를 포함하는 응답일 수 있다. 일 실시 예에 의하면, 응답 이력으로 저장된 복수의 응답들 중에서, 제1 응답의 사용자 입력과 동일한 의도를 가진 제2 사용자 입력에 따라 출력된 응답이 제2 응답으로 식별된 후, 상기 제2 응답에 기초하여, 단계 710 이하의 동작이 수행될 수 있다.

단계 720에서, 일 실시 예에 의한 전자 장치(1000)는, 제2 사용자 입력에 따라 동작된 모듈에 관한 정보 중 단계 710에서 변환된 해쉬 값과 동일한 해쉬 값을 포함하는 정보가 존재하는지 여부가 판단될 수 있다. 일 실시 예에 의한 해쉬 값은, 각 모듈에 대한 입력 정보가 변환된 값일 수 있다.

따라서, 일 실시 예에 의하면, 입력 정보의 해쉬 값에 기초하여, 현재 모듈과 대응되는 제2 사용자 입력에 따라 동작된 모듈에 관한 정보가 식별될 수 있다. 또한, 일 실시 예에 의하면, 해쉬 값을 이용함으로써, 보다 빠른 비교 판단이 가능함에 따라, 변화된 모듈을 판단하는데 소요될 수 있는 연산량이 감소될 수 있다.

일 실시 예에 의한 각각의 모듈들은, 각 모듈에서 이용되는 엔진, 인공지능 모듈에 따라, 각 모듈에서 처리될 수 있는, 서로 다른 정보가 입력될 수 있다. 따라서, 일 실시 예에 의하면, 각 모듈에 대한 식별 정보 대신, 각 모듈에 대한 입력 정보에 기초하여, 현재 모듈과 대응되는 제2 사용자 입력에 따라 동작된 모듈에 관한 정보가 응답 이력 정보에서 식별될 수 있다. 상술한 예에 한하지 않고, 현재 모듈과 대응되는 제2 사용자 입력에 따라 동작된 모듈에 관한 정보를 식별하는 동작은, 입력 정보를 이용하는 방법뿐만 아니라, 다양한 방법에 따라서, 수행될 수 있다. 예를 들면, 각 모듈의 식별 정보에 따라서, 현재 모듈과 대응되는 제2 사용자 입력에 따라 동작된 모듈이 식별될 수도 있다.

단계 720에서, 제2 사용자 입력에 따라 동작된 각 모듈에 관한 정보 중 단계 710에서 변환된 해쉬 값과 동일한 해쉬 값을 포함하는, 모듈에 관한 정보가 존재하지 않는 경우, 단계 760에서, 다음 우선 순위의 모듈이 선택될 수 있다. 현재 모듈에 대한 해쉬 값과 동일한 해쉬 값을 포함하는, 제2 사용자 입력에 따라 동작된 모듈에 관한 정보여도, 입력 정보가 현재 모듈의 입력 정보와 동일하지 않은 경우, 단계 760에서, 다음 우선 순위의 모듈이 선택될 수 있다. 일 실시 예에 의하면, 해쉬 값이 동일하더라도, 대응되는 입력 정보는 서로 동일하지 않을 수 있으므로, 해쉬 값으로, 대응되는 모듈에 관한 정보가 응답 이력 정보에서 먼저 검색된 후, 입력 정보 간 비교가 추가로 수행될 수 있다.

일 실시 예에 의하면, 모듈의 입력 정보가 이전의 사용자 입력에 따라 동작된 모듈의 입력 정보와 다른 경우, 모듈은, 변화된 모듈로 판단되지 않을 수 있다. 예를 들면, 현재 모듈 보다 먼저 제1 사용자 입력의 처리에 이용된 적어도 하나의 모듈(ex. 현재 모듈이 DD 모듈인 경우, ASR 모듈)의 동작이 변화됨에 따라, 현재 모듈의 입력 정보와 동일한 입력 정보를 포함하는 제2 사용자 입력에 따라 동작된 모듈에 관한 정보가 존재하지 않을 수 있다.

따라서, 일 실시 예에 의하면, 현재 모듈의 입력 정보와 동일한 입력 정보를 포함하는, 제2 사용자 입력에 따라 동작된 모듈에 관한 정보가 존재하지 않는 경우, 현재 모듈은, 변화된 모듈이 아닌 것으로 판단됨에 따라, 제1 사용자 입력에 따라 동작된 모듈 중, 단계 760에서 선택된 다음 우선 순위의 모듈에 대해 변화된 모듈인지 여부가 판단될 수 있다.

예를 들면, 현재 모듈이 최우선 순위인 경우, 단계 760에서, 두 번째 우선순위의 모듈이 선택될 수 있고, 단계 710에서, 선택된 두 번째 우선 순위의 모듈에 대한 입력 정보가 해쉬 값으로 변환된 후, 이하 단계에서, 두 번째 우선 순위의 모듈이 변화된 모듈인지 여부가 판단될 수 있다.

다만, 현재 모듈보다 먼저 사용자 입력의 처리에 이용된 적어도 하나의 모듈 중 하나가 변화된 모듈로 판단됨이 바람직하므로, 현재 모듈 다음 우선 순위의 모듈들 중, 현재 모듈보다 먼저 사용자 입력의 처리에 이용된 적어도 하나의 모듈이 먼저, 변화된 모듈인지 여부가 판단될 수 있다.

단계 730에서, 일 실시 예에 의한 전자 장치(1000)는, 단계 720에서 식별된 제2 사용자 입력의 모듈에 대한 출력 정보와, 현재 모듈에 대한 출력 정보를 비교하여, 단계 740에서, 모듈에 대한 출력 정보와 현재 모듈에 대한 출력 정보가 동일한지 여부를 판단할 수 있다.

단계 740에서, 출력 정보가 동일한 경우, 현재 모듈은, 변화된 모듈이 아닌 것으로 판단됨에 따라, 단계 760에서, 다음 우선 순위의 모듈에 대해 변화된 모듈인지 여부가 판단될 수 있다.

단계 740에서, 출력 정보가 다른 경우, 단계 750에서, 현재 모듈이 변화된 모듈인 것으로 판단될 수 있다.

일 실시 예에 의하면, 하나의 모듈이 변화되는 경우, 모듈의 출력 정보가 달라지고, 이후에 처리되는 모듈은, 달라진 출력 정보에 기초하여 수행되므로, 이후 모듈의 입력 정보 및 출력 정보가 모두 변화될 수 있다. 따라서, 일 실시 예에 의하면, 변화된 모듈이 판단될 때까지, 단계 710 내지 740의 동작이 반복하여 수행될 수 있고, 변화된 모듈이 판단된 경우, 변화된 모듈을 판단하기 위한 동작은 종료될 수 있다. 변화된 모듈로 판단된 결과에 기초하여, 제1 응답이 변화된 이유가 추론되어, 사용자에게 추론된 결과가 제공될 수 있다.

도 8은 다양한 실시 예들에 의한 제1 사용자 입력에 따라 동작된 모듈 중 변화된 모듈을 식별하는 예시적인 방법을 나타낸 순서도이다.

도 8을 참조하면, 단계 810에서, 일 실시 예에 의한 전자 장치(1000)는, 제1 사용자 입력에 따라 동작된 모듈 중 현재 모듈의 입력 정보를 해쉬 값으로 변환할 수 있다. 도 8에서는, 우선 순위에 따른 도 7의 동작과는 달리, 사용자 입력이 처리될 때 수행되는 순서에 따라서, 변화된 모듈인지 여부가 판단될 수 있다. 예를 들면, 사용자의 음성 입력이 가장 먼저 처리되는, ASR 모듈이 다른 모듈보다 먼저 변화된 모듈인지 여부가 판단될 수 있다.

단계 820에서, 일 실시 예에 의한 전자 장치(1000)는, 제2 사용자 입력에 따라 동작된 모듈에 관한 정보 중 단계 810에서 변환된 해쉬 값과 동일한 해쉬 값을 포함하는, 모듈에 관한 정보가 존재하는지 여부가 판단될 수 있다. 따라서, 일 실시 예에 의하면, 입력 정보의 해쉬 값에 기초하여, 현재 모듈과 대응되는 제2 응답의 모듈에 관한 정보가 응답 이력 정보에서 식별될 수 있다.

제2 사용자 입력의 모듈에 관한 정보 중 단계 810에서 변환된 해쉬 값과 동일한 해쉬 값을 포함하는, 모듈에 관한 정보가 존재하지 않는 경우, 단계 830에서, 현재 모듈보다 제1 사용자 입력을 처리하는데 먼저 이용된 모듈(ex. 현재 모듈이 DD 모듈인 경우, ASR 모듈)이 변화된 모듈로 판단될 수 있다.

다만, 변화된 모듈로 판단된, 제1 사용자 입력을 처리하는데 현재 모듈보다 먼저 이용된 모듈(이하, 이전 모듈)은, 현재 모듈에 대한 단계 810 및 820의 동작이 수행되기 이전에 먼저 변화된 모듈이 아닌 것으로 판단된 모듈일 수 있다. 예를 들면, 이전 모듈의 입출력 정보가 제2 사용자 입력의 모듈의 입출력 정보와 모두 동일하여, 변화된 모듈이 아닌 것으로 이미 판단되었으나, 현재 모듈의 입력 정보와 동일한 제2 사용자 입력에 따라 동작된 모듈이 존재하지 않는 경우, 현재 모듈 이전에 수행된 이전 모듈의 동작이 변화됨에 따라, 현재 모듈의 입력 정보가 변화된 것으로 판단될 수 있다. 일 예로, 이전 모듈의 출력 정보가 여러가지 요인에 의하여 변형된 후 현재 모듈에 입력되었거나, 이전 모듈의 출력 정보가 잘못 저장된 경우가 이에 해당될 수 있다.

예를 들어, DD 모듈이 단계 810에서, 현재 모듈로서, 입력 정보에 대한 해쉬 값이 획득되었으나, 단계 820에서, 제2 사용자 입력의 모듈 중 동일한 해쉬 값을 가진 모듈이 존재하지 않는 경우, 이전 모듈인, ASR 모듈이 변화된 모듈로 판단될 수 있다.

일 실시 예에 의한 변화된 모듈이 판단됨에 따라, 변화된 모듈을 판단하기 위한 동작은 종료되고, 변화된 모듈에 기초하여, 제1 응답이 변화된 이유가 추론될 수 있다.

단계 840에서, 일 실시 예에 의한 전자 장치(1000)는, 단계 830에서 식별된 제2 사용자 입력의 모듈에 대한 출력 정보와, 현재 모듈에 대한 출력 정보를 비교하여, 단계 850에서, 모듈에 대한 출력 정보와 현재 모듈에 대한 출력 정보가 동일한지 여부를 판단할 수 있다.

단계 850에서, 출력 정보가 동일한 경우, 현재 모듈은, 변화된 모듈이 아닌 것으로 판단됨에 따라, 단계 870에서 선택된 다음 순서의 모듈에 대해 변화된 모듈인지 여부가 판단될 수 있다. 일 실시 예에 의한 다음 순서의 모듈은, 제1 응답이 처리되는데 이용된 모듈 중 현재 모듈 다음 순서로 처리된 모듈(ex. 현재 모듈이 DD 모듈인 경우, DC 모듈)로 결정될 수 있다.

단계 850에서, 출력 정보가 다른 경우, 단계 860에서, 현재 모듈이 변화된 모듈인 것으로 판단될 수 있다.

일 실시 예에 의하면 현재 응답이 출력될 때, 동일한 의도의 사용자 입력에 대한 이전 응답과 현재 응답이 다른 이유를 미리 획득하여, 사용자에게 제공함으로써, 사용자가 현재 응답이 변화된 이유를 쉽게 파악할 수 있다.

기기로 읽을 수 있는 저장매체는, 비일시적(non-transitory) 저장매체의 형태로 제공될 수 있다. 여기서, '비일시적 저장매체'는 실재(tangible)하고, 신호(signal)(예: 전자기파)를 포함하지 않는 장치를 예시적으로 지칭할 수 있다. 예로, '비일시적 저장매체'는 데이터가 임시적으로 저장되는 버퍼를 포함할 수 있다.

일 실시 예에 따르면, 본 개시에 개시된 다양한 실시 예들에 따른 방법은 컴퓨터 프로그램 제품(computer program product)에 포함되어 제공될 수 있다. 컴퓨터 프로그램 제품은 상품으로서 판매자 및 구매자 간에 거래될 수 있다. 컴퓨터 프로그램 제품은 기기로 읽을 수 있는 저장 매체(예: compact disc read only memory (CD-ROM))의 형태로 배포되거나, 또는 어플리케이션 스토어(예: 플레이 스토어TM)를 통해 또는 두개의 사용자 장치들(예: 스마트폰들) 간에 직접, 온라인으로 배포(예: 다운로드 또는 업로드)될 수 있다. 온라인 배포의 경우에, 컴퓨터 프로그램 제품(예: 다운로더블 앱(downloadable app))의 적어도 일부는 제조사의 서버, 어플리케이션 스토어의 서버, 또는 중계 서버의 메모리와 같은 기기로 읽을 수 있는 저장 매체에 적어도 일시 저장되거나, 임시적으로 생성될 수 있다.

본 개시에서, “부”는 프로세서 또는 회로와 같은 하드웨어 구성(hardware component), 및/또는 프로세서와 같은 하드웨어 구성에 의해 실행되는 소프트웨어 구성(software component)일 수 있다.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.

본 발명의 범위는 첨부된 특허청구범위를 포함하며, 상세한 설명에 제한되지 않는다. 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims

전자 장치에서, 응답이 변화된 이유에 관한 정보를 제공하는 방법에 있어서,

제1 입력에 따라, 적어도 하나의 모듈을 처리하여 제1 응답을 출력하는 단계;

상기 제1 입력의 의도와 동일한 의도를 가진 제2 입력에 따라, 상기 제1 응답과 다른 제2 응답이 출력된 이력에 관한 정보를 획득하는 단계;

상기 획득된 정보에 기초하여, 상기 제1 입력에 따라 동작된 적어도 하나의 모듈 중 상기 제2 입력에 따라 동작된 적어도 하나의 모듈과 다르게 동작된 모듈을 변화된 모듈로 식별하는 단계; 및

상기 변화된 모듈에 기초하여, 상기 제1 응답이, 상기 제2 응답과 다르게 변화된 이유에 관한 정보를 제공하는 단계를 포함하는, 방법.
제1항에 있어서, 상기 변화된 모듈로 식별하는 단계는,

상기 제1 입력에 따라 동작된 적어도 하나의 모듈과, 상기 제2 입력에 따라 동작된 적어도 하나의 모듈을 대응시키는 단계; 및

상기 대응된 모듈에서 처리된 정보들 간의 비교 결과에 기초하여, 상기 변화된 모듈을 식별하는 단계를 포함하는, 방법.
제1항에 있어서, 상기 변화된 모듈로 식별하는 단계는,

상기 제1 입력에 따라 동작된 적어도 하나의 모듈 중 제1 모듈의 입력 정보 및 출력 정보를 획득하는 단계;

상기 입력 정보에 기초하여, 상기 제2 입력에 따라 동작된 적어도 하나의 모듈에 관한 정보 중 상기 제1 모듈과 대응되는 제1' 모듈에 관한 정보를 식별하는 단계; 및

상기 제1 모듈의 출력 정보와 상기 제1' 모듈에 대한 출력 정보가 다른것에 기초하여 상기 제1 모듈을 상기 변화된 모듈로 식별하는 단계를 포함하는, 방법.
제3항에 있어서, 상기 제1' 모듈에 관한 정보를 식별하는 단계는,

상기 제1 모듈의 입력 정보를 해쉬 값으로 변환하는 단계; 및

상기 제2 입력에 따라 동작된 적어도 하나의 모듈에 관한 정보 중 상기 변환된 해쉬 값과 동일한 해쉬 값을 포함하는 모듈에 관한 정보를, 상기 제1' 모듈에 관한 정보로 식별하는 단계를 포함하는, 방법.
제1항에 있어서, 상기 변화된 모듈로 식별하는 단계는,

상기 제1 입력에 따라 동작된 적어도 하나의 모듈에 대한 우선 순위를 결정하는 단계;

상기 우선 순위에 따라서, 상기 제1 입력에 따라 동작된 적어도 하나의 모듈에서 처리된 정보와, 상기 제2 입력에 따라 동작된 적어도 하나의 모듈에서 처리된 정보를 순차적으로 비교하는 단계; 및

비교 결과에 기초하여, 상기 변화된 모듈을 식별하는 단계를 포함하는, 방법.
제1항에 있어서, 상기 제1 응답이 변화된 이유에 관한 정보를 사용자에게 제공하는 단계는,

상기 변화된 모듈에 기초하여, 상기 제1 응답이 상기 제2 응답과 다른 이유를 추론하는 단계; 및

상기 추론된 이유를 포함하는 상기 제1 응답이 변화된 이유에 관한 정보를 생성하는 단계를 포함하는, 방법.
제1항에 있어서, 상기 제1 응답이 변화된 이유에 관한 정보를 사용자에게 제공하는 단계는,

상기 제1 응답의 변화에 관련된 질의에 대해 상기 제1 응답이 변화된 이유에 관한 정보를 포함하는 응답이 생성될 수 있도록, 상기 변화된 모듈에 기초하여, 상기 입력에 대한 응답을 생성하는데 이용되는, 적어도 하나의 인공지능 모델을 미리 학습하는 단계; 및

상기 미리 학습된 인공지능 모델에 기초하여, 상기 제1 응답의 변화에 관련된 질의를 포함하는, 입력이 수신됨에 따라서, 상기 제1 응답이 변화된 이유에 관한 정보를 포함하는 응답을 출력하는 단계를 포함하는, 방법.
응답이 변화된 이유에 관한 정보를 제공하는 전자 장치에 있어서,

제1 입력에 따라, 적어도 하나의 모듈을 처리하여 제1 응답을 출력하는 출력부; 및

상기 제1 입력의 의도와 동일한 의도를 가진 제2 입력에 따라, 상기 제1 응답과 다른 제2 응답이 출력된 이력에 관한 정보를 획득하고,

상기 획득된 정보에 기초하여, 상기 제1 입력에 따라 동작된 적어도 하나의 모듈 중 상기 제2 입력에 따라 동작된 적어도 하나의 모듈과 다르게 동작된 모듈을 변화된 모듈로 식별하고,

상기 변화된 모듈에 기초하여, 상기 제1 응답이, 상기 제2 응답과 다르게 변화된 이유에 관한 정보를 제공하는 적어도 하나의 프로세서를 포함하는, 전자 장치.
제8항에 있어서, 상기 적어도 하나의 프로세서는,

상기 제1 입력에 따라 동작된 적어도 하나의 모듈과, 상기 제2 입력에 따라 동작된 적어도 하나의 모듈을 대응시키고,

상기 대응된 모듈에서 처리된 정보들 간의 비교 결과에 기초하여, 상기 변화된 모듈을 식별하는, 전자 장치.
제8항에 있어서, 상기 적어도 하나의 프로세서는,

상기 제1 입력에 따라 동작된 적어도 하나의 모듈 중 제1 모듈의 입력 정보 및 출력 정보를 획득하고,

상기 입력 정보에 기초하여, 상기 제2 입력에 따라 동작된 적어도 하나의 모듈에 관한 정보 중 상기 제1 모듈과 대응되는 제1' 모듈에 관한 정보를 식별하고,

상기 제1 모듈의 출력 정보와 상기 제1' 모듈에 대한 출력 정보가 다른것에 기초하여, 상기 제1 모듈을 상기 변화된 모듈로 식별하는, 전자 장치.
제10항에 있어서, 상기 적어도 하나의 프로세서는,

상기 제1 모듈의 입력 정보를 해쉬 값으로 변환하고,

상기 제2 입력에 따라 동작된 적어도 하나의 모듈에 관한 정보 중 상기 변환된 해쉬 값과 동일한 해쉬 값을 포함하는 정보를, 상기 제1' 모듈에 관한 정보로 식별하는, 전자 장치.
제8항에 있어서, 상기 적어도 하나의 프로세서는,

상기 제1 입력에 따라 동작된 적어도 하나의 모듈에 대한 우선 순위를 결정하고,

상기 우선 순위에 따라서, 상기 제1 입력에 따라 동작된 적어도 하나의 모듈에서 처리된 정보와, 상기 제2 입력에 따라 동작된 적어도 하나의 모듈에서 처리된 정보를 순차적으로 비교하고,

비교 결과에 기초하여, 상기 변화된 모듈을 식별하는, 전자 장치.
제8항에 있어서, 상기 적어도 하나의 프로세서는,

상기 변화된 모듈에 기초하여, 상기 제1 응답이 상기 제2 응답과 다른 이유를 추론하고,

상기 추론된 이유를 포함하는 상기 제1 응답이 변화된 이유에 관한 정보를 생성하는, 전자 장치.
제8항에 있어서, 상기 적어도 하나의 프로세서는,

상기 제1 응답의 변화에 관련된 질의에 대해 상기 제1 응답이 변화된 이유에 관한 정보를 포함하는 응답이 생성될 수 있도록, 상기 변화된 모듈에 기초하여, 상기 입력에 대한 응답을 생성하는데 이용되는, 인공지능 모델을 미리 학습하고,

상기 미리 학습된 인공지능 모델에 기초하여, 상기 제1 응답의 변화에 관련된 질의를 포함하는, 입력이 수신됨에 따라서, 상기 제1 응답이 변화된 이유에 관한 정보를 포함하는 응답을 출력하도록, 상기 출력부를 제어하는, 전자 장치.
제1항의 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.