KR20210043341A - 인공지능 대화 서비스 생성 방법 및 장치 - Google Patents

인공지능 대화 서비스 생성 방법 및 장치 Download PDF

Info

Publication number
KR20210043341A
KR20210043341A KR1020190126396A KR20190126396A KR20210043341A KR 20210043341 A KR20210043341 A KR 20210043341A KR 1020190126396 A KR1020190126396 A KR 1020190126396A KR 20190126396 A KR20190126396 A KR 20190126396A KR 20210043341 A KR20210043341 A KR 20210043341A
Authority
KR
South Korea
Prior art keywords
sentence
artificial intelligence
service
user
conversation service
Prior art date
Application number
KR1020190126396A
Other languages
English (en)
Other versions
KR102356989B1 (ko
Inventor
김시윤
Original Assignee
주식회사 엘지유플러스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엘지유플러스 filed Critical 주식회사 엘지유플러스
Priority to KR1020190126396A priority Critical patent/KR102356989B1/ko
Publication of KR20210043341A publication Critical patent/KR20210043341A/ko
Application granted granted Critical
Publication of KR102356989B1 publication Critical patent/KR102356989B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Machine Translation (AREA)

Abstract

인공지능 대화 서비스 생성 방법 및 장치가 개시된다. 인공지능 대화 서비스 생성 방법은 인공지능 대화 서비스의 제작을 위한 제작 인터페이스를 통해 인공지능 대화 서비스의 서비스 이름에 대한 사용자 입력을 수신하는 단계, 수신에 응답하여, 서비스 이름에 대응하는 시나리오를 생성하는 단계, 시나리오를 형성하는 대화 서비스에서 기준이 되는 사용자 발화 문장에 대한 사용자 입력을 수신하는 단계, 사용자 발화 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력을 수신하는 단계 및 서비스 이름, 사용자 발화 문장 및 인공지능 응답 문장에 대한 정보를 저장하는 단계를 포함할 수 있다.

Description

인공지능 대화 서비스 생성 방법 및 장치{METHOD AND APPARATUS FOR PRODUCING ARTIFICIAL INTELLIGENCE CONVERSATION SERVICE}
실시예들은 인공지능 대화 서비스를 생성하는 기술 및 인공지능 대화 서비스를 제공하는 기술에 관한 것이다.
인공지능 스피커의 보급이 확대되고, 인공지능 스피커와 연계된 다양한 서비스들이 등장하면서 인공지능 스피커의 활용도가 계속해서 높아지고 있다. 사용자들은 다양한 분야의 서비스를 스피커를 통해서 이용할 수 있다. 그러나, 각 서비스들을 이용하기 위해서, 사용자들은 서비스의 제공자가 설정한 대화 가이드에 기초한 사용자의 발화 입력을 통해서만 서비스를 제공받을 수 있다. 제공자가 설정한 대화 가이드는 사용자의 발화 습관이나 사용자의 의도를 포함하지 않는다. 따라서 제공자가 설정한 대화 가이드에 기초한 음성 인식 방법은 사용자에게 최적화된 음성 인식 기능을 제공할 수 없다는 한계점을 가진다.
일 실시예에 따른 인공지능 대화 서비스 생성 방법은 인공지능 대화 서비스의 제작을 위한 제작 인터페이스를 통해 인공지능 대화 서비스의 서비스 이름에 대한 사용자 입력을 수신하는 단계; 상기 수신에 응답하여, 상기 서비스 이름에 대응하는 시나리오를 생성하는 단계; 상기 시나리오를 형성하는 대화 서비스에서 기준이 되는 사용자 발화 문장에 대한 사용자 입력을 수신하는 단계;
상기 사용자 발화 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력을 수신하는 단계; 및 상기 서비스 이름, 상기 사용자 발화 문장 및 상기 인공지능 응답 문장에 대한 정보를 저장하는 단계를 포함할 수 있다.
일 실시예에 따른 인공지능 대화 서비스 생성 방법은 상기 사용자 발화 문장에 대한 하나 이상의 동의 문장을 결정하는 단계를 더 포함할 수 있다.
상기 동의 문장을 결정하는 단계는, 상기 사용자 발화 문장에 대한 텍스트 분석을 수행하는 단계; 상기 텍스트 분석 결과에 기초하여 상기 사용자 발화 문장에 대한 사용자 입력으로부터 추출된 각 단어의 동의어를 출력하는 단계; 상기 각 단어의 동의어에 대한 사용자 선택 정보를 수신하는 단계; 및 상기 사용자 발화 문장에 대한 사용자 입력 및 상기 사용자 선택 정보 중 적어도 하나에 기초하여 상기 동의 문장을 결정하는 단계를 더 포함할 수 있다.
상기 인공지능 응답 문장에 대한 정보를 저장하는 단계는, 상기 사용자 발화 문장 및 상기 사용자 발화 문장의 동의 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력에 기초하여, 상기 인공지능 응답 문장에 대한 정보를 저장하는 단계를 포함할 수 있다.
일 실시예에 따른 인공지능 대화 서비스 제공 방법은 마이크로폰을 통해 사용자의 발화 문장 입력을 수신하는 단계; 미리 등록된 대화 서비스 설정 정보에 기초하여 상기 발화 문장 입력에서 의도된 서비스를 결정하는 단계; 상기 대화 서비스 설정 정보에 기초하여, 상기 결정된 서비스와 관련된 상기 발화 문장 입력에 대응하는 응답 문장을 결정하는 단계; 및 상기 응답 문장을 상기 사용자에게 제공하는 단계를 포함할 수 있다.
상기 응답 문장을 결정하는 단계는, 상기 발화 문장 입력을 분석하는 단계; 및 상기 대화 서비스 설정 정보 및 상기 분석 결과에 기초하여, 상기 발화 문장 입력에 대응하는 응답 문장을 결정하는 단계를 포함할 수 있다.
상기 응답 문장을 결정하는 단계는, 상기 대화 서비스 설정 정보에 등록된 서비스별 대표 문장들 중에서 상기 발화 문장 입력에 대응하는 대표 문장을 결정하는 단계; 및 상기 결정된 대표 문장에 대응하는 기 정의된 응답 문장을 상기 발화 문장 입력에 대응하는 응답 문장으로 결정하는 단계를 포함할 수 있다.
상기 분석하는 단계는, 상기 발화 문장 입력으로부터 명사, 수량, 동사 및 사용자의 의도에 대한 정보 중 적어도 하나를 추출하는 단계를 포함할 수 있다.
상기 대화 서비스 설정 정보는, 서비스, 시나리오, 대화 및 서비스 순서 중 적어도 하나에 대한 설정 정보를 포함할 수 있다.
상기 대화 서비스 설정 정보는, 인공지능 대화 서비스를 생성하는 것에 대한 사용자 입력에 기초하여 등록, 수정 및 삭제 중 적어도 하나가 수행될 수 있다.
일 실시예에 따른 인공지능 대화 서비스 생성 방법을 수행하는, 인공지능 대화 서비스 생성 장치는 메모리 및 프로세서를 포함하고, 상기 메모리는 상기 프로세서에 의해 실행 가능한 인스트럭션들(instructions)을 저장하고, 상기 인스트럭션들이 상기 프로세서에 의해 실행될 때, 상기 프로세서는 상기 인공지능 대화 서비스 생성 장치가, 인공지능 대화 서비스의 제작을 위한 제작 인터페이스를 통해 인공지능 대화 서비스의 서비스 이름에 대한 사용자 입력을 수신하고, 상기 수신에 응답하여, 상기 서비스 이름에 대응하는 시나리오를 생성하고, 상기 시나리오를 형성하는 대화 서비스에서 기준이 되는 사용자 발화 문장에 대한 사용자 입력을 수신하고, 상기 사용자 발화 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력을 수신하고, 상기 서비스 이름, 상기 사용자 발화 문장 및 상기 인공지능 응답 문장에 대한 정보를 저장하도록 상기 인공지능 대화 서비스 생성 장치를 제어할 수 있다.
상기 프로세서는 상기 인공지능 대화 서비스 생성 장치가, 상기 사용자 발화 문장에 대한 하나 이상의 동의 문장을 결정하도록 상기 인공지능 대화 서비스 생성 장치를 제어할 수 있다.
상기 프로세서는 상기 인공지능 대화 서비스 생성 장치가, 상기 사용자 발화 문장에 대한 텍스트 분석을 수행하고, 상기 텍스트 분석 결과에 기초하여 상기 사용자 발화 문장에 대한 사용자 입력으로부터 추출된 각 단어의 동의어를 출력하고, 상기 각 단어의 동의어에 대한 사용자 선택 정보를 수신하고, 상기 사용자 발화 문장에 대한 사용자 입력 및 상기 사용자 선택 정보 중 적어도 하나에 기초하여 상기 동의 문장을 결정하도록 상기 인공지능 대화 서비스 생성 장치를 제어할 수 있다.
상기 프로세서는 상기 인공지능 대화 서비스 생성 장치가, 상기 사용자 발화 문장 및 상기 사용자 발화 문장의 동의 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력에 기초하여, 상기 인공지능 응답 문장에 대한 정보를 저장하도록 상기 인공지능 대화 서비스 생성 장치를 제어할 수 있다.
일 실시예에 따른 인공지능 대화 서비스 제공 방법을 수행하는, 인공지능 대화 서비스 제공 장치는 마이크로폰을 통해 사용자의 발화 문장 입력을 수신하는 사용자 발화 문장 수신부; 미리 등록된 대화 서비스 설정 정보에 기초하여 상기 발화 문장 입력에서 의도된 서비스를 결정하는 서비스 결정부; 상기 대화 서비스 설정 정보에 기초하여, 상기 결정된 서비스와 관련된 상기 발화 문장 입력에 대응하는 응답 문장을 결정하는 응답 문장 결정부; 및 상기 응답 문장을 상기 사용자에게 제공하는 응답 문장 출력부를 포함할 수 있다.
일 실시예에 따른 인공지능 대화 서비스 제공 장치는 상기 발화 문장 입력을 분석하는 사용자 발화 문장 분석부를 더 포함하고, 상기 응답 문장 결정부는, 상기 대화 서비스 설정 정보 및 상기 분석 결과에 기초하여, 상기 발화 문장 입력에 대응하는 응답 문장을 결정할 수 있다.
상기 응답 문장 결정부는, 상기 대화 서비스 설정 정보에 등록된 서비스별 대표 문장들 중에서 상기 발화 문장 입력에 대응하는 대표 문장을 결정하고, 상기 결정된 대표 문장에 대응하는 기 정의된 응답 문장을 상기 발화 문장 입력에 대응하는 응답 문장으로 결정할 수 있다.
상기 사용자 발화 문장 분석부는, 상기 발화 문장 입력으로부터 명사, 수량, 동사 및 사용자의 의도에 대한 정보 중 적어도 하나를 추출할 수 있다.
상기 대화 서비스 설정 정보는, 서비스, 시나리오, 대화 및 서비스 순서 중 적어도 하나에 대한 설정 정보를 포함할 수 있다.
상기 대화 서비스 설정 정보는, 대화 서비스를 설정하는 것에 대한 사용자 입력에 기초하여 등록, 수정 및 삭제 중 적어도 하나가 수행될 수 있다.
일 실시예에 따르면, 사용자에게 최적화된 인공지능 대화 서비스를 제공할 수 있다.
일 실시예에 따르면, 사용자는 개인 맞춤형 인공지능 대화 서비스를 제공받을 수 있다.
일 실시예에 따르면, 사용자는 기술과 관련된 지식 없이도, 인공지능 대화 서비스를 직접 구성하여 생성할 수 있다.
일 실시예에 따르면, 사용자는 사용자의 발화 습관이나 사용자의 의도가 반영된 인공지능 대화 서비스를 제공받을 수 있다.
일 실시예에 따르면, 사용자는 사용자의 편의대로 인공지능 대화 서비스와 관련된 대화 서비스 설정 정보를 생성, 수정 및 삭제할 수 있다.
일 실시예에 따르면, 사용자는 사용자가 생성한 대화 서비스 설정 정보를 통해 보다 편리하게 인공지능 스피커를 작동시킬 수 있도록 하여, 인공지능 스피커의 보급에 기여할 수 있다.
일 실시예에 따르면, 사용자가 생성한 대화 서비스 설정 정보를 커뮤니티에 공유하여, 인공지능 스피커에 대한 홍보와 이에 따른 신규 사용자의 유입을 도모할 수 있다.
일 실시예에 따르면, 사용자가 직접 인공지능 대화 서비스를 구성할 수 있도록 하여, 관리자가 대화 서비스를 구성할 경우에 소요되는 노력, 시간 및 비용을 절감할 수 있다.
도 1은 일 실시예에 따른 인공지능 대화 서비스 생성 방법을 설명하기 위한 흐름도이다.
도 2는 일 실시예에 따른 인공지능 대화 서비스 제공 방법을 설명하기 위한 흐름도이다.
도 3은 일 실시예에 따른 사용자의 발화 문장 입력에 따른 응답 문장이 출력되는 과정을 설명하기 위한 흐름도이다.
도 4a 내지 도 4f는 일 실시예에 따른 인공지능 대화 서비스 생성과 관련된 사용자 인터페이스를 도시하는 도면들이다.
도 5는 일 실시예에 따른 인공지능 대화 서비스 제공 장치의 구성을 도시하는 도면이다.
도 6은 일 실시예에 따른 인공지능 대화 서비스 생성 장치의 구성을 도시하는 도면이다.
이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
아래 설명하는 실시예들에는 다양한 변경이 가해질 수 있다. 아래 설명하는 실시예들은 실시 형태에 대해 한정하려는 것이 아니며, 이들에 대한 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
실시예에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 실시예를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
도 1은 일 실시예에 따른 인공지능 대화 서비스 생성 방법을 설명하기 위한 흐름도이다.
인공지능 대화 서비스 생성 방법을 통해, 인공지능 스피커 또는 음성 인식 기능을 수행하는 기기를 사용하는 사용자는, 사용자가 원하는 대로 직접 대화 서비스 설정 정보를 구성하여 생성할 수 있다. 또한, 사용자는 사용자가 직접 생성한 대화 서비스 설정 정보에 기초하여 인공지능 스피커 또는 음성 인식 기능을 수행하는 기기로부터 인공지능 대화 서비스 생성 기능을 제공받을 수 있다. 또한, 사용자가 대화 서비스 설정 정보에 제휴 플랫폼과 연결된 서비스를 제공받는 것과 관련된 설정 정보를 등록하면, 사용자는 이에 대응하는 사용자의 발화 문장을 입력하여 대화 서비스뿐만 아니라 제휴 플랫폼과 연결된 서비스를 제공받을 수도 있다.
실시예에 따라 인공지능 대화 서비스 생성 방법은, 인공지능 스피커와 연결된 사용자 단말 또는 인공지능 기반의 음성 인식 기능을 수행하는 사용자 단말을 통해 대화 서비스를 설정하는 것과 관련된 사용자 인터페이스를 제공할 수 있다. 사용자는 인공지능 스피커와 연결된 사용자 단말 또는 인공지능 기반의 음성 인식 기능을 수행하는 사용자 단말에서 실행되는 웹 페이지(web page) 또는 애플리케이션을 통해 대화 서비스 설정 정보를 생성, 수정 및 삭제 중 적어도 하나를 수행할 수 있다. 또한, 사용자는 웹 페이지(web page) 또는 애플리케이션을 통해 대화 서비스를 설정하는 것과 관련된 가이드 라인을 제공받을 수도 있다.
본 명세서에서 설명하는 인공지능 대화 서비스 생성 장치는 인공지능 스피커, 인공지능 기반의 음성 인식 기능을 제공하는 기기 및 인공지능 기반의 음성 인식 기능을 제공하는 사용자 단말 중 어느 하나일 수 있다.
도 1을 참조하면, 단계(110)에서 인공지능 대화 서비스 생성 장치는 인공지능 대화 서비스의 제작을 위한 제작 인터페이스를 통해 인공지능 대화 서비스의 서비스 이름에 대한 사용자 입력을 수신할 수 있다. 단계(120)에서 인공지능 대화 서비스 생성 장치는 수신에 응답하여, 서비스 이름에 대응하는 시나리오를 생성할 수 있다.
인공지능 대화 서비스 생성 장치는 시나리오를 구성할 대화를 구성할 수 있다. 단계(130)에서 인공지능 대화 서비스 생성 장치는 시나리오를 형성하는 대화 서비스에서 기준이 되는 사용자 발화 문장에 대한 사용자 입력을 수신할 수 있다. 즉, 인공지능 대화 서비스 생성 장치는, 인공지능 대화 서비스 제공 장치가 시나리오에 기초하여 응답 문장을 결정하기 위한 사용자 발화 문장에 대한 사용자 입력을 수신할 수 있다. 또한, 인공지능 대화 서비스 생성 장치는 단계(140)에서 사용자 발화 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력을 수신할 수도 있다.
실시예에 따라 인공지능 대화 서비스의 서비스 이름에 대한 사용자 입력, 사용자 발화 문장에 대한 사용자 입력 및 인공지능 응답 문장에 대한 사용자 입력은 음성 입력 및 텍스트 입력 중 적어도 하나의 형태로 입력될 수 있다. 사용자는 인공지능 대화 서비스의 제작을 위한 제작 인터페이스를 통해 인공지능 대화 서비스를 생성하는 것과 관련된 사용자 입력을 입력할 수 있다.
단계(150)에서 인공지능 대화 서비스 생성 장치는 서비스 이름, 사용자 발화 문장 및 인공지능 응답 문장에 대한 정보를 저장할 수 있다. 인공지능 대화 서비스 생성 장치는 서비스 이름과 사용자 발화 문장을 대응시킬 수 있다. 또한, 인공지능 대화 서비스 생성 장치는 인공지능 응답 문장에 대한 사용자 입력을 서비스 이름 및 사용자 발화 문장과 대응시킬 수 있다. 인공지능 대화 서비스 생성 장치는 서비스 이름에 대응하는 사용자 발화 문장과, 사용자 발화 문장에 대응하는 인공지능 응답 문장을 저장할 수 있다.
다른 실시예에서 인공지능 대화 서비스 생성 장치는 사용자 발화 문장에 대한 하나 이상의 동의 문장을 결정할 수 있다. 인공지능 대화 서비스 생성 장치는 사용자 발화 문장에 대한 텍스트 분석을 수행할 수 있다. 인공지능 대화 서비스 생성 장치는 텍스트 분석 결과에 기초하여 사용자 발화 문장에 대한 사용자 입력으로부터 추출된 각 단어의 동의어를 출력할 수 있다. 여기서, 인공지능 대화 서비스 생성 장치는 디스플레이를 통해 사용자 발화 문장에 대한 사용자 입력으로부터 추출된 각 단어의 동의어를 출력할 수 있다.
인공지능 대화 서비스 생성 장치는 사용자로부터 각 단어의 동의어에 대한 사용자 선택 정보를 수신할 수 있다. 예를 들어, 인공지능 대화 서비스 생성 장치는 "음악"이라는 단어에 대해 "노래" 및 "뮤직(music)"이라는 동의어를 출력할 수 있다. 인공지능 대화 서비스 생성 장치는 사용자로부터 "노래"에 대한 선택이 포함된 사용자 선택 정보를 수신한 경우, 인공지능 대화 서비스 제공 장치가 사용자 발화 문장 입력에서 "음악"과 "노래"를 동일한 의미를 가진 단어로 인식하도록 설정할 수 있다.
인공지능 대화 서비스 생성 장치는 사용자 발화 문장에 대한 사용자 입력 및 사용자 선택 정보 중 적어도 하나에 기초하여 동의 문장을 결정할 수 있다. 인공지능 대화 서비스 생성 장치는 인공지능 응답 문장을 사용자 발화 문장에 대응시키는 것뿐만 아니라, 사용자 발화 문장의 동의 문장에도 대응시킬 수 있다. 인공지능 대화 서비스 생성 장치는 사용자 발화 문장 및 사용자 발화 문장의 동의 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력에 기초하여, 인공지능 응답 문장에 대한 정보를 저장할 수 있다.
도 2는 일 실시예에 따른 인공지능 대화 서비스 제공 방법을 설명하기 위한 흐름도이다.
본 명세서에서 설명하는 인공지능 대화 서비스 제공 장치는 인공지능 스피커, 인공지능 기반의 음성 인식 기능을 제공하는 기기 및 인공지능 기반의 음성 인식 기능을 제공하는 사용자 단말 중 어느 하나일 수 있다. 인공지능 대화 서비스 제공 장치는, 인공지능 대화 서비스 생성 장치를 통해 생성되어 미리 등록된 대화 서비스 설정 정보에 기초하여 인공지능 대화 서비스를 제공할 수 있다. 인공지능 대화 서비스 제공 장치와 인공지능 대화 서비스 생성 장치는 실시예에 따라 동일한 장치일 수 있고, 서로 다른 장치일 수도 있다. 또한, 인공지능 대화 서비스 제공 장치와 인공지능 대화 서비스 생성 장치는 하나의 장치가 다른 하나의 장치에 포함되어 있거나, 두 장치 모두 또 다른 하나의 장치에 포함되어 있을 수도 있다.
도 2를 참조하면 인공지능 대화 서비스 제공 장치는 단계(210)에서, 마이크로폰을 통해 사용자의 발화 문장 입력을 수신할 수 있다. 인공지능 대화 서비스 제공 장치는 단계(220)에서 미리 등록된 대화 서비스 설정 정보에 기초하여 발화 문장 입력에서 의도된 서비스를 결정할 수 있다. 즉, 인공지능 대화 서비스 제공 장치는 미리 등록된 대화 서비스 설정 정보 및 발화 문장 입력에 기초하여, 사용자가 제공받고자 하는 서비스를 결정할 수 있다.
일 실시예에서, 대화 서비스 설정 정보는 서비스, 시나리오, 대화 및 서비스 순서 중 적어도 하나에 대한 설정 정보를 포함할 수 있다. 대화 서비스 설정 정보는 서비스, 시나리오, 대화 및 서비스 순서 중 적어도 하나에 대한 설정 정보는 사용자에 의해 설정될 수 있다. 즉, 대화 서비스 설정 정보는 인공지능 대화 서비스를 생성하는 것에 대한 사용자 입력에 기초하여 등록, 수정 및 삭제 중 적어도 하나가 수행될 수 있다. 여기서, 사용자 입력은 사용자의 발화 음성, 텍스트 및 사용자 선택 중 적어도 하나일 수 있다.
다른 실시예에서, 인공지능 대화 서비스 제공 장치는 사용자 입력을 통해 사용자로부터 사용자가 생성하고자 하는 서비스에 대한 이름을 수신할 수 있다. 인공지능 대화 서비스 제공 장치는 사용자가 생성하고자 하는 서비스에 대한 이름에 대응하는 시나리오를 생성할 수 있고, 사용자로부터 시나리오 안에서의 대화와 관련된 문장을 입력 받을 수 있다. 인공지능 대화 서비스 제공 장치는 사용자로부터 입력 받은 대화와 관련된 문장에 대해 텍스트 분석을 수행할 수 있다. 인공지능 대화 서비스 제공 장치는 텍스트 분석 결과에 기초하여, 대화와 관련된 문장을 텍스트 형식으로 출력할 수 있고, 사용자가 각각의 텍스트를 구분할 수 있는 색으로 텍스트를 표시할 수 있다. 인공지능 대화 서비스 제공 장치는 사용자로부터 각각의 텍스트와 같은 의미를 가진 다른 텍스트를 입력 받아 대화와 관련된 문장과 동일한 뜻을 가지는 유사 문장을 추가할 수도 있다. 또한, 인공지능 대화 서비스 제공 장치는 대화와 관련된 문장과 유사 문장에 대응하는 응답을 사용자로부터 입력 받을 수 있다.
단계(230)에서, 인공지능 대화 서비스 제공 장치는 대화 서비스 설정 정보에 기초하여, 결정된 서비스와 관련된 발화 문장 입력에 대응하는 응답 문장을 결정할 수 있다.
일 실시예에서 인공지능 대화 서비스 제공 장치는 발화 문장 입력을 분석할 수 있다. 인공지능 대화 서비스 제공 장치는 발화 문장 입력으로부터 명사, 수량, 동사 및 사용자의 의도에 대한 정보 중 적어도 하나를 추출할 수 있다.
인공지능 대화 서비스 제공 장치는 대화 서비스 설정 정보 및 분석 결과에 기초하여, 발화 문장 입력에 대응하는 응답 문장을 결정할 수 있다. 인공지능 대화 서비스 제공 장치는 대화 서비스 설정 정보에 등록된 서비스별 대표 문장들 중에서 발화 문장 입력에 대응하는 대표 문장을 결정할 수 있다.
대화 서비스 설정 정보는 서비스별 대표 문장들을 포함할 수 있고, 서비스별 대표 문장들과 동일한 의미를 가지는 유사 문장들도 포함할 수 있다. 인공지능 대화 서비스 제공 장치는 분석 결과로 추출된 명사, 수량, 동사 및 사용자의 의도에 대한 정보 중 적어도 하나를 포함하는 대표 문장 또는 유사 문장을 결정할 수 있다. 대화 서비스 설정 정보에 기초하면, 대표 문장들은 대표 문장들 각각에 대응하는 응답 문장이 설정되어 있을 수 있다.
인공지능 대화 서비스 제공 장치는 결정된 대표 문장에 대응하는 기 정의된 응답 문장을 발화 문장 입력에 대응하는 응답 문장으로 결정할 수 있다. 또한, 단계(240)에서 인공지능 대화 서비스 제공 장치는 응답 문장을 사용자에게 제공할 수 있다.
일 실시예에서, 사용자 입력에 기초하여 결정된 대화 서비스 설정 정보는 yaml(Aint Markup Language) 파일과 같은 스크립트 파일로 저장되어, 발명자가 시스템 개발 시에 대화 서비스 설정 정보를 소스에 참고할 수 있도록 할 수 있다.
도 3은 일 실시예에 따른 사용자의 발화 문장 입력에 따른 응답 문장이 출력되는 과정을 설명하기 위한 흐름도이다.
도 3을 참조하면, 인공지능 대화 서비스 제공 장치는 단계(310)에서 사용자의 발화 문장 입력을 수신할 수 있다.
단계(320)에서, 인공지능 대화 서비스 제공 장치는 대화 서비스 설정 정보에 기초하여, 사용자의 발화 문장 입력이 어떤 서비스로의 진입을 의도하는 것인지 파악하여, 발화 문장 입력에 대응하는 서비스를 결정할 수 있다.
단계(330)에서 인공지능 대화 서비스 제공 장치는 발화 문장 입력에 대한 분석을 수행할 수 있다. 인공지능 대화 서비스 제공 장치는 음성 형태의 발화 문장 입력을 텍스트 형태로 변환하고, 텍스트 형태의 사용자의 발화 문장 입력으로부터 명사, 수량, 동사 및 사용자의 의도에 대한 정보 중 적어도 하나를 추출할 수 있다.
인공지능 대화 서비스 제공 장치는 단계(340)에서, 발화 문장 입력으로부터 추출된 명사, 수량, 동사 및 사용자의 의도에 대한 정보 중 적어도 하나와 대화 서비스 설정 정보에 기초하여 발화 문장 입력에 대응하는 대표 문장을 결정할 수 있다. 대화 서비스 설정 정보는 서비스별 대표 문장들 및 대표 문장들과 동일한 의미를 가지는 것으로 결정된 유사 문장들도 포함할 수 있다. 인공지능 대화 서비스 제공 장치는 발화 문장 입력으로부터 추출된 명사, 수량, 동사 및 사용자의 의도에 대한 정보 중 적어도 하나를 포함하는 대표 문장 또는 유사 문장을, 발화 문장 입력에 대응하는 것으로 결정할 수 있다.
단계(350)에서 인공지능 대화 서비스 제공 장치는 발화 문장 입력에 대응하는 것으로 결정된 대표 문장의 응답 문장을, 발화 문장 입력에 대응하는 응답 문장으로 결정할 수 있다. 여기서, 응답 문장은 mp3(MPEG-1 Audio Layer 3), txt(text) 및 mp4(MPEG-4 Part 14) 중 적어도 하나의 형태를 가질 수 있다.
단계(360)에서, 인공지능 대화 서비스 제공 장치는 사용자의 발화 문장 입력에 대한 응답으로, 응답 문장을 출력할 수 있다. 실시예에 따라 인공지능 대화 서비스 제공 장치는 응답 문장을 음성 형태, 텍스트 형태 및 동영상 형태 중 적어도 하나로 출력할 수 있다.
도 4a 내지 도 4f는 일 실시예에 따른 인공지능 대화 서비스 생성과 관련된 사용자 인터페이스를 도시하는 도면이다.
일 실시예에서, 인공지능 대화 서비스 생성 장치는 인공지능 대화 서비스 생성 장치와 연결된 사용자 단말 또는, 인공지능 대화 서비스 생성 장치에서 실행될 웹 페이지 또는 애플리케이션 중 적어도 하나를 통해 대화 서비스 설정과 관련된 사용자 인터페이스를 제공할 수 있다.
도 4a는 대화 서비스 설정과 관련된 메인 페이지를 도시하는 도면일 수 있다. 도 4a를 참조하면, 인공지능 대화 서비스 생성 장치에 연결된 사용자 단말 또는 인공지능 대화 서비스 생성 장치는 메인 페이지에서, 대화 서비스 설정하는 것과 관련된 로그인에 대한 가이드와 애플리케이션에 대한 가이드를 제공할 수 있다.
도 4b는 대화 서비스 설정과 관련된 서비스 관리 페이지를 도시하는 도면일 수 있다. 도 4b를 참조하면, 인공지능 대화 서비스 생성 장치에 연결된 사용자 단말 또는 인공지능 대화 서비스 생성 장치는 서비스 관리 페이지에서, 대화 서비스 설정 정보에 등록된 서비스에 대한 설정 정보를 리스트 형식으로 디스플레이할 수 있다. 서비스에 대한 설정 정보는 서비스의 이름(서비스 명), 서비스의 생성일 및 서비스의 생성자에 대한 정보를 포함할 수 있다. 각각의 서비스와 서비스에 대한 설정 정보는 기 저장되어 있거나 사용자 입력에 기초하여 생성, 삭제 및 수정 등과 같은 관리가 수행될 수 있다. 사용자 입력은 음성 및 텍스트 중 적어도 하나의 형태일 수 있고, 또는 실시예에 따라 사용자 선택 정보를 포함할 수도 있다.
도 4c는 대화 서비스 설정과 관련된 시나리오 관리 페이지를 도시하는 도면일 수 있다. 도 4c를 참조하면, 인공지능 대화 서비스 생성 장치에 연결된 사용자 단말 또는 인공지능 대화 서비스 생성 장치는 시나리오 관리 페이지에서, 대화 서비스 설정 정보에 등록된 시나리오에 대한 설정 정보를 리스트 형식으로 디스플레이할 수 있다. 시나리오에 설정 대한 정보는 시나리오의 이름(시나리오 명), 시나리오의 생성일 및 시나리오의 생성자에 대한 정보를 포함할 수 있다. 또한, 일 시나리오는, 기존에 생성되어 있거나 새롭게 생성된 다른 시나리오와 연결될 수도 있기 때문에, 시나리오에 대한 설정 정보에는 각 시나리오의 이전 시나리오 및 다음 시나리오에 대한 설정 정보가 포함될 수도 있다. 각각의 시나리오와 시나리오에 대한 설정 정보는 기 저장되어 있거나 사용자 입력에 기초하여 생성, 삭제 및 수정 등과 같은 관리가 수행될 수 있다. 사용자 입력은 음성 및 텍스트 중 적어도 하나의 형태일 수 있고, 또는 실시예에 따라 사용자 선택 정보를 포함할 수도 있다.
도 4d는 대화 서비스 설정과 관련된 대화 관리 페이지를 도시하는 도면일 수 있다. 도 4d를 참조하면, 인공지능 대화 서비스 생성 장치에 연결된 사용자 단말 또는 인공지능 대화 서비스 생성 장치는 대화 관리 페이지에서, 대화 서비스 설정 정보에 등록된 대화에 대한 설정 정보를 리스트 형식으로 디스플레이할 수 있다. 대화에 대한 설정 정보는 대표 문장(또는 대표 대화 문장), 대화의 생성일 및 대화의 생성자에 대한 정보를 포함할 수 있다. 각각의 대화와 대화에 대한 설정 정보는 기존에 저장되어 있거나 사용자 입력에 기초하여 생성, 삭제 및 수정 등과 같은 관리가 수행될 수 있다. 사용자 입력은 음성 및 텍스트 중 적어도 하나의 형태일 수 있고, 또는 실시예에 따라 사용자 선택 정보를 포함할 수도 있다.
도 4e는 대화 서비스와 관련된 대화 관리 페이지에서 디스플레이된 대표 문장이 클릭되어 선택된 것에 대한 파생 페이지를 도시하는 도면일 수 있다. 즉, 도 4d에서 대표 대화 문장을 클릭한 사용자는, 클릭한 대표 대화 문장에 대응하는 도 4e의 페이지를 제공받을 수 있다.
도 4e를 참조하면, 인공지능 대화 서비스 생성 장치에 연결된 사용자 단말 또는 인공지능 대화 서비스 생성 장치는 사용자 선택 정보에 대응하는 대표 문장에 대한 설정 정보를 출력할 수 있다. 대표 문장에 대한 설정 정보는 대표 대화 문장, 대표 대화 문장의 생성일 및 대표 대화 문장의 생성자에 대한 정보를 포함할 수 있다. 또한, 대표 문장에 대한 설정 정보는 대표 문장에 대한 분석 결과를 포함할 수도 있다. 대표 문장은 명사, 수량 및 대표 문장에 담긴 의도 중 적어도 하나가 추출되어 분석될 수 있다. 인공지능 대화 서비스 생성 장치는 대표 문장에 대한 설정 정보에 기초하여, 사용자로부터 수신한 발화 문장 입력과 동일하거나 동일한 의미를 가지고 있는 대표 문장을 결정할 수 있다.
또한, 대화 서비스와 관련된 대화 관리 페이지에서 디스플레이된 대표 문장이 클릭되어 선택된 것에 대한 파생 페이지에는 대표 문장과 동일하거나 동일한 의미를 가지고 있는 것으로 결정된 유사 문장을 디스플레이될 수도 있다.
대표 문장에 대한 설정 정보 및 대표 문장에 대응하는 유사 문장 중 적어도 하나는 기존에 저장되어 있거나, 또는 사용자 입력에 기초하여 생성, 삭제 및 수정될 수 있다.
도 4f는 서비스 순서도에 대한 페이지를 도시하는 도면일 수 있다. 도 4f를 참조하면, 서비스 순서도에 대한 페이지에는 서비스가 제공되는 순서에 대한 설정 정보를 나타내는 순서도가 디스플레이될 수 있다. 서비스가 제공되는 순서에 대한 설정 정보는 사용자 입력에 기초하여 결정될 수 있다. 서비스가 제공되는 순서에 대한 설정 정보는, 서비스에 대응하는 대화 및 시나리오 중 적어도 하나에 대응하는 사용자의 발화 음성 입력이 수신되고, 발화 음성 입력에 기초한 응답 문장이 결정되고, 출력되는 과정이 포함될 수 있다. 또한, 실시예에 따라, 서비스가 제공되는 순서에 대한 설정 정보에는 응답 문장에 대응하는 서비스를 제공하는 것에 대한 설정 정보가 포함될 수도 있다.
도 5는 일 실시예에 따른 인공지능 대화 서비스 제공 장치의 구성을 도시하는 도면이다.
도 5를 참조하면, 인공지능 대화 서비스 제공 장치는 사용자 발화 문장 수신부(510), 사용자 발화 문장 분석부(520), 서비스 결정부(530), 웹/애플리케이션 페이지 제공부(540), 응답 문장 결정부(550), 응답 문장 출력부(560), 사용자 인증 정보 저장부(570) 및 대화 서비스 설정 정보 저장부(580)를 포함할 수 있다.
일 실시예에서, 사용자 발화 문장 수신부(510)는 마이크로폰을 통해 사용자의 발화 문장 입력을 수신할 수 있다. 사용자 발화 문장 수신부(510)는 사용자의 발화 문장 입력을 수신하기 위한 마이크로폰을 포함할 수 있다.
사용자 발화 문장 분석부(520)는 사용자의 발화 문장 입력에 대응하는 발화 문장에 대한 분석을 수행할 수 있다. 사용자 발화 문장 분석부(520)는 발화 문장으로부터 명사, 수량, 동사 및 사용자의 의도에 대한 정보 중 적어도 하나를 추출할 수 있다. 사용자 발화 문장 분석부(520)는 다른 음성인식에 대한 솔루션을 사용할 수 있는 자유도를 가질 수 있다.
서비스 결정부(530)는 미리 등록된 대화 서비스 설정 정보에 기초하여 발화 문장 입력에서 의도된 서비스를 결정할 수 있다.
웹/애플리케이션 페이지 제공부(540)는 사용자가 대화 서비스 설정 정보에 대한 등록, 수정 및 삭제 중 적어도 하나를 수행하는 것에 대한 웹 페이지 또는 애플리케이션의 페이지를 제공할 수 있다.
응답 문장 결정부(550)는 대화 서비스 설정 정보 및 사용자의 발화 문장에 대한 분석 결과에 기초하여, 결정된 서비스와 관련된 발화 문장 입력에 대응하는 응답 문장을 결정할 수 있다. 응답 문장 결정부(550)는 대화 서비스 설정 정보에 등록된 서비스별 대표 문장들 중에서 발화 문장 입력에 대응하는 대표 문장을 결정할 수 있다. 응답 문장 결정부(550)는 대표 문장에 대응하는 기 정의된 응답 문장을 발화 문장에 대응하는 응답 문장으로 결정할 수 있다.
응답 문장 출력부(560)는 결정된 응답 문장을 출력하여 사용자에게 제공할 수 있다. 응답 문장 출력부(560)는 응답 문장이 음성 형태인 경우, 스피커와 같은 음성 출력 장치를 통해 음성 형태로 출력할 수 있고, 텍스트 형태인 경우, 디스플레이 등을 통해 텍스트 형태로 출력할 수 있다. 또한, 응답 문장 출력부(560)는 응답 문장이 동영상 형태인 경우, 디스플레이와 음성 출력 장치를 통해 동영상 형태로 출력할 수 있다.
사용자 인증 정보 저장부(570)는 사용자 계정이 인공지능 대화 서비스를 제공받는 것과 관련한 사용자의 인증 정보를 저장할 수 있다. 사용자가 입력한 사용자 계정에 대한 입력 정보가 사용자 인증 정보 저장부(570)에 저장되어 있는 경우, 사용자 계정은 인공지능 대화 서비스 제공받는 것과 관련한 권한을 부여받을 수 있다.
대화 서비스 설정 정보 저장부(580)는 인공지능 대화 서비스 제공 장치가 대화 서비스를 제공하는 것과 관련하여, 서비스, 시나리오, 대화 및 서비스 순서 중 적어도 하나에 대한 설정 정보를 저장할 수 있다. 여기서, 서비스, 시나리오, 대화 및 서비스 순서 중 적어도 하나는 인공지능 대화 서비스 생성 장치를 통해 생성되어 인공지능 대화 서비스 제공 장치의 대화 서비스 설정 정보 저장부(580)에 저장될 수 있다.
도 6은 일 실시예에 따른 인공지능 대화 서비스 생성 장치의 구성을 도시하는 도면이다.
도 6을 참조하면, 인공지능 대화 서비스 생성 장치(600)는 본 명세서에서 설명된 인공지능 대화 서비스 생성 장치에 대응할 수 있다. 인공지능 대화 서비스 생성 장치(600)는 프로세서(610), 메모리(620) 및 통신 인터페이스(630)를 포함할 수 있다. 또한 실시예에 따라, 인공지능 대화 서비스 생성 장치(600)는 사용자 입력 인터페이스(640), 디스플레이(650) 및 스피커(660)를 더 포함할 수 있다.
메모리(620)는 프로세서(610)에 연결되고, 프로세서(610)에 의해 실행가능한 인스트럭션들, 프로세서(610)가 연산할 데이터 또는 프로세서(610)에 의해 처리된 데이터를 저장할 수 있다. 메모리(620)는 비일시적인 컴퓨터 판독가능 매체, 예컨대 고속 랜덤 액세스 메모리 및/또는 비휘발성 컴퓨터 판독가능 저장 매체(예컨대, 하나 이상의 디스크 저장 장치, 플래쉬 메모리 장치, 또는 기타 비휘발성 솔리드 스테이트 메모리 장치)를 포함할 수 있다.
통신 인터페이스(630)는 외부 장치(예를 들어, 인공지능 대화 서비스 제공 장치, 사용자 단말 및 제휴 플랫폼)와 통신하기 위한 인터페이스를 제공한다. 예를 들어, 통신 인터페이스(630)는 유선 네트워크, 무선 네트워크, 블루투스 BLE(Bluetooth Low Energy)를 통해 외부 장치와 통신할 수 있다.
디스플레이(650)는 인공지능 대화 서비스 생성 방법을 제공하는 것과 관련된 화면을 디스플레이할 수 있다. 스피커(660)는 인공지능 대화 서비스 생성 방법을 제공하는 것과 관련된 음성을 출력할 수 있다. 사용자 입력 인터페이스(640)는 사용자에 의해 입력되는 사용자 입력을 수신할 수 있다. 예를 들어 사용자 입력 인터페이스(640)는 터치 스크린, 마우스, 키보드 또는 음성 인식 인터페이스(예, 마이크로폰) 등을 포함할 수 있다.
프로세서(610)는 본 명세서에서 설명된 인공지능 대화 서비스 생성 장치의 동작과 관련된 하나 이상의 동작을 수행하도록 인공지능 대화 서비스 생성 장치(600)를 제어할 수 있다.
일 실시예에서, 사용자 입력 인터페이스(640)에 포함된 마이크로폰은 음성 형태의 사용자의 발화 문장 입력에 대한 사용자 입력을 수신할 수 있다. 또한, 사용자 입력 인터페이스(640)에 포함된 터치 스크린 또는 키보드는 텍스트 형태의 사용자의 발화 문장 입력에 대한 사용자 입력을 수신할 수 있다. 스피커(660)는 인공지능 대화 서비스 생성 방법과 관련된 사운드 데이터를 출력할 수 있다. 프로세서(610)는 인공지능 대화 서비스의 서비스 이름에 대한 사용자 입력에 기초하여 서비스 이름에 대응하는 시나리오를 생성할 수 있고, 사용자 발화 문장에 대한 사용자 입력 및 사용자 발화 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력에 기초하여 시나리오를 형성할 수 있다.
예를 들어, 프로세서(610)는 인공지능 대화 서비스 생성 장치(600)가 인공지능 대화 서비스의 제작을 위한 제작 인터페이스를 통해 인공지능 대화 서비스의 서비스 이름에 대한 사용자 입력을 수신하고, 수신에 응답하여, 서비스 이름에 대응하는 시나리오를 생성하도록 인공지능 대화 서비스 생성 장치(600)를 제어할 수 있다.
또한, 프로세서(610)는 인공지능 대화 서비스 생성 장치(600)가 시나리오를 형성하는 대화 서비스에서 기준이 되는 사용자 발화 문장에 대한 사용자 입력을 수신하고, 사용자 발화 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력을 수신하도록 인공지능 대화 서비스 생성 장치(600)를 제어할 수 있다.
프로세서(610)는 인공지능 대화 서비스 생성 장치(600)가 서비스 이름, 사용자 발화 문장 및 인공지능 응답 문장에 대한 정보를 저장하도록 인공지능 대화 서비스 생성 장치(600)를 제어할 수 있다. 프로세서(610)는 인공지능 대화 서비스 생성 장치(600)가 사용자 발화 문장 및 사용자 발화 문장의 동의 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력에 기초하여, 인공지능 응답 문장에 대한 정보를 저장하도록 인공지능 대화 서비스 생성 장치(600)를 제어할 수 있다.
다른 실시예에서 프로세서(610)는 인공지능 대화 서비스 생성 장치(600)가 사용자 발화 문장에 대한 하나 이상의 동의 문장을 결정하도록 인공지능 대화 서비스 생성 장치(600)를 제어할 수 있다. 프로세서(610)는 인공지능 대화 서비스 생성 장치(600)가 사용자 발화 문장에 대한 텍스트 분석을 수행하고, 텍스트 분석 결과에 기초하여 사용자 발화 문장에 대한 사용자 입력으로부터 추출된 각 단어의 동의어를 출력하도록 인공지능 대화 서비스 생성 장치(600)를 제어할 수 있다. 또한, 프로세서(610)는 인공지능 대화 서비스 생성 장치(600)가 각 단어의 동의어에 대한 사용자 선택 정보를 수신하고, 사용자 발화 문장에 대한 사용자 입력 및 사용자 선택 정보 중 적어도 하나에 기초하여 동의 문장을 결정하도록 인공지능 대화 서비스 생성 장치(600)를 제어할 수 있다.
일 실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
510: 사용자 발화 문장 수신부 520: 사용자 발화 문장 분석부
530: 서비스 결정부
540: 웹/애플리케이션 페이지 제공부
550: 응답 문장 결정부 560: 응답 문장 출력부
570: 사용자 인증 정보 저장부
580: 대화 서비스 설정 정보 저장부
600: 인공지능 대화 서비스 생성 장치
610: 프로세서 620: 메모리
630: 통신 인터페이스 640: 사용자 입력 인터페이스
650: 디스플레이 660: 스피커

Claims (21)

  1. 인공지능 대화 서비스 생성 방법에 있어서,
    인공지능 대화 서비스의 제작을 위한 제작 인터페이스를 통해 인공지능 대화 서비스의 서비스 이름에 대한 사용자 입력을 수신하는 단계;
    상기 수신에 응답하여, 상기 서비스 이름에 대응하는 시나리오를 생성하는 단계;
    상기 시나리오를 형성하는 대화 서비스에서 기준이 되는 사용자 발화 문장에 대한 사용자 입력을 수신하는 단계;
    상기 사용자 발화 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력을 수신하는 단계; 및
    상기 서비스 이름, 상기 사용자 발화 문장 및 상기 인공지능 응답 문장에 대한 정보를 저장하는 단계
    를 포함하는,
    인공지능 대화 서비스 생성 방법.
  2. 제1항에 있어서,
    상기 사용자 발화 문장에 대한 하나 이상의 동의 문장을 결정하는 단계
    를 더 포함하는,
    인공지능 대화 서비스 생성 방법.
  3. 제2항에 있어서,
    상기 하나 이상의 동의 문장을 결정하는 단계는,
    상기 사용자 발화 문장에 대한 텍스트 분석을 수행하는 단계;
    상기 텍스트 분석 결과에 기초하여 상기 사용자 발화 문장으로부터 추출된 각 단어의 동의어를 출력하는 단계;
    상기 각 단어의 동의어에 대한 사용자 선택 정보를 수신하는 단계; 및
    상기 사용자 선택 정보에 기초하여 상기 사용자 발화 문장에 대한 동의 문장을 결정하는 단계
    를 더 포함하는,
    인공지능 대화 서비스 생성 방법.
  4. 제1항에 있어서,
    상기 인공지능 응답 문장에 대한 정보를 저장하는 단계는,
    상기 사용자 발화 문장 및 상기 사용자 발화 문장의 동의 문장에 대응하는 인공지능 응답 문장에 기초하여, 상기 인공지능 응답 문장에 대한 정보를 저장하는 단계
    를 포함하는,
    인공지능 대화 서비스 생성 방법.
  5. 인공지능 대화 서비스 제공 방법에 있어서,
    마이크로폰을 통해 사용자의 발화 문장 입력을 수신하는 단계;
    미리 등록된 대화 서비스 설정 정보에 기초하여 상기 발화 문장 입력에서 의도된 서비스를 결정하는 단계;
    상기 대화 서비스 설정 정보에 기초하여, 상기 결정된 서비스와 관련된 상기 발화 문장 입력에 대응하는 응답 문장을 결정하는 단계; 및
    상기 응답 문장을 상기 사용자에게 제공하는 단계
    를 포함하는,
    인공지능 대화 서비스 제공 방법.
  6. 제5항에 있어서,
    상기 응답 문장을 결정하는 단계는,
    상기 발화 문장 입력을 분석하는 단계; 및
    상기 대화 서비스 설정 정보 및 상기 분석 결과에 기초하여, 상기 발화 문장 입력에 대응하는 응답 문장을 결정하는 단계
    를 포함하는,
    인공지능 대화 서비스 제공 방법.
  7. 제6항에 있어서,
    상기 응답 문장을 결정하는 단계는,
    상기 대화 서비스 설정 정보에 등록된 서비스별 대표 문장들 중에서 상기 발화 문장 입력에 대응하는 대표 문장을 결정하는 단계; 및
    상기 결정된 대표 문장에 대응하는 기 정의된 응답 문장을 상기 발화 문장 입력에 대응하는 응답 문장으로 결정하는 단계
    를 포함하는,
    인공지능 대화 서비스 제공 방법.
  8. 제6항에 있어서,
    상기 분석하는 단계는,
    상기 발화 문장 입력으로부터 명사, 수량, 동사 및 사용자의 의도에 대한 정보 중 적어도 하나를 추출하는 단계
    를 포함하는,
    인공지능 대화 서비스 제공 방법.
  9. 제5항에 있어서,
    상기 대화 서비스 설정 정보는,
    서비스, 시나리오, 대화 및 서비스 순서 중 적어도 하나에 대한 설정 정보를 포함하는,
    인공지능 대화 서비스 제공 방법.
  10. 제9항에 있어서,
    상기 대화 서비스 설정 정보는,
    인공지능 대화 서비스를 생성하는 것에 대한 사용자 입력에 기초하여 등록, 수정 및 삭제 중 적어도 하나가 수행되는,
    인공지능 대화 서비스 제공 방법.
  11. 제1항 내지 제10항 중 어느 하나의 항의 방법을 실행시키기 위한 인스트럭션들을 저장하는 컴퓨터 판독 가능한 저장 매체.
  12. 인공지능 대화 서비스 생성 방법을 수행하는, 인공지능 대화 서비스 생성 장치에 있어서,
    메모리 및 프로세서를 포함하고,
    상기 메모리는 상기 프로세서에 의해 실행 가능한 인스트럭션들(instructions)을 저장하고,
    상기 인스트럭션들이 상기 프로세서에 의해 실행될 때, 상기 프로세서는 상기 인공지능 대화 서비스 생성 장치가,
    인공지능 대화 서비스의 제작을 위한 제작 인터페이스를 통해 인공지능 대화 서비스의 서비스 이름에 대한 사용자 입력을 수신하고,
    상기 수신에 응답하여, 상기 서비스 이름에 대응하는 시나리오를 생성하고,
    상기 시나리오를 형성하는 대화 서비스에서 기준이 되는 사용자 발화 문장에 대한 사용자 입력을 수신하고,
    상기 사용자 발화 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력을 수신하고,
    상기 서비스 이름, 상기 사용자 발화 문장 및 상기 인공지능 응답 문장에 대한 정보를 저장하도록 상기 인공지능 대화 서비스 생성 장치를 제어하는,
    인공지능 대화 서비스 생성 장치.
  13. 제12항에 있어서,
    상기 프로세서는 상기 인공지능 대화 서비스 생성 장치가,
    상기 사용자 발화 문장에 대한 하나 이상의 동의 문장을 결정하도록 상기 인공지능 대화 서비스 생성 장치를 제어하는,
    인공지능 대화 서비스 생성 장치.
  14. 제13항에 있어서,
    상기 프로세서는 상기 인공지능 대화 서비스 생성 장치가,
    상기 사용자 발화 문장에 대한 텍스트 분석을 수행하고,
    상기 텍스트 분석 결과에 기초하여 상기 사용자 발화 문장에 대한 사용자 입력으로부터 추출된 각 단어의 동의어를 출력하고,
    상기 각 단어의 동의어에 대한 사용자 선택 정보를 수신하고,
    상기 사용자 발화 문장에 대한 사용자 입력 및 상기 사용자 선택 정보 중 적어도 하나에 기초하여 상기 동의 문장을 결정하도록 상기 인공지능 대화 서비스 생성 장치를 제어하는,
    인공지능 대화 서비스 생성 장치.
  15. 제12항에 있어서,
    상기 프로세서는 상기 인공지능 대화 서비스 생성 장치가,
    상기 사용자 발화 문장 및 상기 사용자 발화 문장의 동의 문장에 대응하는 인공지능 응답 문장에 대한 사용자 입력에 기초하여, 상기 인공지능 응답 문장에 대한 정보를 저장하도록 상기 인공지능 대화 서비스 생성 장치를 제어하는,
    인공지능 대화 서비스 생성 장치.
  16. 인공지능 대화 서비스 제공 방법을 수행하는, 인공지능 대화 서비스 제공 장치에 있어서,
    마이크로폰을 통해 사용자의 발화 문장 입력을 수신하는 사용자 발화 문장 수신부;
    미리 등록된 대화 서비스 설정 정보에 기초하여 상기 발화 문장 입력에서 의도된 서비스를 결정하는 서비스 결정부;
    상기 대화 서비스 설정 정보에 기초하여, 상기 결정된 서비스와 관련된 상기 발화 문장 입력에 대응하는 응답 문장을 결정하는 응답 문장 결정부; 및
    상기 응답 문장을 상기 사용자에게 제공하는 응답 문장 출력부
    를 포함하는,
    인공지능 대화 서비스 제공 장치.
  17. 제16항에 있어서,
    상기 발화 문장 입력을 분석하는 사용자 발화 문장 분석부
    를 더 포함하고,
    상기 응답 문장 결정부는,
    상기 대화 서비스 설정 정보 및 상기 분석 결과에 기초하여, 상기 발화 문장 입력에 대응하는 응답 문장을 결정하는,
    인공지능 대화 서비스 제공 장치.
  18. 제17항에 있어서,
    상기 응답 문장 결정부는,
    상기 대화 서비스 설정 정보에 등록된 서비스별 대표 문장들 중에서 상기 발화 문장 입력에 대응하는 대표 문장을 결정하고,
    상기 결정된 대표 문장에 대응하는 기 정의된 응답 문장을 상기 발화 문장 입력에 대응하는 응답 문장으로 결정하는,
    인공지능 대화 서비스 제공 장치.
  19. 제17항에 있어서,
    상기 사용자 발화 문장 분석부는,
    상기 발화 문장 입력으로부터 명사, 수량, 동사 및 사용자의 의도에 대한 정보 중 적어도 하나를 추출하는,
    인공지능 대화 서비스 제공 장치.
  20. 제16항에 있어서,
    상기 대화 서비스 설정 정보는,
    서비스, 시나리오, 대화 및 서비스 순서 중 적어도 하나에 대한 설정 정보를 포함하는,
    인공지능 대화 서비스 제공 장치.
  21. 제20항에 있어서,
    상기 대화 서비스 설정 정보는,
    대화 서비스를 설정하는 것에 대한 사용자 입력에 기초하여 등록, 수정 및 삭제 중 적어도 하나가 수행되는,
    인공지능 대화 서비스 제공 장치.
KR1020190126396A 2019-10-11 2019-10-11 인공지능 대화 서비스 생성 방법 및 장치 KR102356989B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190126396A KR102356989B1 (ko) 2019-10-11 2019-10-11 인공지능 대화 서비스 생성 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190126396A KR102356989B1 (ko) 2019-10-11 2019-10-11 인공지능 대화 서비스 생성 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20210043341A true KR20210043341A (ko) 2021-04-21
KR102356989B1 KR102356989B1 (ko) 2022-01-27

Family

ID=75744094

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190126396A KR102356989B1 (ko) 2019-10-11 2019-10-11 인공지능 대화 서비스 생성 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102356989B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102603806B1 (ko) * 2022-10-26 2023-11-17 주식회사 타이렐 인공지능을 이용한 대화 서비스 시스템 및 그 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180017342A (ko) * 2016-08-09 2018-02-21 주식회사 피노텍 머신러닝을 활용한 정해진 시나리오로 고객과 상담하는 로봇 자동 상담 방법 및 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180017342A (ko) * 2016-08-09 2018-02-21 주식회사 피노텍 머신러닝을 활용한 정해진 시나리오로 고객과 상담하는 로봇 자동 상담 방법 및 시스템

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102603806B1 (ko) * 2022-10-26 2023-11-17 주식회사 타이렐 인공지능을 이용한 대화 서비스 시스템 및 그 방법

Also Published As

Publication number Publication date
KR102356989B1 (ko) 2022-01-27

Similar Documents

Publication Publication Date Title
KR102660922B1 (ko) 복수의 지능형 개인 비서 서비스를 위한 관리 계층
US11887604B1 (en) Speech interface device with caching component
KR102451437B1 (ko) 크라우드 소싱에 기초해서 디지털 퍼스널 어시스턴트에 대한 언어 이해 분류기 모델을 업데이트하는 기법
US11217239B2 (en) Computer proxy messaging bot
KR102273095B1 (ko) 음성 액션 검색 가능 시스템
TWI376681B (en) Speech understanding system for semantic object synchronous understanding implemented with speech application language tags, and computer readable medium for recording related instructions thereon
WO2020029500A1 (zh) 语音命令定制方法、装置和设备及计算机存储介质
US11749276B2 (en) Voice assistant-enabled web application or web page
US10249296B1 (en) Application discovery and selection in language-based systems
US10860289B2 (en) Flexible voice-based information retrieval system for virtual assistant
KR20200054338A (ko) 다이얼로그 시스템들에서의 파라미터 수집 및 자동 다이얼로그 생성
US11586689B2 (en) Electronic apparatus and controlling method thereof
KR20190139966A (ko) 선택가능한 그래픽 엘리먼트를 통해 자동화된 에이전트로 대화를 초기화하기
KR20200011198A (ko) 대화형 메시지 구현 방법, 장치 및 프로그램
US12020707B2 (en) Response orchestrator for natural language interface
KR102312993B1 (ko) 인공신경망을 이용한 대화형 메시지 구현 방법 및 그 장치
WO2019183453A1 (en) Modifying spoken commands
US11810555B2 (en) User profile linking
KR102356989B1 (ko) 인공지능 대화 서비스 생성 방법 및 장치
Lojka et al. Multi-thread parallel speech recognition for mobile applications
US11211056B1 (en) Natural language understanding model generation
JP7416078B2 (ja) 音声認識装置、音声認識方法、およびプログラム
KR102135182B1 (ko) 성문인식을 통한 인공지능 스피커 맞춤형 개인화 서비스 시스템
KR20210098250A (ko) 전자 장치 및 이의 제어 방법
US11893996B1 (en) Supplemental content output

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant