KR20220162484A - 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치 - Google Patents

실제감을 위한 인공지능 대화제공 서비스 방법 및 장치 Download PDF

Info

Publication number
KR20220162484A
KR20220162484A KR1020210070992A KR20210070992A KR20220162484A KR 20220162484 A KR20220162484 A KR 20220162484A KR 1020210070992 A KR1020210070992 A KR 1020210070992A KR 20210070992 A KR20210070992 A KR 20210070992A KR 20220162484 A KR20220162484 A KR 20220162484A
Authority
KR
South Korea
Prior art keywords
conversation
user
technique
artificial intelligence
providing service
Prior art date
Application number
KR1020210070992A
Other languages
English (en)
Inventor
권은경
Original Assignee
주식회사 디엔엑스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 디엔엑스 filed Critical 주식회사 디엔엑스
Priority to KR1020210070992A priority Critical patent/KR20220162484A/ko
Publication of KR20220162484A publication Critical patent/KR20220162484A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • G06Q50/30
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/033Voice editing, e.g. manipulating the voice of the synthesiser

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치 기술에 관한 것으로, 가상친구의 실제감을 위한 인공지능 대화제공 서비스 방법은 대화를 초기단계, 중간단계, 적극적 단계 및 관계지속 단계로 구분하고 구분된 상기 대화 단계 별로 대화 기법을 결정하는 단계, 상기 대화 기법에 따른 대화 예시들을 상황에 맞추어 맥락 있는 대화내용으로 처리하는 단계, 및 사용자와 대화하는 과정에서 단계에 따라 결정된 대화 기법에 맞춘 상기 맥락 있는 대화내용을 발화 처리하여 실제감을 갖는 음성 대화를 제공하는 단계를 포함한다.

Description

실제감을 위한 인공지능 대화제공 서비스 방법 및 장치{ARTIFICIAL INTELLIGENCE DIALOGUE PROVIDING SERVICE METHOD AND APPARATUS FOR A SENSE OF REALITY}
본 발명은 인공지능 대화 기술에 관한 것으로, 더욱 상세하게는 사용자에게 실제 사람과 대화하는 느낌을 갖도록 하는 대화 서비스를 제공하여 대화의 몰입도를 높일 수 있는 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치에 관한 것이다.
인공지능(Artificial Intelligence, AI)의 기술은 눈부시게 발전하고 있다. 2045년에는 AI 배우가 인간 배우를 대신하여 캐스팅되고 연기를 하게 될 것이다. 그런 단계로 가기 전에는 음성만을 활용한 활용단계는 현재에도 실용화되고 있다.
첫째, 게임 속 수많은 캐릭터의 음성을 AI로 생성하는 것이다. 게임 캐릭터를 실감나게 만드는 요소 중 하나는 생생하고 자연스러운 목소리이다.
둘째, 감정표현이 단순한 편에 속하는 기업의 홍보영상 더빙, 아나운서의 뉴스방송에 AI 음성을 사용하고 있다.
하지만, 다양한 캐릭터 설정과 감정 표현을 전문 연기자처럼 연기를 가능케 하는 톤의 목소리를 선보이는 테크 기업이 늘어나고 있다. 이는 AI 성우가 외국영화 더빙에 등장하게 되는 날이 곧 올 것으로 추측된다.
이러한 기술의 발전은 모두 기존 사람이 하는 일을 생산성 있게 달성하기 위한 의도에서 출발한다. 전문 성우를 채용하게 되면 비용과 시간이 들기 때문이다. 이를 AI 성우로 대체하는 경우 최저비용으로 신속하게 결과물을 만들어낸다. 하지만, 사람이 하는 것에 비해 품질이 저하되는 것을 감수해야 한다. 다시 말해, 청취자 혹은 시청자 혹은 사용자는 사람이기 때문에 해당 결과물의 몰입도를 방해할 수 있기 때문이다. 따라서, 품질과 비용 사이에서 합리적인 중간 지점을 찾아야 한다.
AI 스피커 혹은 스마트폰에서 음성으로만 등장하는 가상비서들(예: 알렉사, 오케이구글, 시리, 빅스비, 아리, 지니 등)은 사용자들의 생활을 도와주는 비서로서의 역할을 한다. 호칭은 인공지능 음성비서, AI virtual assistant, An intelligent virtual assistant (IVA), intelligent personal assistant (IPA) 라고 부른다. 공통적으로 assistant 라고 호칭하듯이 “비서” 라는 의미를 내포한다. AI 비서는 지시하는 명령에 대하여 적당한 응답과 온라인 행위를 대신해주는 역할을 하기 때문에 실제감을 위한 대화가 필요하지 않다. 심심이나 말벗과 같이 사람들의 외로움을 달래주는 음성 챗팅은 음성 비서 중 한가지 응용으로 존재하긴 하지만 독립적이지 않다.
고령자의 보호자 역할을 하는 로봇 분야는 형상을 가진 로봇이나 인형의 형태를 띠고 있어서 실제감을 갖기 어렵다.
한국공개특허 제10-2003-0033890(2003.05.01)호 한국등록특허 제10-2087202(2020.03.04)호
본 발명의 일 실시예는 사용자에게 실제 사람과 대화하는 느낌을 갖도록 하는 대화 서비스를 제공하여 대화의 몰입도를 높일 수 있는 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치를 제공하고자 한다.
본 발명의 일 실시예는 상황에 따른 맥락있는 대화로 낮설음을 줄이고 의인화를 통해 사용자와의 라포(rapport)를 형성할 수 있는 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치를 제공하고자 한다.
본 발명의 일 실시예는 사용자와 가상친구 간에 도움을 주고받는 관계를 만들어가는 대화를 통해 실제감을 높이고 사용자의 건강한 생활습관을 형성하도록 행동촉구를 할 수 있는 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치를 제공하고자 한다.
실시예들 중에서, 실제감을 위한 인공지능 대화제공 서비스 방법은 가상친구의 실제감을 위한 인공지능 대화제공 서비스 방법으로서, 대화를 초기단계, 중간단계, 적극적 단계 및 관계지속 단계로 구분하고 구분된 상기 대화 단계 별로 대화 기법을 결정하는 단계, 상기 대화 기법에 따른 대화 예시들을 상황에 맞추어 맥락 있는 대화내용으로 처리하는 단계, 및 사용자와 대화하는 과정에서 단계에 따라 결정된 대화 기법에 맞춘 상기 맥락 있는 대화내용을 발화 처리하여 실제감을 갖는 음성 대화를 제공하는 단계를 포함한다.
상기 대화 기법을 결정하는 단계는 대화 초기 단계에서 낯설음을 줄이도록 사용자의 호칭, 하루를 기준으로 한 대화의 빈도 및 TPO(시간, 장소, 상황)에 따른 맥락 있는 대화를 결정할 수 있다.
상기 대화 기법을 결정하는 단계는 상기 사용자의 이름을 호칭하고 호칭 앞부분에 형용사를 합성하도록 결정할 수 있다.
상기 대화 기법을 결정하는 단계는 대화 중간 단계에서 라포를 형성하도록 상기 가상친구의 적어도 이름 및 취향을 포함하는 페르소나를 설정하여 의인화하고 상호 간에 개인적 정보 교류를 통해 상기 사용자의 개인화 요소가 강화된 스토리텔링 대화를 결정할 수 있다.
상기 대화 기법을 결정하는 단계는 라포가 형성되면 친근감 및 실제감을 높이는 적극적 대화 단계를 위해 가상친구가 상기 사용자에게 고민 상담을 통해 조언을 구하는 대화 및 상기 사용자의 참여를 유도하는 일상을 주제로 한 제3자를 포함한 대화를 결정할 수 있다.
상기 대화 기법을 결정하는 단계는 상기 가상친구가 주인공이 되어 고민을 전달하거나 나레이터가 되어 특정 상황을 전달하고 상기 사용자가 조언에 참여하는 역할놀이 형식의 대화를 결정할 수 있다.
상기 대화 기법을 결정하는 단계는 라포가 형성되면 관계 지속 단계를 위해 사용자의 하루 생활패턴을 기반으로 환경 컨텍스트에 기초한 상기 사용자 상황에 따른 사용자 행동 추천 및 촉진을 위한 대화를 결정할 수 있다.
실시예들 중에서, 실제감을 위한 인공지능 대화제공 서비스 장치는 대화 과정을 낯설음을 줄이는 초기 단계, 마음을 열어 라포 형성하는 중간 단계, 친근감 및 실제감을 높이는 적극적 단계 및 사용자와의 관계 지속 단계로 구분하고 구분된 상기 대화 단계 별로 대화 기법을 결정하는 대화 기법 결정부, 상기 대화 기법에 따른 대화 예시들을 상황에 맞추어 맥락 있는 대화내용으로 처리하는 대화 예시 처리부, 및 사용자와 대화하는 과정에서 단계에 따라 결정된 대화 기법에 맞춘 상기 맥락 있는 대화내용을 발화 처리하여 실제감을 갖는 음성 대화를 제공하는 음성 대화 처리부를 포함한다.
개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
본 발명의 일 실시예에 따른 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치는 사용자에게 실제 사람과 대화하는 느낌을 갖도록 하는 대화 서비스를 제공하여 대화의 몰입도를 높일 수 있다.
본 발명의 일 실시예에 따른 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치는 상황에 따른 맥락있는 대화로 낮설음을 줄이고 의인화를 통해 사용자와의 라포(rapport)를 형성할 수 있다.
본 발명의 일 실시예에 따른 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치는 사용자와 가상친구 간에 도움을 주고받는 관계를 만들어가는 대화를 통해 실제감을 높이고 사용자의 건강한 생활습관을 형성하도록 행동촉구를 할 수 있다.
따라서, 본 발명은 인공지능(AI) 가상친구가 사용자와 대화하는 과정에서 실제 사람과 대화를 하는 것과 같은 실제감을 줄 수 있고, 친구, 선생님, 보호자 등 여러 역할을 수행할 수 있으며, 이를 고령자의 관점에서 말벗이나 안전, 보호 등의 케어 서비스에 적용할 경우 대화 관계의 지속성을 유지하여 효율을 높일 수 있다.
도 1은 본 발명에 따른 실제감을 위한 인공지능 대화제공 서비스 시스템을 설명하는 도면이다.
도 2는 도 1의 인공지능 대화제공 서비스 장치의 물리적 구성을 설명하는 블록도이다.
도 3은 도 1의 인공지능 대화제공 서비스 장치의 기능적 구성을 설명하는 블록도이다.
도 4는 본 발명에 따른 실제감을 위한 인공지능 대화제공 서비스 방법을 설명하는 순서도이다.
본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
도 1은 본 발명에 따른 실제감을 위한 인공지능 대화제공 서비스 시스템을 설명하는 도면이다.
도 1을 참조하면, 인공지능 대화제공 서비스 시스템(100)은 사용자 단말(110), 인공지능 대화제공 서비스 장치(130) 및 데이터베이스(150)를 포함할 수 있다.
사용자 단말(110)은 실제감을 위한 인공지능 대화제공 서비스 관련 웹 페이지, 앱 페이지, 프로그램 또는 애플리케이션을 이용하여 인공지능 대화제공 서비스 장치(130)와 사용자 사이의 음성 대화를 송수신하는 컴퓨팅 장치에 해당할 수 있고, 스마트폰 또는 AI 스피커로 구현될 수 있으며, 반드시 이에 한정되지 않고, 스마트 워치 등의 웨어러블 디바이스로도 구현될 수 있다. 사용자 단말(110)은 인공지능 대화제공 서비스 장치(130)와 네트워크를 통해 연결될 수 있다. 일 실시예에서, 인공지능 대화제공 서비스 장치(130)는 사용자 단말(110)에서 실행될 수 있는 애플리케이션 형태로 구현될 수도 있다.
인공지능 대화제공 서비스 장치(130)는 인공지능을 기초로 사용자 단말(110)을 통해 사용자에게 실제감을 갖는 대화 서비스를 제공할 수 있는 컴퓨터 하드웨어 및/또는 프로그램을 포함할 수 있다. 인공지능 대화제공 서비스 장치(130)는 사용자 단말(110)과 네트워크를 통해 연결될 수 있고 정보를 주고받을 수 있다.
인공지능 대화제공 서비스 장치(130)는 사용자와 대화를 수행하는 가상친구로서, 사용자와의 대화 과정에서 실제감을 갖도록 하는 대화 기법에 따라 대화제공을 서비스할 수 있다. 여기에서, 실제감은 가상친구가 사용자와 동일한 사람이라고 의인화되는 것을 의미할 수 있고, 나아가 사람들 간에 관계를 형성하는 것과 동일하게 대화 사용자와 라포를 형성하고 사용자의 건강한 생활습관을 형성하도록 행동촉구를 하는 것을 포함할 수 있다.
인공지능 대화제공 서비스 장치(130)는 실제감을 위한 대화기법을 정할 수 있고 대화기법에 따른 대화 규칙에 따라 대화 진행이 이루어질 수 있도록 한다. 여기에서, 실제감을 위한 대화기법은 낯설음을 줄이는 초기 대화 기법, 마음을 열어 라포 형성하는 중간 대화 기법, 라포 형성 후 친근감을 형성하고 실제감을 높이는 적극적 대화 기법 및 관계 지속을 위한 대화 기법으로 구성될 수 있다.
일 실시예에서, 인공지능 대화제공 서비스 장치(130)는 데이터베이스(150)와 연동하여 실제감을 위한 인공지능 대화제공 서비스에 필요한 데이터를 저장할 수 있다. 한편, 인공지능 대화제공 서비스 장치(130)는 도 1과 달리, 데이터베이스(150)를 내부에 포함할 수도 있다.
데이터베이스(150)는 실제감을 위한 인공지능 대화제공 서비스 과정에서 필요한 다양한 정보들을 저장하는 저장장치에 해당할 수 있다. 데이터베이스(150)는 가상친구에 관한 정보를 저장할 수 있고, 가상친구에 의해 사용자에게 제공되는 실제감을 위한 대화 기법에 관한 정보를 저장할 수 있고, 대화 단계 별 대화 규칙 및 대화 예제에 관한 정보를 저장할 수 있으며, 반드시 이에 한정되지 않고, 인공지능 대화제공 서비스 장치(130)가 실제감을 위한 인공지능 대화제공을 서비스하는 과정에서 다양한 형태로 수집 또는 가공된 정보들을 저장할 수 있다.
도 2는 도 1의 인공지능 대화제공 서비스 장치의 물리적 구성을 설명하는 블록도이다.
도 2를 참조하면, 인공지능 대화제공 서비스 장치(130)는 프로세서(210), 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)를 포함할 수 있다.
프로세서(210)는 인공지능 대화제공 서비스 장치(130)가 동작하는 과정에서의 각 단계들을 처리하는 프로시저를 실행할 수 있고, 그 과정 전반에서 읽혀지거나 작성되는 메모리(230)를 관리할 수 있으며, 메모리(230)에 있는 휘발성 메모리와 비휘발성 메모리 간의 동기화 시간을 스케줄링 할 수 있다. 프로세서(210)는 인공지능 대화제공 서비스 장치(130)의 동작 전반을 제어할 수 있고, 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)와 전기적으로 연결되어 이들 간의 데이터 흐름을 제어할 수 있다. 프로세서(210)는 인공지능 대화제공 서비스 장치(130)의 CPU(Central Processing Unit)로 구현될 수 있다.
메모리(230)는 SSD(Solid State Drive) 또는 HDD(Hard Disk Drive)와 같은 비휘발성 메모리로 구현되어 인공지능 대화제공 서비스 장치(130)에 필요한 데이터 전반을 저장하는데 사용되는 보조기억장치를 포함할 수 있고, RAM(Random Access Memory)과 같은 휘발성 메모리로 구현된 주기억장치를 포함할 수 있다.
사용자 입출력부(250)는 사용자 입력을 수신하기 위한 환경 및 사용자에게 특정 정보를 출력하기 위한 환경을 포함할 수 있다. 예를 들어, 사용자 입출력부(250)는 버튼, 터치 패드, 터치 스크린, 화상 키보드, 마이크 또는 포인팅 장치와 같은 어댑터를 포함하는 입력장치 및 모니터 또는 터치스크린, 스피커와 같은 어댑터를 포함하는 출력장치를 포함할 수 있다. 일 실시예에서, 사용자 입출력부(250)는 원격 접속을 통해 접속되는 컴퓨팅 장치에 해당할 수 있고, 그러한 경우, 인공지능 대화제공 서비스 장치(130)는 서버로서 수행될 수 있다.
네트워크 입출력부(270)는 네트워크를 통해 외부 장치 또는 시스템과 연결하기 위한 환경을 포함하고, 예를 들어, LAN(Local Area Network), MAN(Metropolitan Area Network), WAN(Wide Area Network) 및 VAN(Value Added Network) 등의 통신을 위한 어댑터를 포함할 수 있다.
도 3은 도 1의 인공지능 대화제공 서비스 장치의 기능적 구성을 설명하는 블록도이다.
도 3을 참조하면, 인공지능 대화제공 서비스 장치(130)는 대화 기법 결정부(310), 대화 예시 처리부(330), 음성 대화 처리부(350) 및 제어부(370)를 포함할 수 있다.
대화 기법 결정부(310)는 실제감을 위한 대화 기법을 결정할 수 있다. 일 실시예에서, 대화 기법 결정부(310)는 대화 과정에서 4가지의 단계로 구분하여 대화 기법을 결정할 수 있다. 대화 기법 결정부(310)는 대화 과정을 1) 낯설음을 줄이는 초기 단계, 2) 마음을 여는 중간단계, 3) 가상친구를 도와주는 적극적인 단계 및 4) 관계 지속을 위해 건강한 사용자 생활습관을 도와주는 행동 추천 및 촉진 단계로 구분할 수 있고 각 단계 별 대화 기법을 결정할 수 있다.
대화 기법 결정부(310)는 각 단계 별로 세부적인 대화방식을 결정할 수 있다. 일 실시예에서, 대화 기법 결정부(310)는 대화 초기 단계에서 낯설음을 줄일 수 있도록 첫 번째는 호칭을 선택하고, 두 번째는 자주 상황을 알고 먼저 말하고, 세번째는 다양한 정보를 상황에 맞추어 전달할 수 있는 대화방식을 결정할 수 있다. 여기에서, 대화 기법 결정부(310)는 호칭의 선택에 있어 “어르신”, “할머니”, “할아버지” 등의 대중적인 호칭은 최소화할 수 있도록 한다. 비에스텍의 7가지 관계 원칙에서 첫 번째는 개별적으로 취급받기를 원하는 인간의 기본적 욕구, 그리고 독특한 개인으로 취급되어야 함을 의미한다. 이런 이론에 입각하여, 대화 기법 결정부(310)는 호칭의 선택에 있어 사용자의 이름을 부를 수 있도록 한다. 사용자 이름은 인공지능 대화제공 서비스를 이용하기 전에 사용자 단말(110)을 통해 적어도 사용자 이름을 포함하는 사용자의 기본 정보를 입력받는 과정에서 획득될 수 있다. 대화 기법 결정부(310)는 연령이 낮은 가상친구가 무례하게 이름을 부르는 것으로 인식되지 않도록 호칭 앞부분에 형용사를 합성할 수 있도록 한다. 대화 기법 결정부(310)는 서로 모르는 사람끼리 첫 대면을 할때에도 상대방이 먼저 다가와 말을 시킨다면 호감이 생길 가능성이 높고 하루 종일 대화의 빈도가 높을수록 낯설음은 줄어들기 때문에 먼저 말하고 자주 대화를 가질 수 있도록 한다. 대화 기법 결정부(310)는 낯설음을 줄이는 초기 단계의 대화 기법으로, 시간, 장소, 상황(Time Place Occation, TPO)에 맞추어 맥락 있는 말을 건넬 수 있도록 한다. TOP(시간, 장소, 상황)는 자체적으로 또는 네트워크를 통해 수집되는 환경 컨텍스트를 기초로 인식될 수 있다.
일 실시예에서, 대화 기법 결정부(310)는 대화 중간 단계에서 사용자가 마음을 열고 라포를 형성할 수 있도록 첫 번째는 가상친구의 페르소나(persona)를 설정하고, 두 번째는 가상친구를 의인화하고 세 번째는 스토리텔링을 하여 대화할 수 있도록 대화방식을 결정할 수 있다. 여기에서, 대화 기법 결정부(310)는 음성 가상친구의 이름, 성별, 연령, 직업 등의 최소한의 페르소나를 설정할 수 있도록 한다. 가상친구의 페르소나는 기본값으로 정해질 수도 있지만, 사용자가 인공지능 대화제공 서비스를 이용하는 과정에서 사용자 단말(110)을 통해 설정할 수도 있다. 음성 가상친구의 이름(예: 순이)이 정해지면 대화에서 해당 이름으로 지칭될 수 있도록 한다. 대화 기법 결정부(310)는 사용자에게 관심이 있음을 표현하기 위해 취향을 물어볼 때에 우선 음성 가상친구의 취향을 소개한 후에 질문하도록 하여 사용자가 쉽게 답변하게 유도할 수 있도록 한다. 대화 기법 결정부(310)는 마음을 여는 중간 단계의 대화 기법으로, 사용자의 프로파일링을 위한 질문을 하는 경우 상황을 상상할 수 있도록 스토리텔링을 하여 대화할 수 있도록 한다. 사용자에 대한 정보가 많을수록 개인화 요소가 증가하고 강화된 방식의 대화가 가능하게 된다.
일 실시예에서, 대화 기법 결정부(310)는 적극적인 단계에서 친근감을 형성하고 가상친구의 실제감을 높이도록 첫 번째는 가상친구의 부모나 형제 또는 친구들과의 갈등 상황을 포함하여 고민을 털어놓고 조언을 구하고, 두 번째는 가상친구의 주변인들로만 구성된 가상 상황을 들려주면서 사용자의 의견을 물어서 참여를 유도한다. 상황을 실감나게 표현하기 위해 제3자를 다른 특징의 AI목소리를 사용하거나 실제 성우들의 목소리를 포함할 수 있다. 이제까지는 사용자와 가상친구간의 1:1대화로만 진행되었지만 여기서는 가상친구가 주변인을 포함시켜서 상황을 재현하기 때문에 사이코 드라마의 역할놀이와 같은 형식을 띠게 된다. 역할놀이(role playing)는 사이코드라마의 가장 기본적인 기법으로, 자기가 위치한 장면에서 어떤 역할을 선택해서 그것을 연기하는 것으로 개인이 자유로이 역할을 창출해서 즉흥적으로 행동하거나 연극적인 역할이나 특정 상황 속의 역할 등을 연기해 보면서 적응성, 창조성, 자발성을 발휘하게 된다.
여기에서, 첫번째는 가상 친구가 주인공이 되어 고민을 전달하는 것이고 두번째는 가상친구가 나레이터가 되어 특정 상황을 전달하는 것이다. 조언에 참여하는 사용자는 누군가에게 영향을 미쳤다는 보람을 갖게 되어 몰입감이 고조될 수 있다. 첫번째의 경우 가상친구의 실제 이야기로 상상하여 친근함이 더 높아질 수 있다.
일 실시예에서, 대화 기법 결정부(310)는 관계 지속을 위한 행동촉진 단계에서 건강한 사용자 생활습관을 도와주도록 첫 번째는 상황에 맞고 개인패턴에 올바른 방식으로 행동에 즉시 옮기기 용이한 방식으로 추천하고, 두 번째는 지속적인 공감, 칭찬, 격려를 끊임없이 하여서 관계가 멀어지지 않고 지속될 수 있도록 대화방식을 결정할 수 있다. 중간 단계의 대화 기법을 통해 라포가 형성되어 사용자의 안전과 건강을 도와주는 가상의 보호자이자 친구이고 선생님이라는 믿음을 만들어진 상태에서 사용자에게 거부감을 주지 않고 사용자의 행동을 촉진시킬 수 있는 대화방식을 결정할 수 있다. 대화 기법 결정부(310)는 사용자의 생활패턴 및 현재 상황에 따라 맥락에 맞는 대화내용으로 사용자에게 거부감을 주지 않고 사용자의 행동을 촉진시키도록 한다.
대화 예시 처리부(330)는 각 단계별 대화 기법에 따른 대화 예시들을 저장하고 저장된 대화 예시들을 대화하는 과정에서 각 단계의 대화 기법에 맞춰 제공되도록 처리할 수 있다. 일 실시예에서, 대화 예시 처리부(330)는 각 단계별 결정된 대화 기법에 따라 상황에 맞춘 대화 예시들이 저장될 수 있다. 예를 들면, 대화 초기 단계에서 사용자의 이름을 부르는 상황인 경우 “우리 멋진 {name}님 좋은 아침입니다” 등과 같이 앞부분에 형용사가 합성된 대화 예문이 저장될 수 있다. 대화 예시 처리부(330)는 대화 예시들에 동적 변수가 포함될 수 있고 동적 변수에 사용자의 이름, 가상친구의 페르소나, TPO(시간, 장소, 상황)가 반영되게 처리할 수 있다. 일 실시예에서, 대화 예시 처리부(330)는 가상친구를 도와주는 적극적인 단계의 대화 기법을 위해 일상에 대한 제3자가 참여하는 대화를 포함할 수 있다.
음성 대화 처리부(350)는 대화 단계에 따른 대화 기법에 따라 대화 예문을 발화 메시지로 결정하고 결정된 발화 메시지를 발화시켜 사용자와의 음성 대화가 제공되도록 처리할 수 있다. 일 실시예에서, 음성 대화 처리부(350)는 하루를 기준으로 시간대 별로 대화 기법이 결정되는 대화 단계에 따라 자동 발화시켜 사용자의 이름을 부르면서 먼저 대화를 시도할 수 있고 사용자에게 실제감을 줄 수 있다.
제어부(370)는 인공지능 대화제공 서비스 장치(130)의 전체적인 동작을 제어하고, 대화 기법 결정부(310), 대화 예시 처리부(330) 및 음성 대화 처리부(350) 간의 제어 흐름 및 데이터 흐름을 관리할 수 있다.
도 4는 본 발명에 따른 실제감을 위한 인공지능 대화제공 서비스 방법을 설명하는 순서도이다.
도 4를 참조하면, 인공지능 대화제공 서비스 장치(130)는 대화 기법 결정부(310)를 통해 대화 단계 별 대화 기법을 결정할 수 있다(단계 S410). 일 실시예에서, 대화 기법 결정부(310)는 대화 단계를 낯설음을 줄이는 초기단계, 라포(rapport)를 형성하는 중간단계, 친근감 및 실제감을 높이는 적극적 단계 및 사용자와의 관계 지속을 위한 행동촉진 단계로 구분하고 구분한 각 단계에 맞는 대화 기법을 결정할 수 있다. 대화 기법 결정부(310)는 초기단계에서 낯설음을 줄이는 대화 기법을 결정할 수 있다. 예컨대, 사용자의 호칭, 하루를 기준으로 한 대화의 빈도, TPO(시간, 장소, 상황)에 따른 맥락있는 대화의 내용을 결정하여 대화 초기에 낯설음을 줄이도록 한다. 대화 기법 결정부(310)는 중간단계에서 라포를 형성할 수 있는 대화 기법을 결정할 수 있다. 예컨대, 이름, 취향 등의 설정을 통해 의인화시키고 사용자의 개인화 요소가 강화된 대화의 내용을 결정하여 사용자와의 라포를 형성하도록 한다. 대화 기법 결정부(310)는 라포가 형성되면 친근감 및 실제감을 높일 수 있는 적극적인 대화 기법을 결정할 수 있다. 예컨대, 사용자에게 고민 상담을 통해 조언을 구하는 대화의 내용 및 사용자의 참여를 유도하는 일상을 주제로 한 제3자를 포함한 대화를 결정하여 사용자에게 실제감을 줄 수 있도록 한다. 대화 기법 결정부(310)는 사용자의 현재 상황 및 생활패턴을 기초로 사용자의 행동을 촉진시키는 대화의 내용을 결정하여 관계가 지속되도록 하는 대화 기법을 결정할 수 있다.
또한, 인공지능 대화제공 서비스 장치(130)는 대화 예시 처리부(330)를 통해 대화 기법에 따른 대화 예시들을 상황에 맞추어 맥락 있는 대화내용으로 처리할 수 있다(단계 S430).
또한, 인공지능 대화제공 서비스 장치(130)는 음성대화 처리부(350)를 통해 맥락 있는 대화내용을 발화 처리하여 실제감을 갖는 음성 대화를 제공할 수 있다(단계 S450).
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 실제감을 위한 인공지능 대화제공 서비스 시스템
110: 사용자 단말 130: 인공지능 대화제공 서비스 장치
150: 데이터베이스
210: 프로세서 230: 메모리
250: 사용자 입출력부 270: 네트워크 입출력부
310: 대화 기법 결정부 330: 대화 예시 처리부
350: 음성 대화 처리부 370: 제어부

Claims (8)

  1. 가상친구의 실제감을 위한 인공지능 대화제공 서비스 방법으로서,
    대화를 초기단계, 중간단계, 적극적 단계 및 관계지속 단계로 구분하고 구분된 상기 대화 단계 별로 대화 기법을 결정하는 단계;
    상기 대화 기법에 따른 대화 예시들을 상황에 맞추어 맥락 있는 대화내용으로 처리하는 단계; 및
    사용자와 대화하는 과정에서 단계에 따라 결정된 대화 기법에 맞춘 상기 맥락 있는 대화내용을 발화 처리하여 실제감을 갖는 음성 대화를 제공하는 단계를 포함하는 실제감을 위한 인공지능 대화제공 서비스 방법.
  2. 제1항에 있어서, 상기 대화 기법을 결정하는 단계는
    대화 초기 단계에서 낯설음을 줄이도록 사용자의 호칭, 하루를 기준으로 한 대화의 빈도 및 TPO(시간, 장소, 상황)에 따른 맥락 있는 대화를 결정하는 것을 특징으로 하는 실제감을 위한 인공지능 대화제공 서비스 방법.
  3. 제2항에 있어서, 상기 대화 기법을 결정하는 단계는
    상기 사용자의 이름을 호칭하고 호칭 앞부분에 형용사를 합성하도록 결정하는 것을 특징으로 하는 실제감을 위한 인공지능 대화제공 서비스 방법.
  4. 제1항에 있어서, 상기 대화 기법을 결정하는 단계는
    대화 중간 단계에서 라포를 형성하도록 상기 가상친구의 적어도 이름 및 취향을 포함하는 페르소나를 설정하여 의인화하고 상호 간에 개인적 정보 교류를 통해 상기 사용자의 개인화 요소가 강화된 스토리텔링 대화를 결정하는 것을 특징으로 하는 실제감을 위한 인공지능 대화제공 서비스 방법.
  5. 제4항에 있어서, 상기 대화 기법을 결정하는 단계는
    라포가 형성되면 친근감 및 실제감을 높이는 적극적 대화 단계를 위해 상기 가상친구가 상기 사용자에게 고민 상담을 통해 조언을 구하는 대화 및 상기 사용자의 참여를 유도하는 일상을 주제로 한 제3자를 포함한 대화를 결정하는 것을 특징으로 하는 실제감을 위한 인공지능 대화제공 서비스 방법.
  6. 제5항에 있어서, 상기 대화 기법을 결정하는 단계는
    상기 가상친구가 주인공이 되어 고민을 전달하거나 나레이터가 되어 특정 상황을 전달하고 상기 사용자가 조언에 참여하는 역할놀이 형식의 대화를 결정하는 것을 특징으로 하는 실제감을 위한 인공지능 대화제공 서비스 방법.
  7. 제4항에 있어서, 상기 대화 기법을 결정하는 단계는
    라포가 형성되면 관계 지속 단계를 위해 사용자의 하루 생활패턴을 기반으로 환경 컨텍스트에 기초한 상기 사용자 상황에 따른 사용자 행동 추천 및 촉진을 위한 대화를 결정하는 것을 특징으로 하는 실제감을 위한 인공지능 대화제공 서비스 방법.
  8. 대화 과정을 낯설음을 줄이는 초기 단계, 마음을 열어 라포 형성하는 중간 단계, 친근감 및 실제감을 높이는 적극적 단계 및 사용자와의 관계 지속 단계로 구분하고 구분된 상기 대화 단계 별로 대화 기법을 결정하는 대화 기법 결정부;
    상기 대화 기법에 따른 대화 예시들을 상황에 맞추어 맥락 있는 대화내용으로 처리하는 대화 예시 처리부; 및
    사용자와 대화하는 과정에서 단계에 따라 결정된 대화 기법에 맞춘 상기 맥락 있는 대화내용을 발화 처리하여 실제감을 갖는 음성 대화를 제공하는 음성 대화 처리부를 포함하는 실제감을 위한 인공지능 대화제공 서비스 장치.
KR1020210070992A 2021-06-01 2021-06-01 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치 KR20220162484A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210070992A KR20220162484A (ko) 2021-06-01 2021-06-01 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210070992A KR20220162484A (ko) 2021-06-01 2021-06-01 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20220162484A true KR20220162484A (ko) 2022-12-08

Family

ID=84437191

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210070992A KR20220162484A (ko) 2021-06-01 2021-06-01 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20220162484A (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030033890A (ko) 2001-10-25 2003-05-01 (주)인터루션 사용자의 음성정보 분석을 통한 사이버 비서 시스템 및 그방법
KR102087202B1 (ko) 2017-09-13 2020-03-10 (주)파워보이스 인공 지능 비서 서비스 제공 방법, 및 이에 사용되는 음성 인식 장비

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030033890A (ko) 2001-10-25 2003-05-01 (주)인터루션 사용자의 음성정보 분석을 통한 사이버 비서 시스템 및 그방법
KR102087202B1 (ko) 2017-09-13 2020-03-10 (주)파워보이스 인공 지능 비서 서비스 제공 방법, 및 이에 사용되는 음성 인식 장비

Similar Documents

Publication Publication Date Title
JP6719747B2 (ja) 対話方法、対話システム、対話装置、およびプログラム
CN105991847B (zh) 通话方法和电子设备
US11610092B2 (en) Information processing system, information processing apparatus, information processing method, and recording medium
JP6699010B2 (ja) 対話方法、対話システム、対話装置、およびプログラム
WO2020070923A1 (ja) 対話装置、その方法、およびプログラム
KR20210156145A (ko) 인공지능 및 증강현실 기술을 활용한, 음성인식 및 감정인식 기반의 쌍방향 대화 시스템
KR20220123170A (ko) 인공지능 아바타 튜터를 활용한 회화 학습 시스템 및 그 방법
Gillam Representing black girlhood in Brazil: Culture and strategies of empowerment
US11954451B1 (en) Observation-based training of artificial intelligence character models
Boland Jr et al. The limits to language in doing systems design
Jensen et al. Intermediality and social media
Sindoni Multimodality and Translanguaging in Video Interactions
KR20190004486A (ko) 더빙/증강현실을 이용한 참여형 대화훈련 학습 방법
KR20220162484A (ko) 실제감을 위한 인공지능 대화제공 서비스 방법 및 장치
Shan et al. Speech-in-noise comprehension is improved when viewing a deep-neural-network-generated talking face
Ballagas et al. Reading, laughing, and connecting with young children
Kerry ‘The Birth of the Virtual Choir’: Exploring the multimodal realisation of the Covid-19 liminal space in a YouTube virtual choir performance
Portillo Films unseen: Approaching audio description alternatives to enhance perception
Emmett Feeling at home: Sound, affect and domesticity on radio soap operas
Ceresa Matías Piñeiro's Viola and the Resonant Drift of Love
Junell English code-switches in Finnish Youtube vlos: Playful attitudes and casual evaluation
Mehendale Immersion Is „Hear‟: A Practitioners‟ Perspective on Immersive Podcasts
Courneya et al. Talking with a Virtual Human: Transdisciplinary Design Considerations for Speech-based Interaction in the Audience with a Hero Project
Okkema Harvester of desires: Gaming amazon echo through john cayley’s the listeners
JP7409628B2 (ja) 結婚式における音楽選曲のための自動選曲システム

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
E601 Decision to refuse application
E801 Decision on dismissal of amendment