KR20130009272A - 녹음정보데이터베이스에 기반한 가상대화 제공시스템 - Google Patents

녹음정보데이터베이스에 기반한 가상대화 제공시스템 Download PDF

Info

Publication number
KR20130009272A
KR20130009272A KR1020110070250A KR20110070250A KR20130009272A KR 20130009272 A KR20130009272 A KR 20130009272A KR 1020110070250 A KR1020110070250 A KR 1020110070250A KR 20110070250 A KR20110070250 A KR 20110070250A KR 20130009272 A KR20130009272 A KR 20130009272A
Authority
KR
South Korea
Prior art keywords
recording information
application program
voice
information
information database
Prior art date
Application number
KR1020110070250A
Other languages
English (en)
Inventor
강장묵
Original Assignee
동국대학교 경주캠퍼스 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 동국대학교 경주캠퍼스 산학협력단 filed Critical 동국대학교 경주캠퍼스 산학협력단
Priority to KR1020110070250A priority Critical patent/KR20130009272A/ko
Publication of KR20130009272A publication Critical patent/KR20130009272A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G06Q50/40
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1815Semantic context, e.g. disambiguation of the recognition hypotheses based on word meaning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/51Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing
    • H04M3/5166Centralised call answering arrangements requiring operator intervention, e.g. call or contact centers for telemarketing in combination with interactive voice response systems or voice portals, e.g. as front-ends

Abstract

본 발명은 녹음정보데이터베이스에 기반한 가상대화 제공시스템 및 방법으로서, 구체적으로는 실제 인물의 목소리를 단어별, 음절별로 녹음하여 어플리케이션 프로그램을 통하여 녹음정보를 조합한 문장을 생성하고 이에 따른 대화를 가상으로 나눌 수 있도록 구성한 가상대화 제공시스템 및 방법에 관한 것이다.
본 발명은 녹음자의 육성(肉聲)이 사전(事前)에 음절 또는 단어별로 저장된 녹음정보데이터베이스가 구축된 관리서버; 및 상기 관리서버에 연동된 어플리케이션 프로그램이 설치되어 있고, 음성입력부 및 음성송출부가 구비된 단말기;를 포함하여 구성되고, 상기 단말기는 상기 어플리케이션 프로그램의 활성화 상태에서, 상기 음성입력부에 이용자 육성의 질문정보가 인식되면 상기 어플리케이션 프로그램에서 상기 질문정보에 대한 시멘틱 분석(sementic analysis)을 통해 답변정보를 생성하고, 상기 답변정보의 음절 또는 단어에 해당되는 한 개 이상의 녹음정보를 상기 관리서버에 요청하여 수신한 후, 상기 답변정보에 대응되도록 상기 녹음정보를 상기 음성송출부로 송출함으로써 가상대화가 이루어지도록 구성된 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 제공한다.
또한 본 발명은 상기 녹음정보데이터베이스는 녹음자별로 카테고리가 구분되어 있고, 상기 단말기는 상기 어플리케이션 프로그램에서 대화상대를 상기 녹음정보데이터베이스의 녹음자 중 1인 이상을 선택하도록 설정된 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 함께 제공한다.
또한 본 발명은 상기 어플리케이션 프로그램이 무작위로 질문정보를 생성하고 필요한 녹음정보를 상기 관리서버로부터 수신하여 상기 음성송출부로 송출하는 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 함께 제공한다.

Description

녹음정보데이터베이스에 기반한 가상대화 제공시스템 및 방법{Virtual Dialog System and Method Based on Recording Voice DataBase}
본 발명은 녹음정보데이터베이스에 기반한 가상대화 제공시스템 및 방법으로서, 구체적으로는 실제 인물의 목소리를 단어별, 음절별로 녹음하여 어플리케이션 프로그램을 통하여 녹음정보를 조합한 문장을 생성하고 이에 따른 대화를 가상으로 나눌 수 있도록 구성한 가상대화 제공시스템 및 방법에 관한 것이다.
음성언어에 따른 정보처리기술은 IT기술의 태동부터 꾸준하게 연구, 개발이 진행되어 왔다. 특히 음성합성분야는 응용분야가 폭넓어 고성능의 대형시스템의 구축과 DSP 칩 개발과 더불어 점차 연구가 깊이를 더해가고 있다.
음성합성이란 기계적인 장치가 전자회로 또는 컴퓨터 모의를 이용하여 자동으로 음성파형을 생성해 내는 것을 말한다. 음성합성에 대한 연구는 다른 음성에 관련된 기술들보다 가장 먼저 연구된 분야이나, 초기에는 음성합성에 대한 연구는 대부분 기계적 또는 전자회로를 이용하여 인간의 발성기관을 모의하는 것이었다. 인간의 발성기관을 모델링하는 것은 아직까지도 음성합성 연구의 궁극적인 목표로 남아있지만, 컴퓨터의 연산 속도 및 기억용량이 급속히 발전하면서 음성합성에 대한 연구는 단순히 인간의 발성기관 모델링에 그치지 않고 다양한 분야로의 응용을 시도하고 있다.
따라서 최근 음성합성 및 음성인식 등 제반 기술은 모바일 환경에서 스마트한 맥락정보를 바탕으로 예측 및 추론이 가능하도록 구현됨에 따라 음성에 대한 문맥적 이해를 기계적 인간적 차원에서 업그레이드시키는 발전을 이루었다. 구체적으로 미디어 다음과 네이버 등의 음성 검색이 활발하게 이용되고 있으며, 이들 포털은 주요 어절과 음성 데이터 등을 OPEN-API 방식으로 배포함에 따라 추가적인 서비스 개발을 용이하게 돕고 있다. 또한 음성인식은 기계와 인간 사이의 단절과 불편을 좁히는 UI 및 UX 기술로 폭 넓게 이해되기도 한다.
음성합성 기술은 실제 응용방식에 따라 크게 두 가지로 구분될 수 있다. 제한된 어휘 개수와 구문구조의 문장만으로 합성하는 제한어휘합성 또는 자동음성 응답시스템과, 임의의 문장을 입력받아 음성을 합성하는 무제한 어휘합성 또는 문서-음성변환시스템이 있다.
자동음성 응답시스템의 기본적인 구성은 음성부호기 및 음성부로기를 구동시키기 위한 파라미터열로 이루어져 있다. 합성하고자 하는 어휘들을 미리 분석하여 파라미터로 저장하였다가 이들의 조합으로 음성 부호기를 구동하여 음성을 합성하는 방법을 이용하므로 합성 대상 어휘가 제한되게 된다. 초기에는 저장가능한 기억장치에 제약이 있어서 음성신호를 파라미터로 변환, 압축하여 저장하였으므로 음성부호기가 필수적이었으나, 근래에는 기억장치가 대용량화되어 음질면에서 우수한 음성신호를 그대로 저장하여 재생하는 방법을 취하고 있다.
이러한 음성합성 기술을 이용하여 고인의 생전 음성을 미리 저장하여 두었다가 고인이 된 이후 어플리케이션 프로그램을 이용하여 고인과의 가상대화를 현실화시키는 시스템이나, 유명한 연예인과 가상대화를 할 수 있는 시스템을 구축하여 유희를 즐기는 방법을 강구해 고인 추모 외에도 다양한 응용 개발이 가능한 비즈니스 모델을 선보일 수 있다.
본 발명은 음성합성 기술에 관련된 응용분야에 착안하여 고인의 생전 음성을 미리 저장하거나, 유명한 연예인의 음성을 저장하여 데이터베이스를 구축하고, 시멘틱 분석(Sementic Analysis)을 이용하여 가상대화에 사용되는 문장을 데이터베이스에서 추출하여 마치 고인이나 연예인과 직접 대화를 하는 듯한 시스템을 구축하는데 그 목적이 있다.
본 발명은 녹음자의 육성(肉聲)이 사전(事前)에 음절 또는 단어별로 저장된 녹음정보데이터베이스가 구축된 관리서버; 및 상기 관리서버에 연동된 어플리케이션 프로그램이 설치되어 있고, 음성입력부 및 음성송출부가 구비된 단말기;를 포함하여 구성되고, 상기 단말기는 상기 어플리케이션 프로그램의 활성화 상태에서, 상기 음성입력부에 이용자 육성의 질문정보가 인식되면 상기 어플리케이션 프로그램에서 상기 질문정보에 대한 시멘틱 분석(sementic analysis)을 통해 답변정보를 생성하고, 상기 답변정보의 음절 또는 단어에 해당되는 한 개 이상의 녹음정보를 상기 관리서버에 요청하여 수신한 후, 상기 답변정보에 대응되도록 상기 녹음정보를 상기 음성송출부로 송출함으로써 가상대화가 이루어지도록 구성된 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 제공한다.
또한 본 발명은 상기 녹음정보데이터베이스는 녹음자별로 카테고리가 구분되어 있고, 상기 단말기는 상기 어플리케이션 프로그램에서 대화상대를 상기 녹음정보데이터베이스의 녹음자 중 1인 이상을 선택하도록 설정된 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 함께 제공한다.
또한 본 발명은 상기 어플리케이션 프로그램이 무작위로 질문정보를 생성하고 필요한 녹음정보를 상기 관리서버로부터 수신하여 상기 음성송출부로 송출하는 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 함께 제공한다.
본 발명에 의하면 다음과 같은 효과가 있다.
1. 본 발명에 의하면 고인의 생전 음성을 들을 수 있어 마치 고인과 직접 대화하는 듯한 효과를 가져오므로, 고인에 대한 새로운 형식의 추모형식이 될 수 있다.
2. 또한 본 발명에 의하면 연예인의 음성을 저장한 경우에는 연예인과 직접 대화를 나누는 듯한 효과가 있어, 유용한 아이템으로 다양한 마케팅 효과 및 유인효과를 가져올 수 있다.
3. 한편 본 발명에 의하면 시멘틱 분석방법을 이용하여 이용자의 음성질문에 대한 다양한 대답을 구현할 수 있으며, 역으로 먼저 녹음된 음성을 이용하여 질문과 같은 대화를 시도할 수 있어 다양한 형태의 가상대화가 가능하다.
4. 향후 홀로그램 등 증강현실 기술이 현실화될 경우, 고인을 모델링하여 현실 공간에 투사하고 디스플레이된 고인의 음성을 본 개발 서비스로 구현함에 따라 증강현실 기술의 음성 부분 적용과 활용이 가능하다.
[도 1]은 본 발명에 따른 녹음정보데이터베이스에 기반한 가상대화 제공시스템의 각 구성요소간의 정보흐름에 관한 대략적인 개념도이다.
[도 2]는 본 발명에 따른 녹음정보데이터베이스에 기반한 가상대화 제공시스템에서 구축된 녹음정보데이터베이스의 실시예이다.
[도 3]은 본 발명에 따른 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 이용하여 연예인과의 가상대화를 시도하는 실시예이다.
[도 4]는 본 발명에 따른 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 이용하여 고인과의 가상대화를 시도하는 실시예이다.
[도 5]는 본 발명에 따른 녹음정보데이터베이스에 기반한 가상대화 제공방법에서 가상대화가 이루어지는 과정에 관한 순서도이다.
Ⅰ. 녹음정보데이터베이스에 기반한 가상대화 제공시스템
본 발명은 녹음자의 육성(肉聲)이 사전(事前)에 음절 또는 단어별로 저장된 녹음정보데이터베이스가 구축된 관리서버; 및 상기 관리서버에 연동된 어플리케이션 프로그램이 설치되어 있고, 음성입력부 및 음성송출부가 구비된 단말기;를 포함하여 구성되고, 상기 단말기는 상기 어플리케이션 프로그램의 활성화 상태에서, 상기 음성입력부에 이용자 육성의 질문정보가 인식되면 상기 어플리케이션 프로그램에서 상기 질문정보에 대한 시멘틱 분석(sementic analysis)을 통해 답변정보를 생성하고, 상기 답변정보의 음절 또는 단어에 해당되는 한 개 이상의 녹음정보를 상기 관리서버에 요청하여 수신한 후, 상기 답변정보에 대응되도록 상기 녹음정보를 상기 음성송출부로 송출함으로써 가상대화가 이루어지도록 구성된 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 제공한다.
또한 본 발명은 상기 녹음정보데이터베이스는 녹음자별로 카테고리가 구분되어 있고, 상기 단말기는 상기 어플리케이션 프로그램에서 대화상대를 상기 녹음정보데이터베이스의 녹음자 중 1인 이상을 선택하도록 설정된 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 함께 제공한다.
또한 본 발명은 상기 어플리케이션 프로그램이 무작위로 질문정보를 생성하고 필요한 녹음정보를 상기 관리서버로부터 수신하여 상기 음성송출부로 송출하는 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 함께 제공한다.
[도 1]은 본 발명에 따른 녹음정보데이터베이스에 기반한 가상대화 제공시스템의 각 구성요소간의 정보흐름에 관한 대략적인 개념도이다. 이하에서는 [도 1]을 참고하여 본 발명의 구성요소간의 흐름을 검토한다.
1. 관리서버(100)
상기 관리서버(100)는 사람의 실제 음성을 단어나 음절별로 저장하는 녹음정보데이터베이스(110)가 구축되어 있는 것을 특징으로 한다. 이는 음성합성을 위한 재료를 구축하기 위한 것인데, 상기 설명한 바와 같이 제한적 음성합성 기술에 이용될 수 있는 단어나 음절을 미리 녹음자로부터 녹음해 두는 것이 필요하다.
[도 2]는 본 발명에 따른 녹음정보데이터베이스에 기반한 가상대화 제공시스템에서 구축된 녹음정보데이터베이스의 실시예이다. 이를 참고하면, 상기 녹음자가 미리 녹음기기를 이용하여 녹음한 단어들을 저장하고 있는 것을 확인할 수 있다. 녹음된 단어가 많을수록 생성할 수 있는 문장이 더욱 다양해진다.
특히 상기 녹음정보데이터베이스(110)는 녹음자별로 분류하여 녹음정보를 구축할 수 있는데, 특히, 연예인의 목소리를 미리 녹음하여 팬 서비스의 차원을 한층 높여주거나, 고인이 돌아가시기 이전 생전 목소리를 녹음해 두면 추모의 새로운 수단으로 이용될 수 있다. 이와 관련된 실시예에 관하여는 이하에서 설명하도록 한다.
2. 단말기(200)
상기 단말기(200)는 유무선통신회선을 사용할 수 있는 단말기(200)를 모두 포함한다. 노트북, 데스크탑뿐만 아니라 3G 또는 WIFI가 가능한 스마트폰을 포함하는 바, 가상대화를 위한 애플리케이션 프로그램의 운용 및 그 효율성은 이동편의성이 좋은 스마트폰이 상기 단말기로서는 가장 바람직하다. 상기 단말기(200)는 상기 관리서버(100)에 접속가능하여야 하므로 인터넷 등 모바일 통신기능이 부가되어 있을 필요가 있다.
또한 상기 단말기(200)는 가상 대화를 위하여 음성입력부(220)와 음성송출부(230)를 구비하고 있을 필요가 있다. 특히 상기 단말기(200)는 어플리케이션 프로그램이 설치되어 활성화 상태일 것을 요하는데, 상기 어플리케이션 프로그램(210)은 상기 관리서버(100)의 녹음정보를 이용하여 상기 단말기(200)의 이용자가 가상의 상대방과 실시간으로 통화하는 것처럼 정보를 제공하는 기능을 수행한다.
먼저 상기 단말기(200)의 이용자가 상기 어플리케이션 프로그램(210)을 실행시키고 상대방목록에서 선택한 상대방과의 대화를 요청하고, 이용자가 "**씨 점심 드셨어요?"라고 상기 음성입력부(220)에 질문정보를 입력시키면 상기 어플리케이션 프로그램(210)은 상기 질문정보를 시멘틱 분석을 하여 적절한 답변정보를 생성해 낸다.
본 발명에 사용되는 시멘틱 분석은 추론시점에 지식베이스에 있는 모델, 사실, 규칙들을 외부 규칙엔진에 보내어 추론하게 한 후 결과를 받아 지식베이스를 갱신하는 구현방법을 포괄적으로 포함한다.
특히 시멘틱 웹(Semantic Web)은 사람이 정보자원을 보고 찾아들어가는 방식이 아니라 컴퓨터가 정보자원의 의미를 스스로 이해해서 논리적 추론을 할 수 있는 차세대 지능형 웹을 말하며, 컴퓨터가 정보자원의 의미를 스스로 해석, 기기들간 서로 정보를 주고 받으면서 스스로 필요한 일을 처리할 수 있다. 이러한 시멘틱 웹의 실현을 바탕으로 컴퓨터가 자동으로 정보를 처리할 수 있어 정보시스템의 생산성과 효율성이 극대화할 수 있다.
이를 위하여 이용되는 시멘틱 분석은 사용자의 다양한 의도와 상황을 이해하고 많은 데이터를 처리할 수 있는 상황인식 시스템을 필요로 한다. 상황인식 시스템이란 외부 사용자의 간섭 없이 현재 상황에 스스로 자신의 오퍼레이션을 적응하는 시스템이다. 이러한 상황인식 시스템의 개발에서 상황인식 프레임워크, SWRL 규칙을 포함한 OWL 온톨로지로 표현되는 시멘틱 추론에 기반한 상황인식 프레임워크가 제안되고 있다. 이러한 상황인식 프레임워크에서는 지식베이스에 저장된 모델(model), 사실(fact), 규칙(rule)이 모두 OWL 구문으로 표현되어 지식베이스 구조가 간결하며, 규칙 표현에 모델과 사실 표현을 그대로 사용할 수 있다.
온톨로지 기술은 웹에 자원, 속성, 속상값 등 자원을 기술하는 언어인 메타데이터(Metadata)를 부여해 정보의 의미를 이해하고 처리할 수 있도록 하는 것이며, 토픽맵 기술은 ISO의 XML 기반 표준기술언어인 XTM 언어를 이용해 정보와 지식의 분산 관리를 지원하는 기술로 지식층과 정보층의 이중구조로 되어 있다.
이러한 시멘틱 분석에 의하여 답변정보가 "네 잘 먹었습니다. 당신은요?" 라고 생성되었다면 상기 단말기(200)는 상기 녹음정보데이터베이스(210)에 해당 녹음자 카테고리에서 해당 단어 또는 음절인 "네, 잘, 먹었,습니다, 당신,은요?"를 추출하여 상기 음성송출부(230)로 송출하는 과정으로 실행된다.
[도 3]은 본 발명에 따른 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 이용하여 연예인과의 가상대화를 시도하는 실시예이며, [도 4]는 본 발명에 따른 녹음정보데이터베이스에 기반한 가상대화 제공시스템을 이용하여 고인과의 가상대화를 시도하는 실시예이다. [도 3],[도 4]는 본 시스템을 이용할 수 있는 분야를 예로 들고 있는데, 먼저 [도 3]은 연예인과의 가상대화를 제공한다는 점에서 자신이 좋아하는 연예인과 좀 더 밀접한 관계를 형성하는 서비스를 제공하는 효과가 있다.
또한 [도 4]는 조부모님이나 부모님께서 생전 살아계실 때 미리 육성을 녹음시켜 두었다가 고인이 되신 이후에 고인의 육성이 듣고 싶은 경우에는 상기 애플리케이션 프로그램(210)을 설치하여 고인과의 가상대화를 시도해 볼 수 있어 새로운 추모개념의 아이템이 될 수 있다.
Ⅱ. 녹음정보데이터베이스에 기반한 가상대화 제공방법
본 발명은 녹음자의 음성이 음절 또는 단어별로 저장된 녹음정보데이터베이스가 구축된 관리서버; 및 상기 관리서버에 연동된 어플리케이션 프로그램이 설치되어 있고, 음성송출부 및 음성입력부가 구비된 단말기;를 포함하여 구성되는 시스템에서, 상기 단말기는, (a) 상기 단말기의 어플리케이션 프로그램 활성화 상태에서 상기 음성입력부에 이용자 육성(肉聲)의 질문정보가 인식되는 단계; (b) 상기 어플리케이션 프로그램에 의해 상기 질문정보를 시멘틱 분석(sementic analysis)방식에 따라 분석하여 답변정보를 생성하고, (c) 상기 답변정보에 필요한 한 개 이상의 녹음정보를 상기 관리서버에 요청하여 수신하는 단계; (d) 상기 수신한 한 개 이상의 녹음정보를 순서대로 상기 음성송출부로 송출하는 단계;가 반복수행되어 단독의 이용자에 의해서도 대화가 형성되는 녹음정보데이터베이스에 기반한 가상대화 제공방법을 제공한다.
또한 본 발명은 상기 녹음정보데이터베이스는 녹음자별로 카테고리가 구분되어 있고, (a-1) 상기 단말기는 상기 어플리케이션 프로그램에서 대화상대를 상기 녹음정보데이터베이스의 녹음자 중 1인 이상을 선택하도록 설정하는 단계;가 (a) 단계 이전에 수행되는 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공방법을 함께 제공한다.
또한 본 발명은 (a-2) 상기 어플리케이션 프로그램이 무작위로 대화정보를 생성하고 필요한 녹음정보를 상기 관리서버로부터 수신하여 상기 음성송출부로 송출하는 단계;가 (a) 단계 이전에 수행되는 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공방법을 함께 제공한다.
[도 5]는 본 발명에 따른 녹음정보데이터베이스에 기반한 가상대화 제공방법에서 가상대화가 이루어지는 과정에 관한 순서도이다. [도 5]를 참조하여 이하에서는 각 단계별로 구체적인 내용을 상세히 기술해보고자 한다.
(a)단계는 상기 단말기의 어플리케이션 프로그램 활성화 상태에서 상기 음성입력부에 이용자 육성(肉聲)의 질문정보가 인식되는 단계이다. 먼저 상기 단말기(200)에는 상기 어플리케이션 프로그램(210)이 설치되고 활성화되어 있는 것이 필요하다. 상기 단말기의 이용자가 상기 음성입력부(220)에 일정 질문정보를 입력하는데, 예를 들면 " **님 오늘 하루 즐거웠나요?"라고 입력할 수 있다. 질문정보의 입력은 음성으로 입력할 수 있으나, 문자입력이나 그 외 광범위한 입력수단을 이용하여 음성입력을 변환시키는 것을 포함한다.
(a-1)단계는 상기 단말기는 상기 어플리케이션 프로그램에서 대화상대를 상기 녹음정보데이터베이스의 녹음자 중 1인 이상을 선택하도록 설정하는 단계;가 (a) 단계 이전에 수행되는 것을 특징으로 할 수 있다. 상기 녹음자가 연예인인 경우에는 상기 어플리케이션 프로그램(210)에 미리 다수의 연예인 녹음자 목록이 포함되어 있어 이 중에서 상기 단말기의 이용자가 대화하고픈 상대방을 선택한 후에 가상대화를 시도할 수 있도록 하기 위함이다.
(a-2)단계는 상기 어플리케이션 프로그램이 무작위로 대화정보를 생성하고 필요한 녹음정보를 상기 관리서버로부터 수신하여 상기 음성송출부로 송출하는 단계가 (a) 단계 이전에 수행되는 것을 특징으로 할 수 있다. 이는 상기 단말기의 이용자가 먼저 질문을 하지 않고도, 상기 어플리케이션 프로그램에 활성화상태에 있다면 무작위적인 시간에 무작위적인 대화정보, 즉 질문정보와 유사하게 대화를 거는 방식의 음성정보를 상기 음성송출부(230)를 통하여 먼저 송출시킨 다음에 이하의 단계가 진행될 수 있도록 구성하는 데 특징이 있다.
(b)단계는 상기 어플리케이션 프로그램에 의해 상기 질문정보를 시멘틱 분석(sementic analysis)방식에 따라 분석하여 답변정보를 생성하는 단계이다. 상기 질문정보에 따라 상기 어플리케이션 프로그램에 의해서 이루어지는 시멘틱 분석은 시멘틱 추론을 위해 시멘틱 웹 기술 및 상황인식 시스템을 응용할 수 있다. 즉 질문정보를 상기 어플리케이션 프로그램 내에서 자체적으로 분석하고 그에 맞는 답변정보를 상황에 맞도록 생성하는 것을 의미한다.
(c)단계는 상기 답변정보에 필요한 한 개 이상의 녹음정보를 상기 관리서버에 요청하여 수신하는 단계이다. 상기 단말기(200)는 상기 관리서버(100)와 연동되어 있어 상기 어플리케이션 프로그램(210)이 생성한 답변정보에 필요한 녹음정보를 상기 관리서버의 녹음정보데이터베이스(110)로부터 추출할 수 있다.
(d)단계는 상기 수신한 한 개 이상의 녹음정보를 순서대로 상기 음성송출부로 송출하는 단계이다. 상기 녹음정보데이터베이스(110)로부터 추출한 녹음정보는 상기 답변정보의 내용에 맞게 순서대로 상기 단말기의 음성송출부(230)로 송출됨으로써 상기 단말기의 이용자의 질문에 가상으로 대답하는 형식의 구성이 갖추어진다.
상기 단계들이 반복적으로 수행되므로써 가상대화가 이루어지며 이러한 대화내용을 따로 저장하거나 다른 단말기로 송신하는 기능이 부수적으로 제공될 수 있다.
본 발명은 위에서 언급한 바와 같이 첨부된 도면과 관련하여 설명되었으나 본 발명의 요지를 벗어남이 없는 범위 내에서 다양한 수정 및 변형이 가능하며, 다양한 분야에서 사용 가능하다. 따라서 본 발명의 청구범위는 이건 발명의 진정한 범위 내에 속하는 수정 및 변형을 포함한다.
100 : 관리서버 110 : 녹음정보데이터베이스
200 : 단말기 210 : 어플리케이션 프로그램
220 : 음성입력부 230 : 음성송출부

Claims (6)

  1. 녹음자의 육성(肉聲)이 사전(事前)에 음절 또는 단어별로 저장된 녹음정보데이터베이스가 구축된 관리서버; 및
    상기 관리서버에 연동된 어플리케이션 프로그램이 설치되어 있고, 음성입력부 및 음성송출부가 구비된 단말기;를 포함하여 구성되고,
    상기 단말기는 상기 어플리케이션 프로그램의 활성화 상태에서,
    상기 음성입력부에 이용자 육성의 질문정보가 인식되면 상기 어플리케이션 프로그램에서 상기 질문정보에 대한 시멘틱 분석(sementic analysis)을 통해 답변정보를 생성하고,
    상기 답변정보의 음절 또는 단어에 해당되는 한 개 이상의 녹음정보를 상기 관리서버에 요청하여 수신한 후, 상기 답변정보에 대응되도록 상기 녹음정보를 상기 음성송출부로 송출함으로써 가상대화가 이루어지도록 구성된 녹음정보데이터베이스에 기반한 가상대화 제공시스템.
  2. 제1항에서,
    상기 녹음정보데이터베이스는 녹음자별로 카테고리가 구분되어 있고,
    상기 단말기는 상기 어플리케이션 프로그램에서 대화상대를 상기 녹음정보데이터베이스의 녹음자 중 1인 이상을 선택하도록 설정된 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공시스템.
  3. 제1항에서,
    상기 어플리케이션 프로그램이 무작위로 질문정보를 생성하고 필요한 녹음정보를 상기 관리서버로부터 수신하여 상기 음성송출부로 송출하는 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공시스템.
  4. 녹음자의 음성이 음절 또는 단어별로 저장된 녹음정보데이터베이스가 구축된 관리서버; 및 상기 관리서버에 연동된 어플리케이션 프로그램이 설치되어 있고, 음성송출부 및 음성입력부가 구비된 단말기;를 포함하여 구성되는 시스템에서,
    상기 단말기는,
    (a) 상기 단말기의 어플리케이션 프로그램 활성화 상태에서 상기 음성입력부에 이용자 육성(肉聲)의 질문정보가 인식되는 단계;
    (b) 상기 어플리케이션 프로그램에 의해 상기 질문정보를 시멘틱 분석(sementic analysis)방식에 따라 분석하여 답변정보를 생성하는 단계;
    (c) 상기 답변정보에 필요한 한 개 이상의 녹음정보를 상기 관리서버에 요청하여 수신하는 단계;
    (d) 상기 수신한 한 개 이상의 녹음정보를 순서대로 상기 음성송출부로 송출하는 단계;
    가 반복수행되어 단독의 이용자에 의해서도 대화가 형성되는 녹음정보데이터베이스에 기반한 가상대화 제공방법.
  5. 제4항에서,
    상기 녹음정보데이터베이스는 녹음자별로 카테고리가 구분되어 있고,
    (a-1) 상기 단말기는 상기 어플리케이션 프로그램에서 대화상대를 상기 녹음정보데이터베이스의 녹음자 중 1인 이상을 선택하도록 설정하는 단계;
    가 (a) 단계 이전에 수행되는 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공방법.
  6. 제4항에서,
    (a-2) 상기 어플리케이션 프로그램이 무작위로 대화정보를 생성하고 필요한 녹음정보를 상기 관리서버로부터 수신하여 상기 음성송출부로 송출하는 단계;
    가 (a) 단계 이전에 수행되는 것을 특징으로 하는 녹음정보데이터베이스에 기반한 가상대화 제공방법.

KR1020110070250A 2011-07-15 2011-07-15 녹음정보데이터베이스에 기반한 가상대화 제공시스템 KR20130009272A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110070250A KR20130009272A (ko) 2011-07-15 2011-07-15 녹음정보데이터베이스에 기반한 가상대화 제공시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110070250A KR20130009272A (ko) 2011-07-15 2011-07-15 녹음정보데이터베이스에 기반한 가상대화 제공시스템

Publications (1)

Publication Number Publication Date
KR20130009272A true KR20130009272A (ko) 2013-01-23

Family

ID=47839086

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110070250A KR20130009272A (ko) 2011-07-15 2011-07-15 녹음정보데이터베이스에 기반한 가상대화 제공시스템

Country Status (1)

Country Link
KR (1) KR20130009272A (ko)

Similar Documents

Publication Publication Date Title
CN109829039B (zh) 智能聊天方法、装置、计算机设备及存储介质
US9672467B2 (en) Systems and methods for creating and implementing an artificially intelligent agent or system
US9355092B2 (en) Human-like response emulator
CN107294837A (zh) 采用虚拟机器人进行对话交互的方法和系统
US10019670B2 (en) Systems and methods for creating and implementing an artificially intelligent agent or system
US11853345B2 (en) Automated content generation and delivery
Wilks et al. A prototype for a conversational companion for reminiscing about images
CN109313668B (zh) 构建会话理解系统的系统和方法
Chao et al. Emerging technologies of natural language-enabled chatbots: a review and trend forecast using intelligent ontology extraction and patent analytics
Arora et al. Artificial intelligence and virtual assistant—working model
JP2019091416A (ja) 人工知能応用を構築する方法及び装置
Abdullah et al. Paralinguistic speech processing: An overview
WO2022056172A1 (en) Interactive communication system with natural language adaptive components
CN115222857A (zh) 生成虚拟形象的方法、装置、电子设备和计算机可读介质
Tyagi et al. Speech Recognition Intelligence System for Desktop voice Assistant by using AI &IoT
KR20130009272A (ko) 녹음정보데이터베이스에 기반한 가상대화 제공시스템
Ning et al. The development trend of intelligent speech interaction
Feng et al. A platform for building mobile virtual humans
Torres-Cruz et al. Evaluation of Performance of Artificial Intelligence System during Voice Recognition in Social Conversation
Singh Analysis of Currently Open and Closed-source Software for the Creation of an AI Personal Assistant
Nemoto et al. AC lassification and A nalysis F ocusing on A ttempts to G ive a C omputer a P ersonality: AT echnological H istory of C hatbots as S imple A rtificial Intelligence
Moreira Smart speakers and the news in Portuguese: consumption pattern and challenges for content producers
de Andrade Moreira et al. Smart speakers and the news in Portuguese: consumption pattern and challenges for content producers
Kearns It’s Time to Personalise the Voice
AU2012265618B2 (en) Human-like response emulator

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application