KR102182455B1

KR102182455B1 - 배경 음악이 삽입된 음성 멘트 제공 방법 및 이를 실행하는 장치

Info

Publication number: KR102182455B1
Application number: KR1020200037237A
Authority: KR
Inventors: 이병오
Original assignee: 이병오
Priority date: 2020-03-27
Filing date: 2020-03-27
Publication date: 2020-11-24

Abstract

본 발명의 일 실시예에 따른 배경 음악이 삽입된 음성 멘트 제공 장치는 사용자로부터 정적 텍스트 멘트를 수신하는 정적 텍스트 멘트 수신부, 단어 데이터베이스를 기초로 상기 정적 텍스트 멘트를 분석하여 정적 텍스트 멘트 분석 정보를 생성하는 정적 멘트 분석부, 상황 정보 수집 장치를 통해 수신된 상황 정보, 시간 정보 별 멘트 데이터베이스 및 상황 정보 별 사용자 심리 데이터베이스를 이용하여 이벤트 종류 및 사용자 심리가 할당된 현재 상황 정보를 생성하는 현재 상황 정보 생성부, 상기 현재 상황 정보 생성부로부터 현재 상황 정보를 수신하면, 상기 현재 상황 정보에 할당된 이벤트 종류에 따라 단어 데이터베이스 및 상황 별 텍스트 멘트 데이터베이스를 이용하여 동적 텍스트 멘트를 생성하는 동적 텍스트 멘트 생성부, 상기 정적 텍스트 멘트 및 상기 동적 텍스트 멘트 중 어느 하나의 텍스트 멘트를 음성 멘트로 변환하는 음성 변환부, 상기 현재 상황 정보 생성부로부터 수신된 현재 상황 정보에 할당된 사용자 심리 또는 상기 정적 멘트 분석부로부터 수신된 정적 텍스트 멘트 분석 정보에 따라 배경 음악 데이터베이스에 저장된 음악 중 어느 하나의 음악을 배경 음악으로 결정하는 배경 음악 결정부 및 상기 배경 음악 결정부에 의해 결정된 배경 음악 및 상기 음성 변환부에 의해 변환된 음성 멘트와 합성하여 배경 음악이 삽입된 음성 멘트를 생성하는 합성부를 포함한다.

Description

배경 음악이 삽입된 음성 멘트 제공 방법 및 이를 실행하는 장치{METHOD OF PROVIDING VOICE ANNOUNCEMENT HAVING BACKGROUND MUSIC AND APPARATUS PERFORMING THE SAME}

본 발명은 배경 음악이 삽입된 음성 멘트 제공 방법 및 이를 실행하는 장치에 관한 것으로, 동적 또는 정적으로 생성된 텍스트 멘트를 TTS(TTS; Text-To-Speech) 기술을 통해 음성으로 변환한 후 텍스트 멘트에 해당하는 배경 음악을 삽입하여 제공하는 배경 음악이 삽입된 음성 멘트 제공 방법 및 이를 실행하는 장치에 관한 것이다.

일반적으로 텍스트-음성 합성(TTS; Text-To-Speech)이라고 불리는 음성 합성 기술은 안내방송, 네비게이션, 인공지능 비서 등과 같이 사람의 음성이 필요한 어플리케이션에서 실제 사람의 음성을 사전에 녹음해 두지 않고 필요한 음성을 재생하기 위해 사용되는 기술이다.

음성 합성의 전형적인 방법은, 음성을 음소 등 아주 짧은 단위로 미리 잘라서 저장해두고, 합성할 문장을 구성하는 음소들을 결합하여 음성을 합성하는 연결 합성 방식(concatenative TTS)와, 음성의 특징을 파라미터로 표현하고 합성할 문장을 구성하는 음성 특징들을 나타내는 파라미터들을 보코더(vocoder)를 이용해 문장에 대응하는 음성으로 합성하는 매개 변수 합성 방식(parametric TTS)이 있다.

한편, 방송장비가 구비된 건물 혹은 다중이용 시설 등에서 내부 근무자 및 시설이용자(외국인포함)에게 각종 안내방송이나 공지사항 등을 방송할 필요성이 있다. 안내 방송을 하기 위해서는 미리 녹음된 음원이나 마이크 등을 통해 수동으로 방송하는 것이 일반적이다. 하지만, 종래의 방송 시스템의 경우 필요시마다 관리자가 직접 마이크를 이용하여 수동으로 방송을 수행하여야 하는 불편함이 있다.

본 발명은 동적 또는 정적으로 생성된 텍스트 멘트를 TTS(TTS; Text-To-Speech) 기술을 통해 음성으로 변환한 후 텍스트 멘트에 해당하는 배경 음악을 삽입하여 제공하는 배경 음악이 삽입된 음성 멘트 제공 방법 및 이를 실행하는 장치를 제공하는 것을 목적으로 한다.

또한, 본 발명은 상황 정보 수집 장치를 통해 수집된 상황 정보에 따라 현재 상황 정보에 이벤트의 종류 및 배경 음악 설정 옵셜을 할당함으로써 이벤트의 종류에 따라 텍스트 멘트가 동적으로 생성되고 배경 음악 설정 옵션에 따라 배경 음악이 결정될 수 있도록 하여 상황에 적합한 멘트 및 배경 음악이 합성되어 제공될 수 있도록 하는 배경 음악이 삽입된 음성 멘트 제공 방법 및 이를 실행하는 장치를 제공하는 것을 목적으로 한다.

또한, 본 발명은 텍스트 멘트가 현재 상황 정보에 따라 동적으로 생성되기 때문에 현재 상황이 긴급한 상황이 발생한 경우 정적 텍스트 멘트를 입력하지 않아도 배경 음악이 삽입된 음성 멘트를 제공할 수 있도록 하는 배경 음악이 삽입된 음성 멘트 제공 방법 및 이를 실행하는 장치를 제공하는 것을 목적으로 한다.

본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 발명의 목적 및 장점들은 특허 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.

이러한 목적을 달성하기 위한 배경 음악이 삽입된 음성 멘트 제공 장치는 사용자로부터 정적 텍스트 멘트를 수신하는 정적 텍스트 멘트 수신부, 단어 데이터베이스를 기초로 상기 정적 텍스트 멘트를 분석하여 정적 텍스트 멘트 분석 정보를 생성하는 정적 멘트 분석부, 상황 정보 수집 장치를 통해 수신된 상황 정보, 시간 정보 별 멘트 데이터베이스 및 상황 정보 별 사용자 심리 데이터베이스를 이용하여 이벤트 종류 및 사용자 심리가 할당된 현재 상황 정보를 생성하는 현재 상황 정보 생성부, 상기 현재 상황 정보 생성부로부터 현재 상황 정보를 수신하면, 상기 현재 상황 정보에 할당된 이벤트 종류에 따라 단어 데이터베이스 및 상황 별 텍스트 멘트 데이터베이스를 이용하여 동적 텍스트 멘트를 생성하는 동적 텍스트 멘트 생성부, 상기 정적 텍스트 멘트 및 상기 동적 텍스트 멘트 중 어느 하나의 텍스트 멘트를 음성 멘트로 변환하는 음성 변환부, 상기 현재 상황 정보 생성부로부터 수신된 현재 상황 정보에 할당된 사용자 심리 또는 상기 정적 멘트 분석부로부터 수신된 정적 텍스트 멘트 분석 정보에 따라 배경 음악 데이터베이스에 저장된 음악 중 어느 하나의 음악을 배경 음악으로 결정하는 배경 음악 결정부 및 상기 배경 음악 결정부에 의해 결정된 배경 음악 및 상기 음성 변환부에 의해 변환된 음성 멘트와 합성하여 배경 음악이 삽입된 음성 멘트를 생성하는 합성부를 포함한다.

또한, 이러한 목적을 달성하기 위한 배경 음악이 삽입된 음성 멘트 제공 장치에서 실행되는 배경 음악이 삽입된 음성 멘트 제공 방법은 사용자로부터 정적 텍스트 멘트 또는 상황 정보 수집 장치를 통해 수신된 상황 정보를 수신하는 단계, 단어 데이터베이스를 기초로 상기 정적 텍스트 멘트를 분석하여 정적 텍스트 멘트 분석 정보를 생성하거나 상기 상황 정보 수집 장치를 통해 수신된 상황 정보, 시간 정보 별 멘트 데이터베이스 및 상황 정보 별 사용자 심리 데이터베이스를 이용하여 이벤트 종류 및 사용자 심리가 할당된 현재 상황 정보를 생성하는 단계, 상기 현재 상황 정보에 할당된 이벤트 종류에 따라 단어 데이터베이스 및 상황 별 텍스트 멘트 데이터베이스를 이용하여 동적 텍스트 멘트를 생성하는 단계, 상기 동적 텍스트 멘트 또는 상기 정적 텍스트 멘트를 음성 멘트로 변환하는 단계, 현재 상황 정보에 할당된 사용자 심리 또는 상기 정적 텍스트 멘트 분석 정보에 할당된 사용자 심리에 따라 배경 음악 데이터베이스에 저장된 음악 중 어느 하나의 음악을 배경 음악으로 결정하는 단계 및 상기 배경 음악 및 상기 음성 멘트와 합성하여 배경 음악이 삽입된 음성 멘트를 생성하는 단계를 포함한다.

전술한 바와 같은 본 발명에 의하면, 동적 또는 정적으로 생성된 텍스트 멘트를 TTS(TTS; Text-To-Speech) 기술을 통해 음성으로 변환한 후 텍스트 멘트에 해당하는 배경 음악을 삽입하여 제공한다는 장점이 있다.

또한 본 발명에 의하면, 상황 정보 수집 장치를 통해 수집된 상황 정보에 따라 현재 상황 정보에 이벤트의 종류 및 배경 음악 설정 옵셜을 할당함으로써 이벤트의 종류에 따라 텍스트 멘트가 동적으로 생성되고 배경 음악 설정 옵션에 따라 배경 음악이 결정될 수 있도록 하여 상황에 적합한 멘트 및 배경 음악이 합성되어 제공될 수 있다는 장점이 있다.

또한 본 발명에 의하면, 텍스트 멘트가 현재 상황 정보에 따라 동적으로 생성되기 때문에 현재 상황이 긴급한 상황이 발생한 경우 정적 텍스트 멘트를 입력하지 않아도 배경 음악이 삽입된 음성 멘트를 제공할 수 있다는 장점이 있다.

도 1은 본 발명의 일 실시예에 따른 배경 음악이 삽입된 음성 멘트 제공 시스템을 설명하기 위한 네트워크 구성도이다.
도 2는 본 발명의 일 실시예에 따른 배경 음악이 삽입된 음성 멘트 제공 장치의 내부 구조를 설명하기 위한 블록도이다.
도 3은 본 발명에 따른 배경 음악이 삽입된 음성 멘트 제공 방법의 일 실시예를 설명하기 위한 흐름도이다.
도 4는 본 발명에 따른 배경 음악이 삽입된 음성 멘트 제공 방법의 다른 일 실시예를 설명하기 위한 흐름도이다.

전술한 목적, 특징 및 장점은 첨부된 도면을 참조하여 상세하게 후술되며, 이에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 상세한 설명을 생략한다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하기로 한다. 도면에서 동일한 참조부호는 동일 또는 유사한 구성요소를 가리키는 것으로 사용된다.

도 1은 본 발명의 일 실시예에 따른 배경 음악이 삽입된 음성 멘트 제공 시스템을 설명하기 위한 네트워크 구성도이다.

도 1을 참조하면, 배경 음악이 삽입된 음성 멘트 제공 시스템은 배경 음악이 삽입된 음성 멘트 제공 장치(100), 사용자 단말(200_1, 200_2, …, 200_N) 및 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 포함한다.

배경 음악이 삽입된 음성 멘트 제공 장치(100)는 동적 또는 정적으로 생성된 텍스트 멘트를 TTS(TTS; Text-To-Speech) 기술을 통해 음성으로 변환한 후 텍스트 멘트에 해당하는 배경 음악을 삽입하여 제공하는 장치이다.

일 실시예에서, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 사용자 단말(200_1, 200_2, …, 200_N)로부터 정적 텍스트 멘트를 수신하면, 정적 텍스트 멘트를 분석하여 정적 텍스트 멘트 분석 정보를 생성한다.

다른 일 실시예에서, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 상황 정보 수집 장치(300_1, 300_2, …, 300_N)로부터 수신된 상황 정보, 시간 정보 별 멘트 데이터베이스 및 상황 정보 별 사용자 심리 데이터베이스를 이용하여 이벤트 종류 및 사용자 심리가 할당된 현재 상황 정보를 생성한다.

그런 다음, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 현재 상황 정보에 할당된 이벤트 종류에 따라 동적 텍스트 멘트의 생성하고 현재 상황 정보에 할당된 사용자 심리에 따라 배경 음악을 결정한다.

그 후, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 동적 텍스트 멘트를 음성 멘트로 변환한 후 배경 음악을 합성하여 배경 음악이 삽입된 음성 멘트를 생성한다.

사용자 단말(200_1, 200_2, …, 200_N)은 미리 결정된 시점에 정적 텍스트 멘트를 배경 음악이 삽입된 음성 멘트 제공 장치(100)에 제공하는 사용자가 보유하는 단말이다. 이러한 사용자 단말(200_1, 200_2, …, 200_N)은 노트북, 데스크탑, 스마트폰 등으로 구현될 수 있다.

상황 정보 수집 장치(300_1, 300_2, …, 300_N)는 배경 음악이 삽입된 음성 멘트 제공 장치(100)가 설치된 건물의 주변에 설치되어 상황 정보를 수집하는 장치이다. 이러한 상황 정보 수집 장치(300_1, 300_2, …, 300_N)는 시계, 온도 센서, 습도 센서 등으로 구현될 수 있다.

이때, 상황 정보는 상황 정보 수집 장치(300_1, 300_2, …, 300_N)의 종류에 따라 변경될 수 있으며, 시간 정보, 온도 정보, 연기 감지 정보, 날씨 정보(예를 들어, 온도, 미세먼지 여부, 강수, 바람, 습도 등) 등을 포함할 수 있다.

도 2는 본 발명의 일 실시예에 따른 배경 음악이 삽입된 음성 멘트 제공 장치의 내부 구조를 설명하기 위한 블록도이다.

도 2를 참조하면, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 정적 텍스트 멘트 수신부(105), 정적 텍스트 멘트 분석부(110), 현재 상황 정보 생성부(115), 동적 텍스트 멘트 생성부(120), 배경 음악 결정부(125), 음성 변환부(130), 합성부(135), 시간 정보 별 멘트 데이터베이스(140), 상황 정보 별 사용자 심리 데이터베이스(145), 단어 데이터베이스(150) 및 상황 별 텍스트 멘트 데이터베이스(155)를 포함한다.

정적 텍스트 멘트 수신부(105)는 사용자로부터 정적 텍스트 멘트를 수신하고, 사용자로부터 수신된 정적 텍스트 멘트를 정적 멘트 분석부(110) 및 음성 변환부(130)에 제공한다.

정적 멘트 분석부(110)는 정적 텍스트 멘트 수신부(105)로부터 정적 텍스트 멘트를 수신하면, 단어 데이터베이스(150)를 기초로 정적 텍스트 멘트를 분석하여 정적 텍스트 멘트 분석 정보를 생성한다.

일 실시예에서, 정적 멘트 분석부(110)는 정적 텍스트 멘트를 형태소 분석하여 정적 멘트 키워드를 추출하고, 단어 데이터베이스(150)에서 정적 멘트 키워드와 매칭되는 단어를 추출한다.

그런 다음, 단어 데이터베이스(150)에서 정적 멘트 분석부(110)는 정적 멘트 키워드와 매칭되는 단어의 부가 정보를 추출하고, 부가 정보를 이용하여 정적 텍스트 멘트 분석 정보를 생성한다. 이때, 부가 정보는 실제 사용 시간, 사용 빈도, 추천 사용 시간, 추천 사용 상황 등을 포함할 수 있다.

상기의 실시예에서, 정적 멘트 분석부(110)는 정적 멘트 키워드와 매칭되는 단어의 사용 빈도가 특정 빈도 이하인 경우, 실제 사용 시간 및 추천 사용 시간을 비교하여 최종 사용 시간을 결정한다. 즉, 정적 멘트 분석부(110)는 실제 사용 시간 및 추천 사용 시간 사이의 차이 시간이 특정 시간 이하인 경우 실제 사용 시간을 최종 사용 시간으로 결정한다.

그런 다음, 정적 멘트 분석부(110)는 최종 사용 시간에 해당하는 사용자 심리를 정적 텍스트 멘트 분석 정보에 할당하여 배경 음악 결정부(125)에 제공한다. 이때, 배경 음악 결정부(125)가 배경 음악을 결정할 때 참조되는 정보이며, 미리 결정된 주파수로 표현된다.

현재 상황 정보 생성부(115)는 상황 정보 수집 장치(300_1, 300_2, …, 300_N)(예를 들어, 시계, 온도 센서, 습도 센서 등)를 통해 수신된 상황 정보, 시간 정보 별 멘트 데이터베이스(140) 및 상황 정보 별 사용자 심리 데이터베이스(145)를 이용하여 이벤트 종류 및 사용자 심리가 할당된 현재 상황 정보를 생성하고, 현재 상황 정보를 동적 텍스트 멘트 생성부(120) 및 배경 음악 합성부(135) 각각에 제공한다.

즉, 현재 상황 정보 생성부(115)는 시간 정보 별 멘트 데이터베이스(140)에 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 통해 수신된 상황 정보 중 시간 정보 및 날씨 정보를 이용하여 이벤트의 종류를 결정한다.

일 실시예에서, 현재 상황 정보 생성부(115)는 시간 정보 별 멘트 데이터베이스(140)에 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 통해 수신된 시간 정보에 해당하는 멘트가 존재하는 경우 시점 일치 이벤트를 지시하는 이벤트 종류를 현재 상황 정보에 할당한다. 이때, 이벤트의 종류는 동적 텍스트 멘트 생성부(120)가 동적 텍스트 멘트를 생성할 때 참조되는 정보이다.

그 후, 현재 상황 정보 생성부(115)는 상황 정보 별 사용자 심리 데이터베이스(145)를 기초로 날씨 정보에 해당하는 사용자 심리를 추출하여 현재 상황 정보에 할당한다. 이때, 사용자 심리는 배경 음악 결정부(125)가 배경 음악을 결정할 때 참조되는 정보이며, 미리 결정된 주파수로 표현된다.

이와 같이, 사용자 심리가 주파수로 표현되는 이유는 사용자 심리에 해당하는 배경 음악을 결정할 때 음악의 주파수와의 통해 주파수 차이가 가장 작은 음악을 배경 음악으로 결정하기 위해서이다.

다른 일 실시예에서, 현재 상황 정보 생성부(115)는 시간 정보 별 멘트 데이터베이스(140)에 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 통해 수신된 상황 정보 중 시간 정보에 해당하는 멘트가 존재하지 않는 경우, 상황 정보 수집 장치(300_1, 300_2, …, 300_N) 각각의 온도 정보 비교하여 온도 차이가 특정 온도 이상인지 여부를 확인한다.

상기의 실시예에서, 현재 상황 정보 생성부(115)는 온도 차이가 특정 온도 이상이고 온도 차이가 증가되는 경우, 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 통해 수신된 상황 정보 중 연기 감지 정보를 이용하여 연기가 감지되면 긴급 상황 발생 이벤트를 지시하는 이벤트 종류를 현재 상황 정보에 할당한다.

그 후, 현재 상황 정보 생성부(115)는 상황 정보 별 사용자 심리 데이터베이스(145)를 기초로 화재 발생에 해당하는 사용자 심리를 추출하여 현재 상황 정보에 할당한다. 이때, 사용자 심리는 배경 음악 결정부(125)가 배경 음악을 결정할 때 참조되는 정보이며, 미리 결정된 주파수로 표현된다.

동적 텍스트 멘트 생성부(120)는 현재 상황 정보 생성부(115)로부터 현재 상황 정보를 수신하면, 현재 상황 정보에 할당된 이벤트 종류에 따라 단어 데이터베이스(150) 및 상황 별 텍스트 멘트 데이터베이스(155)를 이용하여 동적 텍스트 멘트를 생성한다.

일 실시예에서, 동적 텍스트 멘트 생성부(120)는 현재 상황 정보에 할당된 이벤트 종류가 시점 일치 이벤트인 경우, 단어 데이터베이스(150)에 저장된 단어의 부가 정보(즉, 사용 시간 및 추천 사용 시간)를 이용하여 해당 시점에 사용되는 단어를 추출하고, 시간 정보 별 멘트 데이터베이스에서 해당 시점에 해당하는 멘트 포맷을 추출하고, 상기 멘트 포맷에 상기 단어를 배치하여 동적 텍스트 멘트를 생성한다.

다른 일 실시예에서, 동적 텍스트 멘트 생성부(120)는 현재 상황 정보에 할당된 이벤트 종류가 긴급 상황 발생 이벤트인 경우, 단어 데이터베이스(150)에 저장된 단어의 부가 정보(즉, 사용 상황)를 이용하여 해당 시점에 사용되는 단어를 추출하고, 상황 별 텍스트 멘트 데이터베이스(155)스에서 해당 상황에 해당하는 멘트 포맷을 추출하고, 상기 멘트 포맷에 상기 단어를 배치하여 동적 텍스트 멘트를 생성한다.

단어 데이터베이스(150)에는 동적 텍스트 멘트에 생성되는데 사용되는 단어가 저장되어 있는 데이터베이스이다. 이때, 단어 데이터베이스(150)에는 단어 뿐만 아니라 단어의 실제 사용 시간, 사용 빈도, 추천 사용 시간, 추천 사용 상황 등이 함께 저장되어 있다.

상기의 실제 사용 시간은 단어의 실제 사용 시간을 의미하며, 정적 텍스트 멘트 분석부(110)에 의해 정적 텍스트 멘트가 형태소 분석되어 정적 멘트 키워드가 추출된 경우, 정적 멘트 키워드에 해당하는 단어가 단어 데이터베이스(150)에 저장되어 있으면 정적 텍스트 멘트가 수신된 시점에 따라 누적되어 저장된다.

상기의 사용 빈도는 단어의 사용 빈도를 의미하며, 정적 텍스트 멘트 분석부(110)에 의해 정적 텍스트 멘트가 형태소 분석되어 정적 멘트 키워드가 추출된 경우, 정적 멘트 키워드에 해당하는 단어가 단어 데이터베이스(150)에 저장되어 있는지 여부에 따라 증가된다.

상기의 추천 사용 시간은 단어를 사용가 적합한 사용 시간을 의미하며, 단어의 누적된 사용 시간에 따라 결정된다.

시간 정보 별 멘트 데이터베이스(140)에는 사용자에 의해 설정된 시간 별 멘트가 저장되어 있다. 이때, 시간 정보 별 멘트는 시간 때 별로 사용 가능한 멘트 포맷을 포함한다. 이때, 포맷에는 해당 시점에 사용 가능한 단어 각각이 배치될 수 있는 삽입 공간이 형성되어 있다.

상황 별 텍스트 멘트 데이터베이스(155)에는 상황에 해당하는 텍스트 멘트 포맷이 저장되어 있다. 이때, 포맷에는 상황 별 사용 가능한 단어 각각이 배치될 수 있는 삽입 공간이 형성되어 있다.

음성 변환부(130)는 정적 텍스트 멘트 수신부(105)로부터 수신된 정적 텍스트 멘트 또는 동적 텍스트 멘트 생성부(120)에 의해 생성된 동적 텍스트 멘트를 음성으로 변환한다.

이때, 음성 변환부(130)는 TSS(Text-To-Speech) 엔진을 이용한다. TSS는 언어의 모든 음소에 대한 발음 데이터베이스를 구축하고 이를 연결시켜 연속된 음성을 생성하게 되는데, 이때 음성의 크기, 길이, 높낮이 등을 조절하여 자연스러운 음성을 합성해 내는 것으로서 이를 위해 자연어 처리 기술이 포함될 수 있다.

본 발명의 일 실시예에서는 정적 텍스트 멘트 수신부(105)로부터 수신된 정적 텍스트 멘트 및 동적 텍스트 멘트 생성부(120)에 의해 생성된 동적 텍스트 멘트가 음성 변환부(130)에 의해 변환될 수 있다.

배경 음악 결정부(125)는 현재 상황 정보 생성부(115)로부터 현재 상황 정보를 수신하면, 현재 상황 정보에 할당된 사용자 심리를 기초로 배경 음악 데이터베이스(160)에 저장된 음악 중 어느 하나의 음악을 배경 음악으로 결정한다.

일 실시예에서, 배경 음악 결정부(125)는 배경 음악 데이터베이스(160)에 저장된 음악의 주파수 및 현재 상황 정보에 할당된 사용자 심리의 주파수를 특정 단위 별로 비교하여 특정 단위 별 주파수 차이의 평균을 산출한다. 그 후, 배경 음악 결정부(125)는 음악 별 평균을 기초로 가장 낮은 평균에 해당하는 음악을 배경 음악으로 결정한다.

배경 음악 합성부(135)는 배경 음악 결정부(125)에 의해 결정된 배경 음악 및 상기 음성 변환부(130)에 의해 변환된 음성 멘트와 합성하여 배경 음악이 삽입된 음성 멘트를 생성한다.

도 3은 본 발명에 따른 배경 음악이 삽입된 음성 멘트 제공 방법의 일 실시예를 설명하기 위한 흐름도이다. 도 3에 개시된 일 실시예는 동적 텍스트 멘트를 생성하는 경우에 배경 음악이 삽입된 음성 멘트 제공 과정에 대한 일 실시예에 관한 것이다.

도 3을 참조하면, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 통해 상황 정보를 수신한다(단계 S305). 이때, 상황 정보는 상황 정보 수집 장치(300_1, 300_2, …, 300_N)의 종류에 따라 변경될 수 있으며, 시간 정보, 온도 정보, 연기 감지 정보, 날씨 정보(예를 들어, 온도, 미세먼지 여부, 강수, 바람, 습도 등) 등을 포함할 수 있다.

배경 음악이 삽입된 음성 멘트 제공 장치(100)는 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 통해 수신된 상황 정보, 시간 정보 별 멘트 데이터베이스 및 상황 정보 별 사용자 심리 데이터베이스를 이용하여 이벤트 종류 및 사용자 심리가 할당된 현재 상황 정보를 생성한다(단계 S310).

단계 S310에 대한 일 실시예에서, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 시간 정보 별 멘트 데이터베이스에 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 통해 수신된 시간 정보에 해당하는 멘트가 존재하는 경우 시점 일치 이벤트를 지시하는 이벤트 종류를 현재 상황 정보에 할당한다.

그 후, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 상황 정보 별 사용자 심리 데이터베이스를 기초로 날씨 정보에 해당하는 사용자 심리를 추출하여 현재 상황 정보에 할당한다. 이때, 사용자 심리는 배경 음악 결정부(125)가 배경 음악을 결정할 때 참조되는 정보이며, 미리 결정된 주파수로 표현된다.

단계 S310에 대한 다른 일 실시예에서, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 시간 정보 별 멘트 데이터베이스에 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 통해 수신된 상황 정보 중 시간 정보에 해당하는 멘트가 존재하지 않는 경우, 상황 정보 수집 장치(300_1, 300_2, …, 300_N) 각각의 온도 정보 비교하여 온도 차이가 특정 온도 이상인지 여부를 확인한다.

상기의 실시예에서, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 온도 차이가 특정 온도 이상이고 온도 차이가 증가되는 경우, 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 통해 수신된 상황 정보 중 연기 감지 정보를 이용하여 연기가 감지되면 긴급 상황 발생 이벤트를 지시하는 이벤트 종류를 현재 상황 정보에 할당한다.

그 후, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 온도 차이가 특정 온도 이상이고 온도 차이가 증가되는 경우, 상황 정보 수집 장치(300_1, 300_2, …, 300_N)를 통해 수신된 상황 정보 중 연기 감지 정보를 이용하여 연기가 감지되면 상황 정보 별 사용자 심리 데이터베이스를 기초로 화재 발생에 해당하는 사용자 심리를 추출하여 현재 상황 정보에 할당한다.

배경 음악이 삽입된 음성 멘트 제공 장치(100)는 현재 상황 정보에 할당된 이벤트 종류에 따라 단어 데이터베이스 및 상황 별 텍스트 멘트 데이터베이스를 이용하여 동적 텍스트 멘트를 생성한다(단계 S315).

배경 음악이 삽입된 음성 멘트 제공 장치(100)는 단계 S315에서 생성된 동적 텍스트 멘트를 음성 멘트로 변환한다(단계 S320).

배경 음악이 삽입된 음성 멘트 제공 장치(100)는 현재 상황 정보에 할당된 사용자 심리에 따라 배경 음악 데이터베이스에 저장된 음악 중 어느 하나의 음악을 배경 음악으로 결정한다(단계 S325).

단계 S325에 대한 일 실시예에서, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 배경 음악 데이터베이스에 저장된 음악의 주파수 및 현재 상황 정보에 할당된 사용자 심리의 주파수를 특정 단위 별로 비교하여 특정 단위 별 주파수 차이의 평균을 산출한다. 그 후, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 음악 별 평균을 기초로 가장 낮은 평균에 해당하는 음악을 배경 음악으로 결정한다.

배경 음악이 삽입된 음성 멘트 제공 장치(100)는 배경 음악 및 음성 멘트와 합성하여 배경 음악이 삽입된 음성 멘트를 생성한다(단계 S330).

도 4는 본 발명에 따른 배경 음악이 삽입된 음성 멘트 제공 방법의 다른 일 실시예를 설명하기 위한 흐름도이다. 도 4에 개시된 일 실시예는 사용자로부터 정적 텍스트 멘트를 수신하는 경우에 배경 음악이 삽입된 음성 멘트 제공 과정에 대한 일 실시예에 관한 것이다.

도 4를 참조하면, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 사용자로부터 정적 텍스트 멘트를 수신한다(단계 S410).

배경 음악이 삽입된 음성 멘트 제공 장치(100)는 단어 데이터베이스를 기초로 정적 텍스트 멘트를 분석하여 정적 텍스트 멘트 분석 정보를 생성한다(단계 S420).

배경 음악이 삽입된 음성 멘트 제공 장치(100)는 정적 텍스트 멘트 분석 정보에 할당된 사용자 심리를 기초로 배경 음악 데이터베이스(160)에 저장된 음악 중 어느 하나의 음악을 배경 음악으로 결정한다(단계 S430).

단계 S430에 대한 일 실시예에서, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 배경 음악 데이터베이스에 저장된 음악의 주파수 및 현재 상황 정보에 할당된 사용자 심리의 주파수를 특정 단위 별로 비교하여 특정 단위 별 주파수 차이의 평균을 산출한다. 그 후, 배경 음악이 삽입된 음성 멘트 제공 장치(100)는 음악 별 평균을 기초로 가장 낮은 평균에 해당하는 음악을 배경 음악으로 결정한다.

배경 음악이 삽입된 음성 멘트 제공 장치(100)는 정적 텍스트 멘트를 음성으로 변환한다(단계 S440).

배경 음악이 삽입된 음성 멘트 제공 장치(100)는 배경 음악 및 음성 멘트와 합성하여 배경 음악이 삽입된 음성 멘트를 생성한다(단계 S450).

한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.

100: 배경 음악이 삽입된 음성 멘트 제공 장치
105: 정적 텍스트 멘트 수신부
110: 정적 텍스트 멘트 분석부
115: 현재 상황 정보 생성부
120: 동적 텍스트 멘트 생성부
125: 배경 음악 결정부
130: 음성 변환부
135: 합성부
140: 시간 정보 별 멘트 데이터베이스
145: 상황 정보 별 사용자 심리 데이터베이스
150: 단어 데이터베이스
155: 상황 별 텍스트 멘트 데이터베이스
200_1, 200_2, …, 200_N: 사용자 단말
300_1, 300_2, …, 300_N: 상황 정보 수집 장치

Claims

사용자로부터 정적 텍스트 멘트를 수신하는 정적 텍스트 멘트 수신부;
단어 데이터베이스를 기초로 상기 정적 텍스트 멘트를 분석하여 정적 텍스트 멘트 분석 정보를 생성하는 정적 멘트 분석부;
시간 정보 별 멘트 데이터베이스에 상황 정보 수집 장치를 통해 수신된 시간 정보에 해당하는 멘트가 존재하는 경우 시점 일치 이벤트를 지시하는 이벤트 종류를 현재 상황 정보에 할당하고 상황 정보 별 사용자 심리 데이터베이스를 기초로 날씨 정보에 해당하는 사용자 심리를 추출하여 현재 상황 정보에 할당하고, 상기 시간 정보에 해당하는 멘트가 존재하지 않는 경우 상기 상황 정보 수집 장치를 통해 수신된 온도 정보를 비교하여 온도 차이가 특정 온도 이상이고 온도 차이가 증가되는 경우 상기 상황 정보 수집 장치를 통해 수신된 연기 감지 정보를 이용하여 연기가 감지된다고 판단되면 긴급 상황 발생 이벤트를 지시하는 이벤트 종류를 현재 상황 정보에 할당하고 상기 상황 정보 별 사용자 심리 데이터베이스를 기초로 화재 발생에 해당하는 사용자 심리를 추출하여 현재 상황 정보에 할당하는 현재 상황 정보 생성부;
상기 현재 상황 정보 생성부로부터 현재 상황 정보를 수신하면, 상기 현재 상황 정보에 할당된 이벤트 종류가 시점 일치 이벤트인 경우, 단어 데이터베이스에 저장된 단어의 부가 정보를 이용하여 해당 시점에 사용되는 단어를 추출하고, 시간 정보 별 멘트 데이터베이스에서 해당 시점에 해당하는 멘트 포맷을 추출하고, 상기 멘트 포맷에 상기 단어를 배치하여 동적 텍스트 멘트를 생성하고, 상기 현재 상황 정보에 할당된 이벤트 종류가 긴급 상황 발생 이벤트인 경우, 단어 데이터베이스에 저장된 단어의 부가 정보를 이용하여 해당 시점에 사용되는 단어를 추출하고, 상황 별 텍스트 멘트 데이터베이스에서 해당 상황에 해당하는 멘트 포맷을 추출하고, 상기 멘트 포맷에 상기 단어를 배치하여 동적 텍스트 멘트를 생성하는 동적 텍스트 멘트 생성부;
상기 정적 텍스트 멘트 및 상기 동적 텍스트 멘트 중 어느 하나의 텍스트 멘트를 음성 멘트로 변환하는 음성 변환부;
상기 현재 상황 정보 생성부로부터 수신된 현재 상황 정보에 할당된 사용자 심리 및 배경 음악 데이터베이스에 저장된 음악의 주파수를 특정 단위 별로 비교하여 특정 단위 별 주파수 차이의 평균을 산출하고, 음악 별 평균을 기초로 가장 낮은 평균에 해당하는 음악을 배경 음악으로 결정하는 배경 음악 결정부; 및
상기 배경 음악 결정부에 의해 결정된 배경 음악 및 상기 음성 변환부에 의해 변환된 음성 멘트와 합성하여 배경 음악이 삽입된 음성 멘트를 생성하는 합성부를 포함하고,
상기 이벤트의 종류는 상기 동적 텍스트 멘트 생성부가 텍스트 멘트를 생성할 때 참조되는 정보이고,
상기 사용자 심리는 배경 음악을 결정할 때 참조되는 정보이며, 미리 결정된 주파수로 표현되는 것을 특징으로 하는
배경 음악이 삽입된 음성 멘트 제공 장치.
삭제
삭제
삭제
배경 음악이 삽입된 음성 멘트 제공 장치에서 실행되 배경 음악이 삽입된 음성 멘트 제공 방법에 있어서,
사용자로부터 정적 텍스트 멘트 또는 상황 정보 수집 장치를 통해 수신된 상황 정보를 수신하는 단계;
단어 데이터베이스를 기초로 상기 정적 텍스트 멘트를 분석하여 정적 텍스트 멘트 분석 정보를 생성하거나 상기 상황 정보 수집 장치를 통해 수신된 상황 정보, 시간 정보 별 멘트 데이터베이스 및 상황 정보 별 사용자 심리 데이터베이스를 이용하여 이벤트 종류 및 사용자 심리가 할당된 현재 상황 정보를 생성하는 단계;
상기 현재 상황 정보에 할당된 이벤트 종류에 따라 단어 데이터베이스 및 상황 별 텍스트 멘트 데이터베이스를 이용하여 동적 텍스트 멘트를 생성하는 단계;
상기 동적 텍스트 멘트 또는 상기 정적 텍스트 멘트를 음성 멘트로 변환하는 단계;
현재 상황 정보에 할당된 사용자 심리 또는 상기 정적 텍스트 멘트 분석 정보에 할당된 사용자 심리에 따라 배경 음악 데이터베이스에 저장된 음악 중 어느 하나의 음악을 배경 음악으로 결정하는 단계; 및
상기 배경 음악 및 상기 음성 멘트와 합성하여 배경 음악이 삽입된 음성 멘트를 생성하는 단계를 포함하고,
상기 이벤트 종류 및 사용자 심리가 할당된 현재 상황 정보를 생성하는 단계는
시간 정보 별 멘트 데이터베이스에 상황 정보 수집 장치를 통해 수신된 시간 정보에 해당하는 멘트가 존재하는 경우 시점 일치 이벤트를 지시하는 이벤트 종류를 현재 상황 정보에 할당하고 상황 정보 별 사용자 심리 데이터베이스를 기초로 날씨 정보에 해당하는 사용자 심리를 추출하여 현재 상황 정보에 할당하는 단계; 및
시간 정보 별 멘트 데이터베이스에 상황 정보 수집 장치를 통해 수신된 상기 시간 정보에 해당하는 멘트가 존재하지 않는 경우 상기 상황 정보 수집 장치를 통해 수신된 온도 정보를 비교하여 온도 차이가 특정 온도 이상이고 온도 차이가 증가되는 경우 상기 상황 정보 수집 장치를 통해 수신된 연기 감지 정보를 이용하여 연기가 감지된다고 판단되면 긴급 상황 발생 이벤트를 지시하는 이벤트 종류를 현재 상황 정보에 할당하고 상기 상황 정보 별 사용자 심리 데이터베이스를 기초로 화재 발생에 해당하는 사용자 심리를 추출하여 현재 상황 정보에 할당하는 단계를 포함하고,
상기 동적 텍스트 멘트를 생성하는 단계는
상기 상기 현재 상황 정보 생성부로부터 현재 상황 정보를 수신하면, 상기 현재 상황 정보에 할당된 이벤트 종류가 시점 일치 이벤트인 경우, 단어 데이터베이스에 저장된 단어의 부가 정보를 이용하여 해당 시점에 사용되는 단어를 추출한 후, 시간 정보 별 멘트 데이터베이스에서 해당 시점에 해당하는 멘트 포맷을 추출하고, 상기 멘트 포맷에 상기 단어를 배치하여 동적 텍스트 멘트를 생성하는 단계; 및
상기 현재 상황 정보에 할당된 이벤트 종류가 긴급 상황 발생 이벤트인 경우, 단어 데이터베이스에 저장된 단어의 부가 정보를 이용하여 해당 시점에 사용되는 단어를 추출하고, 상황 별 텍스트 멘트 데이터베이스에서 해당 상황에 해당하는 멘트 포맷을 추출하고, 상기 멘트 포맷에 상기 단어를 배치하여 동적 텍스트 멘트를 생성하는 단계를 포함하고,
상기 배경 음악으로 결정하는 단계는
상기 현재 상황 정보 생성부로부터 수신된 현재 상황 정보에 할당된 사용자 심리 및 배경 음악 데이터베이스에 저장된 음악의 주파수를 특정 단위 별로 비교하여 특정 단위 별 주파수 차이의 평균을 산출하고, 음악 별 평균을 기초로 가장 낮은 평균에 해당하는 음악을 배경 음악으로 결정하는 단계를 포함하고,
상기 이벤트의 종류는 상기 동적 텍스트 멘트 생성부가 텍스트 멘트를 생성할 때 참조되는 정보이고,
상기 사용자 심리는 배경 음악을 결정할 때 참조되는 정보이며, 미리 결정된 주파수로 표현되는 것을 특징으로 하는
배경 음악이 삽입된 음성 멘트 제공 방법.