KR20110055957A - 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템 - Google Patents

파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템 Download PDF

Info

Publication number
KR20110055957A
KR20110055957A KR1020090112594A KR20090112594A KR20110055957A KR 20110055957 A KR20110055957 A KR 20110055957A KR 1020090112594 A KR1020090112594 A KR 1020090112594A KR 20090112594 A KR20090112594 A KR 20090112594A KR 20110055957 A KR20110055957 A KR 20110055957A
Authority
KR
South Korea
Prior art keywords
powerpoint
voice
module
file
slide
Prior art date
Application number
KR1020090112594A
Other languages
English (en)
Inventor
김학식
박시몬
김병국
Original Assignee
김학식
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김학식 filed Critical 김학식
Priority to KR1020090112594A priority Critical patent/KR20110055957A/ko
Publication of KR20110055957A publication Critical patent/KR20110055957A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Processing Or Creating Images (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

본 발명은 멀티미디어 프레젠테이션 자료 제작의 생산성 향상 및 배포의 다양성을 증대시키기 위하여 파워포인트 내부에 음성합성(TTS : Text To Speech)엔진 및 음성합성 모듈을 플러그인(plug-in)시키고 파워포인트 각 슬라이더 노트에 작성된 텍스트를 티티에스(TTS) 엔진을 이용하여 자동으로 음성파일로 변환하여 파워포인트 파일 내에 음성 객체로 자동 삽입하고 파워포인트 애니메이션의 동기화를 맞추어, 별도의 음성 녹음 및 편집 없이 자동화된 음성합성 파워포인트 자료를 작성하고 이를 바탕으로 다양한 동영상 파일을 자동으로 작성하는 방법과 이에 따른 시스템에 관한 것으로 신규 또는 기 작성된 파워포인트 파일을 선택하는 단계와, 선택된 파워포인트의 각 슬라이드 마다 '슬라이드 노트'를 불러오는 단계, 선택된 슬라이드에 기 삽입된 음성 객체가 있는지 판단하고 슬라이드 노트에서 가져온 텍스트를 분석하는 단계, 분석된 텍스트에 맞게 다양한 음원을 선택하고 미리 듣기를 수행하는 단계, 분석된 텍스트를 음성합성 엔진을 이용하여 음성파일로 변환하는 단계, 작성된 음성파일을 파워포인트에 음성 객체로 자동 삽입하는 단계, 음성과 파워포인트 애니메이션의 동기화를 맞추는 단계와 음성합성 파워포인트 문서 및 다양한 동영상 파일로 저장하는 단계를 포함함으로써 파워포인트 문서를 이용한 프레젠테이션 제작자와 발표자에게 별도의 음성 녹음 및 편집, 동영상 파일 제작 과정에서 발생하는 불편함 및 문제점 없이 파워포인트 내에서 음성합성 파워포인트 문서 및 다양한 동영상 파일을 자동으로 작성하여 모든 자동화된 프레젠테이션을 준 비하고 진행할 수 있는 효과를 얻는다.
파워포인트, 프레젠테이션, 음성 합성, 티티에스(TTS), 슬라이드 노트, 음성 객체, 애니메이션 동기화, 동영상 파일, 음원, 플러그인(plug-in)

Description

파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템{The Power Points documents that synthesized voices and The method that makes various video files and The system using plug-in TTS module in Power Points}
본 발명은 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템에 관한 것으로서, 보다 상세하게는 파워포인트 내부에 음성합성(TTS)엔진 및 음성합성 모듈을 플러그인(plug-in)시키고 파워포인트 파일의 각 슬라이드 노트에 작성된 텍스트를 티티에스(TTS) 엔진을 이용하여 자동으로 음성파일로 변환하여 파워포인트 파일 내에 음성 객체로 자동 삽입하고 파워포인트 애니메이션의 동기화를 맞추어 별 도 녹음과정과 편집 없이 자동화된 음성합성 파워포인트 자료를 작성하고 이를 바탕으로 다양한 동영상파일을 자동으로 작성하는 방법과 이에 따른 시스템에 관한 것이다.
일반적으로 프레젠테이션 제작자와 발표자는 파워포인트를 이용하여 음성이 제공되는 프레젠테이션을 위해서, 기존의 방법으로는 제작자와 발표자가 직접 파워포인트 및 다른 녹음장치를 이용하여 본인 또는 성우의 음성을 녹음하여 파워포인트에 녹음된 파일을 삽입하는 방법, 또는 음성으로 TTS(Text To Speech :음성합성)를 이용하는 경우에는 별도의 음성 합성 프로그램을 이용하여 음성 파일을 제작한 후에 파워포인트에 삽입하여 저장하는 방법을 사용하였다.
이러한 방법의 문제점은 파워포인트는 일정 크기 이상, 기본적으로는 100KB이상의 음성 파일은 외부의 링크로 인식되어 파워포인트 문서를 저장할 경우 파워포인트 파일의 경로와 음성파일의 경로가 일치 하지 않는 경우 프레젠테이션시 음성이 나오지 않는 경우가 발생하는 문제점이 발생하며, 내레이션의 수정사항이 발생할 경우 기존의 음성녹음 파일을 폐기하고 처음부터 새로이 녹음 및 편집 과정을 해야 하는 불편함이 발생하게 된다. 또한 음성합성을 위해 별도의 프로그램을 실행 할 경우 파워포인트와 별도의 프로그램을 병행 실행하여 녹음 및 편집 과정을 진행하는 불편함이 발생하게 된다.
특히 프레젠테이션을 위한 파워포인트 애니메이션 처리와 음성파일과의 동기화를 맞추기 위해 계속적인 음성 녹음 및 편집 과정을 수행하는 불편함 및 이 과정에서 오류가 발생하는 문제점이 발생하게 된다.
또한 다국어 프레젠테이션을 진행 할 경우 제작자와 발표자가 직접 외국어를 구사하여 진행하여야 하거나 제작자와 발표자의 외국어 실력에 따라 정보전달의 효율성이 떨어지는 문제점이 발생한다.
한편 기존에는 파워포인트 문서를 이용한 동영상 파일을 작성할 경우 동영상 파일 저작도구를 이용하여 파워포인트 파일을 로딩하여 재편집 작업 또는 플래시 프로그램 처리를 통하여 작성하는 불편함이 있었다.
따라서 본 발명이 이루고자 하는 기술적 과제는 파워포인트 내부에 음성합성(TTS)엔진 및 음성합성 모듈을 플러그인(plug-in)시키고 파워포인트의 슬라이드 노트에 작성된 텍스트를 음성합성 모듈로 불러와서, 연동된 음성합성(TTS) 엔진을 이용하여 자동으로 음성파일로 변환하여 파워포인트 파일 내에 음성 객체로 자동 삽입하고, 파워포인트 애니메이션 처리와 동기화를 맞추어 자동화된 음성합성 파워포인트 자료를 작성하고 이를 바탕으로 다양한 동영상파일을 자동으로 작성하여, 파워포인트 및 다른 녹음장치를 이용하여 본인 또는 성우의 음성을 직접 녹음하거나 별도의 음성 합성 프로그램을 이용하여 음성 파일을 제작한 후에 파워포인트에 삽입하여 저장하는 방법의 불편함, 파워포인트 애니메이션 처리와 음성파일과의 동기화를 맞추기 위해 계속적인 음성 녹음 및 편집과정의 불편함, 음성객체의 크기가 커져서 외부의 링크로 인식되어 파워포인트 파일의 경로와 음성파일의 경로 가 일치 하지 않는 경우 프레젠테이션시 음성이 나오지 않는 문제점, 다국어 프레젠테이션을 진행 할 경우 제작자와 발표자가 직접 외국어를 구사하여 진행하여야 하거나 제작자와 발표자의 외국어 실력에 따라 정보전달의 효율성이 떨어지는 문제점, 파워포인트 문서를 이용한 동영상 파일을 작성할 경우 동영상 파일 저작도구를 이용하여 파워포인트 파일을 로딩하여 재편집 작업 또는 플래시 프로그램 처리를 통하여 작성하는 불편함을 해결할 수 있도록 하여 파워포인트 내에서 슬라이드 노트에 작성되는 내용에 따라 음성을 자동으로 합성하고 파워포인트 내 음성 객체로 자동 삽입하는 음성합성(TTS) 모듈을 이용한 음성 합성 파워포인트 문서의 작성과 이를 바탕으로 다양한 동영상파일을 자동으로 작성하는 방법과 이에 따른 시스템을 제공하는 데 그 목적이 있다.
본 발명은 파워포인트 내부에 음성합성(TTS)엔진 및 음성합성 모듈을 플러그인(plug-in)시키고 신규 또는 기 작성된 파워포인트 파일을 선택하는 단계와, 선택된 파워포인트의 각 슬라이드 마다 '슬라이드 노트'를 불러오는 단계, 선택된 슬라이드에 기 삽입된 음성 객체가 있는지 판단하고 슬라이드 노트에서 가져온 텍스트를 분석하는 단계, 분석된 텍스트에 맞게 다양한 음원을 선택하고 미리 듣기를 수행하는 단계, 분석된 텍스트를 음성합성 엔진을 이용하여 음성파일로 변환하는 단계, 작성된 음성파일을 파워포인트에 음성 객체로 자동 삽입하는 단계, 음성과 파워포인트 애니메이션의 동기화를 맞추는 단계와 음성합성 파워포인트 문서 및 다양한 동영상 파일로 자동 저장하는 단계로 이루어진 것에 특징이 있다.
본 발명은 파워포인트 내부에 음성합성(TTS)엔진 및 음성합성 모듈을 플러그인(plug-in)시키고 파워포인트의 슬라이드 노트에 작성된 내용을 음성합성 모듈로 불러와서 연동된 음성합성(TTS) 엔진을 이용하여 음성을 자동 합성하고, 완성된 음성합성 내용을 음성파일로 자동으로 생성하여 파워포인트내의 음성객체로 자동 삽입하고, 파워포인트 애니메이션 처리와 동기화를 맞추어 자동화된 음성합성 파워포인트 자료를 작성하고 이를 바탕으로 다양한 동영상파일을 자동으로 작성하게 함으로써 파워포인트 문서를 이용한 프레젠테이션 제작자와 발표자에게 파워포인트 및 다른 녹음장치를 이용하여 본인 또는 성우의 음성을 직접 녹음하거나 별도의 음성 합성 프로그램을 이용하여 음성 파일을 제작한 후에 파워포인트에 삽입하여 저장하는 방법의 불편함, 파워포인트 애니메이션 처리와 음성파일과의 동기화를 맞추기 위해 계속적인 음성 녹음 및 편집과정의 불편함, 음성객체의 크기가 커져서 외부의 링크로 인식되어 파워포인트 파일의 경로와 음성파일의 경로가 일치 하지 않는 경우 프레젠테이션시 음성이 나오지 않는 문제점, 다국어 프레젠테이션을 진행 할 경우 제작자와 발표자가 직접 외국어를 구사하여 진행하여야 하거나 제작자와 발표자의 외국어 실력에 따라 정보전달의 효율성이 떨어지는 문제점, 파워포인트 문서를 이용한 동영상 파일을 작성할 경우 동영상 파일 저작도구를 이용하여 파워포인트 파일을 로딩하여 재편집 작업 또는 플래시 프로그램 처리를 통하여 작성하는 불편함을 해결하여 파워포인트 내에서 모든 자동화된 프레젠테이션을 준비하고 진행할 수 있는 효과를 얻는다.
본 발명은 상기한 기술적 과제를 달성하기 위하여 파워포인트 내부에 음성합성(TTS)엔진 및 음성합성 모듈을 플러그인(plug-in)시키고 신규 또는 기 작성된 파워포인트 파일을 선택하는 1단계, 선택된 파워포인트의 각 슬라이드 마다 '슬라이드 노트'를 불러오는 2단계, 선택된 슬라이드에 기 삽입된 음성 객체가 있는지 판단하고 슬라이드 노트에서 가져온 텍스트를 분석하는 3단계, 분석된 텍스트에 맞게 다양한 음원을 선택하고 미리 듣기를 수행하는 4단계, 분석된 텍스트를 음성합성 엔진을 이용하여 음성파일로 변환하는 5단계, 작성된 음성파일을 파워포인트에 음성 객체로 자동 삽입하는 6단계, 음성과 파워포인트 애니메이션의 동기화를 맞추는 7단계와 음성합성 파워포인트 문서 및 다양한 동영상 파일로 저장하는 8단계를 포함한다.
바람직하게는, 기 삽입된 음성 객체가 있는지 판단하는 3단계에서는 일반적인 음향 데이터(배경음악 등)는 제외하고 구성된 TTS엔진으로 자동 삽입된 음성 객체에 대해서만 존재 여부만 판단하고 일반적인 음향데이터는 작성된 음성 객체와 같이 사용할 수 있도록 하는데 있다.
바람직하게는, 분석된 텍스트에 맞게 다양한 음원을 선택하고 미리 듣기를 수행하는 4단계에서는 음원은 슬라이드별로 작성된 데이터 언어에 맞게 다국어 음원으로 구분되어지고 또 분석된 데이터의 특성에 맞게 성별 혹은 연령별로 구분되어져서 작업자가 이를 직접 선택 가능할 수 있도록 하는데 있다. 그러므로 이 과정을 거쳐 하나의 파워포인트 파일에서 슬라이드별로 다양한 성별, 연령별 음성과 다국어 음 성을 지원할 수 있도록 하는데 있다.
바람직하게는, 음성과 파워포인트 애니메이션의 동기화를 맞추는 7단계에서는 애니메이션과의 동기화를 위하여 작성되는 음성의 속도, 높낮이, 문장사이의 간격을 작업자가 직접 선택 가능하도록 하여 앞의 4단계의 미리 듣기 기능과 파워포인트에서 제공하는 슬라이드 쇼와 연동하여 음성과 애니메이션과의 동기화를 확인할 수 있도록 하는데 있다.
바람직하게는, 음성합성 파워포인트 문서 및 다양한 동영상 파일로 저장하는 8단계에서는 다른 동영상 파일 저작도구를 이용하여 파워포인트 파일을 로딩하여 재편집 작업 또는 프로그램 처리를 통하여 작성하는 불편함이 없이 자동으로 플래시(Flash)/동영상 파일을 생성할 수 있도록 하는데 있다.
바람직하게는, 파워포인트 내부에 플러그인(plug-in)되는 음성합성(TTS)엔진의 경우 음성합성의 국제규약 SAPI(Speech Application Programing Interface)를 준수한 경우 어떠한 TTS엔진이라도 사용 가능할 수 있도록 하는데 있다.
본 발명을 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다. 먼저 본 발명을 설명함에 있어서 관련된 공지기술 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 기존 파워포인트를 이용한 프레젠테이션 제작자와 발표자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1을 참조하면 파워포인트 내부에 음성합성(TTS)엔진 및 음성합성 모듈이 플러그인(plug-in)된 상황에서 신규 또는 기 작성된 파워포인트 파일을 선택하는 1단계는 먼저 도 1의 파워포인트(100)로부터 해당 파워포인트 파일(110)을 로드하거나 신규 파일을 선택하게 되면 플러그인(plug-in)된 TTS모듈(300)의 파워포인트 연동모듈(310)이 파워포인트에 설치된 TTS모듈의 음원정보, 음성 합성 속도, 음성 합성 높이, 문장 간 시간 설정 기본 값을 체크하고 (도 2의 S110 참조) 파워포인트 내 음성합성 편집 창에 기본 값을 Display한다. (도 3의 화면 참조)
선택된 파워포인트의 각 슬라이드 마다 '슬라이드 노트'를 불러오는 2단계는 음성합성 편집 창의 현재 슬라이드 노트 불러오기 버튼에(도 3의 화면 참조) 의해 도 1의 TTS모듈(300)내의 슬라이드 노트 로딩 모듈(320)이 파워포인트 연동모듈(310)을 통하여 해당 슬라이드 노트의 텍스트를 메모리에 로드한다.(도 4의 S200,S210,S220 참조)
선택된 슬라이드에 기 삽입된 음성 객체가 있는지 판단하고 슬라이드 노트에서 가져온 텍스트를 분석하는 3단계는 슬라이드 노트의 텍스트를 메모리에 로드한 후 도 1의 슬라이드 노트 로딩 모듈(320)이 슬라이드 내의 기존 음성 객체가 존재하는지 검색하여(도 4의 S230) 만약 존재하는 경우(도 4의 S240) 음원 정보의 태그를 검색하고(도 4의 S250) 음성합성 편집 창을 업데이트하여 Display한다(도 4의 S280). 만약 기존음성 객체가 존재하지 않으면 도 1의 텍스트 검색 모듈(330)에 의해 슬라이드 노트의 텍스트를 분석하고(도 4의 S260) 음성합성 편집 창을 업데이트하여 Display한다(도 5 화면 참조).
분석된 텍스트에 맞게 다양한 음원을 선택하고 미리 듣기를 수행하는 4단계는 프레젠테이션 제작자가 음원 선택 또는 음원 변경을 할 경우(도 8 화면 참조) 도 1의 음원관리 모듈이(340) 먼저 선택된 음원이 기존 음원과 같은지 비교하여(도 6의 S310) 변동이 있으면 신규 음원이 메모리에 로드되어 있는 지 확인하고(도 6의 S320) 로드되어 있지 않는 경우 도 1의 음원관리 모듈(340)에 의해 신규 음원을 메모리에 업데이트 한다.(도 6의 S340) 음원의 메모리 업데이트 이후 도 1의 파워포인트 연동 모듈(310)은 기존 슬라이드 태그의 유무를 체크하여(도 6의 S350) 슬라이드 태그가 존재하면 해당 슬라이드 태그를 삭제하고(도 6의 S360) 신규 슬라이드 태그를 추가한다.(도 6의 S380)
프레젠테이션 제작자가 음원 선택 변경 후, 변경된 음원으로 미리듣기를 선택할 경우 도 1의 음성합성 제작 편집 모듈은(350) 음성 합성 편집창의 텍스트의 일부가 블록 선택되어 있는 지 여부를 판단하여 선택된 블록 또는 전체 텍스트에 대해서 선택된 음원 정보, 음성 합성 속도의 값, 음성 합성 높이의 값, 문장 간 시간 설정의 값을 체크하여(도 7의 S440) 미리듣기를 실행한다.(도 7의 S450) 프레젠테이션 제작자는 원하는 음성 합성을 위하여 음성 합성 속도의 값, 음성 합성 높이의 값, 문장 간 시간 설정의 값을 변화하여(도 11 참조) 재차 미리듣기를 실행한다.(도 5 화면 참조)
분석된 텍스트를 음성합성 엔진을 이용하여 음성파일로 변환하는 5단계는
음성합성 메뉴의 음성 합성 버튼에(도 10 화면 참조) 의해 도 1의 음성 합성 제작 편집 모듈(350)이 기존 음성 객체가 있을 경우 삭제하고(도 9의 S540) 각 슬라이드 의 텍스트, 각 슬라이드 별 설정 값, 각 슬라이드 별 음원정보 값을 취합하여 음성합성을 실행하여(도 9의 S550) 음성 웨이브(wave) 파일로 저장한다.(도 9의 S570)
작성된 음성파일을 파워포인트에 음성 객체로 자동 삽입하는 6단계는 도 1의 제작 편집 제어 모듈(370)이 기 생성된 음성 웨이브(wave) 파일을 읽어 음성 객체의 파워포인트 쉐이프(Shape) 설정, 플레이 모드 설정, 오디오(Audio) 객체 위치 설정을 하고(도 9의 S580) 도 1의 파워포인트 연동 모듈을(310) 통하여 각 슬라이드에 삽입한다. 음성 객체의 삽입이 완료 되면 파워포인트 슬라이드 내에 음성 객체 쉐이프(Shape)가 Display된다.(도 5의 화면 참조)
음성과 파워포인트 애니메이션의 동기화를 맞추는 7단계는 파워포인트 메뉴에 있는 슬라이드 예행연습과 함께 앞서 4단계의 미리듣기에서 기술한 전체 텍스트에 대해서 선택된 음원 정보, 음성 합성 속도의 값, 음성 합성 높이의 값, 문장 간 시간 설정의 값을 조절하여(도 11 참조) 5단계의 음성 파일 변환과 6단계의 음성 객체 자동 삽입의 과정을 반복하여 동기화를 맞춘다.
음성합성 파워포인트 문서 및 다양한 동영상 파일로 저장하는 8단계는 동영상 생성 버튼에(도 10 화면 참조) 의해 도 1의 동영상 파일 생성 모듈(380)이 플래시 파일 생성인 경우에는 도 1의 파워포인트 연동 모듈을(310) 통하여 슬라이드를 분석하고(도 12의 S740) 그 결과에 따라 슬라이드의 애니메이션 객체를 슬라이드에서 제외한 후 남은 객체들을 하나의 배경 이미지로 만든 후, 그 배경 이미지 위에 애니메이션 객체들을 시간의 순서에 맞게 재배열한 후 음성 객체와 시간에 맞게 동기화를 시켜 플래시 파일로 자동 저장을 한다.(도 12 참조) 무비(Movie) 파일 인 경우 도 1의 동영상 파일 생성 모듈(380)이 화면과 오디오(Audio) 캡처(Capture) 기능을 시작한 후 파워포인트 슬라이드 쇼를 실행하고 슬라이드 쇼 실행 내용을 녹화 하여 무비(Movie) 파일로 저장한다.(도 12 참조)
이로써 본 발명은 파워포인트 내부에 음성합성(TTS)엔진 및 음성합성 모듈을 플러그인(plug-in)시키고 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 자동으로 작성하여 멀티미디어 프레젠테이션 자료 제작의 생산성 향상 및 배포의 다양성을 증대시키고 프레젠테이션 제작자와 발표자가 파워포인트 내에서 모든 자동화된 프레젠테이션을 준비하고 진행 할 수 있는 것이다.
전술한 본 발명에 따른 파워포인트에 TTS 모듈을 플러그인(Plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템에 대하여 설명하였지만, 본 발명은 이에 한정되는 것이 아니고 특허 청구 범위와 발명에 상세한 설명 및 첨부한 도면의 범위 안에서 여러 가지로 변형하여 실시하는 것이 가능하고 이 또한 본 발명에 속한다.
예를 들면, 본 발명은 파워포인트 문서를 대상으로 하였으나 이에 국한되지 않으며, 내부에 슬라이드 용 프레젠테이션 도구가 내장되어 있고, 이에 접근 가능한 프레젠테이션 저작 도구들, 예를 들어 한글과 컴퓨터의 한컴 슬라이드, 구글사의 구글 오피스 등에 대해서도 실시가 가능하다.
도 1은 본 발명에 따른 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템의 구성도.
도 2는 본 발명에 따른 선택된 파워포인트의 각 슬라이드 마다 '슬라이드 노트'를 불러오는 단계의 처리 흐름도.
도 3은 본 발명에 따른 파워포인트 내 음성합성 편집 창에 기본 값을 Display 한 수행 화면.
도 4는 본 발명에 따른 선택된 슬라이드에 기 삽입된 음성 객체가 있는지 판단하고 슬라이드 노트에서 가져온 텍스트를 분석하는 단계의 처리 흐름도.
도 5는 본 발명에 따른 슬라이드 노트를 음성 합성 편집 창에 로드하고 음성 객체를 슬라이드에 생성하는 과정을 수행한 화면.
도 6은 본 발명에 따른 분석된 텍스트에 맞게 다양한 음원을 선택하는 단계의 처리 흐름도.
도 7은 본 발명에 따른 미리듣기를 수행하는 단계의 처리 흐름도.
도 8은 본 발명에 따른 다양한 음원의 선택을 수행한 화면.
도 9는 본 발명에 따른 분석된 텍스트를 음성합성 엔진을 이용하여 음성파일로 변환하고 작성된 음성파일을 파워포인트에 음성 객체로 자동 삽입하는 단계의 처리 흐름도.
도 10은 본 발명에 따른 음성 합성 메뉴창의 수행 화면.
도 11은 본 발명에 따른 음성 합성 속도의 값, 음성 합성 높이의 값, 문장 간 시간 설정의 값을 조절하는 단계의 처리 흐름도.
도 12는 본 발명에 따른 파워포인트 문서를 다양한 동영상 파일로 저장하는 단계의 처리 흐름도.

Claims (10)

  1. 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템에 있어서 파워포인트 내부에 음성합성(TTS)엔진 및 음성합성 모듈을 플러그인(plug-in)시키고 신규 또는 기 작성된 파워포인트 파일을 선택하는 1단계;
    선택된 파워포인트의 각 슬라이드 마다 '슬라이드 노트'를 불러오는 2단계;
    선택된 슬라이드에 기 삽입된 음성 객체가 있는지 판단하고 슬라이드 노트에서 가져온 텍스트를 분석하는 3단계;
    분석된 텍스트에 맞게 다양한 음원을 선택하고 미리 듣기를 수행하는 4단계;
    분석된 텍스트를 음성합성 엔진을 이용하여 음성파일로 변환하는 5단계;
    작성된 음성파일을 파워포인트에 음성 객체로 자동 삽입하는 6단계;
    음성과 파워포인트 애니메이션의 동기화를 맞추는 7단계; 음성합성 파워포인트 문서 및 다양한 동영상 파일로 저장하는 8단계를 포함하는 것을 특징으로 하는 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템.
  2. 상기 1항에 있어서,
    상기 3단계에서 일반적인 음향 데이터(배경음악 등)는 제외하고 구성된 TTS엔진으로 자동 삽입된 음성 객체에 대해서만 존재 여부만 판단하고 일반적인 음향데이터는 작성된 음성 객체와 같이 사용할 수 있는 것을 특징으로 하는 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템.
  3. 상기 1항에 있어서,
    상기 4단계에서 음원은 슬라이드별로 작성된 텍스트 데이터 언어에 맞게 다국어 음원으로 구분하고 또 분석된 데이터의 특성에 맞게 성별 혹은 연령별로 구분하여 작업자가 이를 직접 선택 가능하도록 할 수 있도록 하여 이 과정을 거쳐 하나의 파워포인트 파일에서 슬라이드별로 다양한 성별, 연령별 음성과 다국어 음성을 지원 할 수 있도록 하는 것을 특징으로 하는 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템.
  4. 상기 1항에 있어서,
    상기 7단계에서 애니메이션과의 동기화를 위하여 작성되는 음성의 속도, 높낮이, 문장사이의 간격을 작업자가 직접 선택 가능하도록 하여 앞의 4단계의 미리 듣기 기능과 파워포인트에서 제공하는 슬라이드 쇼와 연동하여 음성과 애니메이션과의 동기화를 확인할 수 있도록 하는 것을 특징으로 하는 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템.
  5. 상기 1항에 있어서,
    상기 8단계에서 다른 동영상 파일 저작도구를 이용하여 파워포인트 파일을 로딩하 여 재편집 작업 또는 프로그램 처리를 통하여 작성하는 불편함이 없이 파워포인트 내에서 자동으로 플래시(Flash)/동영상 파일을 생성할 수 있도록 하는 것을 특징으로 하는 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템.
  6. 상기 1항에 있어서,
    파워포인트 내부에 플러그인(plug-in)되는 음성합성(TTS)엔진의 경우 음성합성의 국제규약 SAPI(Speech Application Programing Interface)를 준수한 경우 어떠한 TTS엔진이라도 사용 가능할 수 있도록 하는 것을 특징으로 하는 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템.
  7. 상기 1항에 있어서,
    파워포인트 문서에 국한되지 않으며, 내부에 슬라이드 용 프레젠테이션 도구가 내장되어 있고, 이에 접근 가능한 프레젠테이션 저작 도구들 예를 들어 한글과 컴퓨터의 한컴 슬라이드, 구글사의 구글 오피스 등에 대해서도 사용 가능할 수 있도록 하는 것을 특징으로 하는 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템.
  8. 상기 1항에 있어서,
    파워포인트에 설치된 TTS모듈의 음원정보, 음성 합성 속도, 음성 합성 높이, 문장 간 시간 설정 기본 값을 체크하고 파워포인트 내 음성합성 편집 창에 기본 값을 Display하며, 슬라이드에 포함된 음성 정보 태그를 분석하는 파워포인트 연동 모듈;
    파워포인트 슬라이드 노트 선택 시 해당 슬라이드 노트의 텍스트를 메모리에 로드하고 선택된 슬라이드에 기 삽입된 음성 객체가 있는지 판단하고 삭제, 추가하는 슬라이드 노트 로딩 모듈;
    슬라이드 노트를 통해 가져온 텍스트를 분석하는 텍스트 분석 모듈;
    원원 선택 시 기존 음원과 비교하고 음원의 메모리 로드 여부를 체크하여 새로운 음원 데이터를 메모리로 업데이트 하는 음원관리 모듈;
    음성 합성 시 기존 음성 객체의 존재 여부를 체크하고 기존 음원의 객체를 삭제하고 각 슬라이드 노트의 텍스트, 음성 설정 값, 음원 정보를 이용하여 음성 합성을 실행하여 음성 파일을 저장하는 음성 합성 제작 편집 모듈;
    파워포인트의 쉐이프(Shape) 설정, 플레이 모드 설정, 오디오 객체 위치 설정 을 통하여 저장된 음성 파일을 파워포인트 슬라이드에 삽입하는 제작 편집 제어 모듈;
    동영상 저장 선택 시 음성 객체와 객체 애니메이션이 포함된 파워포인트 파일을 플래시 파일이나 무비(Movie) 파일로 자동 생성을 처리하는 동영상 파일 생성 모듈;
  9. 상기 8항에 기재된 각 모듈을 저장하고 있는 것을 특징으로 하는 저장매체.
  10. 상기 1항에 있어서,
    제 1항의 방법을 컴퓨터로 실행시킬 수 있는 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020090112594A 2009-11-20 2009-11-20 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템 KR20110055957A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090112594A KR20110055957A (ko) 2009-11-20 2009-11-20 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090112594A KR20110055957A (ko) 2009-11-20 2009-11-20 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템

Publications (1)

Publication Number Publication Date
KR20110055957A true KR20110055957A (ko) 2011-05-26

Family

ID=44364603

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090112594A KR20110055957A (ko) 2009-11-20 2009-11-20 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템

Country Status (1)

Country Link
KR (1) KR20110055957A (ko)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101273535B1 (ko) * 2012-06-14 2013-06-17 삼성에스디에스 주식회사 프리젠테이션 자료를 이용한 설문 시스템, 방법 및 상기 프리젠테이션 자료를 생성하기 위한 플러그-인 프로그램이 저장 된 저장 매체
CN107292941A (zh) * 2017-06-21 2017-10-24 江西服装学院 动画管理方法及其系统
CN111309941A (zh) * 2020-01-22 2020-06-19 福建天泉教育科技有限公司 一种控制pptx文件演示的方法及终端
CN111538851A (zh) * 2020-04-16 2020-08-14 北京捷通华声科技股份有限公司 自动生成演示视频的方法、系统、设备及存储介质
CN112148900A (zh) * 2020-09-14 2020-12-29 联想(北京)有限公司 一种多媒体文件的显示方法及装置
KR20220007221A (ko) * 2020-07-10 2022-01-18 닥프렌즈 주식회사 전문 상담 미디어 등록 처리 방법
KR20220067089A (ko) * 2020-11-17 2022-05-24 주식회사 한글과컴퓨터 프레젠테이션 문서를 구성하는 슬라이드에 음성 데이터의 삽입을 가능하게 하는 전자 장치 및 그 동작 방법
WO2023002300A1 (ja) * 2021-07-21 2023-01-26 アイメソフト ジェイエスシー スライド再生プログラム、スライド再生装置及びスライド再生方法
DE102018007493B4 (de) 2017-11-29 2023-06-01 Adobe Inc. Verfügbares Tonumstellen für Clientvorrichtungen auf einer Onlinekonferenz
WO2023132140A1 (ja) * 2022-01-05 2023-07-13 株式会社アーティスソリューションズ プログラム、ファイル生成方法、情報処理装置、及び情報処理システム
KR102574619B1 (ko) * 2023-02-03 2023-09-06 김용로 논문 영상 변환을 이용한 저널 홍보 시스템

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101273535B1 (ko) * 2012-06-14 2013-06-17 삼성에스디에스 주식회사 프리젠테이션 자료를 이용한 설문 시스템, 방법 및 상기 프리젠테이션 자료를 생성하기 위한 플러그-인 프로그램이 저장 된 저장 매체
WO2013187634A1 (ko) * 2012-06-14 2013-12-19 삼성에스디에스 주식회사 프리젠테이션 자료를 이용한 설문 시스템, 방법 및 상기 프리젠테이션 자료를 생성하기 위한 플러그-인 프로그램이 저장 된 저장 매체
CN104380336A (zh) * 2012-06-14 2015-02-25 三星Sds株式会社 利用演示资料的问卷系统、方法及存储有用于生成该演示资料的插件程序的存储介质
CN104380336B (zh) * 2012-06-14 2017-07-04 三星Sds株式会社 利用演示资料的问卷系统及方法
CN107292941A (zh) * 2017-06-21 2017-10-24 江西服装学院 动画管理方法及其系统
DE102018007493B4 (de) 2017-11-29 2023-06-01 Adobe Inc. Verfügbares Tonumstellen für Clientvorrichtungen auf einer Onlinekonferenz
CN111309941A (zh) * 2020-01-22 2020-06-19 福建天泉教育科技有限公司 一种控制pptx文件演示的方法及终端
CN111538851A (zh) * 2020-04-16 2020-08-14 北京捷通华声科技股份有限公司 自动生成演示视频的方法、系统、设备及存储介质
CN111538851B (zh) * 2020-04-16 2023-09-12 北京捷通华声科技股份有限公司 自动生成演示视频的方法、系统、设备及存储介质
KR20220007221A (ko) * 2020-07-10 2022-01-18 닥프렌즈 주식회사 전문 상담 미디어 등록 처리 방법
CN112148900A (zh) * 2020-09-14 2020-12-29 联想(北京)有限公司 一种多媒体文件的显示方法及装置
KR20220067089A (ko) * 2020-11-17 2022-05-24 주식회사 한글과컴퓨터 프레젠테이션 문서를 구성하는 슬라이드에 음성 데이터의 삽입을 가능하게 하는 전자 장치 및 그 동작 방법
WO2023002300A1 (ja) * 2021-07-21 2023-01-26 アイメソフト ジェイエスシー スライド再生プログラム、スライド再生装置及びスライド再生方法
JP2023016504A (ja) * 2021-07-21 2023-02-02 アイメソフト ジェイエスシー スライド再生プログラム、スライド再生装置及びスライド再生方法
WO2023132140A1 (ja) * 2022-01-05 2023-07-13 株式会社アーティスソリューションズ プログラム、ファイル生成方法、情報処理装置、及び情報処理システム
JP2023100149A (ja) * 2022-01-05 2023-07-18 株式会社Airobo プログラム、ファイル生成方法、情報処理装置、及び情報処理システム
KR102574619B1 (ko) * 2023-02-03 2023-09-06 김용로 논문 영상 변환을 이용한 저널 홍보 시스템

Similar Documents

Publication Publication Date Title
KR20110055957A (ko) 파워포인트에 TTS 모듈을 플러그인(plug-in)하여 음성 합성된 파워포인트 문서 및 다양한 동영상 파일을 작성하는 방법과 이에 따른 시스템
US8196032B2 (en) Template-based multimedia authoring and sharing
US8966360B2 (en) Transcript editor
CN106688035B (zh) 声音合成装置及声音合成方法
US20180226101A1 (en) Methods and systems for interactive multimedia creation
EP2136370B1 (en) Systems and methods for identifying scenes in a video to be edited and for performing playback
US20110239119A1 (en) Spot dialog editor
US20140006031A1 (en) Sound synthesis method and sound synthesis apparatus
US11295069B2 (en) Speech to text enhanced media editing
CN101374241A (zh) 运动图像创建设备、运动图像创建方法及程序
JP4741406B2 (ja) ノンリニア編集装置およびそのプログラム
EP2428957B1 (en) Time stamp creation and evaluation in media effect template
JP2011030224A (ja) マルチメディア字幕表示システム及びマルチメディア字幕表示方法
KR101850285B1 (ko) 영상 스크립트 생성 장치 및 방법, 영상 스크립트 기반 동영상 제작 시스템 및 방법, 컴퓨터프로그램 저장 매체
JP2006227082A (ja) 歌詞と音楽との同期データ作成方法、装置、プログラムおよびプログラムを記録する記録媒体
CN113676772A (zh) 视频生成方法及装置
Coffy et al. Ascograph: A user interface for sequencing and score following for interactive music
JP5082971B2 (ja) 音声合成装置およびそれを用いた読み上げシステム。
CN114911973A (zh) 动作生成方法、装置、电子设备及存储介质
JP2012181307A (ja) 音声処理装置、音声処理方法及び音声処理プログラム
KR101477492B1 (ko) 동영상 콘텐츠 편집 및 재생을 위한 장치 및 그 방법
JP2008216965A (ja) 音楽と一体化した形式でメールを画面に表示する方法
KR102523746B1 (ko) 프레젠테이션 문서를 구성하는 슬라이드에 음성 데이터의 삽입을 가능하게 하는 전자 장치 및 그 동작 방법
KR20070109103A (ko) 온라인 복합 콘텐츠 제작 시스템
JP2007127994A (ja) 音声合成方法及び音声合成装置並びにプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application