KR101579905B1 - A system for creating English word decoding multimedia file aiming at enhancing literacy - Google Patents

A system for creating English word decoding multimedia file aiming at enhancing literacy Download PDF

Info

Publication number
KR101579905B1
KR101579905B1 KR1020140020150A KR20140020150A KR101579905B1 KR 101579905 B1 KR101579905 B1 KR 101579905B1 KR 1020140020150 A KR1020140020150 A KR 1020140020150A KR 20140020150 A KR20140020150 A KR 20140020150A KR 101579905 B1 KR101579905 B1 KR 101579905B1
Authority
KR
South Korea
Prior art keywords
file
voice
text
english
multimedia file
Prior art date
Application number
KR1020140020150A
Other languages
Korean (ko)
Other versions
KR20150098820A (en
Inventor
이밝음
Original Assignee
(주)빅스바이트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)빅스바이트 filed Critical (주)빅스바이트
Priority to KR1020140020150A priority Critical patent/KR101579905B1/en
Publication of KR20150098820A publication Critical patent/KR20150098820A/en
Application granted granted Critical
Publication of KR101579905B1 publication Critical patent/KR101579905B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Abstract

본 발명은 「영어 음성을 입력받는 음성입력부; 상기 영어 음성을 음성파일로 생성하는 음성파일생성부; 상기 영어 음성을 텍스트로 변환하여 텍스트파일을 생성하는 텍스트파일생성부; 단어 단위로 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 메타데이터로 생성하여 상기 음성파일 및 상기 텍스트파일에 각각 삽입하여 주는 대응정보생성부; 및 상기 음성파일과 상기 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터를 생성하여 삽입하여 주는 멀티미디어파일생성부;를 포함하여 구성된 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템」을 제공한다.The present invention relates to a voice input unit for inputting an English voice; A voice file generation unit for generating the English voice as a voice file; A text file generation unit for converting the English voice into text and generating a text file; A correspondence information generation unit for generating correspondence information between the speech file and the text file in units of words as metadata and inserting the correspondence information into the speech file and the text file, respectively; And a multimedia file generation unit for generating a multimedia file by combining the voice file and the text file and generating a pointer for indicating a location on a text corresponding to the voice on a word by word basis based on the corresponding information And an English word decoding multimedia file generation system for improving the literacy.

Description

리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템{A system for creating English word decoding multimedia file aiming at enhancing literacy}[0001] The present invention relates to an English word decoding multimedia file generation system for improving literacy,

본 발명은 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 관한 것으로, 더욱 상세하게는 영어 음성을 입력받아 음성파일, 텍스트파일 및 단어 단위로 주어지는 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 생성하고, 상기 음성파일과 상기 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터가 포함된 멀티미디어파일을 생성하여 주도록 구성된 것을 특징으로 하는 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 관한 것이다.
The present invention relates to an English word decoding multimedia file generation system for improving literacy, and more particularly, to a system and method for generating English word decoding multimedia file for improving literacy, And generating a multimedia file by combining the voice file and the text file to generate a multimedia file including a pointer for indicating a position on a text corresponding to a voice on a word by word basis based on the corresponding information To an English word decoding multimedia file generation system for enhancing the literacy.

글로벌 공용어로서의 영어의 중요성은 지속적으로 강조되어 왔으며, 이에 따라 영어교육 또는 영어학습과 관련하여 다양한 교육방법 및 교육교재 등이 선보이고 있다. 이러한 가운데 우리나라의 영어교육 또는 영어학습은 독해능력의 배양에 지나치게 치중되어 있다는 지적이 계속되어 왔고, 이의 극복을 위해 말하기능력이나 쓰기능력의 향상을 위한 방안들이 활발하게 개발되고 있다.The importance of English as a global language has been continuously emphasized, and various teaching methods and teaching materials related to English education or English learning are being presented. In this regard, it has been pointed out that our English education or English learning is too focused on the cultivation of reading ability. To cope with this, there are actively developing measures for improving the speaking ability and the writing ability.

한편, 근래에 무선인터넷 기술, 태블릿 PC나 스마트폰과 같은 모바일단말기 기술 및 음성검색 등에 활용되는 음성인식 기술 등이 발전함에 따라 이러한 기술들을 이용한 영어교육 또는 영어학습을 통해 위의 문제점을 해결하려는 연구들이 진행되고 있다. 구체적으로 대한민국 등록특허 제0450019호는 인터넷을 이용한 음성인식 영어학습서비스방법을 제시하고 있으며, 대한민국 등록특허 제0628983호는 음성인식 기술 등을 이용한 영어 능력 평가 및 진단 처방 시스템 등에 관해 제시하고 있다.In recent years, as the development of wireless Internet technology, mobile terminal technologies such as tablet PC and smart phone, and voice recognition technology used for voice search, etc., researches to solve the above problems through English education or English learning using these technologies . Specifically, Korean Patent No. 0450019 discloses a speech recognition English learning service method using the Internet, and Korean Patent No. 0628983 suggests an English ability evaluation and diagnostic prescription system using speech recognition technology and the like.

그러나 종래의 기술 가운데 영어 음성을 입력받아 음성파일과 텍스트파일을 생성하고 이들을 자동으로 결합하여 최종적으로 멀티미디어파일을 생성하되 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터가 포함된 멀티미디어파일을 생성하여 줌으로써 사용자로 하여금 영어 음성을 단어 단위로 디코딩 인지할 수 있게 해주는 콘텐츠를 자동적으로 생성하여 주는 기술은 찾아볼 수 없는 실정이다.
However, in the conventional technology, a multimedia file including a pointer that receives an English voice and generates a voice file and a text file and automatically combines them to generate a multimedia file, It is impossible to find a technique for automatically generating a content that enables a user to recognize English speech by decoding on a word-by-word basis.

[문헌 1] 대한민국 등록특허 제0450019호 "인터넷을 이용한 음성인식 영어 학습서비스방법", 2004.09.30.[Patent Document 1] Korean Patent Registration No. 0450019 "Method of English Speech Recognition Service using Internet ", 2004.09.30. [문헌 2] 대한민국 등록특허 제0628983호 "영어 능력 평가 및 진단 처방 시스템, 이를 이용한 영어능력 평가 및 진단 처방 방법, 그리고 영어 능력 평가 및 진단 처방 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체" 2006.09.27.[Patent Literature 2] Korean Patent No. 0628983 "English Ability Assessment and Diagnosis Prescription System, English Ability Evaluation and Diagnosis Prescription Method Using It, and Computer-Readable Recording Media Recorded with English Proficiency Assessment and Diagnosis Prescription Program" 2006.09. 27.

본 발명은 영어 음성을 입력받아 음성파일과 텍스트파일을 생성하고 이들을 자동으로 결합하여 최종적으로 멀티미디어파일을 생성하되 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터가 포함된 멀티미디어파일을 생성하여 줌으로써 사용자로 하여금 영어 음성을 단어 단위로 디코딩 인지할 수 있게 해주는 콘텐츠의 효율적 제작을 가능하게 만들어 주는 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템을 제공하는 데 그 목적이 있다.
The present invention generates a multimedia file including pointers for inputting English speech, generating a voice file and a text file, automatically combining them, and finally generating a multimedia file, The present invention provides a system for generating an English word decoding multimedia file for improving the literacy, which makes it possible to efficiently produce contents enabling a user to perceive decoding of English speech by word unit.

전술한 과제의 해결을 위해 본 발명은 「영어 음성을 입력받는 음성입력부; 상기 영어 음성을 음성파일로 생성하는 음성파일생성부; 상기 영어 음성을 텍스트로 변환하여 텍스트파일을 생성하는 텍스트파일생성부; 단어 단위로 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 메타데이터로 생성하여 상기 음성파일 및 상기 텍스트파일에 각각 삽입하여 주는 대응정보생성부; 및 상기 음성파일과 상기 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터를 생성하여 삽입하여 주는 멀티미디어파일생성부;를 포함하여 구성된 리터러시(literacy) 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템」을 제공한다.
In order to solve the above-described problem, the present invention is characterized by " a voice input unit for inputting an English voice; A voice file generation unit for generating the English voice as a voice file; A text file generation unit for converting the English voice into text and generating a text file; A correspondence information generation unit for generating correspondence information between the speech file and the text file in units of words as metadata and inserting the correspondence information into the speech file and the text file, respectively; And a multimedia file generation unit for generating a multimedia file by combining the voice file and the text file and generating a pointer for indicating a location on a text corresponding to the voice on a word by word basis based on the corresponding information And an English word decoding multimedia file generation system for improving the literacy composed of the English words.

또한 본 발명은 「상기 포인터는 출력되는 멀티미디어파일의 음성에 대응되는 텍스트 상의 단어 상단 또는 하단을 따라 이동하는 도형으로 구현된 것을 특징으로 하는 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템」을 함께 제공한다. 이 경우 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템은 포인터의 모양에 대한 사용자의 입력정보를 입력받는 모양입력부;를 더 포함하고, 상기 멀티미디어파일생성부는 상기 멀티미디어파일을 생성하며 상기 포인터를 삽입하되 상기 모양입력부를 통해 입력된 모양의 포인터를 삽입하여 주도록 구성된 것을 특징으로 할 수 있다.
Further, the present invention is also related to a system for generating an English word decoding multimedia file for improving the lexibility, characterized in that the pointer is implemented as a figure moving along the upper or lower end of the word on the text corresponding to the voice of the output multimedia file do. In this case, the English word decoding multimedia file generation system for improving the lager according to the present invention further includes a shape input unit for receiving user input information on the shape of the pointer, and the multimedia file generation unit generates the multimedia file, A pointer is inserted and a pointer of the shape inputted through the shape input unit is inserted.

본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 의하면 다음과 같은 효과가 있다.According to the present invention, the English word decoding multimedia file generation system for improving the lighter has the following effects.

1. 영어 음성을 입력받아 만들어지는 음성파일, 텍스트파일 및 단어 단위로 주어지는 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 기초로, 상기 음성파일과 상기 텍스트파일이 결합되되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터가 포함된 멀티미디어파일을 자동적으로 생성할 수 있게 된다.1. A voice file and a text file are combined based on correspondence information between an audio file, a text file, and a speech file, which are given in units of words, and the text file, It is possible to automatically generate a multimedia file including a pointer for indicating a position on a text corresponding to a voice on a word-by-word basis.

2. 위의 멀티미디어파일은 사용자로 하여금 영어 음성을 단어 단위로 디코딩하여 문자와 함께 인지할 수 있게 해주는 영어학습 콘텐츠로서 활용될 수 있다.
2. The above multimedia file can be utilized as English learning contents which enables the user to decode the English speech by word and recognize it with the character.

[도 1]은 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템의 블록 구성도이다.
[도 2]는 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 의해 생성된 멀티미디어파일의 출력 실시예이다.
1 is a block diagram of a system for generating an English word decoding multimedia file for improving the loudness according to the present invention.
FIG. 2 is an example of outputting a multimedia file generated by an English word decoding multimedia file generating system for improving the loudness according to the present invention.

이하에서는 첨부한 도면을 참조하면서 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 관하여 상세하게 설명하도록 한다. 통상적으로 영어 리터러시(literacy)라 함은 글을 읽고 쓰는 능력을 종합적으로 이르는 것인데 본 발명에서는 영어의 이해, 소리내어 읽는 능력 등을 포괄하는 넓은 의미로 사용된다.
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an English word decoding multimedia file generation system for improving a lighter according to the present invention will be described in detail with reference to the accompanying drawings. Normally, English literacy refers to the ability to comprehensively read and write text. In the present invention, it is used broadly to encompass the understanding of English and the ability to read aloud.

[도 1]에는 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템의 블록 구성도가 도시되어 있다.
1 is a block diagram illustrating a system for generating an English word decoding multimedia file for improving the luck according to the present invention.

본 발명에 따른 영문 단어 디코딩 시스템은 음성입력부(10), 음성파일생성부(20), 텍스트파일생성부(30), 대응정보생성부(40), 멀티미디어파일생성부(50) 및 모양입력부(60)를 포함하여 구성된다.
An English word decoding system according to the present invention includes a speech input unit 10, a speech file generation unit 20, a text file generation unit 30, a corresponding information generation unit 40, a multimedia file generation unit 50, 60).

상기 음성입력부(10)는 영어 음성을 입력받는 역할을 수행한다. 상기 음성입력부(10)는 통상의 마이크장치로 구현될 수 있으며, 상기 음성파일생성부(20) 및 상기 텍스트파일생성부(30)에 영어 음성을 전달하게 된다. 상기 음성입력부(10)를 통해 입력되는 영어 음성은 특정 영문장에 대한 읽기 음성 일수도 있고, 연설이나 일상 회화 등이 될 수도 있다. 일반적으로 영어학습 콘텐츠 제작의 자료로서 활용되기 위해서는 영어 원어민의 영문 읽기 음성이 주요한 입력 대상이 될 것이나 그 범위에 특별한 제한은 없다.
The voice input unit 10 plays a role of receiving an English voice. The voice input unit 10 may be implemented as a conventional microphone device and transmits English voice to the voice file generation unit 20 and the text file generation unit 30. [ The English voice input through the voice input unit 10 may be a reading voice for a specific English chapter, a speech, a daily conversation, or the like. In general, in order to be used as a material for production of English learning contents, English reading voices of English native speakers will be the main input target, but there is no particular limitation in the range.

상기 음성파일생성부(20)는 상기 음성입력부(10)가 입력받은 영어 음성을 음성파일로 생성하는 역할을 수행한다. 상기 음성파일생성부(20)는 디지털녹음모듈로 구현될 수 있으며, 상기 음성파일생성부(20)에 의해 생성된 음성파일은 멀티미디어파일의 음성부로 사용되게 된다.
The voice file generating unit 20 generates an English voice input by the voice input unit 10 as a voice file. The voice file generation unit 20 may be implemented as a digital recording module, and the voice file generated by the voice file generation unit 20 may be used as a voice unit of the multimedia file.

상기 텍스트파일생성부(30)는 상기 음성입력부(10)가 입력받은 영어 음성을 텍스트로 변환하여 텍스트파일을 생성하는 역할을 수행한다. 상기 텍스트파일생성부(30)는 음성파형으로부터 언어정보를 추출해내도록 되어 있는 음성인식모듈을 기반으로 구현될 수 있는데, 본 발명의 성격상 연속음성인식 기술이 적용된 것이어야 한다. 상기 텍스트파일생성부(30)에 의해 생성된 텍스트파일은 멀티미디어파일의 텍스트부로 사용되게 된다.
The text file generation unit 30 converts the English voice input by the voice input unit 10 into text and generates a text file. The text file generation unit 30 may be implemented based on a speech recognition module for extracting language information from a speech waveform. In the present invention, continuous speech recognition technology should be applied. The text file generated by the text file generation unit 30 is used as a text portion of the multimedia file.

상기 대응정보생성부(40)는 단어 단위로 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 메타데이터로 생성하여 상기 음성파일 및 상기 텍스트파일에 각각 삽입하여 주는 역할을 수행한다. 상기 대응정보생성부(40)는 상기 대응정보의 생성을 위한 프로그램이 설치된 컴퓨팅모듈로 구현될 수 있으며, 상기 대응정보는 상기 음성파일과 상기 텍스트파일 사이에 단어 단위로 일대일로 생성되는 싱크(syncronization, 동조)정보라고 할 수 있다.The correspondence information generation unit 40 generates correspondence information between the voice file and the text file on a word-by-word basis, and inserts the correspondence information into the voice file and the text file, respectively. The correspondence information generator 40 may be implemented as a computing module provided with a program for generating the correspondence information, and the correspondence information may include syncronization between the speech file and the text file, , Tuning) information.

구체적인 예를 들면 상기 대응정보생성부(40)는 상기 음성파일이 "I am happy."라는 영어 음성으로 이루어져 있고, 그에 상응하는 텍스트파일이 생성되었다고 할 때 상기 음성파일의 재생구간 중 "I", "am", "happy" 부분에 각각 001, 002 및 003 등과 같은 특정 코드를 부여하여 삽입하고, 상기 텍스트파일 상의 각 단어 "I", "am", "happy"에는 상기 특정 코드에 대응되는 001-1, 002-2 및 003-3 등과 같은 싱크(sync) 코드를 부여하여 삽입할 수 있다.
Specifically, for example, the corresponding information generator 40 generates an audio file in which the audio file is composed of an English voice "I am happy." And a corresponding text file is generated, "I" , "am", and "happy" are assigned to specific codes such as 001, 002, and 003, respectively, to the "am" 001-1, 002-2, 003-3, or the like.

상기 멀티미디어파일생성부(50)는 상기 음성파일과 상기 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터를 생성하여 삽입하여 주는 역할을 수행한다. 상기 멀티미디어파일생성부(50)는 상기 음성파일과 상기 텍스트파일의 결합 및 상기 포인터 생성·삽입을 위한 프로그램이 설치된 컴퓨팅모듈로 구현될 수 있다.The multimedia file generation unit 50 generates a multimedia file by combining the voice file and the text file, and generates and inserts a pointer indicating a text position corresponding to the voice on a word-by-word basis based on the corresponding information The state plays a role. The multimedia file generator 50 may be implemented as a computing module having a program for combining the voice file and the text file and for creating and inserting the pointer.

위의 구체적인 예를 이어서 살펴보면 상기 멀티미디어파일생성부(50)는 "I am happy."라는 음성과 텍스트로 각각 이루어진 음성파일 및 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 음성파일 및 상기 텍스트파일에 각각 삽입되어 있는 대응정보를 분석하여 상기 음성파일로 이루어진 음성부의 재생시 상기 텍스트파일로 이루어진 텍스트부의 해당 단어를 지시하여 주는 표시정보인 포인터를 삽입하여 생성하는 것이다. 상기 포인터는 출력되는 멀티미디어파일의 음성에 대응되는 텍스트 상의 단어 상단 또는 하단을 따라 이동하는 도형으로 구현될 수 있다.
The multimedia file generation unit 50 generates a multimedia file by combining a voice file and a text file, each of which is composed of voice and text "I am happy." In the voice file and the text file, And inserts a pointer, which is display information for indicating a corresponding word in the text portion of the text file, when inserting the voice file into the voice file. The pointer may be implemented as a figure moving along the upper or lower end of a word on a text corresponding to a voice of the output multimedia file.

상기 모양입력부(60)는 선택적인 구성으로서 상기 포인터의 모양에 대한 사용자의 입력정보를 입력받는 역할을 수행한다. 상기 모양입력부(60)는 터치스크린, 마우스, 키보드 등의 통상적인 입력장치로 구현될 수 있으며, 사전에 제작되어 있는 2 이상의 모양 중에서 사용자가 선택하도록 해주는 방식의 선택인터페이스를 제공할 수도 있다.The shape input unit 60 selectively receives input information of the user about the shape of the pointer. The shape input unit 60 may be implemented by a conventional input device such as a touch screen, a mouse, and a keyboard, and may provide a selection interface of a method that allows the user to select from two or more shapes previously prepared.

본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 상기 모양입력부(60)가 구비된 경우 상기 멀티미디어파일생성부(50)는 상기 멀티미디어파일을 생성하며 상기 포인터를 삽입하되 상기 모양입력부(60)를 통해 입력된 모양의 포인터를 삽입하여 주게 된다.
In the case where the shape input unit 60 is provided in the English word decoding multimedia file generation system for improving the loudspeaker according to the present invention, the multimedia file generation unit 50 generates the multimedia file, inserts the pointer, 60 are inserted into the pointer.

[도 2]에는 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 의해 생성된 멀티미디어파일의 출력 실시예가 도시되어 있다.
FIG. 2 illustrates an example of outputting a multimedia file generated by the English word decoding multimedia file generating system for improving the loudness according to the present invention.

[도 2]를 살펴보면 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 의해 생성된 멀티미디어파일이 출력되고 있는 모습이 나타나 있는데, 상기 멀티미디어파일이 출력될 때 단어 단위로 음성에 대응되는 텍스트가 스마일 케릭터 도형으로 이루어진 포인터에 의해 지시되고 있는 것을 확인할 수 있다. 상기 스마일 케릭터 도형으로 이루어진 포인터는 상기 멀티미디어파일의 음성부의 진행에 맞추어 상기 텍스트의 단어 하단을 따라 이동하게 되어 있다. 이를 통해 확인할 수 있는 바와 같이 본 발명에 의할 경우 영어 음성을 단어 단위로 디코딩하여 인식할 수 있게 해주는 멀티미디어파일이 자동적으로 생성되게 된다.
2, a multimedia file generated by the system for generating an English word decoded multimedia file for improving the luckiness according to an embodiment of the present invention is outputted. When the multimedia file is output, You can see that the text is pointed to by a pointer made up of a smiley character graphic. The pointer made of the smile character figure moves along the lower part of the word of the text according to the progress of the voice part of the multimedia file. As can be seen from the above description, according to the present invention, a multimedia file that automatically decodes and recognizes an English voice by word unit is automatically generated.

이상에서 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 관하여 상세하게 설명하였다. 본 발명은 위에서 설명한 실시예들에 의해 한정되는 것은 아니며, 본 발명의 요지를 벗어남이 없는 범위 내에서 다양한 수정 및 변형이 가능하고, 다양한 분야에서 활용 가능하다. 따라서 본 발명의 청구범위는 이건 발명의 진정한 범위 내에 속하는 수정 및 변형을 포함한다.
The English word decoding multimedia file generation system for improving the lag according to the present invention has been described in detail above. The present invention is not limited to the above-described embodiments, and various modifications and variations can be made without departing from the gist of the present invention, and the present invention can be utilized in various fields. It is therefore intended that the appended claims cover such modifications and variations as fall within the true scope of the invention.

10: 음성입력부 20: 음성파일생성부
30: 텍스트파일생성부 40: 대응정보생성부
50: 멀티미디어파일생성부 60: 모양입력부
10: voice input unit 20: voice file generation unit
30: text file generation unit 40: correspondence information generation unit
50: multimedia file generation unit 60: shape input unit

Claims (3)

삭제delete 영어 음성을 입력받는 음성입력부;
상기 영어 음성을 음성파일로 생성하는 음성파일생성부;
상기 영어 음성을 텍스트로 변환하여 텍스트파일을 생성하는 텍스트파일생성부;
단어 단위로 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 메타데이터로 생성하여 상기 음성파일 및 상기 텍스트파일에 각각 삽입하여 주는 대응정보생성부; 및
상기 음성파일과 상기 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터를 생성하여 삽입하여 주는 멀티미디어파일생성부;를 포함하여 구성되되,
상기 포인터는 출력되는 멀티미디어파일의 음성에 대응되는 텍스트 상의 단어 상단 또는 하단을 따라 이동하는 도형으로 구현된 것을 특징으로 하는 리터러시(literacy) 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템.
A voice input unit for receiving an English voice;
A voice file generation unit for generating the English voice as a voice file;
A text file generation unit for converting the English voice into text and generating a text file;
A correspondence information generation unit for generating correspondence information between the speech file and the text file in units of words as metadata and inserting the correspondence information into the speech file and the text file, respectively; And
And a multimedia file generator for generating a multimedia file by combining the voice file and the text file and generating and inserting a pointer indicating a location on a text corresponding to the voice on a word by word basis based on the corresponding information, Respectively,
Wherein the pointer is embodied as a figure moving along an upper or lower end of a word on a text corresponding to an output multimedia file.
제2항에서,
포인터의 모양에 대한 사용자의 입력정보를 입력받는 모양입력부;를 더 포함하고,
상기 멀티미디어파일생성부는 상기 멀티미디어파일을 생성하며 상기 포인터를 삽입하되 상기 모양입력부를 통해 입력된 모양의 포인터를 삽입하여 주도록 구성된 것을 특징으로 하는 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템.
3. The method of claim 2,
And a shape input unit for receiving input information of the user with respect to the shape of the pointer,
Wherein the multimedia file generation unit generates the multimedia file, inserts the pointer, and inserts a pointer of an input shape through the shape input unit.
KR1020140020150A 2014-02-21 2014-02-21 A system for creating English word decoding multimedia file aiming at enhancing literacy KR101579905B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140020150A KR101579905B1 (en) 2014-02-21 2014-02-21 A system for creating English word decoding multimedia file aiming at enhancing literacy

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140020150A KR101579905B1 (en) 2014-02-21 2014-02-21 A system for creating English word decoding multimedia file aiming at enhancing literacy

Publications (2)

Publication Number Publication Date
KR20150098820A KR20150098820A (en) 2015-08-31
KR101579905B1 true KR101579905B1 (en) 2015-12-23

Family

ID=54060088

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140020150A KR101579905B1 (en) 2014-02-21 2014-02-21 A system for creating English word decoding multimedia file aiming at enhancing literacy

Country Status (1)

Country Link
KR (1) KR101579905B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102274275B1 (en) * 2019-03-29 2021-07-08 아이피랩 주식회사 Application and method for generating text link

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100450019B1 (en) 2001-11-17 2004-09-30 전준호 Method of service for english training of interactive voice response using internet
KR100628983B1 (en) 2004-09-22 2006-09-27 김용명 A system and method for diagnosis, prescription and testing of english ability and a memory device recorded a program for diagnosis, prescription and testing of english ability
KR100929688B1 (en) * 2007-02-12 2009-12-03 주식회사 이지씨앤씨 System and method for generating indexing information of a multimedia data file using voice data System and method for retrieving indexing information of a multimedia data file

Also Published As

Publication number Publication date
KR20150098820A (en) 2015-08-31

Similar Documents

Publication Publication Date Title
CN107516511B (en) Text-to-speech learning system for intent recognition and emotion
KR102582291B1 (en) Emotion information-based voice synthesis method and device
CN105244022B (en) Audio-video method for generating captions and device
US20200294487A1 (en) Hands-free annotations of audio text
US20200035209A1 (en) Automatic song generation
US10043519B2 (en) Generation of text from an audio speech signal
CN105704538A (en) Method and system for generating audio and video subtitles
US20150279349A1 (en) Text-to-Speech for Digital Literature
US9558733B1 (en) Audibly indicating secondary content with spoken text
CN103955454A (en) Method and equipment for carrying out literary form conversion between vernacular Chinese and classical Chinese
CN111079423A (en) Method for generating dictation, reading and reporting audio, electronic equipment and storage medium
KR20150105075A (en) Apparatus and method for automatic interpretation
US10276150B2 (en) Correction system, method of correction, and computer program product
KR101567449B1 (en) E-Book Apparatus Capable of Playing Animation on the Basis of Voice Recognition and Method thereof
KR101579905B1 (en) A system for creating English word decoding multimedia file aiming at enhancing literacy
US9865250B1 (en) Audibly indicating secondary content with spoken text
Wilcock et al. Bringing Cognitive Infocommunications to small language communities
KR20140126485A (en) Method of Emotion Reactive Type Mobile Private Secretary Service
KR20150131287A (en) Note-taking assistance system, information delivery device, terminal, note-taking assistance method, and computer-readable recording medium
Arawjo et al. Typetalker: A speech synthesis-based multi-modal commenting system
JP6342792B2 (en) Speech recognition method, speech recognition apparatus, and speech recognition program
JP2015114559A (en) Method for recording two-dimensional code and two-dimensional code readout device
Graham et al. Evaluating OpenAI's Whisper ASR: Performance analysis across diverse accents and speaker traits
KR20090112882A (en) Multimedia data offering service by Using TTS and Talking head
KR20190075765A (en) Webtoon tts system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20191105

Year of fee payment: 5