KR101579905B1 - A system for creating English word decoding multimedia file aiming at enhancing literacy - Google Patents
A system for creating English word decoding multimedia file aiming at enhancing literacy Download PDFInfo
- Publication number
- KR101579905B1 KR101579905B1 KR1020140020150A KR20140020150A KR101579905B1 KR 101579905 B1 KR101579905 B1 KR 101579905B1 KR 1020140020150 A KR1020140020150 A KR 1020140020150A KR 20140020150 A KR20140020150 A KR 20140020150A KR 101579905 B1 KR101579905 B1 KR 101579905B1
- Authority
- KR
- South Korea
- Prior art keywords
- file
- voice
- text
- english
- multimedia file
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Abstract
본 발명은 「영어 음성을 입력받는 음성입력부; 상기 영어 음성을 음성파일로 생성하는 음성파일생성부; 상기 영어 음성을 텍스트로 변환하여 텍스트파일을 생성하는 텍스트파일생성부; 단어 단위로 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 메타데이터로 생성하여 상기 음성파일 및 상기 텍스트파일에 각각 삽입하여 주는 대응정보생성부; 및 상기 음성파일과 상기 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터를 생성하여 삽입하여 주는 멀티미디어파일생성부;를 포함하여 구성된 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템」을 제공한다.The present invention relates to a voice input unit for inputting an English voice; A voice file generation unit for generating the English voice as a voice file; A text file generation unit for converting the English voice into text and generating a text file; A correspondence information generation unit for generating correspondence information between the speech file and the text file in units of words as metadata and inserting the correspondence information into the speech file and the text file, respectively; And a multimedia file generation unit for generating a multimedia file by combining the voice file and the text file and generating a pointer for indicating a location on a text corresponding to the voice on a word by word basis based on the corresponding information And an English word decoding multimedia file generation system for improving the literacy.
Description
본 발명은 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 관한 것으로, 더욱 상세하게는 영어 음성을 입력받아 음성파일, 텍스트파일 및 단어 단위로 주어지는 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 생성하고, 상기 음성파일과 상기 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터가 포함된 멀티미디어파일을 생성하여 주도록 구성된 것을 특징으로 하는 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 관한 것이다.
The present invention relates to an English word decoding multimedia file generation system for improving literacy, and more particularly, to a system and method for generating English word decoding multimedia file for improving literacy, And generating a multimedia file by combining the voice file and the text file to generate a multimedia file including a pointer for indicating a position on a text corresponding to a voice on a word by word basis based on the corresponding information To an English word decoding multimedia file generation system for enhancing the literacy.
글로벌 공용어로서의 영어의 중요성은 지속적으로 강조되어 왔으며, 이에 따라 영어교육 또는 영어학습과 관련하여 다양한 교육방법 및 교육교재 등이 선보이고 있다. 이러한 가운데 우리나라의 영어교육 또는 영어학습은 독해능력의 배양에 지나치게 치중되어 있다는 지적이 계속되어 왔고, 이의 극복을 위해 말하기능력이나 쓰기능력의 향상을 위한 방안들이 활발하게 개발되고 있다.The importance of English as a global language has been continuously emphasized, and various teaching methods and teaching materials related to English education or English learning are being presented. In this regard, it has been pointed out that our English education or English learning is too focused on the cultivation of reading ability. To cope with this, there are actively developing measures for improving the speaking ability and the writing ability.
한편, 근래에 무선인터넷 기술, 태블릿 PC나 스마트폰과 같은 모바일단말기 기술 및 음성검색 등에 활용되는 음성인식 기술 등이 발전함에 따라 이러한 기술들을 이용한 영어교육 또는 영어학습을 통해 위의 문제점을 해결하려는 연구들이 진행되고 있다. 구체적으로 대한민국 등록특허 제0450019호는 인터넷을 이용한 음성인식 영어학습서비스방법을 제시하고 있으며, 대한민국 등록특허 제0628983호는 음성인식 기술 등을 이용한 영어 능력 평가 및 진단 처방 시스템 등에 관해 제시하고 있다.In recent years, as the development of wireless Internet technology, mobile terminal technologies such as tablet PC and smart phone, and voice recognition technology used for voice search, etc., researches to solve the above problems through English education or English learning using these technologies . Specifically, Korean Patent No. 0450019 discloses a speech recognition English learning service method using the Internet, and Korean Patent No. 0628983 suggests an English ability evaluation and diagnostic prescription system using speech recognition technology and the like.
그러나 종래의 기술 가운데 영어 음성을 입력받아 음성파일과 텍스트파일을 생성하고 이들을 자동으로 결합하여 최종적으로 멀티미디어파일을 생성하되 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터가 포함된 멀티미디어파일을 생성하여 줌으로써 사용자로 하여금 영어 음성을 단어 단위로 디코딩 인지할 수 있게 해주는 콘텐츠를 자동적으로 생성하여 주는 기술은 찾아볼 수 없는 실정이다.
However, in the conventional technology, a multimedia file including a pointer that receives an English voice and generates a voice file and a text file and automatically combines them to generate a multimedia file, It is impossible to find a technique for automatically generating a content that enables a user to recognize English speech by decoding on a word-by-word basis.
본 발명은 영어 음성을 입력받아 음성파일과 텍스트파일을 생성하고 이들을 자동으로 결합하여 최종적으로 멀티미디어파일을 생성하되 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터가 포함된 멀티미디어파일을 생성하여 줌으로써 사용자로 하여금 영어 음성을 단어 단위로 디코딩 인지할 수 있게 해주는 콘텐츠의 효율적 제작을 가능하게 만들어 주는 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템을 제공하는 데 그 목적이 있다.
The present invention generates a multimedia file including pointers for inputting English speech, generating a voice file and a text file, automatically combining them, and finally generating a multimedia file, The present invention provides a system for generating an English word decoding multimedia file for improving the literacy, which makes it possible to efficiently produce contents enabling a user to perceive decoding of English speech by word unit.
전술한 과제의 해결을 위해 본 발명은 「영어 음성을 입력받는 음성입력부; 상기 영어 음성을 음성파일로 생성하는 음성파일생성부; 상기 영어 음성을 텍스트로 변환하여 텍스트파일을 생성하는 텍스트파일생성부; 단어 단위로 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 메타데이터로 생성하여 상기 음성파일 및 상기 텍스트파일에 각각 삽입하여 주는 대응정보생성부; 및 상기 음성파일과 상기 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터를 생성하여 삽입하여 주는 멀티미디어파일생성부;를 포함하여 구성된 리터러시(literacy) 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템」을 제공한다.
In order to solve the above-described problem, the present invention is characterized by " a voice input unit for inputting an English voice; A voice file generation unit for generating the English voice as a voice file; A text file generation unit for converting the English voice into text and generating a text file; A correspondence information generation unit for generating correspondence information between the speech file and the text file in units of words as metadata and inserting the correspondence information into the speech file and the text file, respectively; And a multimedia file generation unit for generating a multimedia file by combining the voice file and the text file and generating a pointer for indicating a location on a text corresponding to the voice on a word by word basis based on the corresponding information And an English word decoding multimedia file generation system for improving the literacy composed of the English words.
또한 본 발명은 「상기 포인터는 출력되는 멀티미디어파일의 음성에 대응되는 텍스트 상의 단어 상단 또는 하단을 따라 이동하는 도형으로 구현된 것을 특징으로 하는 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템」을 함께 제공한다. 이 경우 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템은 포인터의 모양에 대한 사용자의 입력정보를 입력받는 모양입력부;를 더 포함하고, 상기 멀티미디어파일생성부는 상기 멀티미디어파일을 생성하며 상기 포인터를 삽입하되 상기 모양입력부를 통해 입력된 모양의 포인터를 삽입하여 주도록 구성된 것을 특징으로 할 수 있다.
Further, the present invention is also related to a system for generating an English word decoding multimedia file for improving the lexibility, characterized in that the pointer is implemented as a figure moving along the upper or lower end of the word on the text corresponding to the voice of the output multimedia file do. In this case, the English word decoding multimedia file generation system for improving the lager according to the present invention further includes a shape input unit for receiving user input information on the shape of the pointer, and the multimedia file generation unit generates the multimedia file, A pointer is inserted and a pointer of the shape inputted through the shape input unit is inserted.
본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 의하면 다음과 같은 효과가 있다.According to the present invention, the English word decoding multimedia file generation system for improving the lighter has the following effects.
1. 영어 음성을 입력받아 만들어지는 음성파일, 텍스트파일 및 단어 단위로 주어지는 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 기초로, 상기 음성파일과 상기 텍스트파일이 결합되되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터가 포함된 멀티미디어파일을 자동적으로 생성할 수 있게 된다.1. A voice file and a text file are combined based on correspondence information between an audio file, a text file, and a speech file, which are given in units of words, and the text file, It is possible to automatically generate a multimedia file including a pointer for indicating a position on a text corresponding to a voice on a word-by-word basis.
2. 위의 멀티미디어파일은 사용자로 하여금 영어 음성을 단어 단위로 디코딩하여 문자와 함께 인지할 수 있게 해주는 영어학습 콘텐츠로서 활용될 수 있다.
2. The above multimedia file can be utilized as English learning contents which enables the user to decode the English speech by word and recognize it with the character.
[도 1]은 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템의 블록 구성도이다.
[도 2]는 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 의해 생성된 멀티미디어파일의 출력 실시예이다.1 is a block diagram of a system for generating an English word decoding multimedia file for improving the loudness according to the present invention.
FIG. 2 is an example of outputting a multimedia file generated by an English word decoding multimedia file generating system for improving the loudness according to the present invention.
이하에서는 첨부한 도면을 참조하면서 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 관하여 상세하게 설명하도록 한다. 통상적으로 영어 리터러시(literacy)라 함은 글을 읽고 쓰는 능력을 종합적으로 이르는 것인데 본 발명에서는 영어의 이해, 소리내어 읽는 능력 등을 포괄하는 넓은 의미로 사용된다.
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an English word decoding multimedia file generation system for improving a lighter according to the present invention will be described in detail with reference to the accompanying drawings. Normally, English literacy refers to the ability to comprehensively read and write text. In the present invention, it is used broadly to encompass the understanding of English and the ability to read aloud.
[도 1]에는 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템의 블록 구성도가 도시되어 있다.
1 is a block diagram illustrating a system for generating an English word decoding multimedia file for improving the luck according to the present invention.
본 발명에 따른 영문 단어 디코딩 시스템은 음성입력부(10), 음성파일생성부(20), 텍스트파일생성부(30), 대응정보생성부(40), 멀티미디어파일생성부(50) 및 모양입력부(60)를 포함하여 구성된다.
An English word decoding system according to the present invention includes a
상기 음성입력부(10)는 영어 음성을 입력받는 역할을 수행한다. 상기 음성입력부(10)는 통상의 마이크장치로 구현될 수 있으며, 상기 음성파일생성부(20) 및 상기 텍스트파일생성부(30)에 영어 음성을 전달하게 된다. 상기 음성입력부(10)를 통해 입력되는 영어 음성은 특정 영문장에 대한 읽기 음성 일수도 있고, 연설이나 일상 회화 등이 될 수도 있다. 일반적으로 영어학습 콘텐츠 제작의 자료로서 활용되기 위해서는 영어 원어민의 영문 읽기 음성이 주요한 입력 대상이 될 것이나 그 범위에 특별한 제한은 없다.
The
상기 음성파일생성부(20)는 상기 음성입력부(10)가 입력받은 영어 음성을 음성파일로 생성하는 역할을 수행한다. 상기 음성파일생성부(20)는 디지털녹음모듈로 구현될 수 있으며, 상기 음성파일생성부(20)에 의해 생성된 음성파일은 멀티미디어파일의 음성부로 사용되게 된다.
The voice file generating unit 20 generates an English voice input by the
상기 텍스트파일생성부(30)는 상기 음성입력부(10)가 입력받은 영어 음성을 텍스트로 변환하여 텍스트파일을 생성하는 역할을 수행한다. 상기 텍스트파일생성부(30)는 음성파형으로부터 언어정보를 추출해내도록 되어 있는 음성인식모듈을 기반으로 구현될 수 있는데, 본 발명의 성격상 연속음성인식 기술이 적용된 것이어야 한다. 상기 텍스트파일생성부(30)에 의해 생성된 텍스트파일은 멀티미디어파일의 텍스트부로 사용되게 된다.
The text file generation unit 30 converts the English voice input by the
상기 대응정보생성부(40)는 단어 단위로 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 메타데이터로 생성하여 상기 음성파일 및 상기 텍스트파일에 각각 삽입하여 주는 역할을 수행한다. 상기 대응정보생성부(40)는 상기 대응정보의 생성을 위한 프로그램이 설치된 컴퓨팅모듈로 구현될 수 있으며, 상기 대응정보는 상기 음성파일과 상기 텍스트파일 사이에 단어 단위로 일대일로 생성되는 싱크(syncronization, 동조)정보라고 할 수 있다.The correspondence information generation unit 40 generates correspondence information between the voice file and the text file on a word-by-word basis, and inserts the correspondence information into the voice file and the text file, respectively. The correspondence information generator 40 may be implemented as a computing module provided with a program for generating the correspondence information, and the correspondence information may include syncronization between the speech file and the text file, , Tuning) information.
구체적인 예를 들면 상기 대응정보생성부(40)는 상기 음성파일이 "I am happy."라는 영어 음성으로 이루어져 있고, 그에 상응하는 텍스트파일이 생성되었다고 할 때 상기 음성파일의 재생구간 중 "I", "am", "happy" 부분에 각각 001, 002 및 003 등과 같은 특정 코드를 부여하여 삽입하고, 상기 텍스트파일 상의 각 단어 "I", "am", "happy"에는 상기 특정 코드에 대응되는 001-1, 002-2 및 003-3 등과 같은 싱크(sync) 코드를 부여하여 삽입할 수 있다.
Specifically, for example, the corresponding information generator 40 generates an audio file in which the audio file is composed of an English voice "I am happy." And a corresponding text file is generated, "I" , "am", and "happy" are assigned to specific codes such as 001, 002, and 003, respectively, to the "am" 001-1, 002-2, 003-3, or the like.
상기 멀티미디어파일생성부(50)는 상기 음성파일과 상기 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터를 생성하여 삽입하여 주는 역할을 수행한다. 상기 멀티미디어파일생성부(50)는 상기 음성파일과 상기 텍스트파일의 결합 및 상기 포인터 생성·삽입을 위한 프로그램이 설치된 컴퓨팅모듈로 구현될 수 있다.The multimedia file generation unit 50 generates a multimedia file by combining the voice file and the text file, and generates and inserts a pointer indicating a text position corresponding to the voice on a word-by-word basis based on the corresponding information The state plays a role. The multimedia file generator 50 may be implemented as a computing module having a program for combining the voice file and the text file and for creating and inserting the pointer.
위의 구체적인 예를 이어서 살펴보면 상기 멀티미디어파일생성부(50)는 "I am happy."라는 음성과 텍스트로 각각 이루어진 음성파일 및 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 음성파일 및 상기 텍스트파일에 각각 삽입되어 있는 대응정보를 분석하여 상기 음성파일로 이루어진 음성부의 재생시 상기 텍스트파일로 이루어진 텍스트부의 해당 단어를 지시하여 주는 표시정보인 포인터를 삽입하여 생성하는 것이다. 상기 포인터는 출력되는 멀티미디어파일의 음성에 대응되는 텍스트 상의 단어 상단 또는 하단을 따라 이동하는 도형으로 구현될 수 있다.
The multimedia file generation unit 50 generates a multimedia file by combining a voice file and a text file, each of which is composed of voice and text "I am happy." In the voice file and the text file, And inserts a pointer, which is display information for indicating a corresponding word in the text portion of the text file, when inserting the voice file into the voice file. The pointer may be implemented as a figure moving along the upper or lower end of a word on a text corresponding to a voice of the output multimedia file.
상기 모양입력부(60)는 선택적인 구성으로서 상기 포인터의 모양에 대한 사용자의 입력정보를 입력받는 역할을 수행한다. 상기 모양입력부(60)는 터치스크린, 마우스, 키보드 등의 통상적인 입력장치로 구현될 수 있으며, 사전에 제작되어 있는 2 이상의 모양 중에서 사용자가 선택하도록 해주는 방식의 선택인터페이스를 제공할 수도 있다.The
본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 상기 모양입력부(60)가 구비된 경우 상기 멀티미디어파일생성부(50)는 상기 멀티미디어파일을 생성하며 상기 포인터를 삽입하되 상기 모양입력부(60)를 통해 입력된 모양의 포인터를 삽입하여 주게 된다.
In the case where the
[도 2]에는 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 의해 생성된 멀티미디어파일의 출력 실시예가 도시되어 있다.
FIG. 2 illustrates an example of outputting a multimedia file generated by the English word decoding multimedia file generating system for improving the loudness according to the present invention.
[도 2]를 살펴보면 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 의해 생성된 멀티미디어파일이 출력되고 있는 모습이 나타나 있는데, 상기 멀티미디어파일이 출력될 때 단어 단위로 음성에 대응되는 텍스트가 스마일 케릭터 도형으로 이루어진 포인터에 의해 지시되고 있는 것을 확인할 수 있다. 상기 스마일 케릭터 도형으로 이루어진 포인터는 상기 멀티미디어파일의 음성부의 진행에 맞추어 상기 텍스트의 단어 하단을 따라 이동하게 되어 있다. 이를 통해 확인할 수 있는 바와 같이 본 발명에 의할 경우 영어 음성을 단어 단위로 디코딩하여 인식할 수 있게 해주는 멀티미디어파일이 자동적으로 생성되게 된다.
2, a multimedia file generated by the system for generating an English word decoded multimedia file for improving the luckiness according to an embodiment of the present invention is outputted. When the multimedia file is output, You can see that the text is pointed to by a pointer made up of a smiley character graphic. The pointer made of the smile character figure moves along the lower part of the word of the text according to the progress of the voice part of the multimedia file. As can be seen from the above description, according to the present invention, a multimedia file that automatically decodes and recognizes an English voice by word unit is automatically generated.
이상에서 본 발명에 따른 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템에 관하여 상세하게 설명하였다. 본 발명은 위에서 설명한 실시예들에 의해 한정되는 것은 아니며, 본 발명의 요지를 벗어남이 없는 범위 내에서 다양한 수정 및 변형이 가능하고, 다양한 분야에서 활용 가능하다. 따라서 본 발명의 청구범위는 이건 발명의 진정한 범위 내에 속하는 수정 및 변형을 포함한다.
The English word decoding multimedia file generation system for improving the lag according to the present invention has been described in detail above. The present invention is not limited to the above-described embodiments, and various modifications and variations can be made without departing from the gist of the present invention, and the present invention can be utilized in various fields. It is therefore intended that the appended claims cover such modifications and variations as fall within the true scope of the invention.
10: 음성입력부 20: 음성파일생성부
30: 텍스트파일생성부 40: 대응정보생성부
50: 멀티미디어파일생성부 60: 모양입력부10: voice input unit 20: voice file generation unit
30: text file generation unit 40: correspondence information generation unit
50: multimedia file generation unit 60: shape input unit
Claims (3)
상기 영어 음성을 음성파일로 생성하는 음성파일생성부;
상기 영어 음성을 텍스트로 변환하여 텍스트파일을 생성하는 텍스트파일생성부;
단어 단위로 상기 음성파일과 상기 텍스트파일 사이의 대응정보를 메타데이터로 생성하여 상기 음성파일 및 상기 텍스트파일에 각각 삽입하여 주는 대응정보생성부; 및
상기 음성파일과 상기 텍스트파일을 결합하여 멀티미디어파일을 생성하되 상기 대응정보에 근거해 단어 단위로 음성에 대응되는 텍스트 상의 위치를 지시하여 주는 포인터를 생성하여 삽입하여 주는 멀티미디어파일생성부;를 포함하여 구성되되,
상기 포인터는 출력되는 멀티미디어파일의 음성에 대응되는 텍스트 상의 단어 상단 또는 하단을 따라 이동하는 도형으로 구현된 것을 특징으로 하는 리터러시(literacy) 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템.
A voice input unit for receiving an English voice;
A voice file generation unit for generating the English voice as a voice file;
A text file generation unit for converting the English voice into text and generating a text file;
A correspondence information generation unit for generating correspondence information between the speech file and the text file in units of words as metadata and inserting the correspondence information into the speech file and the text file, respectively; And
And a multimedia file generator for generating a multimedia file by combining the voice file and the text file and generating and inserting a pointer indicating a location on a text corresponding to the voice on a word by word basis based on the corresponding information, Respectively,
Wherein the pointer is embodied as a figure moving along an upper or lower end of a word on a text corresponding to an output multimedia file.
포인터의 모양에 대한 사용자의 입력정보를 입력받는 모양입력부;를 더 포함하고,
상기 멀티미디어파일생성부는 상기 멀티미디어파일을 생성하며 상기 포인터를 삽입하되 상기 모양입력부를 통해 입력된 모양의 포인터를 삽입하여 주도록 구성된 것을 특징으로 하는 리터러시 향상을 위한 영어단어 디코딩 멀티미디어파일 생성시스템.3. The method of claim 2,
And a shape input unit for receiving input information of the user with respect to the shape of the pointer,
Wherein the multimedia file generation unit generates the multimedia file, inserts the pointer, and inserts a pointer of an input shape through the shape input unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140020150A KR101579905B1 (en) | 2014-02-21 | 2014-02-21 | A system for creating English word decoding multimedia file aiming at enhancing literacy |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140020150A KR101579905B1 (en) | 2014-02-21 | 2014-02-21 | A system for creating English word decoding multimedia file aiming at enhancing literacy |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20150098820A KR20150098820A (en) | 2015-08-31 |
KR101579905B1 true KR101579905B1 (en) | 2015-12-23 |
Family
ID=54060088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140020150A KR101579905B1 (en) | 2014-02-21 | 2014-02-21 | A system for creating English word decoding multimedia file aiming at enhancing literacy |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101579905B1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102274275B1 (en) * | 2019-03-29 | 2021-07-08 | 아이피랩 주식회사 | Application and method for generating text link |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100450019B1 (en) | 2001-11-17 | 2004-09-30 | 전준호 | Method of service for english training of interactive voice response using internet |
KR100628983B1 (en) | 2004-09-22 | 2006-09-27 | 김용명 | A system and method for diagnosis, prescription and testing of english ability and a memory device recorded a program for diagnosis, prescription and testing of english ability |
KR100929688B1 (en) * | 2007-02-12 | 2009-12-03 | 주식회사 이지씨앤씨 | System and method for generating indexing information of a multimedia data file using voice data System and method for retrieving indexing information of a multimedia data file |
-
2014
- 2014-02-21 KR KR1020140020150A patent/KR101579905B1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20150098820A (en) | 2015-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107516511B (en) | Text-to-speech learning system for intent recognition and emotion | |
KR102582291B1 (en) | Emotion information-based voice synthesis method and device | |
CN105244022B (en) | Audio-video method for generating captions and device | |
US20200294487A1 (en) | Hands-free annotations of audio text | |
US20200035209A1 (en) | Automatic song generation | |
US10043519B2 (en) | Generation of text from an audio speech signal | |
CN105704538A (en) | Method and system for generating audio and video subtitles | |
US20150279349A1 (en) | Text-to-Speech for Digital Literature | |
US9558733B1 (en) | Audibly indicating secondary content with spoken text | |
CN103955454A (en) | Method and equipment for carrying out literary form conversion between vernacular Chinese and classical Chinese | |
CN111079423A (en) | Method for generating dictation, reading and reporting audio, electronic equipment and storage medium | |
KR20150105075A (en) | Apparatus and method for automatic interpretation | |
US10276150B2 (en) | Correction system, method of correction, and computer program product | |
KR101567449B1 (en) | E-Book Apparatus Capable of Playing Animation on the Basis of Voice Recognition and Method thereof | |
KR101579905B1 (en) | A system for creating English word decoding multimedia file aiming at enhancing literacy | |
US9865250B1 (en) | Audibly indicating secondary content with spoken text | |
Wilcock et al. | Bringing Cognitive Infocommunications to small language communities | |
KR20140126485A (en) | Method of Emotion Reactive Type Mobile Private Secretary Service | |
KR20150131287A (en) | Note-taking assistance system, information delivery device, terminal, note-taking assistance method, and computer-readable recording medium | |
Arawjo et al. | Typetalker: A speech synthesis-based multi-modal commenting system | |
JP6342792B2 (en) | Speech recognition method, speech recognition apparatus, and speech recognition program | |
JP2015114559A (en) | Method for recording two-dimensional code and two-dimensional code readout device | |
Graham et al. | Evaluating OpenAI's Whisper ASR: Performance analysis across diverse accents and speaker traits | |
KR20090112882A (en) | Multimedia data offering service by Using TTS and Talking head | |
KR20190075765A (en) | Webtoon tts system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20191105 Year of fee payment: 5 |