KR101336716B1 - Listen and write system on network - Google Patents

Listen and write system on network Download PDF

Info

Publication number
KR101336716B1
KR101336716B1 KR1020110077239A KR20110077239A KR101336716B1 KR 101336716 B1 KR101336716 B1 KR 101336716B1 KR 1020110077239 A KR1020110077239 A KR 1020110077239A KR 20110077239 A KR20110077239 A KR 20110077239A KR 101336716 B1 KR101336716 B1 KR 101336716B1
Authority
KR
South Korea
Prior art keywords
dictation
data
voice
recording
listening
Prior art date
Application number
KR1020110077239A
Other languages
Korean (ko)
Other versions
KR20130015317A (en
Inventor
김준환
Original Assignee
김준환
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김준환 filed Critical 김준환
Priority to KR1020110077239A priority Critical patent/KR101336716B1/en
Publication of KR20130015317A publication Critical patent/KR20130015317A/en
Application granted granted Critical
Publication of KR101336716B1 publication Critical patent/KR101336716B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student

Abstract

본 발명은 온라인상에서의 듣고 받아쓰기 시스템에 관한 것으로서, 더욱 상세하게는 비음성 구간의 시간 길이의 값이 도출될 때, 그 시간 길이에 따른 확률 분포도를 구하고, 그 확률에 따라 각각 문장, 숙어 및 단어를 구분하여 데이터를 저장하되, 상기 데이터가 사용자의 듣고 쓰기 재생시 제공되어 단어, 숙어 및 문장의 구분을 가능하게 하는 끊어 읽기 모듈과, 사용자가 원하는 레벨의 듣기 데이터를 검색하되, 사용자가 제시하는 키워드나 요청사항에 의해서 듣고 받아쓰기를 원하는 음성자료가 검색되는 받아쓰기 데이터 검색 모듈과, 받아쓰고 난 후 사용자 입력 데이터를 하기 클라이언트로부터 수신하여 저장 및 분석하여 듣고 쓰는 능력을 분석해주는 것을 가능하게 하는 받아쓰기 다면 평가 모듈 및 일정 시간 간격 또는 일정량의 입력 후 임시 데이터로 저장하여, 위급 종료시 복구를 가능하게 하는 데이터 복구 모듈을 구비한 서버 및 자판 입력 중에 특정 구간을 반복해서 재생하거나 앞뒤의 구간으로 쉽게 이동하여 재생하게 하는 재생제어부와, 듣고 쓰기 입력 중 다면 평가를 위한 사용자 입력 데이터를 수집하여 수시로 상기 서버에 저장하고, 입력 완료 후 최종적으로 그 데이터를 서버로 전송하는 다면 평가용 사용자 원시 데이터 수집부와, 듣고 쓰기용 음성데이터 및 텍스트를 업로드 하는 받아쓰기 데이터 업로드부 및 음성 데이터과 텍스트 데이터 간 싱크 에디팅 및 주석 추가를 위한 싱크 및 주석 에디터부를 구비한 클라이언트를 포함하는 온라인상에서의 듣고 받아쓰기 시스템에 관한 것이다.
본 발명에 따르면, 첫째, 듣고 받아쓰기 능력을 다면적으로 정량화하는 효과가 있다.
둘째, 다면 평가용 원시 데이터를 분석하면 사람이 입력했는지 비인간적인 어떤 프로그램이 입력했는지를 확인할 확률을 높일 수 있어 온라인 평가에서 피 평가자가 사람인지 아닌지 인증하는 효과가 있다.
셋째, 반복 재생 제어 기능과 자동 끊어 읽기 기능을 이용하면, 자판 사용에 문제가 없는 사용자인 일반인의 경우도 녹취 작업 시간이 피 녹취 파일 시간 길이의 4배 이하로 줄어드는 효과가 있다.
넷째, 싱크 에디팅 기능을 이용해서 음성 파일의 특정 위치에 여러 단계의 설명이나 번역을 추가할 수 있어 강의 보조 자료나 번역 교육의 도구로 사용하는 장점이 있다.
다섯째, 녹취 작업을 공동으로 할 수 있으며, 받아쓰기 자료 제공 및 가공자, 받아쓰기 자료 사용자, 서버 운영자로 이루어지는 새로운 시장을 창출할 수 있다.
여섯째, 녹취 작업 요청자, 녹취 작업 수행자 및 녹취 서버 운영자로 이루어지는 새로운 시장 창출할 수 있고, 음성 강의 자료 주석 작업자, 음성 강의 주석 자료 사용자, 음성 강의 주석 파일 서버 관리자로 이루어지는 새로운 시장 창출할 수 있으며, 오디오북 또는 시청각 강의에 대한 새로운 시장 창출되는 이점이 있다.
The present invention relates to a listening dictation system online, and more particularly, when a value of a time length of a non-speech interval is derived, a probability distribution map is obtained according to the time length, and sentences, idioms, and words are respectively calculated according to the probability. To store data by separating the data, the data is provided at the time of listening and writing of the user to read and cut the module to enable the separation of words, idioms and sentences, and the user to search the listening data of the desired level, If the dictation data retrieval module that retrieves the voice data that you want to hear and dictate by keyword or request, and the dictation that enables to analyze the ability to receive, store and analyze the user input data after the dictation, and to listen and write Evaluation module and temporary after input of a certain time interval or amount A server equipped with a data recovery module that enables data recovery in case of an emergency, and a playback control unit for repeatedly playing a specific section during keyboard input or easily moving back and forth between sections, and listening and writing input. Collect user input data for and store it on the server from time to time, and if the input is finally sent to the server after the input is completed, the user raw data collection unit for evaluation, dictation data upload to upload voice data and text for listening and writing A listening and dictation system on-line including a client having a sync and annotation editor for sync editing and annotation between audio and text data and text data.
According to the present invention, first, there is an effect of quantifying the ability to hear and dictate in multiple ways.
Second, analyzing the raw data for multi-faceted evaluation can increase the probability of checking whether a human input or a non-human program has been entered, and thus, it is effective to verify whether the evaluator is a human in the online evaluation.
Third, by using the repeat play control function and the automatic cut-out function, the recording work time is reduced to less than four times the length of the recorded file even for a general person who has no problem using the keyboard.
Fourth, by using the sync editing function, multiple levels of explanation or translation can be added to a specific location of a voice file, which can be used as a teaching aid or a tool for translation education.
Fifth, the recording work can be done jointly, and a new market can be created by providing dictation materials and using processors, dictation materials users, and server operators.
Sixth, it can create a new market consisting of call requesters, record performers, and recording server operators, and create a new market consisting of voice lecture commentaries, voice lecture comment users, and voice lecture comment file server administrators. There is a new market creation advantage for book or audiovisual lectures.

Description

온라인상에서의 듣고 받아쓰기 시스템{Listen and write system on network}Listen and write system on network

본 발명은 온라인상에서의 듣고 받아쓰기 시스템에 관한 것이다.The present invention relates to a listening dictation system online.

일반적으로 종래에는 개인용 컴퓨터로 듣고 받아쓰기를 위해서 소정의 듣고 받아쓰기 소프트웨어를 사용하였다.In general, a predetermined listening and dictation software is used for listening and dictating with a personal computer.

그리고, 영화 화면과 자막의 싱크를 맞춰주는 싱크 에디터 소프트웨어의 경우에는 영화 자막 제작 목적으로 만들어진 프로그램이기 때문에 결과 비교와 같은 받아쓰기 기능이 미흡한 단점이 있었다.In addition, the sync editor software that synchronizes the movie screen and the subtitle has a disadvantage in that the dictation function such as result comparison is insufficient because the program is made for the purpose of producing the movie subtitle.

종래의 듣고 받아쓰기 서비스는 한 문장 받아쓰기 혹은 특정 구문 채워 넣기 등으로 구성되어 있어서, 전체적으로 여러 문장을 지속적으로 듣고 받아쓰기 위한 기능은 구현되어 있지 않은 상황이다.The conventional listening dictation service is composed of one sentence dictation or a specific phrase filling, so that a function for continuously listening and dictating several sentences as a whole is not implemented.

따라서, 사용자에게 실제의 듣고 받아쓰기를 위한 각종 편리한 기능들(구문 단위로 끊어서 읽어주기, 답안과 비교 확인, 다면 평가 방식 등)을 제공하는 시스템의 개발이 요구되고 있다.Therefore, there is a demand for the development of a system that provides a user with a variety of convenient functions for reading and dictating the actual sentence (reading in syntax units, comparing and checking answers, multi-face evaluation method, etc.).

본 발명의 과제는 듣고 받아쓰기 능력을 다면적으로 정량화할 수 있고, 다면 평가용 원시 데이터를 분석하면 사람이 입력했는지 비인간적인 어떤 프로그램이 입력했는지를 확인할 확률을 높일 수 있어 온라인 평가에서 피 평가자가 사람인지 아닌지 인증할 수 있으며, 반복 재생 제어 기능과 자동 끊어 읽기 기능을 이용하면, 자판 사용에 문제가 없는 사용자인 일반인의 경우도 녹취 작업 시간이 피 녹취 파일 시간 길이의 4배 이하로 줄어들게 할 수 있고, 싱크 에디팅 기능을 이용해서 음성 파일의 특정 위치에 여러 단계의 설명이나 번역을 추가할 수 있어 음성 강의 자료의 보조 자료나 번역 교육의 도구로 사용할 수 있고, 녹취 작업을 공동으로 할 수 있으며, 받아쓰기 자료 제공 및 가공자, 받아쓰기 자료 사용자, 서버 운영자로 이루어지는 새로운 시장을 창출할 수 있으며, 녹취 작업 요청자, 녹취 작업 수행자 및 녹취 서버 운영자로 이루어지는 새로운 시장 창출할 수 있고, 음성 강의 자료 주석 작업자, 음성 강의 주석 자료 사용자, 음성 강의 주석 파일 서버 관리자로 이루어지는 새로운 시장 창출할 수 있으며, 오디오북 또는 시청각 강의에 대한 새로운 시장을 창출할 수 있는 온라인상에서의 듣고 받아쓰기 시스템을 제공하는 데 있다.The object of the present invention is to quantify the ability to listen and dictate in multiple ways, and analyzing raw data for multi-faceted evaluation can increase the probability of checking whether a human input or a non-human program is input. By using the repeat play control function and the automatic break reading function, the recording time can be reduced to less than four times the length of the recording file even for a general user who has no problem using the keyboard. Sync editing allows you to add multiple levels of explanation or translation to a specific location in a voice file, which can be used as an aid to voice lectures or as a tool for translation training, to collaborate on recordings, and to dictate material. A new city of providers and processors, dictator users, and server operators Create a new market with voice requesters, record performers, and record server operators, and create a new market with voice lecture commentators, voice lecture comment users, and voice lecture comment file server administrators. It is possible to provide an online listening and dictation system that can create new markets for audiobooks or audiovisual lectures.

상기 과제를 달성하기 위해 안출된 본 발명은, 비음성 구간의 시간 길이의 값이 도출될 때, 그 시간 길이에 따른 확률 분포도를 구하고, 그 확률에 따라 각각 문장, 숙어 및 단어를 구분하여 데이터를 저장하되, 상기 데이터가 사용자의 듣고 쓰기 재생시 제공되어 단어, 숙어 및 문장의 구분을 가능하게 하는 끊어 읽기 모듈과, 사용자가 원하는 레벨의 듣기 데이터를 검색하되, 사용자가 제시하는 키워드나 요청사항에 의해서 듣고 받아쓰기를 원하는 음성자료가 검색되는 받아쓰기 데이터 검색 모듈과, 받아쓰고 난 후 사용자 입력 데이터를 하기 클라이언트로부터 수신하여 저장 및 분석하여 듣고 쓰는 능력을 분석해주는 것을 가능하게 하는 받아쓰기 다면 평가 모듈 및 일정 시간 간격 또는 일정량의 입력 후 임시 데이터로 저장하여, 위급 종료시 복구를 가능하게 하는 데이터 복구 모듈을 구비한 서버 및 자판 입력 중에 특정 구간을 반복해서 재생하거나 앞뒤의 구간으로 쉽게 이동하여 재생하게 하는 재생제어부와, 듣고 쓰기 입력 중 다면 평가를 위한 사용자 입력 데이터를 수집하여 수시로 상기 서버에 저장하고, 입력 완료 후 최종적으로 그 데이터를 서버로 전송하는 다면 평가용 사용자 원시 데이터 수집부와, 듣고 쓰기용 음성데이터 및 텍스트를 업로드 하는 받아쓰기 데이터 업로드부 및 음성 데이터과 텍스트 데이터 간 싱크 에디팅 및 주석 추가를 위한 싱크 및 주석 에디터부를 구비한 클라이언트를 포함한다.The present invention devised to achieve the above object, when the value of the time length of the non-speech interval is derived, obtain a probability distribution according to the time length, and according to the probability to separate the sentences, idioms and words, respectively, the data Save, but the data is provided at the time of listening and writing playback of the user to cut words, idioms and sentences, and the reading module and the user to search the listening data of the desired level, the user's keywords or requests A dictation data search module in which voice data desired to be listened and dictated is searched, and a dictation evaluation module and a predetermined time, which enable to analyze the ability to receive, store, analyze, listen to and write user input data from a client after dictation. Recovery after emergency by saving as temporary data after interval or certain amount of input A server having a data recovery module for enabling a user and a playback control unit for replaying a specific section repeatedly or easily moving back and forth between sections during keyboard input, and collecting user input data for multi-faceted evaluation during listening and writing input. If the data is stored in the server from time to time, and the data is finally transmitted to the server after the input is completed, the user raw data collection unit for evaluation, the dictation data upload unit for uploading the voice data and the text for listening and writing, and the sync between the voice data and the text data Includes a client with sink and annotation editor for editing and annotating.

상기 서버는 녹취록 공동 작업을 위해 작업자 간 자동 조율을 위한 공동 녹취 데이터 분할 모듈 및 공동 작업 녹취 결과를 통합시키는 녹취 결과 통합 모듈을 더 포함하는 것을 특징으로 한다.The server may further include a joint recording data splitting module for automatic coordination between workers for recording collaboration and a recording result integration module for integrating the collaboration recording results.

상기 클라이언트는 녹취 요청 및 지불 비용 게시와 녹취록 작성자가 선택하는 녹취 요청 게시부를 더 포함하는 것을 특징으로 한다.The client may further include a recording request posting unit for posting a recording request and payment cost and selecting a recording author.

상기 클라이언트는 녹취 결과를 검증하는 환경을 제공하는 녹취 결과 검증부를 더 포함하는 것을 특징으로 한다.The client may further include a recording result verification unit providing an environment for verifying the recording result.

상기 클라이언트는 듣는 중에 소정의 키를 누르면, 그 시점에 관련된 설명이 제공되는 음성 주석 재생부를 더 포함하는 것을 특징으로 한다.When the client presses a predetermined key while listening, the client may further include a voice annotation playback unit provided with a description related to the point in time.

본 발명의 효과는 다음과 같다.The effects of the present invention are as follows.

첫째, 듣고 받아쓰기 능력을 다면적으로 정량화하는 효과가 있다.First, it has the effect of quantifying the ability to listen and dictate in multiple ways.

둘째, 다면 평가용 원시 데이터를 분석하면 사람이 입력했는지 비인간적인 어떤 프로그램이 입력했는지를 확인할 확률을 높일 수 있어 온라인 평가에서 피 평가자가 사람인지 아닌지 혹은 순수하게 듣고 받아썼는지 아니면 다른 부정적인 방법을 이용했는지 확인하는 효과가 있다.Second, analyzing raw data for multi-faceted assessments can increase the likelihood of determining whether a human or a non-human program has been entered, and whether the evaluator is a human, purely listening or dictating, or using other negative methods in online assessment. It is effective to confirm.

셋째, 반복 재생 제어 기능과 자동 끊어 읽기 기능을 이용하면, 자판 사용에 문제가 없는 사용자인 일반인의 경우도 녹취 작업 시간이 피 녹취 파일 시간 길이의 4배 이하로 줄어드는 효과가 있다.Third, by using the repeat play control function and the automatic cut-out function, the recording work time is reduced to less than four times the length of the recorded file even for a general person who has no problem using the keyboard.

넷째, 싱크 에디팅 기능을 이용해서 음성 파일의 특정 위치에 여러 단계의 설명이나 번역을 추가할 수 있어 음성 강의 자료의 보조 자료나 번역 교육의 도구로 사용하는 장점이 있다.Fourth, by using the sync editing function, multiple levels of explanation or translation can be added to a specific location of a voice file, which can be used as an auxiliary material for voice lecture materials or as a tool for translation education.

다섯째, 녹취 작업을 공동으로 할 수 있으며, 받아쓰기 자료 제공 및 가공자, 받아쓰기 자료 사용자, 서버 운영자로 이루어지는 새로운 시장을 창출할 수 있다.Fifth, the recording work can be done jointly, and a new market can be created by providing dictation materials and using processors, dictation materials users, and server operators.

여섯째, 녹취 작업 요청자, 녹취 작업 수행자 및 녹취 서버 운영자로 이루어지는 새로운 시장 창출할 수 있고, 음성 강의 자료 주석 작업자, 음성 강의 주석 자료 사용자, 음성 강의 주석 파일 서버 관리자로 이루어지는 새로운 시장 창출할 수 있으며, 오디오북 또는 시청각 강의에 대한 새로운 시장 창출되는 이점이 있다.Sixth, it can create a new market consisting of call requesters, record performers, and recording server operators, and create a new market consisting of voice lecture commentaries, voice lecture comment users, and voice lecture comment file server administrators. There is a new market creation advantage for book or audiovisual lectures.

본 명세서에서 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어서 해석되어서는 아니 된다.
도 1은 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템을 나타낸 구성도,
도 2는 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템을 설명하기 위한 개념도,
도 3은 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템에서 온라인 녹취를 나타낸 개념도,
도 4는 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템에서 음성 강의 주석 자료 사업 모델을 나타낸 개념도,
도 5 내지 도 9는 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템에서 서버-클라이언트 간 상호 동작 순서를 나타낸 개념도이다.
BRIEF DESCRIPTION OF THE DRAWINGS The accompanying drawings, which are incorporated in and constitute a part of the specification, illustrate preferred embodiments of the invention and, together with the description, serve to further the understanding of the technical idea of the invention, And shall not be construed as interpretation.
1 is a block diagram showing an online listening dictation system according to an embodiment of the present invention;
2 is a conceptual diagram for explaining a listening dictation system online according to an embodiment of the present invention;
3 is a conceptual diagram showing online recording in a listening dictation system online according to an embodiment of the present invention;
4 is a conceptual diagram illustrating a voice lecture annotation material business model in an online listening dictation system according to an embodiment of the present invention;
5 to 9 are conceptual diagrams illustrating a server-client interaction order in a listening dictation system online according to an embodiment of the present invention.

이하, 본 발명에 따른 온라인상에서의 듣고 받아쓰기 시스템의 바람직한 실시예에 대해 상세하게 설명한다.
Hereinafter, a preferred embodiment of the listening dictation system online according to the present invention will be described in detail.

도 1은 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템을 나타낸 구성도이다. 도 1을 참조하면, 본 발명에 바람직한 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템은 서버(100) 및 클라이언트(200)를 포함하는 구성요소로 이루어지며, 이를 상세히 설명하면 다음과 같다.1 is a block diagram showing a listening dictation system online according to an embodiment of the present invention. Referring to FIG. 1, the system for listening and dictating online according to a preferred embodiment of the present invention includes components including a server 100 and a client 200, which will be described in detail as follows.

상기 서버(100)는 끊어 읽기 모듈(110), 받아쓰기 데이터 저장 모듈(120), 받아쓰기 다면 평가 모듈(130) 및 데이터 복구 모듈(140)을 포함한다.The server 100 includes a broken read module 110, a dictation data storage module 120, a dictation multifaceted evaluation module 130, and a data recovery module 140.

상기 끊어 읽기 모듈(110)은 단어, 숙어(문맥) 및 문장 단위를 구분하는 알고리즘이 구현된 소프트웨어 모듈로서, 듣기용 MP3파일이 제공되면 MP3파일의 음성 활성도를 분석하여 음성 구간과 비음성 구간으로 나눈다.The reading module 110 is a software module that implements an algorithm for classifying words, idioms, and sentence units. When a listening MP3 file is provided, the voice reading module 110 analyzes the voice activity of the MP3 file into a voice section and a non-voice section. Divide.

그리고, 끊어 읽기 모듈(110)은 비음성 구간의 시간 길이의 값이 도출될 때, 그 시간 길이에 따른 확률 분포도를 구하고, 그 확률에 따라 각각 문장 구분, 숙어 구분 및 단어 구분으로 나누어 정보를 저장한다. 그러면, 서버(100)에는 상기 듣기용 MP3 파일별로 대응하는 각각의 문장, 숙어 및 단어로 구분된 정보가 저장된다.When the value of the time length of the non-speech interval is derived, the reading module 110 obtains a probability distribution map according to the time length, and stores information by dividing the sentence into a sentence, an idiom, and a word according to the probability. do. Then, the server 100 stores information divided into respective sentences, idioms, and words corresponding to the listening MP3 file.

여기서, 상기 구분된 정보는 사용자의 듣고 쓰기 재생을 할 때 클라이언트(200)로 제공되어 단어, 숙어 및 문장 구분을 가능하게 한다. Here, the divided information is provided to the client 200 when the user listens and writes and reproduces the words, idioms, and sentences.

단, 상기 모듈에서 생성되는 정보는 비음성 구간에 근거한 구분이므로 추후 재확인 작업이 더 필요한데, 이것은 음성 파일과 텍스트 파일간 싱크 에디팅 기능을 통해서 더욱 정교하게 다듬어 질 수 있다.However, since the information generated in the module is classified based on the non-voice interval, further reconfirmation is required, which can be refined more precisely through the sync editing function between the voice file and the text file.

즉, 음성 파일과 텍스트 파일간 싱크 에디팅 기능은 사용자가 받아쓰기 편하게 음성 파일 중에서 말을 하지 않는 부분, 적당한 시간 간격 또는 단어, 숙어, 문맥 및 문장 단위로 끊어주는 기능이다.In other words, the sync editing function between the voice file and the text file is a function that allows the user to easily dictate and break the voice file in the non-speaking parts, at appropriate time intervals, or in words, idioms, contexts, and sentences.

종래에는 문장 단위로 반복적으로 재생하는 동안 받아쓰도록 하였으나, 본 발명은 이러한 문장 단위의 단순한 반복 재생을 지양하고, 받아쓰기 좋은 시간적 위치를 상기의 문장 구분, 숙어 구분 및 단어 구분으로 미리 측정해서 그 정보를 저장하고, 이 정보를 이용해서 끊어 읽어 준다. 따라서, 서버(100)가 상기의 문장, 숙어 및 단어의 구분 단위 정보를 미리 저장하고, 클라이언트(200)가 서버(100)로 듣기용 MP3 파일을 요청한 후, 서버(100)로부터 상기 듣기용 MP3 파일 및 상기 구분 단위 정보를 수신하면, 상기 듣기용 MP3 파일 및 상기 구분 단위 정보를 이용하여 문장별, 숙어별 또는 단어별로 끊어서 재생하는 서비스를 사용자에게 제공할 수 있다.Conventionally, while the dictation is repeatedly performed in sentence units, the present invention avoids the simple repetition of such sentence units, and the information is measured in advance by the sentence division, the idiom division, and the word division. Save and cut off using this information. Therefore, the server 100 previously stores the division unit information of the sentences, idioms, and words, and after the client 200 requests the listening MP3 file from the server 100, the listening MP3 from the server 100. When the file and the division unit information are received, the user may provide a service to cut and play a sentence, an idiom or a word by using the listening MP3 file and the division unit information.

또한 지속적인 반복 재생이 아니라, 사용자 특정 입력에 의해서만 반복 재생하거나, 사용자 특정 입력에 의해서 앞뒤로 이동하면서 구간을 재생할 수 있는 기능을 추가하여 받아쓰기 편리한 환경을 제공한다.
In addition, it provides a convenient dictation environment by adding a function of replaying only by user specific input or playing back and forth by user specific input, not continuous repeat playback.

받아쓰기 다면 평가 기능을 이용하기 위한 음성파일과 해당하는 기본적인 텍스트 외에 음성화일 안에서 각 단어가 재생되는 시점에 대한 시간 정보와 문장의 의미 단위로 구분을 해 주는 정보를 제공하는 측(자료 제공자)과 이것을 이용해서 듣고 받아쓰는 측(자료 사용자) 사이의 거래를 중개해 주는 기능을 제공한다.In addition to the voice file and the corresponding basic text to use the dictation function, the side (data provider) that provides time information on the time point at which each word is played in the voice file and information that distinguishes them by the semantic unit of the sentence. It provides the ability to broker transactions between the parties who listen and dictate by using.

또한 받아쓰기 자료뿐 아니라 음성 주석 기능을 이용하기 위한 단어, 숙어, 구문 및 문장 단위의 해석 정보를 추가한, 가공된 정보를 제공하는 측과 이러한 서비스를 이용하는 자료 이용자 사이의 중개 역할을 하며, 자료 제공자와 자료 사용자의 각종 이용환경을 제공한다.
It also acts as a mediator between the provider of the processed information and the user of the data using these services, adding not only dictation material but also interpretation information in units of words, idioms, phrases and sentences to use the voice annotation function. Provides various usage environments of users and data users.

상기 받아쓰기 데이터 저장 모듈(120)은 사용자가 원하는 레벨의 듣기 자료를 찾아주는 소프트웨어 모듈로서, 듣고 받아쓰기의 음성 자료의 경우 재생 빠르기나 사용된 단어나 내용에 따라서 레벨이나 분야가 구별될 수가 있다.The dictation data storage module 120 is a software module that finds a user's desired level of listening material. In the case of audio data of listening and dictation, the level or field may be distinguished according to the speed of reproduction or the word or content used.

사용자가 제시하는 키워드나 요청사항에 의해서 듣고 받아쓰기를 원하는 음성자료를 찾아주는 검색 엔진 역할을 한다.It acts as a search engine that finds voice data that you want to hear and dictate based on a keyword or request that a user presents.

이 기능을 위해서는 서버에는 미리 관련된 정보를 분석하여 데이터 베이스화 해야 한다. 이와 같은 선행적인 데이터 베이스화와 검색엔진의 기능을 수행한다.For this function, the server needs to analyze the related information in advance and make a database. It performs the functions of such a proactive database and search engine.

종래의 받아쓰기 프로그램이나 서비스는 단문이나 몇 문장 안 되는 내용을 듣고 쓰기 위주여서 음성 파일을 앞뒤로 움직일 필요가 없었다.Conventional dictation programs or services are written and listened to for short sentences or a few sentences, so there is no need to move the voice file back and forth.

그러나 수 분 이상의 음성 파일을 받아쓰기 위해서는 단순한 반복 재생이 아니라 사용자 의도대로 현재 재생 부분을 반복재생, 앞뒤 이동 재생 기능 등이 필요하다.However, in order to dictate a voice file of several minutes or more, it is necessary to repeat playback of the current playback portion and to move forward and backward as the user intends.

또한, 들리는 내용을 받아쓰는 도중에 이러한 재생 제어를 편리하게 하기 위해서 본 발명은 녹취 기록에는 잘 사용하지 않는 자판키를 재생 제어 키로 강제로 지정함으로써 끊어 읽기 기능과 편리한 반복 재생 제어 기능을 같이 사용할 경우, 듣고 받아쓰기 수고를 획기적으로 줄일 수 있다.
In addition, in order to facilitate such playback control while dictating what is heard, the present invention forcibly assigns a keyboard key, which is not well used for recording, to use a break reading function and a convenient repeat playback control function. It can greatly reduce the trouble of listening and dictation.

재생 제어 키로 사용되는 일례로는, 쉬프트+탭키 입력 시에는, 시간적으로 한 단계(사용자 지정에 따라서 문장, 구문, 단어가 될 수 있음.) 이전의 부분을 재생하고, 탭키 입력시에는 현재 재생된 부분을 다시 반복 재생하며, 쉬프트+엔터키 입력시에는 시간적으로 한 단계 다음 부분을 재생하는 방법을 들 수 있다.As an example of being used as a playback control key, when the Shift + Tab key is input, the previous part is played back in time (it may be a sentence, a phrase, or a word, depending on a user's designation). The part is repeatedly played back, and when the shift + enter key is input, the next part in time is played.

또한, 백슬래쉬 키는 재생시 잠시 멈춤 혹은 다시 재생 기능을 수행하고, 엔터키는 커서가 다음 줄로 이동함과 동시에 시간적으로 한 단계 다음 부분을 재생하는 기능을 수행한다.In addition, the backslash key performs a pause or replay function during playback, and the enter key performs a function of replaying the next part in time as the cursor moves to the next line.

쉬프트+탭키, 탭키, 백슬래쉬키, 쉬프트+엔터키는 실제 녹취기록에는 잘 사용하지 않기 때문에, 텍스트 에디팅의 기능은 제한하고 재생 제어로만 바꾸어 사용한다. 이와 같은 구현으로 일반 사용자가 직관적으로, 자연스럽게 받아쓰기를 할 수 있도록 기능을 제공하는 것이 본 재생 제어의 목적이다.
Since Shift + Tab, Tab, Backslash, and Shift + Enter are not used for actual recording, the text editing functions are limited and used only for playback control. It is an object of the present playback control to provide a function such that an ordinary user can intuitively and naturally dictate by such an implementation.

상기 받아쓰기 다면 평가 모듈(130)은 받아쓰고 난 후 사용자 입력 정보를 클라이언트로부터 받아서 서버에 저장하고, 분석하여 듣고 쓰는 능력을 분석해주는 소프트웨어 모듈로서, 사용자의 듣고 받아쓰기 작업이 끝나면 사용자가 들으면서 받아쓸 시점에 클라이언트 단말기에서 측정 가능한 여러 가지 정보들(예를 들어, 특정 구간 재생 시점 후 받아쓴 시점까지의 시간 간격, 받아쓸 때까지의 반복 재생횟수, 받아쓴 결과 텍스트 및 일 회에 받아쓴 문장 길이 등 사용자가 듣고 받아쓰는 능력을 객관적으로 평가할 수 있고, 클라이언트 단말기에서 계측 및 기록 가능한 모든 정보)이 본 모듈로 전송되어 입력되는데, 이 정보를 이용하여 1차원 수치화한다.The dictation evaluation module 130 is a software module that receives the dictation and stores the user input information from the client and stores the data on the server, and analyzes the ability to analyze and hear the dictation. Various information that can be measured at the client terminal (for example, the time interval from the point of time to the dictation after the playback of a specific section, the number of repetitions until the dictation, the text of the dictation, and the length of the sentence dictated once) The user can objectively evaluate the ability to hear and dictate, and all information that can be measured and recorded on the client terminal) is transmitted to and inputted into this module.

단, 현재 제시한 4가지 입력 정보 외에도 다른 정보가 추가될 수 있도록 설계되었으며, 이러한 정보를 1차원 수치화하는 매핑 함수는 여러 가지 중에서 선택 가능하도록 한다.However, it is designed so that other information can be added in addition to the four input information presently presented, and a mapping function for quantifying the information in one dimension can be selected from various types.

이때, 매핑 함수는 본 IT기술외적인 요소로서 언어 교육적인 측면에서 접근 가능하도록, 응용 프로그램 인터페이스(API)를 공개하여, 매핑 함수를 개별적으로 만들어서 적용할 수 있도록 한다.At this time, the mapping function is an element other than the IT technology, and the application program interface (API) is disclosed to be accessible from the aspect of language education, so that the mapping function can be made and applied individually.

여기서 입력 정보는 재생 시점 후 받아쓴 시점까지의 시간 간격, 받아쓸 때까지의 반복 재생횟수, 받아쓴 결과 텍스트 및 일 회에 받아쓴 문장 길이로 정의한다.(혹은, 사용자가 듣고 받아쓰는 능력을 객관적으로 평가할 수 있고, 클라이언트 단말기에서 계측 및 기록 가능한 추가적인 모든 정보를 포함한다.) The input information is defined as the time interval from the time of playback to the time of dictation, the number of repetitions of playback until the time of dictation, the dictation result text, and the length of sentence dictation at one time. Includes all additional information that can be objectively assessed and measured and recorded on the client terminal.)

기존의 받아쓰기 프로그램이나 웹 서비스에서는 결과 텍스트의 단순한 비교를 통해서 정오만을 판단한다.Conventional dictation programs or web services only judge noon by simply comparing the resulting text.

그러나, 본 발명은 듣고 받아쓰는 중에 발생하는 모든 입력 정보를 이용하여 종합적으로 판단하도록 한다.However, the present invention allows comprehensive determination using all the input information generated during listening and dictation.

예를 들어, 입력 텍스트와 답안이 맞았다고 하더라도, 반복 청취 회수에 따라서 듣고 받아쓰는 능력이 다르게 평가될 수 있고, 한 번에 듣고 받아썼다고 하더라도 그 받아쓴 문장길이에 따라서 다르게 평가할 수 있기 때문이다.For example, even if the input text and the answer are correct, the ability to listen and dictate may be evaluated differently according to the number of repeated listening, and even if the listening and dictation is performed at one time, the sentence length may be evaluated differently.

한편, 상기 다면 평가용 원시 데이터 수집 후 발생하는 4가지의 서로 다른 기준의 정보를 1차원 수치화하는 매핑 알고리즘을 개발하고 적용할 수 있는 기능을 제공한다.On the other hand, it provides a function that can develop and apply a mapping algorithm for dimensionalizing the information of the four different criteria that occurs after the collection of the raw data for the multi-faceted evaluation.

이 기능은 수학적으로 말하면, 4차원의 배열을 한 실수(1차원)로 나타내는 매핑 함수로 표현될 수 있다.Mathematically, this function can be expressed as a mapping function that represents a 4-dimensional array as a real number (one-dimensional).

이러한 함수는 여러 개 존재할 수 있는데, 이는 언어 교육학적으로 분석한 후 여러 방법으로 적용 가능하기 때문에 종류가 많을 것이다.There can be several such functions, which will be numerous because they can be applied in many ways after being analyzed pedagogically.

일반적으로 특정 구간 재생 시점 후 받아쓴 시점까지의 시간 간격, 반복 청취 재생 횟수 및 일 회에 받아쓴 문장길이에 대한 가중치를 다르게 주어서 텍스트 결과가 같더라도 단시간 내에 한 번에 긴 문장을 받아쓴 경우에 더 높은 점수가 되는 함수가 상식적이나, 이러한 함수는 그 가중치의 종류에 따라서 여러 가지가 될 수 있다.In general, if a long sentence is written at a time within a short time even if the text results are the same by giving different weights for the time interval from the point of time when the specific section is played to the point of dictation, the number of repeated listening and the length of the dictated sentence. The higher scores are common sense, but these functions can vary depending on the type of weight.

이러한 경우 언어 교육적 측면을 고려한 다른 평가 방법을 개발할 수 있게 하고, 사용자는 이 평가 방법 자체를 상호 보완적 혹은 경쟁적으로 선택할 수 있게 한다.
In this case, it is possible to develop other evaluation methods that take into account language education aspects, and the user may choose to complement or compete with the evaluation method itself.

상기 데이터 복구 모듈(140)은 일정 시간 간격이나 일정량의 입력 후 임시 화일로 저장하여, 위급 종료시 복구시켜주는 소프트웨어 모듈로서, 특정 시간 간격 또는 특정 횟수의 키 입력 발생 후에 현재 작업하고 있던 내용이 서버의 저장부에 자동으로 저장되어 추후 복구 가능한 자료로 활용된다.
The data recovery module 140 is a software module that stores a temporary file after a certain time interval or a certain amount of input and restores it in an emergency. The current data after the key input of a specific time interval or a specific number of times is generated by the server. It is automatically stored in the storage area and used as data that can be recovered later.

상기 클라이언트(200)는 재생제어부(210), 다면 평가용 사용자 원시 데이터 수집부(220), 받아쓰기 데이터 업로드부(230) 및 싱크 및 주석 에디팅부(240)를 포함한다.The client 200 includes a playback controller 210, a user raw data collector 220 for multifaceted evaluation, a dictation data uploader 230, and a sink and annotation editing unit 240.

상기 재생제어부(210)는 재생 제어 및 자판 입력을 위한 자바스크립트 코드로서, 듣고 받아쓰기에 최적화된 자판 사용법과, 이러한 사용법을 통해서 구간의 듣고 받아쓰기를 하면서 발생하는 여러 사용자 입력정보를 저장한다.The playback control unit 210 is a JavaScript code for playback control and keyboard input. The playback controller 210 stores keyboard usage optimized for listening and dictation, and various user input information generated while listening and dictating sections through such usage.

상기 재생제어부(210)는 이와 같은 사용자 입력 정보의 계속적인 저장을 위해서 다차원 배열이 구성되고 사용자 입력정보가 저장된다.
The reproduction control unit 210 is configured to a multi-dimensional array for the continuous storage of the user input information and the user input information is stored.

상기 다면 평가용 사용자 원시 데이터 수집부(220)는 듣고 쓰기 입력 중, 사용자 입력 정보를 수시로 서버 측에 저장하고, 입력 완료 후 최종적으로 그 정보를 서버로 전송하는 자바스크립트 코드로서, 사용자 입력 정보는 다차원 배열 형태로 일단 클라이언트 브라우저 영역 내에 저장되는데, 위급상시 복구를 위해서 정해진 시간이나 이벤트 횟수에 따라서 서버 측으로 전송하여 임시저장 한다.The multi-faceted evaluation user raw data collection unit 220 is a JavaScript code for storing the user input information from time to time during listening and writing input, and finally transmitting the information to the server after the input is completed. It is stored in the client browser area in the form of a multi-dimensional array, which is sent to the server for temporary recovery and temporarily stored for emergency recovery.

이때, 사용자가 최종적으로 작업 완료 승인을 선택하면, 임시 저장된 내용은 삭제되고 최종본만 남는다.
At this time, when the user finally selects the work completion approval, the temporarily stored contents are deleted and only the final version remains.

상기 받아쓰기 데이터 업로드부(230)는 듣고 쓰기용 음성화일 및 텍스트 업로드 자바스크립트 코드로서, 사용자 임의의 파일을 등록하여 사용할 수 있게 하는 부분이다.The dictation data uploading unit 230 is a voice file and text upload JavaScript code for listening and writing. The dictation data uploading unit 230 may register and use a user arbitrary file.

즉, 음성 내용을 담고 있는 MP3파일과 그 음성 파일의 텍스트 내용을 한꺼번에 서버 측으로 업로드 하는 기능이 구현된다. 여기서, 텍스트가 없고 음성 파일만 있을 경우는 음성 파일만 서버로 전송 및 저장하여 추후 텍스트를 추가하거나, 본 서비스를 이용해서 받아쓸 수 있도록 한다.
In other words, the MP3 file containing the voice content and the text content of the voice file are uploaded to the server side at once. In this case, when there is no text and only a voice file, only the voice file is transmitted and stored to the server so that the text can be added later or dictated using this service.

상기 싱크 및 주석 에디팅부(240)는 음성 파일과 텍스트 파일 간 싱크 에디팅 및 주석 추가를 위한 자바스크립트 코드로서, 음성 파일과 텍스트 파일만으로는 서로 싱크가 안 맞은 상태이다.The sink and annotation editing unit 240 is a JavaScript code for sync editing and annotation between the voice file and the text file, and is synchronized with only the voice file and the text file.

즉, 싱크 에디팅 작업을 통해서, 특별한 포맷 형태로 정보를 가공하여 저장한다. 싱크 에디팅 기능 외에도 단어, 숙어(문맥) 및 문장별 해석과 같은 주석을 추가할 수 있는 텍스트 편집 기능이 포함된 자바 스크립트 코드로 구현된다.In other words, through sink editing, information is processed and stored in a special format. In addition to the sink editing feature, it is implemented in JavaScript code that includes text editing to add comments such as words, idioms, and sentence-by-phrase interpretation.

싱크 에디팅과 주석 추가가 끝난 정보는 서버로 전송되어 저장한다. 그리고, 서버에는 해당 MP3파일과 쌍으로 저장된다.
Sink editing and annotated information are sent to the server for storage. The server is stored in pairs with the corresponding MP3 file.

한편, 상기 서버(100)는 녹취록 공동 작업을 위해 작업자 간 자동 조율을 위한 공동 녹취 데이터 분할 모듈(150)과 공동 작업 녹취 결과를 통합시키는 녹취 결과 통합 모듈(160)을 더 포함할 수 있다.On the other hand, the server 100 may further include a recording result integration module 160 for integrating the joint recording data splitting module 150 and the collaboration work recording results for automatic coordination between the workers for the recording collaboration work.

상기 공동 녹취 데이터 분할 모듈(150)은 녹취록 공동 작업을 위한 작업자 간 자동 조율 소프트웨어 모듈로서, 녹취되어야 할 파일을 미리 정의된 방식에 의해서 분할하여 1인 이상의 녹취 작업자가 온라인 또는 오프라인으로 작업할 수 있게 한다.The joint recording data dividing module 150 is an automatic coordinating software module for recording a collaborative work, and divides a file to be recorded by a predefined method so that one or more recording workers can work online or offline. do.

이때, 작업 중에 각 분할 작업자의 할당 분이 동적으로 재조정할 수 있는 기능이 포함된다. 분할 작업을 통한 작업 시간 단축뿐만 아니라 중복 작업을 통해서 오류를 낮추는 기능이 포함된다.At this time, a function of dynamically rescheduling the allocation of each split worker is included. In addition to reducing the work time through the splitting operation, the function of lowering the error through the redundant operation is included.

본 발명에서 녹취 목적으로 이용할 때, 여러 사람이 나누어서 공동 작업할 수 있는 온라인 환경, 즉 중복 녹취 기능과 중첩되게 혹은 독립적으로 사용할 수 있는 기능으로서, 일반적으로 녹취 작업은 실제 음성파일의 시간을 기준으로 할 때 최소 약 2 내지 3배의 시간이 소요되기 때문에, 여러 사람이 분할 작업함으로써 작업 시간을 단축할 수 있다. 이때, 이러한 녹취 공동 작업은 온라인에서 구축된다.When used for the purpose of recording in the present invention, as an online environment that can be shared by several people, that is, a function that can be used overlapping or independently of the duplicate recording function, recording is generally based on the time of the actual voice file Since it takes at least about two to three times as much time, it is possible to shorten the working time by dividing the work by several people. This recording collaboration is then built online.

공동 녹취 기능을 이용하여 녹취를 할 때, 녹취를 원하는 측과 녹취를 하는 사람 사이의 거래를 중개해 주는 기능, 즉 일반적인 녹취 작업 수요자(B측: 음성 파일을 문자화하기 원하는 측)와 녹취 작업 공급자(A측: 음성 파일을 듣고 받아쓰는 1인 이상의 녹취 작업자 그룹) 사이에서 필요한 여러 가지 기능을 수행한다.When recording using the co-recording function, it is a function to broker a transaction between the person who wants to record and the person who is recording. (A side: A group of one or more recording workers who listen to and dictate voice files).

일례로 B측은 음성파일 업로드 하고, 녹취 작업 완료 시간 또는 지급할 의사가 있는 비용 등을 제시하여 게시하면, A측은 입찰이나 선착순 등의 선택 과정을 통해서 작업을 할당받고, 웹상에서 제공하는 온라인 또는 오프라인 녹취 작업 프로그램을 제공받고 단독 혹은 공동 작업을 수행하여 완료한다.For example, if side B uploads a voice file, posts a recording work completion time, or is willing to pay, the side A is assigned a task through a selection process such as bidding or first-come-first-served basis, and is provided online or offline. A recording work program is provided and completed either alone or in collaboration.

녹취 작업 완료 후 B측은 중복 녹취 결과 비교 기능과 같은 검수 과정을 통해서 확인을 하고 비용 지급을 완료한다.After completion of the recording work, B side checks through the inspection process such as the comparison function of duplicate recording results and completes payment.

이때, 웹 서비스는 각 단계에서 발생하는 작업에 필요한 온라인 및 오프라인 환경을 제공하며 거래를 중개한다.
At this time, the web service brokers transactions by providing on-line and off-line environments necessary for work occurring at each stage.

그리고, 상기 녹취 결과 통합 모듈(160)은 공동 작업 녹취 결과를 통합시키는 소프트웨어 모듈로서, 분할되어 작업한 녹취 결과나 중복 작업을 통한 녹취 결과를 합치거나 선택할 수 있는 기능이 구현된 모듈이다.In addition, the recording result integrating module 160 is a software module for integrating the collaborative recording result, and is a module in which a function of combining or selecting the recording result of the divided work or the recording result through the duplicate work is implemented.

각 작업자가 온라인 혹은 오프라인으로 작업한 결과 데이터를 서버로 업로드 하면 서버에서는 작업자의 녹취 타임스탬프정보를 이용해서 겹치지 않게 배열을 해서 원래의 MP3파일의 순서대로 맞춘다.When each worker uploads the data to the server as a result of working online or offline, the server arranges them so that they do not overlap by using the worker's recording timestamp information, so that the original MP3 files are aligned.

중복 작업 부분이 있는 경우는 비교 기능을 통해서 똑같은 경우와 다를 경우로 나누어 다른 경우, 사용자(녹취 결과 검사자)가 선택할 수 있게 한다.
If there is a duplicate work part, the comparison function can be divided into the same case and the other case, and the user (recording result inspector) can select the case.

한편, 상기 클라이언트(200)는 녹취 요청 게시부(250), 녹취 결과 검증부(260) 및 음성 주석 재생부(270)를 더 포함할 수 있다.Meanwhile, the client 200 may further include a recording request posting unit 250, a recording result verification unit 260, and a voice annotation playback unit 270.

상기 녹취 요청 게시부(250)는 녹취 요청 및 지급 비용 게시와 녹취록 작성자가 선택할 수 있는 게시판 코드로서, 녹취를 요청하는 측에서는 준비된 MP3파일을 업로드해야 하는데, 이러한 기능이 상기 모듈에서 구현된다.The recording request posting unit 250 is a bulletin board code that can be selected by the recording request posting and payment costs and the recording author, the recording request side should upload the prepared MP3 file, this function is implemented in the module.

MP3파일 업로드와 더불어 지급할 의사가 있는 최대 비용에 대한 정보 등의 요구사항들을 나열하여 녹취 작업자가 열람할 수 있게 한다.In addition to uploading MP3 files, the list of requirements, such as information about the maximum cost you are willing to pay, will be made available to the recording worker for viewing.

여기서, 지급할 비용은 본 서버 관리자에게 예치되는 방식으로 구현하며, 관련 작업이 본 모듈을 통해서 구현된다. 녹취 작업자들은 본 모듈을 통해서 작업을 확인받는 과정을 통해서 승인을 받은 후 작업을 시작한다.Here, the expenses to be paid are implemented in a manner that is deposited to the server administrator, and related work is implemented through this module. Recording workers begin work after receiving approval through the process of confirming work through this module.

이때, 녹취 작업 환경은 본 서비스에서 온라인 또는 오프라인 소프트웨어로 제공되며, 작업 결과 데이터는 서버로 전송되어 합쳐진다.
At this time, the recording work environment is provided by on-line or off-line software in this service, and the work result data is transmitted to the server and merged.

상기 녹취 결과 검증부(260)는 녹취 결과를 검증하는 환경을 제공하는 자바스크립트 코드로서, 녹취 작업이 완료되면, 상기 모듈을 통해서 녹취 작업 요청자가 녹취 결과를 샘플링 혹은 전체로서 확인해 볼 수 있는 환경을 제공한다.The recording result verification unit 260 is a JavaScript code that provides an environment for verifying the recording result. When the recording operation is completed, an environment in which the recording operation requester can check the recording result as a sampling or the whole through the module is described. to provide.

녹취 요청자가 만족하여 작업 완료 확인 과정을 통해서 녹취 요청자와 작업자 간의 거래가 종료된다.The recording requester is satisfied and the transaction between the recording requester and the worker is terminated through the work completion confirmation process.

거래 종료 후 요청자가 제시한 비용 및 결과 정보는 작업자에게 전달된다.After the transaction ends, the cost and result information presented by the requester is sent to the worker.

또한, 여러 사람이 중복하여 녹취한 경우, 해당 음성 부분과 녹취 결과를 비교 혹은 선택할 수 있도록 화면에 배열해 주는 기능도 포함한다.It also includes a function that arranges on the screen to compare or select the voice part and the recording result when multiple people record repeatedly.

상기 코드를 통해서 같은 음성 부분을 서로 다른 녹취자가 중복하여 결과를 저장함으로서 녹취의 품질을 높일 수 있도록 한다.Through the code, different recorders duplicate the same voice part to store the result, thereby improving the recording quality.

즉, 텍스트가 없는 음성 파일의 경우 적어도 한 명 이상의 듣고 받아쓴 결과 텍스트를 서로 비교하거나 텍스트와 원본 음성 내용을 다시 확인함으로써, 오류를 판단할 수 있는 환경을 제공한다.That is, in the case of a text file without text, at least one or more people hear and dictate the result text, or check the text and the original voice content again, thereby providing an environment for determining an error.

그리고, 음성파일의 해당 텍스트가 없을 경우, 여러 사람이 듣고 받아쓴 결과를 비교하는 기능으로서, 듣고 받아쓰는 중에 음성파일의 시간 정보가 텍스트에 함께 기록되어 이 시간 정보를 이용해서 받아쓴 결과들을 비교하면 음성파일의 같은 위치에서 사람들의 받아쓴 결과를 쉽게 비교할 수 있다.
And, if there is no corresponding text in the voice file, it is a function to compare the result of listening and dictation by several people, and the time information of the voice file is recorded together in the text while listening and writing. This makes it easy to compare people's dictation results at the same location in the voice file.

상기 음성 주석 재생부(270)는 듣는 중에 헬프 키를 누르면, 그 시점에 관련된 설명이 나오는 자바 스크립트 코드로서, 녹취나 받아쓰기 연습이 아닌 순수하게 듣고 이해하기만을 목적으로 하는 경우, 알아듣지 못한 부분에서 특정 입력(브라우저에서는 마우스 클릭이나 자판 입력, 스마트 폰 등에서는 특정 터치)을 통해서 해당 부분의 설명을 들을 수 있는 기능이 구현되는 부분이다.The voice annotation playback unit 270 is a JavaScript code that appears when the help key is pressed during listening, and the description is related to the point in time. This is the part where the function to listen to the explanation of the corresponding part is implemented through the specific input (mouse click or keyboard input in the browser, specific touch in the smart phone, etc.).

예를 들어 영어 듣기의 경우, 특정 입력 후 레벨에 따라서 단어, 숙어(문맥) 및 문장의 순서로 설명을 들을 수 있게 한다.For example, in the case of English listening, explanations can be given in the order of words, idioms, and sentences according to the level after a particular input.

설명 도중에는 영어 재생이 정지되며, 설명 내용은 제공자가 입력한 단어, 숙어(문맥) 및 문장에 따른 주석 내용이 별도로 저장되어 있는 주석용 MP3파일에서 재생되도록 한다.During the description, English playback is stopped, and the description content is played back in the MP3 file for annotation, in which the contents of the words, idioms (contexts), and sentences entered by the provider are stored separately.

즉, 다시 말해 영어와 같은 외국어를 듣고 쓰는 중 또는 듣기만 하는 중 "헬프" 입력을 통해서 단어, 구문 또는 문장 단위 등으로 구분하여 해석해 주는 기능이다.In other words, while listening to and writing a foreign language such as English, or only listening, the function may be interpreted by dividing it into words, phrases, or sentence units through a "help" input.

외국어로 된 강의 내용을 듣다가 해석되지 않는 부분에서 해석에 도움을 주는 기능으로, 단어, 숙어, 구문 및 문장 등으로 미리 정보를 입력해 놓은 자료를 이용해서 사용자가 "헬프" 키와 같은 입력을 하면, 해당 정보를 보여주거나 말해주는 기능이다.This function helps you to interpret the lecture in a foreign language and interpret it in the uninterpreted part. You can use the data that has been pre-populated with words, idioms, phrases and sentences. If you do, it is a function that shows or speaks the information.

일반적으로 강의 자료는 1차원적이고 수동적이다.In general, lecture materials are one-dimensional and passive.

1차원적이란 시간의 흐름에 따라서만 이동할 수 있다는 것이고, 수동적이라 청취자는 계속 들어야 한다.One-dimensional means that you can only move over time, and it's passive, so the listener needs to keep listening.

본 기능에서는 이러한 수동적, 1차원성을 벗어나기 위한 편리한 환경을 제공한다.This function provides a convenient environment to escape this passive, one-dimensionality.

예컨대, 외국어 강의 음성 파일인 경우, 모르는 단어나 문맥, 문장이 나올 때, 별도의 사전이나 참고 자료를 사용했었다.For example, in the case of a foreign language lecture voice file, a separate dictionary or reference material was used when an unknown word, context, or sentence appeared.

그러나, 본 발명은 이러한 불편한 점을 개선하여, 해당 시간 위치에서 "헬프" 입력을 통해서 그 시간의 도움말을 여러 단계(예를 들어 단어 수준, 문맥 수준 및 문장수준)별로 제공받을 수 있도록 한다.However, the present invention ameliorates this inconvenience, allowing the help of the time to be provided at various stages (eg, word level, context level and sentence level) through a "help" input at that time location.

음성 주석 기능을 위해서 음성 주석 재생기(프로그램 형태 혹은 웹 서비스)를 제공된다.A voice annotation player (program type or web service) is provided for the voice annotation function.

또한, 편리하게 음성 주석 자막을 편집하기 위해서 온라인 혹은 오프라인 음성 주석 편집 프로그램을 제공한다.
In addition, an online or offline voice annotation editing program is provided to conveniently edit voice annotation subtitles.

이상에서는 본 발명을 바람직한 실시예에 의거하여 설명하였으나, 본 발명의 기술적 사상은 이에 한정되지 아니하고 청구항에 기재된 범위 내에서 변형이나 변경 실시가 가능함은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명백한 것이며, 그러한 변형이나 변경은 첨부된 특허청구범위에 속한다 할 것이다.While the present invention has been described in connection with what is presently considered to be practical exemplary embodiments, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, And such variations and modifications are intended to fall within the scope of the appended claims.

100: 서버 110: 끊어 읽기 모듈
120: 받아쓰기 데이터 저장 모듈 130: 받아쓰기 다면 평가 모듈
140: 데이터 복구 모듈 150: 공동 녹취 데이터 분할 모듈
160: 녹취 결과 통합 모듈 200: 클라이언트
210: 재생제어부 220: 다면 평가용 사용자 원시 데이터 수집부
230: 받아쓰기 데이터 업로드부 240: 싱크 및 주석 에디터부
250: 녹취 요청 게시부 260: 녹취 결과 검증부
270: 음성 주석 재생부
100: Server 110: Disconnected Read Module
120: dictation data storage module 130: dictation multi-faceted evaluation module
140: data recovery module 150: joint recording data partitioning module
160: recording results integration module 200: client
210: playback control unit 220: multi-sided user raw data collection unit
230: dictation data upload unit 240: sink and annotation editor unit
250: recording request posting unit 260: recording result verification unit
270: voice annotation playback unit

Claims (7)

사용자가 받아쓰기를 원하는 레벨의 음성 파일을 검색하되, 사용자가 제시하는 키워드나 요청사항에 매칭되는 상기 음성 파일을 검색하는 받아쓰기 데이터 검색 모듈과,
상기 음성 파일에 대해 비음성 구간의 시간 길이의 값을 분석하여 상기 시간 길이에 따른 확률 분포도를 구하고, 구해진 확률에 따라 각각 문장, 숙어 및 단어로 구분하여 데이터를 저장하고, 사용자의 받아쓰기 재생시 상기 음성 파일과 저장된 상기 데이터를 제공하는 끊어 읽기 모듈과,
하기 클라이언트로부터 상기 음성 파일별로 사용자의 받아쓰기 데이터를 수신하여 저장하고, 저장된 상기 받아쓰기 데이터 중에서 받아쓴 텍스트의 항목을 기본으로 포함하고, 재생 시점 후 받아쓴 시점까지의 시간 간격의 항목, 받아쓸 때까지의 반복 재생 회수의 항목 및 일 회에 받아쓴 문장 길이의 항목 중에서 적어도 하나의 항목이 더 포함된 다면 평가 항목별로 평가하여 사용자의 받아쓰기 능력을 분석하는 받아쓰기 다면 평가 모듈 및
상기 받아쓰기 데이터를 일정 시간 간격 또는 일정량의 입력 후 임시 데이터로 저장하여, 위급 종료시 복구를 가능하게 하는 데이터 복구 모듈을 포함하는 서버; 및
사용자의 요청에 따라, 상기 끊어 일기 모듈로부터 제공받은 음성 파일을 요청된 문장, 숙어 또는 단어별로 끊어서 재생하고, 상기 음성 파일의 특정 구간을 반복해서 재생하거나 또는 앞뒤의 구간으로 이동하여 재생하는 재생제어부와,
재생된 상기 음성 파일에 대응하여 사용자에 의해 입력된 받아쓰기 텍스트를 상기 다면 평가 항목별로 수집하여 상기 받아쓰기 데이터로서 상기 서버로 전송하는 다면 평가용 사용자 원시 데이터 수집부와,
받아쓰기용 상기 음성 파일 및 텍스트를 업로드 하는 받아쓰기 데이터 업로드부를 포함하는 클라이언트;를 포함하는 것을 특징으로 하는 온라인상에서의 듣고 받아쓰기 시스템.
A dictation data search module for searching for a voice file of a level desired by the user and searching for the voice file matching a keyword or a request presented by the user;
Analyze the value of the time length of the non-voice interval for the speech file to obtain a probability distribution map according to the time length, and store the data by dividing it into sentences, idioms, and words, respectively, according to the obtained probability, and reproducing the dictation of the user. A disconnect reading module for providing a voice file and said stored data;
Receive and store dictation data of the user for each voice file from the client below, and include items of dictated text in the stored dictation data by default, and items of a time interval from the time of reproduction until the dictation time until dictation Dictate evaluation module for analyzing the dictation ability of the user by evaluating by each evaluation item if at least one item of the repetition number of times of repetition and sentence length dictated at one time is further included and
A server comprising a data recovery module for storing the dictation data as a temporary data after a predetermined time interval or a predetermined amount of input and enabling recovery at an emergency end; And
At the request of the user, the playback control unit for playing the speech file provided by the cut-out diary module by cutting the requested sentence, idiom or word, and repeatedly playing a specific section of the speech file or moving back and forth to the section. Wow,
A multi-faceted user raw data collection unit for collecting the dictation text input by the user corresponding to the reproduced voice file for each multi-faceted evaluation item and transmitting the dictation text to the server as the dictation data;
And a client including a dictation data upload unit for uploading the voice file and text for dictation.
삭제delete 제 1항에 있어서, 상기 서버는,
녹취록 공동 작업을 위해 작업자 간 자동 조율을 위한 공동 녹취 데이터 분할 모듈 및
공동 작업 녹취 결과를 통합시키는 녹취 결과 통합 모듈을 더 포함하는 것을 특징으로 하는 온라인상에서의 듣고 받아쓰기 시스템.
The method of claim 1, wherein the server,
Joint recording data splitting module for automatic coordination between workers for transcript collaboration
And further comprising a recording result integration module for integrating the collaboration recording results.
제 1항에 있어서, 상기 클라이언트는,
녹취 요청 및 지불 비용 게시와 녹취록 작성자가 선택하는 녹취 요청 게시부를 더 포함하는 것을 특징으로 하는 온라인상에서의 듣고 받아쓰기 시스템.
The method of claim 1, wherein the client,
A dictation system for online listening and dictation, further comprising a recording request posting section selected by the recording author and the recording request and payment cost.
제 1항에 있어서, 상기 클라이언트는,
녹취 결과를 검증하는 환경을 제공하는 녹취 결과 검증부를 더 포함하는 것을 특징으로 하는 온라인상에서의 듣고 받아쓰기 시스템.
The method of claim 1, wherein the client,
Listening dictation system online, characterized in that it further comprises a recording result verification unit for providing an environment for verifying the recording result.
제 1항에 있어서, 상기 클라이언트는,
듣는 중에 소정의 키를 누르면, 그 시점에 관련된 설명이 제공되는 음성 주석 재생부를 더 포함하는 것을 특징으로 하는 온라인상에서의 듣고 받아쓰기 시스템.
The method of claim 1, wherein the client,
And a voice annotation reproducing unit which provides a description related to the point in time when a predetermined key is pressed while listening.
제 1항에 있어서, 상기 클라이언트는,
상기 음성 파일 및 텍스트의 데이터 간 싱크 에디팅 및 주석 추가를 위한 싱크 및 주석 에디터부를 더 포함하는 것을 특징으로 하는 온라인상에서의 듣고 받아쓰기 시스템.
The method of claim 1, wherein the client,
And a sync and annotation editor for sync editing and annotating the data of the voice file and the text.
KR1020110077239A 2011-08-03 2011-08-03 Listen and write system on network KR101336716B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110077239A KR101336716B1 (en) 2011-08-03 2011-08-03 Listen and write system on network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110077239A KR101336716B1 (en) 2011-08-03 2011-08-03 Listen and write system on network

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR20130089761A Division KR101508718B1 (en) 2013-07-29 2013-07-29 Listen and write system on network

Publications (2)

Publication Number Publication Date
KR20130015317A KR20130015317A (en) 2013-02-14
KR101336716B1 true KR101336716B1 (en) 2013-12-03

Family

ID=47895154

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110077239A KR101336716B1 (en) 2011-08-03 2011-08-03 Listen and write system on network

Country Status (1)

Country Link
KR (1) KR101336716B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230112979A (en) 2022-01-21 2023-07-28 엔에이치엔클라우드 주식회사 Apparatus and method for providing writing training service based on user's handwriting recognition

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111081081B (en) * 2019-07-02 2021-12-21 广东小天才科技有限公司 Dictation and reading method and electronic equipment

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040018810A (en) * 2002-08-27 2004-03-04 (주)메이븐 Translation mediating service method to process a lot of translation
KR20090068590A (en) * 2007-12-24 2009-06-29 김영한 Dictation game system
KR20090075052A (en) * 2008-01-03 2009-07-08 황인도 Network english study system using multimedia file
KR20100071426A (en) * 2008-12-19 2010-06-29 주식회사 케이티 Dictation learning method and apparatus for foreign language listening training

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040018810A (en) * 2002-08-27 2004-03-04 (주)메이븐 Translation mediating service method to process a lot of translation
KR20090068590A (en) * 2007-12-24 2009-06-29 김영한 Dictation game system
KR20090075052A (en) * 2008-01-03 2009-07-08 황인도 Network english study system using multimedia file
KR20100071426A (en) * 2008-12-19 2010-06-29 주식회사 케이티 Dictation learning method and apparatus for foreign language listening training

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230112979A (en) 2022-01-21 2023-07-28 엔에이치엔클라우드 주식회사 Apparatus and method for providing writing training service based on user's handwriting recognition

Also Published As

Publication number Publication date
KR20130015317A (en) 2013-02-14

Similar Documents

Publication Publication Date Title
US11070553B2 (en) Apparatus and method for context-based storage and retrieval of multimedia content
Pavel et al. Video digests: a browsable, skimmable format for informational lecture videos.
Waibel et al. Advances in automatic meeting record creation and access
US8407049B2 (en) Systems and methods for conversation enhancement
Dempster et al. The economic crisis though the eyes of Transana
US20130007043A1 (en) Voice description of time-based media for indexing and searching
Spina et al. Extracting audio summaries to support effective spoken document search
US20130311181A1 (en) Systems and methods for identifying concepts and keywords from spoken words in text, audio, and video content
Schultz et al. The ISL meeting room system
Shin et al. Dynamic authoring of audio with linked scripts
Thompson Building a specialised audiovisual corpus
Boyd ‘I Just Want to Click on it to Listen': Oral history archives, orality and usability
Goldman et al. Accessing the spoken word
KR101336716B1 (en) Listen and write system on network
Kretzschmar Jr et al. Collaboration on corpora for regional and social analysis
Smith et al. Integrating technology to improve the efficiency of qualitative data analysis—A note on methods
KR101508718B1 (en) Listen and write system on network
Baume et al. A contextual study of semantic speech editing in radio production
Cassidy et al. Case study: the AusTalk corpus
Marsden et al. Tools for searching, annotation and analysis of speech, music, film and video—a survey
US11074939B1 (en) Disambiguation of audio content using visual context
Ward et al. Data collection for the Similar Segments in Social Speech task
Baume et al. Use of audio editors in radio production
Baume Semantic Audio Tools for Radio Production
Kendall Data preservation and access

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161109

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171127

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181229

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190916

Year of fee payment: 7