KR20130015317A - 온라인상에서의 듣고 받아쓰기 시스템 - Google Patents

온라인상에서의 듣고 받아쓰기 시스템 Download PDF

Info

Publication number
KR20130015317A
KR20130015317A KR1020110077239A KR20110077239A KR20130015317A KR 20130015317 A KR20130015317 A KR 20130015317A KR 1020110077239 A KR1020110077239 A KR 1020110077239A KR 20110077239 A KR20110077239 A KR 20110077239A KR 20130015317 A KR20130015317 A KR 20130015317A
Authority
KR
South Korea
Prior art keywords
data
dictation
recording
module
listening
Prior art date
Application number
KR1020110077239A
Other languages
English (en)
Other versions
KR101336716B1 (ko
Inventor
김준환
Original Assignee
김준환
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김준환 filed Critical 김준환
Priority to KR1020110077239A priority Critical patent/KR101336716B1/ko
Publication of KR20130015317A publication Critical patent/KR20130015317A/ko
Application granted granted Critical
Publication of KR101336716B1 publication Critical patent/KR101336716B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B7/00Electrically-operated teaching apparatus or devices working with questions and answers
    • G09B7/02Electrically-operated teaching apparatus or devices working with questions and answers of the type wherein the student is expected to construct an answer to the question which is presented or wherein the machine gives an answer to the question presented by a student

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

본 발명은 온라인상에서의 듣고 받아쓰기 시스템에 관한 것으로서, 더욱 상세하게는 비음성 구간의 시간 길이의 값이 도출될 때, 그 시간 길이에 따른 확률 분포도를 구하고, 그 확률에 따라 각각 문장, 숙어 및 단어를 구분하여 데이터를 저장하되, 상기 데이터가 사용자의 듣고 쓰기 재생시 제공되어 단어, 숙어 및 문장의 구분을 가능하게 하는 끊어 읽기 모듈과, 사용자가 원하는 레벨의 듣기 데이터를 검색하되, 사용자가 제시하는 키워드나 요청사항에 의해서 듣고 받아쓰기를 원하는 음성자료가 검색되는 받아쓰기 데이터 검색 모듈과, 받아쓰고 난 후 사용자 입력 데이터를 하기 클라이언트로부터 수신하여 저장 및 분석하여 듣고 쓰는 능력을 분석해주는 것을 가능하게 하는 받아쓰기 다면 평가 모듈 및 일정 시간 간격 또는 일정량의 입력 후 임시 데이터로 저장하여, 위급 종료시 복구를 가능하게 하는 데이터 복구 모듈을 구비한 서버 및 자판 입력 중에 특정 구간을 반복해서 재생하거나 앞뒤의 구간으로 쉽게 이동하여 재생하게 하는 재생제어부와, 듣고 쓰기 입력 중 다면 평가를 위한 사용자 입력 데이터를 수집하여 수시로 상기 서버에 저장하고, 입력 완료 후 최종적으로 그 데이터를 서버로 전송하는 다면 평가용 사용자 원시 데이터 수집부와, 듣고 쓰기용 음성데이터 및 텍스트를 업로드 하는 받아쓰기 데이터 업로드부 및 음성 데이터과 텍스트 데이터 간 싱크 에디팅 및 주석 추가를 위한 싱크 및 주석 에디터부를 구비한 클라이언트를 포함하는 온라인상에서의 듣고 받아쓰기 시스템에 관한 것이다.
본 발명에 따르면, 첫째, 듣고 받아쓰기 능력을 다면적으로 정량화하는 효과가 있다.
둘째, 다면 평가용 원시 데이터를 분석하면 사람이 입력했는지 비인간적인 어떤 프로그램이 입력했는지를 확인할 확률을 높일 수 있어 온라인 평가에서 피 평가자가 사람인지 아닌지 인증하는 효과가 있다.
셋째, 반복 재생 제어 기능과 자동 끊어 읽기 기능을 이용하면, 자판 사용에 문제가 없는 사용자인 일반인의 경우도 녹취 작업 시간이 피 녹취 파일 시간 길이의 4배 이하로 줄어드는 효과가 있다.
넷째, 싱크 에디팅 기능을 이용해서 음성 파일의 특정 위치에 여러 단계의 설명이나 번역을 추가할 수 있어 강의 보조 자료나 번역 교육의 도구로 사용하는 장점이 있다.
다섯째, 녹취 작업을 공동으로 할 수 있으며, 받아쓰기 자료 제공 및 가공자, 받아쓰기 자료 사용자, 서버 운영자로 이루어지는 새로운 시장을 창출할 수 있다.
여섯째, 녹취 작업 요청자, 녹취 작업 수행자 및 녹취 서버 운영자로 이루어지는 새로운 시장 창출할 수 있고, 음성 강의 자료 주석 작업자, 음성 강의 주석 자료 사용자, 음성 강의 주석 파일 서버 관리자로 이루어지는 새로운 시장 창출할 수 있으며, 오디오북 또는 시청각 강의에 대한 새로운 시장 창출되는 이점이 있다.

Description

온라인상에서의 듣고 받아쓰기 시스템{Listen and write system on network}
본 발명은 온라인상에서의 듣고 받아쓰기 시스템에 관한 것이다.
일반적으로 종래에는 개인용 컴퓨터로 듣고 받아쓰기를 위해서 소정의 듣고 받아쓰기 소프트웨어를 사용하였다.
그리고, 영화 화면과 자막의 싱크를 맞춰주는 싱크 에디터 소프트웨어의 경우에는 영화 자막 제작 목적으로 만들어진 프로그램이기 때문에 결과 비교와 같은 받아쓰기 기능이 미흡한 단점이 있었다.
종래의 듣고 받아쓰기 서비스는 한 문장 받아쓰기 혹은 특정 구문 채워 넣기 등으로 구성되어 있어서, 전체적으로 여러 문장을 지속적으로 듣고 받아쓰기 위한 기능은 구현되어 있지 않은 상황이다.
따라서, 사용자에게 실제의 듣고 받아쓰기를 위한 각종 편리한 기능들(구문 단위로 끊어서 읽어주기, 답안과 비교 확인, 다면 평가 방식 등)을 제공하는 시스템의 개발이 요구되고 있다.
본 발명의 과제는 듣고 받아쓰기 능력을 다면적으로 정량화할 수 있고, 다면 평가용 원시 데이터를 분석하면 사람이 입력했는지 비인간적인 어떤 프로그램이 입력했는지를 확인할 확률을 높일 수 있어 온라인 평가에서 피 평가자가 사람인지 아닌지 인증할 수 있으며, 반복 재생 제어 기능과 자동 끊어 읽기 기능을 이용하면, 자판 사용에 문제가 없는 사용자인 일반인의 경우도 녹취 작업 시간이 피 녹취 파일 시간 길이의 4배 이하로 줄어들게 할 수 있고, 싱크 에디팅 기능을 이용해서 음성 파일의 특정 위치에 여러 단계의 설명이나 번역을 추가할 수 있어 음성 강의 자료의 보조 자료나 번역 교육의 도구로 사용할 수 있고, 녹취 작업을 공동으로 할 수 있으며, 받아쓰기 자료 제공 및 가공자, 받아쓰기 자료 사용자, 서버 운영자로 이루어지는 새로운 시장을 창출할 수 있으며, 녹취 작업 요청자, 녹취 작업 수행자 및 녹취 서버 운영자로 이루어지는 새로운 시장 창출할 수 있고, 음성 강의 자료 주석 작업자, 음성 강의 주석 자료 사용자, 음성 강의 주석 파일 서버 관리자로 이루어지는 새로운 시장 창출할 수 있으며, 오디오북 또는 시청각 강의에 대한 새로운 시장을 창출할 수 있는 온라인상에서의 듣고 받아쓰기 시스템을 제공하는 데 있다.
상기 과제를 달성하기 위해 안출된 본 발명은, 비음성 구간의 시간 길이의 값이 도출될 때, 그 시간 길이에 따른 확률 분포도를 구하고, 그 확률에 따라 각각 문장, 숙어 및 단어를 구분하여 데이터를 저장하되, 상기 데이터가 사용자의 듣고 쓰기 재생시 제공되어 단어, 숙어 및 문장의 구분을 가능하게 하는 끊어 읽기 모듈과, 사용자가 원하는 레벨의 듣기 데이터를 검색하되, 사용자가 제시하는 키워드나 요청사항에 의해서 듣고 받아쓰기를 원하는 음성자료가 검색되는 받아쓰기 데이터 검색 모듈과, 받아쓰고 난 후 사용자 입력 데이터를 하기 클라이언트로부터 수신하여 저장 및 분석하여 듣고 쓰는 능력을 분석해주는 것을 가능하게 하는 받아쓰기 다면 평가 모듈 및 일정 시간 간격 또는 일정량의 입력 후 임시 데이터로 저장하여, 위급 종료시 복구를 가능하게 하는 데이터 복구 모듈을 구비한 서버 및 자판 입력 중에 특정 구간을 반복해서 재생하거나 앞뒤의 구간으로 쉽게 이동하여 재생하게 하는 재생제어부와, 듣고 쓰기 입력 중 다면 평가를 위한 사용자 입력 데이터를 수집하여 수시로 상기 서버에 저장하고, 입력 완료 후 최종적으로 그 데이터를 서버로 전송하는 다면 평가용 사용자 원시 데이터 수집부와, 듣고 쓰기용 음성데이터 및 텍스트를 업로드 하는 받아쓰기 데이터 업로드부 및 음성 데이터과 텍스트 데이터 간 싱크 에디팅 및 주석 추가를 위한 싱크 및 주석 에디터부를 구비한 클라이언트를 포함한다.
상기 서버는 녹취록 공동 작업을 위해 작업자 간 자동 조율을 위한 공동 녹취 데이터 분할 모듈 및 공동 작업 녹취 결과를 통합시키는 녹취 결과 통합 모듈을 더 포함하는 것을 특징으로 한다.
상기 클라이언트는 녹취 요청 및 지불 비용 게시와 녹취록 작성자가 선택하는 녹취 요청 게시부를 더 포함하는 것을 특징으로 한다.
상기 클라이언트는 녹취 결과를 검증하는 환경을 제공하는 녹취 결과 검증부를 더 포함하는 것을 특징으로 한다.
상기 클라이언트는 듣는 중에 소정의 키를 누르면, 그 시점에 관련된 설명이 제공되는 음성 주석 재생부를 더 포함하는 것을 특징으로 한다.
본 발명의 효과는 다음과 같다.
첫째, 듣고 받아쓰기 능력을 다면적으로 정량화하는 효과가 있다.
둘째, 다면 평가용 원시 데이터를 분석하면 사람이 입력했는지 비인간적인 어떤 프로그램이 입력했는지를 확인할 확률을 높일 수 있어 온라인 평가에서 피 평가자가 사람인지 아닌지 혹은 순수하게 듣고 받아썼는지 아니면 다른 부정적인 방법을 이용했는지 확인하는 효과가 있다.
셋째, 반복 재생 제어 기능과 자동 끊어 읽기 기능을 이용하면, 자판 사용에 문제가 없는 사용자인 일반인의 경우도 녹취 작업 시간이 피 녹취 파일 시간 길이의 4배 이하로 줄어드는 효과가 있다.
넷째, 싱크 에디팅 기능을 이용해서 음성 파일의 특정 위치에 여러 단계의 설명이나 번역을 추가할 수 있어 음성 강의 자료의 보조 자료나 번역 교육의 도구로 사용하는 장점이 있다.
다섯째, 녹취 작업을 공동으로 할 수 있으며, 받아쓰기 자료 제공 및 가공자, 받아쓰기 자료 사용자, 서버 운영자로 이루어지는 새로운 시장을 창출할 수 있다.
여섯째, 녹취 작업 요청자, 녹취 작업 수행자 및 녹취 서버 운영자로 이루어지는 새로운 시장 창출할 수 있고, 음성 강의 자료 주석 작업자, 음성 강의 주석 자료 사용자, 음성 강의 주석 파일 서버 관리자로 이루어지는 새로운 시장 창출할 수 있으며, 오디오북 또는 시청각 강의에 대한 새로운 시장 창출되는 이점이 있다.
본 명세서에서 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어서 해석되어서는 아니 된다.
도 1은 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템을 나타낸 구성도,
도 2는 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템을 설명하기 위한 개념도,
도 3은 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템에서 온라인 녹취를 나타낸 개념도,
도 4는 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템에서 음성 강의 주석 자료 사업 모델을 나타낸 개념도,
도 5 내지 도 9는 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템에서 서버-클라이언트 간 상호 동작 순서를 나타낸 개념도이다.
이하, 본 발명에 따른 온라인상에서의 듣고 받아쓰기 시스템의 바람직한 실시예에 대해 상세하게 설명한다.
도 1은 본 발명의 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템을 나타낸 구성도이다. 도 1을 참조하면, 본 발명에 바람직한 실시예에 의한 온라인상에서의 듣고 받아쓰기 시스템은 서버(100) 및 클라이언트(200)를 포함하는 구성요소로 이루어지며, 이를 상세히 설명하면 다음과 같다.
상기 서버(100)는 끊어 읽기 모듈(110), 받아쓰기 데이터 저장 모듈(120), 받아쓰기 다면 평가 모듈(130) 및 데이터 복구 모듈(140)을 포함한다.
상기 끊어 읽기 모듈(110)은 단어, 숙어(문맥) 및 문장 단위를 구분하는 알고리즘이 구현된 소프트웨어 모듈로서, 듣기용 MP3파일이 제공되면 MP3파일의 음성 활성도를 분석하여 음성 구간과 비음성 구간으로 나눈다.
그리고, 비음성 구간의 시간 길이의 값이 도출될 때, 그 시간 길이에 따른 확률 분포도를 구하고, 그 확률에 따라 각각 문장 구분, 숙어 구분 및 단어 구분으로 나누어 정보를 저장한다.
여기서, 이 정보는 사용자의 듣고 쓰기 재생을 할 때 제공되어 단어, 숙어 및 문장 구분을 가능하게 한다.
단, 상기 모듈에서 생성되는 정보는 비음성 구간에 근거한 구분이므로 추후 재확인 작업이 더 필요한데, 이것은 음성 파일과 텍스트 파일간 싱크 에디팅 기능을 통해서 더욱 정교하게 다듬어 질 수 있다.
즉, 음성 파일과 텍스트 파일간 싱크 에디팅 기능은 사용자가 받아쓰기 편하게 음성 파일 중에서 말을 하지 않는 부분, 적당한 시간 간격 또는 단어, 숙어, 문맥 및 문장 단위로 끊어주는 기능이다.
종래에는 문장 단위로 반복적으로 재생하는 동안 받아쓰도록 하였으나, 본 발명은 이러한 문장 단위의 단순한 반복 재생을 지양하고, 받아쓰기 좋은 시간적 위치를 미리 측정해서 그 정보를 저장하고, 이 정보를 이용해서 끊어 읽어 준다.
또한 지속적인 반복 재생이 아니라, 사용자 특정 입력에 의해서만 반복 재생하거나, 사용자 특정 입력에 의해서 앞뒤로 이동하면서 구간을 재생할 수 있는 기능을 추가하여 받아쓰기 편리한 환경을 제공한다.
받아쓰기 다면 평가 기능을 이용하기 위한 음성파일과 해당하는 기본적인 텍스트 외에 음성화일 안에서 각 단어가 재생되는 시점에 대한 시간 정보와 문장의 의미 단위로 구분을 해 주는 정보를 제공하는 측(자료 제공자)과 이것을 이용해서 듣고 받아쓰는 측(자료 사용자) 사이의 거래를 중개해 주는 기능을 제공한다.
또한 받아쓰기 자료뿐 아니라 음성 주석 기능을 이용하기 위한 단어, 숙어, 구문 및 문장 단위의 해석 정보를 추가한, 가공된 정보를 제공하는 측과 이러한 서비스를 이용하는 자료 이용자 사이의 중개 역할을 하며, 자료 제공자와 자료 사용자의 각종 이용환경을 제공한다.
상기 받아쓰기 데이터 저장 모듈(120)은 사용자가 원하는 레벨의 듣기 자료를 찾아주는 소프트웨어 모듈로서, 듣고 받아쓰기의 음성 자료의 경우 재생 빠르기나 사용된 단어나 내용에 따라서 레벨이나 분야가 구별될 수가 있다.
사용자가 제시하는 키워드나 요청사항에 의해서 듣고 받아쓰기를 원하는 음성자료를 찾아주는 검색 엔진 역할을 한다.
이 기능을 위해서는 서버에는 미리 관련된 정보를 분석하여 데이터 베이스화 해야 한다. 이와 같은 선행적인 데이터 베이스화와 검색엔진의 기능을 수행한다.
종래의 받아쓰기 프로그램이나 서비스는 단문이나 몇 문장 안 되는 내용을 듣고 쓰기 위주여서 음성 파일을 앞뒤로 움직일 필요가 없었다.
그러나 수 분 이상의 음성 파일을 받아쓰기 위해서는 단순한 반복 재생이 아니라 사용자 의도대로 현재 재생 부분을 반복재생, 앞뒤 이동 재생 기능 등이 필요하다.
또한, 들리는 내용을 받아쓰는 도중에 이러한 재생 제어를 편리하게 하기 위해서 본 발명은 녹취 기록에는 잘 사용하지 않는 자판키를 재생 제어 키로 강제로 지정함으로써 끊어 읽기 기능과 편리한 반복 재생 제어 기능을 같이 사용할 경우, 듣고 받아쓰기 수고를 획기적으로 줄일 수 있다.
재생 제어 키로 사용되는 일례로는, 쉬프트+탭키 입력 시에는, 시간적으로 한 단계(사용자 지정에 따라서 문장, 구문, 단어가 될 수 있음.) 이전의 부분을 재생하고, 탭키 입력시에는 현재 재생된 부분을 다시 반복 재생하며, 쉬프트+엔터키 입력시에는 시간적으로 한 단계 다음 부분을 재생하는 방법을 들 수 있다.
또한, 백슬래쉬 키는 재생시 잠시 멈춤 혹은 다시 재생 기능을 수행하고, 엔터키는 커서가 다음 줄로 이동함과 동시에 시간적으로 한 단계 다음 부분을 재생하는 기능을 수행한다.
쉬프트+탭키, 탭키, 백슬래쉬키, 쉬프트+엔터키는 실제 녹취기록에는 잘 사용하지 않기 때문에, 텍스트 에디팅의 기능은 제한하고 재생 제어로만 바꾸어 사용한다. 이와 같은 구현으로 일반 사용자가 직관적으로, 자연스럽게 받아쓰기를 할 수 있도록 기능을 제공하는 것이 본 재생 제어의 목적이다.
상기 받아쓰기 다면 평가 모듈(130)은 받아쓰고 난 후 사용자 입력 정보를 클라이언트로부터 받아서 서버에 저장하고, 분석하여 듣고 쓰는 능력을 분석해주는 소프트웨어 모듈로서, 사용자의 듣고 받아쓰기 작업이 끝나면 사용자가 들으면서 받아쓸 시점에 클라이언트 단말기에서 측정 가능한 여러 가지 정보들(예를 들어, 특정 구간 재생 시점 후 받아쓴 시점까지의 시간 간격, 받아쓸 때까지의 반복 재생횟수, 받아쓴 결과 텍스트 및 일 회에 받아쓴 문장 길이 등 사용자가 듣고 받아쓰는 능력을 객관적으로 평가할 수 있고, 클라이언트 단말기에서 계측 및 기록 가능한 모든 정보)이 본 모듈로 전송되어 입력되는데, 이 정보를 이용하여 1차원 수치화한다.
단, 현재 제시한 4가지 입력 정보 외에도 다른 정보가 추가될 수 있도록 설계되었으며, 이러한 정보를 1차원 수치화하는 매핑 함수는 여러 가지 중에서 선택 가능하도록 한다.
이때, 매핑 함수는 본 IT기술외적인 요소로서 언어 교육적인 측면에서 접근 가능하도록, 응용 프로그램 인터페이스(API)를 공개하여, 매핑 함수를 개별적으로 만들어서 적용할 수 있도록 한다.
여기서 입력 정보는 재생 시점 후 받아쓴 시점까지의 시간 간격, 받아쓸 때까지의 반복 재생횟수, 받아쓴 결과 텍스트 및 일 회에 받아쓴 문장 길이로 정의한다.(혹은, 사용자가 듣고 받아쓰는 능력을 객관적으로 평가할 수 있고, 클라이언트 단말기에서 계측 및 기록 가능한 추가적인 모든 정보를 포함한다.)
기존의 받아쓰기 프로그램이나 웹 서비스에서는 결과 텍스트의 단순한 비교를 통해서 정오만을 판단한다.
그러나, 본 발명은 듣고 받아쓰는 중에 발생하는 모든 입력 정보를 이용하여 종합적으로 판단하도록 한다.
예를 들어, 입력 텍스트와 답안이 맞았다고 하더라도, 반복 청취 회수에 따라서 듣고 받아쓰는 능력이 다르게 평가될 수 있고, 한 번에 듣고 받아썼다고 하더라도 그 받아쓴 문장길이에 따라서 다르게 평가할 수 있기 때문이다.
한편, 상기 다면 평가용 원시 데이터 수집 후 발생하는 4가지의 서로 다른 기준의 정보를 1차원 수치화하는 매핑 알고리즘을 개발하고 적용할 수 있는 기능을 제공한다.
이 기능은 수학적으로 말하면, 4차원의 배열을 한 실수(1차원)로 나타내는 매핑 함수로 표현될 수 있다.
이러한 함수는 여러 개 존재할 수 있는데, 이는 언어 교육학적으로 분석한 후 여러 방법으로 적용 가능하기 때문에 종류가 많을 것이다.
일반적으로 특정 구간 재생 시점 후 받아쓴 시점까지의 시간 간격, 반복 청취 재생 횟수 및 일 회에 받아쓴 문장길이에 대한 가중치를 다르게 주어서 텍스트 결과가 같더라도 단시간 내에 한 번에 긴 문장을 받아쓴 경우에 더 높은 점수가 되는 함수가 상식적이나, 이러한 함수는 그 가중치의 종류에 따라서 여러 가지가 될 수 있다.
이러한 경우 언어 교육적 측면을 고려한 다른 평가 방법을 개발할 수 있게 하고, 사용자는 이 평가 방법 자체를 상호 보완적 혹은 경쟁적으로 선택할 수 있게 한다.
상기 데이터 복구 모듈(140)은 일정 시간 간격이나 일정량의 입력 후 임시 화일로 저장하여, 위급 종료시 복구시켜주는 소프트웨어 모듈로서, 특정 시간 간격 또는 특정 횟수의 키 입력 발생 후에 현재 작업하고 있던 내용이 서버의 저장부에 자동으로 저장되어 추후 복구 가능한 자료로 활용된다.
상기 클라이언트(200)는 재생제어부(210), 다면 평가용 사용자 원시 데이터 수집부(220), 받아쓰기 데이터 업로드부(230) 및 싱크 및 주석 에디팅부(240)를 포함한다.
상기 재생제어부(210)는 재생 제어 및 자판 입력을 위한 자바스크립트 코드로서, 듣고 받아쓰기에 최적화된 자판 사용법과, 이러한 사용법을 통해서 구간의 듣고 받아쓰기를 하면서 발생하는 여러 사용자 입력정보를 저장한다.
상기 재생제어부(210)는 이와 같은 사용자 입력 정보의 계속적인 저장을 위해서 다차원 배열이 구성되고 사용자 입력정보가 저장된다.
상기 다면 평가용 사용자 원시 데이터 수집부(220)는 듣고 쓰기 입력 중, 사용자 입력 정보를 수시로 서버 측에 저장하고, 입력 완료 후 최종적으로 그 정보를 서버로 전송하는 자바스크립트 코드로서, 사용자 입력 정보는 다차원 배열 형태로 일단 클라이언트 브라우저 영역 내에 저장되는데, 위급상시 복구를 위해서 정해진 시간이나 이벤트 횟수에 따라서 서버 측으로 전송하여 임시저장 한다.
이때, 사용자가 최종적으로 작업 완료 승인을 선택하면, 임시 저장된 내용은 삭제되고 최종본만 남는다.
상기 받아쓰기 데이터 업로드부(230)는 듣고 쓰기용 음성화일 및 텍스트 업로드 자바스크립트 코드로서, 사용자 임의의 파일을 등록하여 사용할 수 있게 하는 부분이다.
즉, 음성 내용을 담고 있는 MP3파일과 그 음성 파일의 텍스트 내용을 한꺼번에 서버 측으로 업로드 하는 기능이 구현된다. 여기서, 텍스트가 없고 음성 파일만 있을 경우는 음성 파일만 서버로 전송 및 저장하여 추후 텍스트를 추가하거나, 본 서비스를 이용해서 받아쓸 수 있도록 한다.
상기 싱크 및 주석 에디팅부(240)는 음성 파일과 텍스트 파일 간 싱크 에디팅 및 주석 추가를 위한 자바스크립트 코드로서, 음성 파일과 텍스트 파일만으로는 서로 싱크가 안 맞은 상태이다.
즉, 싱크 에디팅 작업을 통해서, 특별한 포맷 형태로 정보를 가공하여 저장한다. 싱크 에디팅 기능 외에도 단어, 숙어(문맥) 및 문장별 해석과 같은 주석을 추가할 수 있는 텍스트 편집 기능이 포함된 자바 스크립트 코드로 구현된다.
싱크 에디팅과 주석 추가가 끝난 정보는 서버로 전송되어 저장한다. 그리고, 서버에는 해당 MP3파일과 쌍으로 저장된다.
한편, 상기 서버(100)는 녹취록 공동 작업을 위해 작업자 간 자동 조율을 위한 공동 녹취 데이터 분할 모듈(150)과 공동 작업 녹취 결과를 통합시키는 녹취 결과 통합 모듈(160)을 더 포함할 수 있다.
상기 공동 녹취 데이터 분할 모듈(150)은 녹취록 공동 작업을 위한 작업자 간 자동 조율 소프트웨어 모듈로서, 녹취되어야 할 파일을 미리 정의된 방식에 의해서 분할하여 1인 이상의 녹취 작업자가 온라인 또는 오프라인으로 작업할 수 있게 한다.
이때, 작업 중에 각 분할 작업자의 할당 분이 동적으로 재조정할 수 있는 기능이 포함된다. 분할 작업을 통한 작업 시간 단축뿐만 아니라 중복 작업을 통해서 오류를 낮추는 기능이 포함된다.
본 발명에서 녹취 목적으로 이용할 때, 여러 사람이 나누어서 공동 작업할 수 있는 온라인 환경, 즉 중복 녹취 기능과 중첩되게 혹은 독립적으로 사용할 수 있는 기능으로서, 일반적으로 녹취 작업은 실제 음성파일의 시간을 기준으로 할 때 최소 약 2 내지 3배의 시간이 소요되기 때문에, 여러 사람이 분할 작업함으로써 작업 시간을 단축할 수 있다. 이때, 이러한 녹취 공동 작업은 온라인에서 구축된다.
공동 녹취 기능을 이용하여 녹취를 할 때, 녹취를 원하는 측과 녹취를 하는 사람 사이의 거래를 중개해 주는 기능, 즉 일반적인 녹취 작업 수요자(B측: 음성 파일을 문자화하기 원하는 측)와 녹취 작업 공급자(A측: 음성 파일을 듣고 받아쓰는 1인 이상의 녹취 작업자 그룹) 사이에서 필요한 여러 가지 기능을 수행한다.
일례로 B측은 음성파일 업로드 하고, 녹취 작업 완료 시간 또는 지급할 의사가 있는 비용 등을 제시하여 게시하면, A측은 입찰이나 선착순 등의 선택 과정을 통해서 작업을 할당받고, 웹상에서 제공하는 온라인 또는 오프라인 녹취 작업 프로그램을 제공받고 단독 혹은 공동 작업을 수행하여 완료한다.
녹취 작업 완료 후 B측은 중복 녹취 결과 비교 기능과 같은 검수 과정을 통해서 확인을 하고 비용 지급을 완료한다.
이때, 웹 서비스는 각 단계에서 발생하는 작업에 필요한 온라인 및 오프라인 환경을 제공하며 거래를 중개한다.
그리고, 상기 녹취 결과 통합 모듈(160)은 공동 작업 녹취 결과를 통합시키는 소프트웨어 모듈로서, 분할되어 작업한 녹취 결과나 중복 작업을 통한 녹취 결과를 합치거나 선택할 수 있는 기능이 구현된 모듈이다.
각 작업자가 온라인 혹은 오프라인으로 작업한 결과 데이터를 서버로 업로드 하면 서버에서는 작업자의 녹취 타임스탬프정보를 이용해서 겹치지 않게 배열을 해서 원래의 MP3파일의 순서대로 맞춘다.
중복 작업 부분이 있는 경우는 비교 기능을 통해서 똑같은 경우와 다를 경우로 나누어 다른 경우, 사용자(녹취 결과 검사자)가 선택할 수 있게 한다.
한편, 상기 클라이언트(200)는 녹취 요청 게시부(250), 녹취 결과 검증부(260) 및 음성 주석 재생부(270)를 더 포함할 수 있다.
상기 녹취 요청 게시부(250)는 녹취 요청 및 지급 비용 게시와 녹취록 작성자가 선택할 수 있는 게시판 코드로서, 녹취를 요청하는 측에서는 준비된 MP3파일을 업로드해야 하는데, 이러한 기능이 상기 모듈에서 구현된다.
MP3파일 업로드와 더불어 지급할 의사가 있는 최대 비용에 대한 정보 등의 요구사항들을 나열하여 녹취 작업자가 열람할 수 있게 한다.
여기서, 지급할 비용은 본 서버 관리자에게 예치되는 방식으로 구현하며, 관련 작업이 본 모듈을 통해서 구현된다. 녹취 작업자들은 본 모듈을 통해서 작업을 확인받는 과정을 통해서 승인을 받은 후 작업을 시작한다.
이때, 녹취 작업 환경은 본 서비스에서 온라인 또는 오프라인 소프트웨어로 제공되며, 작업 결과 데이터는 서버로 전송되어 합쳐진다.
상기 녹취 결과 검증부(260)는 녹취 결과를 검증하는 환경을 제공하는 자바스크립트 코드로서, 녹취 작업이 완료되면, 상기 모듈을 통해서 녹취 작업 요청자가 녹취 결과를 샘플링 혹은 전체로서 확인해 볼 수 있는 환경을 제공한다.
녹취 요청자가 만족하여 작업 완료 확인 과정을 통해서 녹취 요청자와 작업자 간의 거래가 종료된다.
거래 종료 후 요청자가 제시한 비용 및 결과 정보는 작업자에게 전달된다.
또한, 여러 사람이 중복하여 녹취한 경우, 해당 음성 부분과 녹취 결과를 비교 혹은 선택할 수 있도록 화면에 배열해 주는 기능도 포함한다.
상기 코드를 통해서 같은 음성 부분을 서로 다른 녹취자가 중복하여 결과를 저장함으로서 녹취의 품질을 높일 수 있도록 한다.
즉, 텍스트가 없는 음성 파일의 경우 적어도 한 명 이상의 듣고 받아쓴 결과 텍스트를 서로 비교하거나 텍스트와 원본 음성 내용을 다시 확인함으로써, 오류를 판단할 수 있는 환경을 제공한다.
그리고, 음성파일의 해당 텍스트가 없을 경우, 여러 사람이 듣고 받아쓴 결과를 비교하는 기능으로서, 듣고 받아쓰는 중에 음성파일의 시간 정보가 텍스트에 함께 기록되어 이 시간 정보를 이용해서 받아쓴 결과들을 비교하면 음성파일의 같은 위치에서 사람들의 받아쓴 결과를 쉽게 비교할 수 있다.
상기 음성 주석 재생부(270)는 듣는 중에 헬프 키를 누르면, 그 시점에 관련된 설명이 나오는 자바 스크립트 코드로서, 녹취나 받아쓰기 연습이 아닌 순수하게 듣고 이해하기만을 목적으로 하는 경우, 알아듣지 못한 부분에서 특정 입력(브라우저에서는 마우스 클릭이나 자판 입력, 스마트 폰 등에서는 특정 터치)을 통해서 해당 부분의 설명을 들을 수 있는 기능이 구현되는 부분이다.
예를 들어 영어 듣기의 경우, 특정 입력 후 레벨에 따라서 단어, 숙어(문맥) 및 문장의 순서로 설명을 들을 수 있게 한다.
설명 도중에는 영어 재생이 정지되며, 설명 내용은 제공자가 입력한 단어, 숙어(문맥) 및 문장에 따른 주석 내용이 별도로 저장되어 있는 주석용 MP3파일에서 재생되도록 한다.
즉, 다시 말해 영어와 같은 외국어를 듣고 쓰는 중 또는 듣기만 하는 중 "헬프" 입력을 통해서 단어, 구문 또는 문장 단위 등으로 구분하여 해석해 주는 기능이다.
외국어로 된 강의 내용을 듣다가 해석되지 않는 부분에서 해석에 도움을 주는 기능으로, 단어, 숙어, 구문 및 문장 등으로 미리 정보를 입력해 놓은 자료를 이용해서 사용자가 "헬프" 키와 같은 입력을 하면, 해당 정보를 보여주거나 말해주는 기능이다.
일반적으로 강의 자료는 1차원적이고 수동적이다.
1차원적이란 시간의 흐름에 따라서만 이동할 수 있다는 것이고, 수동적이라 청취자는 계속 들어야 한다.
본 기능에서는 이러한 수동적, 1차원성을 벗어나기 위한 편리한 환경을 제공한다.
예컨대, 외국어 강의 음성 파일인 경우, 모르는 단어나 문맥, 문장이 나올 때, 별도의 사전이나 참고 자료를 사용했었다.
그러나, 본 발명은 이러한 불편한 점을 개선하여, 해당 시간 위치에서 "헬프" 입력을 통해서 그 시간의 도움말을 여러 단계(예를 들어 단어 수준, 문맥 수준 및 문장수준)별로 제공받을 수 있도록 한다.
음성 주석 기능을 위해서 음성 주석 재생기(프로그램 형태 혹은 웹 서비스)를 제공된다.
또한, 편리하게 음성 주석 자막을 편집하기 위해서 온라인 혹은 오프라인 음성 주석 편집 프로그램을 제공한다.
이상에서는 본 발명을 바람직한 실시예에 의거하여 설명하였으나, 본 발명의 기술적 사상은 이에 한정되지 아니하고 청구항에 기재된 범위 내에서 변형이나 변경 실시가 가능함은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 명백한 것이며, 그러한 변형이나 변경은 첨부된 특허청구범위에 속한다 할 것이다.
100: 서버 110: 끊어 읽기 모듈
120: 받아쓰기 데이터 저장 모듈 130: 받아쓰기 다면 평가 모듈
140: 데이터 복구 모듈 150: 공동 녹취 데이터 분할 모듈
160: 녹취 결과 통합 모듈 200: 클라이언트
210: 재생제어부 220: 다면 평가용 사용자 원시 데이터 수집부
230: 받아쓰기 데이터 업로드부 240: 싱크 및 주석 에디터부
250: 녹취 요청 게시부 260: 녹취 결과 검증부
270: 음성 주석 재생부

Claims (5)

  1. 비음성 구간의 시간 길이의 값이 도출될 때, 그 시간 길이에 따른 확률 분포도를 구하고, 그 확률에 따라 각각 문장, 숙어 및 단어를 구분하여 데이터를 저장하되, 상기 데이터가 사용자의 듣고 쓰기 재생시 제공되어 단어, 숙어 및 문장의 구분을 가능하게 하는 끊어 읽기 모듈과,
    사용자가 원하는 레벨의 듣기 데이터를 검색하되, 사용자가 제시하는 키워드나 요청사항에 의해서 듣고 받아쓰기를 원하는 음성자료가 검색되는 받아쓰기 데이터 검색 모듈과,
    받아쓰고 난 후 사용자 입력 데이터를 하기 클라이언트로부터 수신하여 저장 및 분석하여 듣고 쓰는 능력을 분석해주는 것을 가능하게 하는 받아쓰기 다면 평가 모듈 및
    일정 시간 간격 또는 일정량의 입력 후 임시 데이터로 저장하여, 위급 종료시 복구를 가능하게 하는 데이터 복구 모듈을 구비한 서버; 및
    자판 입력 중에 특정 구간을 반복해서 재생하거나 앞뒤의 구간으로 쉽게 이동하여 재생하게 하는 재생제어부와,
    듣고 쓰기 입력 중 다면 평가를 위한 사용자 입력 데이터를 수집하여 수시로 상기 서버에 저장하고, 입력 완료 후 최종적으로 그 데이터를 서버로 전송하는 다면 평가용 사용자 원시 데이터 수집부와,
    듣고 쓰기용 음성데이터 및 텍스트를 업로드 하는 받아쓰기 데이터 업로드부 및
    음성 데이터과 텍스트 데이터 간 싱크 에디팅 및 주석 추가를 위한 싱크 및 주석 에디터부를 구비한 클라이언트를 포함하는 온라인상에서의 듣고 받아쓰기 시스템.
  2. 제1항에 있어서, 상기 서버는,
    녹취록 공동 작업을 위해 작업자 간 자동 조율을 위한 공동 녹취 데이터 분할 모듈 및
    공동 작업 녹취 결과를 통합시키는 녹취 결과 통합 모듈을 더 포함하는 것을 특징으로 하는 온라인상에서의 듣고 받아쓰기 시스템.
  3. 제1항에 있어서, 상기 클라이언트는,
    녹취 요청 및 지불 비용 게시와 녹취록 작성자가 선택하는 녹취 요청 게시부를 더 포함하는 것을 특징으로 하는 온라인상에서의 듣고 받아쓰기 시스템.
  4. 제1항에 있어서, 상기 클라이언트는,
    녹취 결과를 검증하는 환경을 제공하는 녹취 결과 검증부를 더 포함하는 것을 특징으로 하는 온라인상에서의 듣고 받아쓰기 시스템.
  5. 제1항에 있어서, 상기 클라이언트는,
    듣는 중에 소정의 키를 누르면, 그 시점에 관련된 설명이 제공되는 음성 주석 재생부를 더 포함하는 것을 특징으로 하는 온라인상에서의 듣고 받아쓰기 시스템.
KR1020110077239A 2011-08-03 2011-08-03 온라인상에서의 듣고 받아쓰기 시스템 KR101336716B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110077239A KR101336716B1 (ko) 2011-08-03 2011-08-03 온라인상에서의 듣고 받아쓰기 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110077239A KR101336716B1 (ko) 2011-08-03 2011-08-03 온라인상에서의 듣고 받아쓰기 시스템

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR20130089761A Division KR101508718B1 (ko) 2013-07-29 2013-07-29 온라인상에서의 듣고 받아쓰기 시스템

Publications (2)

Publication Number Publication Date
KR20130015317A true KR20130015317A (ko) 2013-02-14
KR101336716B1 KR101336716B1 (ko) 2013-12-03

Family

ID=47895154

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110077239A KR101336716B1 (ko) 2011-08-03 2011-08-03 온라인상에서의 듣고 받아쓰기 시스템

Country Status (1)

Country Link
KR (1) KR101336716B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111081081A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种听写报读方法及电子设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230112979A (ko) 2022-01-21 2023-07-28 엔에이치엔클라우드 주식회사 글쓰기 트레이닝 서비스를 제공하는 장치 및 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040018810A (ko) * 2002-08-27 2004-03-04 (주)메이븐 다량 번역 중개 서비스 방법
KR20090068590A (ko) * 2007-12-24 2009-06-29 김영한 받아쓰기 게임 시스템
KR20090075052A (ko) * 2008-01-03 2009-07-08 황인도 멀티미디어를 이용한 네트워크 영어학습 시스템
KR20100071426A (ko) * 2008-12-19 2010-06-29 주식회사 케이티 외국어 듣기훈련을 위한 받아쓰기 학습방법 및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111081081A (zh) * 2019-07-02 2020-04-28 广东小天才科技有限公司 一种听写报读方法及电子设备
CN111081081B (zh) * 2019-07-02 2021-12-21 广东小天才科技有限公司 一种听写报读方法及电子设备

Also Published As

Publication number Publication date
KR101336716B1 (ko) 2013-12-03

Similar Documents

Publication Publication Date Title
US11070553B2 (en) Apparatus and method for context-based storage and retrieval of multimedia content
Pavel et al. Video digests: a browsable, skimmable format for informational lecture videos.
Waibel et al. Advances in automatic meeting record creation and access
US20060288273A1 (en) Event-driven annotation techniques
Dempster et al. The economic crisis though the eyes of Transana
US20130007043A1 (en) Voice description of time-based media for indexing and searching
Spina et al. Extracting audio summaries to support effective spoken document search
Thompson Building a specialised audiovisual corpus
Schultz et al. The ISL meeting room system
Shin et al. Dynamic authoring of audio with linked scripts
Kendall On the history and future of sociolinguistic data
Goldman et al. Accessing the spoken word
Sivaraman et al. Simplified audio production in asynchronous voice-based discussions
Whittaker et al. Semantic speech editing
Praharaj et al. Towards collaborative convergence: quantifying collaboration quality with automated co-located collaboration analytics
Tardel Measuring effort in subprocesses of subtitling: The case of post-editing via pivot language
Polák et al. ALIGNMEET: A comprehensive tool for meeting annotation, alignment, and evaluation
KR101336716B1 (ko) 온라인상에서의 듣고 받아쓰기 시스템
Smith et al. Integrating technology to improve the efficiency of qualitative data analysis—A note on methods
KR101508718B1 (ko) 온라인상에서의 듣고 받아쓰기 시스템
Baume et al. A contextual study of semantic speech editing in radio production
Cassidy et al. Case study: the AusTalk corpus
Marsden et al. Tools for searching, annotation and analysis of speech, music, film and video—a survey
US11074939B1 (en) Disambiguation of audio content using visual context
Bouamrane et al. Navigating multimodal meeting recordings with the meeting miner

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
A107 Divisional application of patent
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161109

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171127

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181229

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190916

Year of fee payment: 7