KR20200046734A - 강의 콘텐츠 생성 장치 및 이를 위한 방법 - Google Patents

강의 콘텐츠 생성 장치 및 이를 위한 방법 Download PDF

Info

Publication number
KR20200046734A
KR20200046734A KR1020180128289A KR20180128289A KR20200046734A KR 20200046734 A KR20200046734 A KR 20200046734A KR 1020180128289 A KR1020180128289 A KR 1020180128289A KR 20180128289 A KR20180128289 A KR 20180128289A KR 20200046734 A KR20200046734 A KR 20200046734A
Authority
KR
South Korea
Prior art keywords
text
file
lecture
content
voice
Prior art date
Application number
KR1020180128289A
Other languages
English (en)
Inventor
김지희
김원주
김진희
Original Assignee
서울여자대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울여자대학교 산학협력단 filed Critical 서울여자대학교 산학협력단
Priority to KR1020180128289A priority Critical patent/KR20200046734A/ko
Publication of KR20200046734A publication Critical patent/KR20200046734A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • G06Q50/2057Career enhancement or continuing education service
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

본 발명은 강의 콘텐츠 생성 장치 및 이를 위한 방법에 관한 것으로, 이러한 본 발명은 강의 음성을 녹음하는 오디오부와, 상기 강의 음성을 포함하는 오디오 파일을 생성하고, 상기 오디오 파일의 음성을 텍스트로 인식하여 인식된 텍스트를 포함하는 텍스트 파일을 생성하고, 상기 오디오 파일의 음성과 상기 텍스트 파일의 텍스트를 동기화시킨 후, 상기 동기화된 오디오 파일 및 텍스트 파일을 포함하는 강의 콘텐츠를 생성하는 콘텐츠생성부를 포함하는 것을 특징으로 하는 강의 콘텐츠 생성 장치와, 이를 위한 방법을 제공한다.

Description

강의 콘텐츠 생성 장치 및 이를 위한 방법{Apparatus and method for generating lecture content}
본 발명은 강의 콘텐츠 생성 기술에 관한 것으로, 보다 상세하게는, 텍스트를 기초로 강의 내용을 손쉽게 검색할 수 있는 강의 콘텐츠 생성 장치 및 이를 위한 방법에 관한 것이다.
일반적으로 학업은 누군가로부터 지식을 얻는 일련의 과정을 말한다. 이러한 학업의 거의 대부분은 학교와 학원과 같은 시설에서 선생님이나 강사에 의해 주로 이루어지고 있다. 학교와 같은 교육시설에서 선생님의 강의를 통해 수업을 받는 경우, 기존에는 중요한 내용이나 강의 전체를 필기하거나 녹음하여, 강의 이후 필기된 노트나 녹음된 파일을 통하여 스스로 복습할 수 있었다.
최근에는 이동식 단말기를 통해 강의 내용을 직접 텍스트로 작성하거나, 녹음 및 동영상을 촬영하여 저장함으로써 이 후, 강의 내용이 필요한 경우 다시금 확인할 수 있게 되었다.
하지만, 직접 텍스트로 작성하는 경우에는 강의 내용 전체를 작성하기 힘들뿐 아니라, 텍스트 작성에 집중함으로써 오히려 강의에 소홀해질 수 있다.
강의 내용을 녹음하는 경우에는, 특정 강의 내용을 찾기 위해서는 녹음기의 빨리 감기, 돌려 감기 등의 반복을 통해 수동적으로 직접 찾아야 하기 때문에 불편하고, 처음부터 끝까지 확인해야하므로 시간이 많이 소모되는 문제가 발생할 수 있다.
한국공개특허 제2014-0062247호 2014년 05월 23일 공개 (명칭: 이동 통신 단말기에서의 강좌 텍스트 데이터 생성 방법과 이를 이용한 이동 통신 단말기)
본 발명의 목적은 녹음한 강의 내용을 정확하고 손쉽게 검색할 수 있는 강의 콘텐츠 생성 장치 및 이를 위한 방법을 제공함에 있다.
상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 강의 콘텐츠 생성 장치는 강의 음성을 녹음하는 오디오부와, 상기 강의 음성을 포함하는 오디오 파일을 생성하고, 상기 오디오 파일의 음성을 텍스트로 인식하여 인식된 텍스트를 포함하는 텍스트 파일을 생성하고, 상기 오디오 파일의 음성과 상기 텍스트 파일의 텍스트를 동기화시킨 후, 상기 동기화된 오디오 파일 및 텍스트 파일을 포함하는 강의 콘텐츠를 생성하는 콘텐츠생성부를 포함한다.
상기 강의 콘텐츠 생성 장치는 상기 텍스트 파일에 포함된 텍스트를 표시하는 표시부와, 상기 텍스트에 파일에 포함된 텍스트 중 일부의 텍스트가 선택되고, 재생 기능이 요청되면, 선택된 텍스트에 대응하는 부분의 음성 파일을 재생하는 콘텐츠재생부를 더 포함한다.
상기 콘텐츠재생부는 상기 텍스트에 파일에 포함된 텍스트 중 일부의 텍스트가 선택되고, 하이라이트 기능이 요청되면, 선택된 텍스트와 동일한 텍스트를 모두 하이라이트 표시하여 상기 표시부를 통해 표시하는 것을 특징으로 한다.
상기 콘텐츠재생부는 상기 텍스트에 파일에 포함된 텍스트 중 일부의 텍스트가 선택되고, 텍스트 편집 기능이 요청되면, 상기 선택된 텍스트를 편집 가능한 상태로 전환하는 것을 특징으로 한다.
상술한 바와 같은 목적을 달성하기 위한 본 발명의 바람직한 실시예에 따른 강의 콘텐츠 생성 방법은 강의 음성을 녹음하여 상기 강의 음성을 포함하는 오디오 파일을 생성하는 단계와, 상기 오디오 파일의 음성을 텍스트로 변환하여 텍스트 파일을 생성하는 단계와, 상기 오디오 파일의 음성과 상기 텍스트 파일의 텍스트를 동기화시키는 단계와, 상기 동기화된 오디오 파일 및 텍스트 파일을 포함하는 강의 콘텐츠를 생성하는 단계를 포함한다.
본 발명의 바람직한 실시예에 따른 강의 콘텐츠 생성 방법은 상기 텍스트 파일에 포함된 텍스트를 표시하는 단계와, 상기 텍스트에 파일에 포함된 텍스트 중 일부의 텍스트가 선택되고, 재생 기능이 요청되면, 선택된 텍스트에 대응하는 부분의 음성 파일을 재생하는 단계를 더 포함한다.
상기 표시하는 단계 후, 상기 텍스트에 파일에 포함된 텍스트 중 일부의 텍스트가 선택되고, 하이라이트 기능이 요청되면, 선택된 텍스트와 동일한 텍스트를 모두 하이라이트 표시하여 상기 표시부를 통해 표시하는 단계를 더 포함한다.
상기 표시하는 단계 후, 상기 텍스트에 파일에 포함된 텍스트 중 일부의 텍스트가 선택되고, 텍스트 편집 기능이 요청되면, 상기 선택된 텍스트를 편집 가능한 상태로 전환하는 단계를 더 포함한다.
본 발명에 따르면, 강의를 녹음한 오디오 파일을 기초로 텍스트 파일을 생성하고, 텍스트 파일과 오디오 파일을 동기화시키고, 텍스트 파일을 통해 강의를 검색할 수 있어, 사용자는 손쉽고 빠르게 원하는 부분의 강의 내용을 검색할 수 있다.
도 1은 본 발명의 실시예에 따른 강의 콘텐츠 생성 장치를 설명하기 위한 블록도이다.
도 2는 본 발명의 실시예에 따른 강의 콘텐츠 생성 장치 중 제어부의 세부 구성을 설명하기 위한 블록도이다.
도 3은 본 발명의 실시예에 따른 강의 콘텐츠 생성 방법을 설명하기 위한 흐름도이다.
도 4는 본 발명의 실시예에 따른 강의 콘텐츠를 재생하는 방법을 설명하기 위한 흐름도이다.
본 발명의 상세한 설명에 앞서, 이하에서 설명되는 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념으로 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 실시예에 불과할 뿐, 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명하기로 한다. 이때, 첨부된 도면에서 동일한 구성 요소는 가능한 동일한 부호로 나타내고 있음을 유의해야 한다. 또한, 본 발명의 요지를 흐리게 할 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략할 것이다. 마찬가지의 이유로 첨부 도면에 있어서 일부 구성요소는 과장되거나 생략되거나 또는 개략적으로 도시되었으며, 각 구성요소의 크기는 실제 크기를 전적으로 반영하는 것이 아니다.
먼저, 본 발명의 실시예에 따른 강의 콘텐츠 생성 장치에 대해서 설명하기로 한다. 도 1은 본 발명의 실시예에 따른 강의 콘텐츠 생성 장치를 설명하기 위한 블록도이다. 도 2는 본 발명의 실시예에 따른 강의 콘텐츠 생성 장치 중 제어부의 세부 구성을 설명하기 위한 블록도이다.
도 1을 참조하면, 본 발명의 실시예에 따른 콘텐츠생성장치(100)는 통신부(110), 오디오부(120), 입력부(130), 표시부(140), 저장부(150) 및 제어부(160)를 포함한다.
통신부(110)는 통신을 위한 수단이다. 통신부(110)는 네트워크를 통해 다른 장치와 통신할 수 있다. 통신부(110)는 송신되는 신호의 주파수를 상승 변환 및 증폭하는 RF(Radio Frequency) 송신기(Tx) 및 수신되는 신호를 저 잡음 증폭하고 주파수를 하강 변환하는 RF 수신기(Rx)를 포함할 수 있다. 그리고 통신부(110)는 송신되는 신호를 변조하고, 수신되는 신호를 복조하는 모뎀(Modem)을 포함할 수 있다. 통신부(110)는 수신되는 데이터, 메시지 등을 제어부(160)로 전달한다. 또한, 통신부(110)는 제어부(160)로부터 송신하는 데이터, 메시지 등을 전달받아 마스터장치(100)로 전송한다.
오디오부(130)는 음성과 같은 오디오 신호를 수집하여 제어부(160)에 전달하는 마이크(MIC) 및 제어부(160)로부터 제공되는 오디오 신호를 출력하기 위한 스피커(SPK)를 포함한다. 오디오부(130)는 복수의 대역 및 복수의 채널의 오디오 신호를 출력할 수 있다. 오디오부(130)의 스피커(SPK)는 제어부(160)의 제어에 따라 오디오 신호의 출력 대역 및 출력 채널을 변경하여 출력할 수 있다. 이와 같이, 오디오부(130)는 오디오 신호의 출력 대역 및 출력 채널을 변경하여 출력하여 오디오 신호의 노이즈를 제거할 수 있다. 이러한 노이즈는 대표적으로 음향 되울림 현상에 의한 잡음을 예시할 수 있다.
입력부(130)는 콘텐츠생성장치(100)를 제어하기 위한 사용자의 키 조작을 입력받고 입력 신호를 생성하여 제어부(160)에 전달한다. 입력부(130)는 콘텐츠생성장치(100)를 제어하기 위한 각 종 키들을 포함할 수 있다. 입력부(130)는 표시부(140)가 터치스크린으로 이루어진 경우, 각 종 키들의 기능이 표시부(140)에서 이루어질 수 있으며, 터치스크린만으로 모든 기능을 수행할 수 있는 경우, 입력부(130)는 생략될 수도 있다.
표시부(140)는 콘텐츠생성장치(100)의 메뉴, 입력된 데이터, 기능 설정 정보 및 기타 다양한 정보를 사용자에게 시각적으로 제공한다. 표시부(140)는 콘텐츠생성장치(100)의 부팅 화면, 대기 화면, 메뉴 화면, 등의 화면을 출력하는 기능을 수행한다. 표시부(140)는 액정표시장치(LCD, Liquid Crystal Display), 유기 발광 다이오드(OLED, Organic Light Emitting Diodes), 능동형 유기 발광 다이오드(AMOLED, Active Matrix Organic Light Emitting Diodes) 등으로 형성될 수 있다. 한편, 표시부(140)는 터치스크린으로 구현될 수 있다. 이러한 경우, 표시부(140)는 터치센서를 포함한다. 터치센서는 사용자의 터치 입력을 감지한다. 터치센서는 정전용량 방식(capacitive overlay), 압력식, 저항막 방식(resistive overlay), 적외선 감지 방식(infrared beam) 등의 터치 감지 센서로 구성되거나, 압력 감지 센서(pressure sensor)로 구성될 수도 있다. 상기 센서들 이외에도 물체의 접촉 또는 압력을 감지할 수 있는 모든 종류의 센서 기기가 본 발명의 터치센서로 이용될 수 있다. 터치센서는 사용자의 터치 입력을 감지하고, 감지 신호를 발생시켜 제어부(160)로 전송한다. 특히, 표시부(140)가 터치스크린으로 이루어진 경우, 입력부(130) 기능의 일부 또는 전부는 표시부(140)를 통해 이루어질 수 있다.
저장부(150)는 콘텐츠생성장치(100)의 동작에 필요한 프로그램 및 데이터를 저장하는 역할을 수행한다. 예컨대, 저장부(150)는 강의 음성을 녹음한 오디오 파일과 오디오 파일의 음성을 텍스트로 인식하여 생성된 텍스트 파일을 포함하는 강의 콘텐츠를 저장할 수 있다. 저장부(150)에 저장되는 각 종 데이터는 사용자의 조작에 따라, 삭제, 변경, 추가될 수 있다.
제어부(160)는 콘텐츠생성장치(100)의 전반적인 동작 및 콘텐츠생성장치(100)의 내부 블록들 간 신호 흐름을 제어하고, 데이터를 처리하는 데이터 처리 기능을 수행할 수 있다. 또한, 제어부(160)는 기본적으로, 콘텐츠생성장치(100)의 각 종 기능을 제어하는 역할을 수행한다. 제어부(160)는 애플리케이션 프로세서(Application Processor), 중앙처리장치(CPU: Central Processing Unit), 디지털신호처리기(DSP: Digital Signal Processor) 등을 예시할 수 있다.
한편, 제어부(160)는 콘텐츠생성부(161) 및 콘텐츠재생부(163)를 포함한다.
콘텐츠생성부(161)는 오디오부(120)를 통해 강의 음성을 녹음하고, 녹음된 음성을 포함하는 오디오 파일을 생성한다. 또한, 콘텐츠생성부(161)는 오디오 파일의 음성을 텍스트로 인식하여 인식된 텍스트를 포함하는 텍스트 파일을 생성한다. 이때, 콘텐츠생성부(161)는 STT(Speech To Text) 기법과 같은 음성 인식 기술에 따라 음성을 텍스트로 인식할 수 있다. 이를 위하여, 콘텐츠생성부(161)는 인식기를 포함할 수 있다. 인식기는 전방전달신경망(FNN: feedforward neural network), 순환인공신경망(RNN: Recurrent neural network), 합성곱신경망(CNN: convolutional neural networks), 코헨자기조직신경망(KSN: kohonen self-organizing network) 등의 인공신경망(ANN: artificial neural network)을 비롯하여 트리인식기, 서포트 벡터 머신(SVM: support vector machine), 퍼셉트론(perceptron), RBF(radial basis function) 등을 예시할 수 있다.
콘텐츠생성부(161)는 텍스트 파일에 포함된 텍스트의 문법적 오류를 수정한다. 이를 위하여, 저장부(150)에 단어의 철자법 또는 맞춤법이 등록된 단어사전, 문법 규칙이 등록된 문법사전 등을 저장할 수 있다. 예컨대, 콘텐츠생성부(161)는 저장부(150)의 단어사전 및 문법사전을 참고하여 텍스트의 철자법 또는 맞춤법, 그리고 문법 규칙에 따른 문법 검사를 수행하여 오류를 검출하고, 이를 문법에 맞게 수정할 수 있다.
특히, 콘텐츠생성부(161)는 오디오 파일의 음성을 타임스탬프를 통해 텍스트 파일의 텍스트와 동기화시킬 수 있다. 이에 따라, 콘텐츠생성부(161)는 동기화된 오디오 파일 및 텍스트 파일을 포함하는 강의 콘텐츠를 생성하고, 이를 저장부(150)에 저장한다.
콘텐츠재생부(163)는 기본적으로, 콘텐츠생성부(161)가 생성하여 저장부(150)에 저장한 강의 콘텐츠의 텍스트 파일로부터 텍스트를 추출하여 표시부(140)를 통해 표시한다.
콘텐츠재생부(163)는 강의 콘텐츠의 텍스트 파일의 텍스트가 표시된 상태에서, 사용자는 표시부(140) 혹은 입력부(130)를 통해 표시된 텍스트 중 일부 텍스트를 선택할 수 있다. 또한, 사용자는 텍스트를 선택한 후, 표시부(140) 혹은 입력부(130)를 통해 재생 기능, 하이라이트 기능 및 텍스트 편집 기능 중 어느 하나를 선택할 수 있다. 이에 따라, 콘텐츠재생부(163)는 표시부(140) 혹은 입력부(130)를 통해 선택되는 텍스트를 감지하고, 재생 기능, 하이라이트 기능 및 텍스트 편집 기능 중 어느 하나의 선택을 감지할 수 있다.
일 실시예에 따르면, 텍스트가 선택되고, 이어서, 재생 기능이 선택되면, 콘텐츠재생부(163)는 선택된 텍스트에 대응하는 부분의 강의 콘텐츠의 음성 파일의 위치를 검색한 후, 검색된 위치의 음성을 재생한다. 이러한 검색은 동기화에서 사용된 타임스탬프를 이용할 수 있다.
다른 실시예에 따르면, 텍스트가 선택되고, 이어서, 하이라이트 기능이 선택되면, 콘텐츠재생부(163)는 텍스트 파일의 전체 텍스트 중 앞서(S220) 선택된 텍스트와 동일한 텍스트를 모두 검색하여, 검색된 텍스트를 모두 하이라이트 표시하여 표시부(140)를 통해 표시한다.
다른 실시예에 따르면, 텍스트가 선택되고, 텍스트 편집 기능이 선택되면, 콘텐츠재생부(163)는 선택된 텍스트를 편집 가능한 상태로 전환하여 표시부(140)를 통해 표시한다.
전술한 바와 같은 콘텐츠생성장치(100)는 네트워크를 통해 유선 데이터 링크, 무선 데이터 링크, 또는 유선 및 무선 데이터 링크의 조합으로 링크된 로컬 및 원격 컴퓨터 시스템 모두가 태스크를 수행하는 분산형 시스템 환경에서 실행될 수 있다. 분산형 시스템 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치에 위치될 수 있다.
본 발명의 실시예에서 콘텐츠생성장치(100)는 모든 정보통신기기, 멀티미디어 단말기, 유선 단말기, 고정형 단말기 및 IP(Internet Protocol) 단말기 등의 다양한 단말기에 적용될 수 있다. 예컨대, 콘텐츠생성장치(100)는 휴대폰, PMP(Portable MultimediaPlayer), MID(Mobile Internet Device), 스마트폰(Smart Phone), 태블릿, 패블릿, 노트북 등을 예시할 수 있다.
다음으로, 본 발명의 실시예에 따른 강의 콘텐츠 생성 방법을 설명하기로 한다. 도 3은 본 발명의 실시예에 따른 강의 콘텐츠 생성 방법을 설명하기 위한 흐름도이다.
도 3을 참조하면, 제어부(160)의 콘텐츠생성부(161)는 S110 단계에서 오디오부(120)를 통해 강의 음성을 녹음하고, 녹음된 음성을 포함하는 오디오 파일을 생성한다.
그런 다음, 콘텐츠생성부(161)는 S120 단계에서 오디오 파일의 음성을 텍스트로 인식하여 인식된 텍스트를 포함하는 텍스트 파일을 생성한다. 이때, 콘텐츠생성부(161)는 STT(Speech To Text) 기법과 같은 음성 인식 기술에 따라 음성을 텍스트로 인식할 수 있다. 이를 위하여, 콘텐츠생성부(161)는 인식기를 포함할 수 있다. 인식기는 전방전달신경망(FNN: feedforward neural network), 순환인공신경망(RNN: Recurrent neural network), 합성곱신경망(CNN: convolutional neural networks), 코헨자기조직신경망(KSN: kohonen self-organizing network) 등의 인공신경망(ANN: artificial neural network)을 비롯하여 트리인식기, 서포트 벡터 머신(SVM: support vector machine), 퍼셉트론(perceptron), RBF(radial basis function) 등을 예시할 수 있다.
텍스트 파일을 생성한 후, 콘텐츠생성부(161)는 S130 단계에서 텍스트 파일에 포함된 텍스트의 문법적 오류를 수정한다.
이어서, 콘텐츠생성부(161)는 S140 단계에서 상호 대응하는 오디오 파일의 음성과 텍스트 파일의 텍스트를 동기화시킨다. 이는 타임스탬프를 통해 이루어질 수 있다.
다음으로, 콘텐츠생성부(161)는 S150 단계에서 동기화된 오디오 파일 및 텍스트 파일을 포함하는 강의 콘텐츠를 생성하고, 이를 저장부(150)에 저장한다.
전술한 바와 같이, 강의 콘텐츠를 생성한 후, 사용자의 요청에 따라 강의 콘텐츠를 재생할 수 있다. 그러면, 본 발명의 실시예에 따른 강의 콘텐츠를 재생하는 방법에 대해서 설명하기로 한다. 도 4는 본 발명의 실시예에 따른 강의 콘텐츠를 재생하는 방법을 설명하기 위한 흐름도이다.
도 4를 참조하면, 콘텐츠재생부(163)는 S210 단계에서 저장부(150)에 저장된 강의 콘텐츠의 텍스트 파일로부터 텍스트를 추출하여 표시부(140)를 통해 표시한다.
이때, 사용자는 표시부(140) 혹은 입력부(130)를 통해 표시된 텍스트 중 일부 텍스트를 선택할 수 있다. 그러면, 콘텐츠재생부(163)는 S220 단계에서 표시부(140) 혹은 입력부(130)를 통해 선택되는 텍스트를 감지할 수 있다.
또한, 사용자는 텍스트를 선택한 후, 표시부(140) 혹은 입력부(130)를 통해 재생 기능, 하이라이트 기능 및 텍스트 편집 기능 중 어느 하나를 선택할 수 있다.
이에 따라, 콘텐츠재생부(163)는 S230 단계에서 표시부(140) 혹은 입력부(130)를 통해 재생 기능이 선택되는지 여부를 감지한다. S230 단계의 판단 결과, 재생 기능이 선택되면, S240 단계로 진행한다.
S240 단계에서, 콘텐츠재생부(163)는 앞서(S220) 선택된 텍스트에 대응하는 부분의 강의 콘텐츠의 음성 파일의 위치를 검색한 후, 검색된 위치의 음성을 재생한다. 이러한 검색은 동기화에서 사용된 타임스탬프를 이용할 수 있다.
만약, S230 단계의 판단 결과, 재생 기능이 선택되지 않은 경우, 콘텐츠재생부(163)는 S250 단계에서 표시부(140) 혹은 입력부(130)를 통해 하이라이트 기능이 선택되는지 여부를 감지한다. S250 단계의 판단 결과, 하이라이트 기능이 선택되면, S260 단계로 진행한다.
S260 단계에서, 콘텐츠재생부(163)는 텍스트 파일의 전체 텍스트 중 앞서(S220) 선택된 텍스트와 동일한 텍스트를 모두 검색하여, 검색된 텍스트를 모두 하이라이트 표시하여 표시부(140)를 통해 표시한다.
만약, S250 단계의 판단 결과, 하이라이트 기능이 선택되지 않은 경우, 콘텐츠재생부(163)는 S250 단계에서 표시부(140) 혹은 입력부(130)를 통해 텍스트 편집 기능이 선택되는지 여부를 감지한다. S250 단계의 판단 결과, 텍스트 편집 기능이 선택되면, S280 단계로 진행한다.
S280 단계에서, 콘텐츠재생부(163)는 선택된 텍스트를 편집 가능한 상태로 전환하여 표시부(140)를 통해 표시한다. 즉, S210 단계의 텍스트 표시의 경우, 원본 훼손의 우려가 있기 때문에 읽기와 선택하기만 가능하지만, 텍스트를 선택하고, 편집 기능을 선택한 경우, 선택된 텍스트를 편집할 수 있도록 한다.
만약, S250 단계의 판단 결과, 텍스트 편집 기능이 선택되지 않은 경우, 콘텐츠재생부(163)는 S210 단계로 회귀한다.
전술한 바와 같은 본 발명에 따르면, 강의를 녹음한 오디오 파일을 기초로 텍스트 파일을 생성하고, 텍스트 파일과 오디오 파일을 동기화시키고, 텍스트 파일을 통해 강의를 검색할 수 있어, 사용자는 손쉽고 빠르게 원하는 부분의 강의 내용을 검색할 수 있다.
한편, 본 발명에 따른 강의 콘텐츠 생성 방법은 컴퓨터 시스템에 의해 실행되고 있는 프로그램 모듈과 같은 컴퓨터 실행가능 명령어와 관련하여 기술될 수 있다. 일반적으로, 프로그램 모듈은 특정 태스크를 수행하거나 특정 추상 데이터 유형을 구현하는 루틴, 프로그램, 오브젝트, 컴포넌트, 데이터 구조 등을 포함한다. 컴퓨터 실행가능 명령어, 관련 데이터 구조, 및 프로그램 모듈은 본 명세서에 개시된 발명의 행위를 실행하는 프로그램 코드 수단의 예를 나타낸다.
즉, 앞서 설명된 본 발명의 실시예에 따른 방법은 다양한 컴퓨터수단을 통하여 판독 가능한 프로그램 형태로 구현되어 컴퓨터로 판독 가능한 기록매체에 기록될 수 있다. 여기서, 기록매체는 프로그램 명령, 데이터 파일, 데이터구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 예컨대 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광 기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 와이어뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 와이어를 포함할 수 있다. 이러한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상 본 발명을 몇 가지 바람직한 실시예를 사용하여 설명하였으나, 이들 실시예는 예시적인 것이며 한정적인 것이 아니다. 이와 같이, 본 발명이 속하는 기술분야에서 통상의 지식을 지닌 자라면 본 발명의 사상과 첨부된 특허청구범위에 제시된 권리범위에서 벗어나지 않으면서 균등론에 따라 다양한 변화와 수정을 가할 수 있음을 이해할 것이다.
110: 통신부
120: 오디오부
130: 입력부
140: 표시부
150: 저장부
160: 제어부
161: 컨텐츠생성부
163: 컨텐츠재생부

Claims (6)

  1. 강의 콘텐츠 생성 장치에 있어서,
    강의 음성을 녹음하는 오디오부; 및
    상기 강의 음성을 포함하는 오디오 파일을 생성하고,
    상기 오디오 파일의 음성을 텍스트로 인식하여 인식된 텍스트를 포함하는 텍스트 파일을 생성하고,
    상기 오디오 파일의 음성과 상기 텍스트 파일의 텍스트를 동기화시킨 후,
    상기 동기화된 오디오 파일 및 텍스트 파일을 포함하는 강의 콘텐츠를 생성하는 콘텐츠생성부;를 포함하는 것을 특징으로 하는 강의 콘텐츠 생성 장치.
  2. 제1항에 있어서,
    상기 강의 콘텐츠 생성 장치는
    상기 텍스트 파일에 포함된 텍스트를 표시하는 표시부; 및
    상기 텍스트에 파일에 포함된 텍스트 중 일부의 텍스트가 선택되고, 재생 기능이 요청되면, 선택된 텍스트에 대응하는 부분의 음성 파일을 재생하는 콘텐츠재생부;를 더 포함하는 것을 특징으로 하는
    강의 콘텐츠 생성 장치.
  3. 제2항에 있어서,
    상기 콘텐츠재생부는
    상기 텍스트에 파일에 포함된 텍스트 중 일부의 텍스트가 선택되고, 하이라이트 기능이 요청되면, 선택된 텍스트와 동일한 텍스트를 모두 하이라이트 표시하여 상기 표시부를 통해 표시하는 것을 특징으로 하는
    강의 콘텐츠 생성 장치.
  4. 제2항에 있어서,
    상기 콘텐츠재생부는
    상기 텍스트에 파일에 포함된 텍스트 중 일부의 텍스트가 선택되고, 텍스트 편집 기능이 요청되면, 상기 선택된 텍스트를 편집 가능한 상태로 전환하는 것을 특징으로 하는
    강의 콘텐츠 생성 장치.
  5. 강의 콘텐츠 생성 방법에 있어서,
    강의 음성을 녹음하여 상기 강의 음성을 포함하는 오디오 파일을 생성하는 단계;
    상기 오디오 파일의 음성을 텍스트로 변환하여 텍스트 파일을 생성하는 단계;
    상기 오디오 파일의 음성과 상기 텍스트 파일의 텍스트를 동기화시키는 단계; 및
    상기 동기화된 오디오 파일 및 텍스트 파일을 포함하는 강의 콘텐츠를 생성하는 단계;를 포함하는 것을 특징으로 하는
    강의 콘텐츠 생성 방법.
  6. 제5항에 있어서,
    상기 텍스트 파일에 포함된 텍스트를 표시하는 단계;
    상기 텍스트에 파일에 포함된 텍스트 중 일부의 텍스트가 선택되고, 재생 기능이 요청되면, 선택된 텍스트에 대응하는 부분의 음성 파일을 재생하는 단계;를 더 포함하는 것을 특징으로 하는
    강의 콘텐츠 생성 방법.
KR1020180128289A 2018-10-25 2018-10-25 강의 콘텐츠 생성 장치 및 이를 위한 방법 KR20200046734A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180128289A KR20200046734A (ko) 2018-10-25 2018-10-25 강의 콘텐츠 생성 장치 및 이를 위한 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180128289A KR20200046734A (ko) 2018-10-25 2018-10-25 강의 콘텐츠 생성 장치 및 이를 위한 방법

Publications (1)

Publication Number Publication Date
KR20200046734A true KR20200046734A (ko) 2020-05-07

Family

ID=70734196

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180128289A KR20200046734A (ko) 2018-10-25 2018-10-25 강의 콘텐츠 생성 장치 및 이를 위한 방법

Country Status (1)

Country Link
KR (1) KR20200046734A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220010109A (ko) * 2020-07-17 2022-01-25 윤종식 무료 학습 큐레이션 서비스를 제공하는 서버 및 방법
KR102534774B1 (ko) * 2022-09-02 2023-05-26 (주) 아하 디지털 교재의 진도 정보에 따라 능동적으로 온오프를 제어하는 전자칠판 및 그것의 온오프 제어방법
KR20230089385A (ko) 2021-12-13 2023-06-20 경상국립대학교산학협력단 다수 개의 영상을 활용한 강의 콘텐츠 제작 모듈 및 이를 포함하는 플랫폼, 이를 이용한 강의 콘텐츠 제작 방법
KR102603508B1 (ko) * 2023-05-12 2023-11-17 (주) 아하 전력 효율성이 향상된 전자칠판 및 그것의 온오프 제어방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140062247A (ko) 2012-11-14 2014-05-23 전소연 이동 통신 단말기에서의 강좌 텍스트 데이터 생성 방법과 이를 이용한 이동 통신 단말기

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140062247A (ko) 2012-11-14 2014-05-23 전소연 이동 통신 단말기에서의 강좌 텍스트 데이터 생성 방법과 이를 이용한 이동 통신 단말기

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220010109A (ko) * 2020-07-17 2022-01-25 윤종식 무료 학습 큐레이션 서비스를 제공하는 서버 및 방법
KR20230089385A (ko) 2021-12-13 2023-06-20 경상국립대학교산학협력단 다수 개의 영상을 활용한 강의 콘텐츠 제작 모듈 및 이를 포함하는 플랫폼, 이를 이용한 강의 콘텐츠 제작 방법
KR102534774B1 (ko) * 2022-09-02 2023-05-26 (주) 아하 디지털 교재의 진도 정보에 따라 능동적으로 온오프를 제어하는 전자칠판 및 그것의 온오프 제어방법
KR102603508B1 (ko) * 2023-05-12 2023-11-17 (주) 아하 전력 효율성이 향상된 전자칠판 및 그것의 온오프 제어방법

Similar Documents

Publication Publication Date Title
US11727914B2 (en) Intent recognition and emotional text-to-speech learning
KR20200046734A (ko) 강의 콘텐츠 생성 장치 및 이를 위한 방법
US20220115019A1 (en) Method and system for conversation transcription with metadata
JP6463825B2 (ja) 多重話者音声認識修正システム
US10089974B2 (en) Speech recognition and text-to-speech learning system
JP6987124B2 (ja) 通訳装置及び方法(device and method of translating a language)
WO2018227761A1 (zh) 一种教学录播数据修正装置
US20210243528A1 (en) Spatial Audio Signal Filtering
EP3701521B1 (en) Voice recognition apparatus and operation method thereof cross-reference to related application
US11527251B1 (en) Voice message capturing system
US11869508B2 (en) Systems and methods for capturing, processing, and rendering one or more context-aware moment-associating elements
KR20160056734A (ko) 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체
KR102023157B1 (ko) 휴대 단말기의 사용자 음성 녹음 및 재생 방법 및 장치
CN106067310A (zh) 录音数据处理方法及装置
US10181312B2 (en) Acoustic system, communication device, and program
CN114999464A (zh) 语音数据处理方法及装置
CN117321603A (zh) 用于多语言处理的系统、方法和界面
KR101336256B1 (ko) 음성 기반 멀티미디어 컨텐츠 태깅 방법 및 장치
US10657202B2 (en) Cognitive presentation system and method
US11798542B1 (en) Systems and methods for integrating voice controls into applications
KR102438364B1 (ko) 인공지능 기반 작곡 서비스 제공 장치 및 방법
US20230368785A1 (en) Processing voice input in integrated environment
US20240087574A1 (en) Systems and methods for capturing, processing, and rendering one or more context-aware moment-associating elements
US20220189467A1 (en) User-perceived latency while maintaining accuracy
KR20180103273A (ko) 음성 합성 장치 및 음성 합성 방법

Legal Events

Date Code Title Description
E601 Decision to refuse application