KR20160144104A - 음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템 - Google Patents

음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템 Download PDF

Info

Publication number
KR20160144104A
KR20160144104A KR1020150080435A KR20150080435A KR20160144104A KR 20160144104 A KR20160144104 A KR 20160144104A KR 1020150080435 A KR1020150080435 A KR 1020150080435A KR 20150080435 A KR20150080435 A KR 20150080435A KR 20160144104 A KR20160144104 A KR 20160144104A
Authority
KR
South Korea
Prior art keywords
data
learning
text
unit
syllable
Prior art date
Application number
KR1020150080435A
Other languages
English (en)
Inventor
김경태
Original Assignee
김경태
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김경태 filed Critical 김경태
Priority to KR1020150080435A priority Critical patent/KR20160144104A/ko
Publication of KR20160144104A publication Critical patent/KR20160144104A/ko

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

본 발명은 음성인식 기반의 학습용 단말에 관한 것으로서, 학습 과정에서 발생한 학습결과인 음성데이터를 외부로부터 전달받아 음성인식 처리하고, 처리된 음성데이터와 상기 학습 과정에 대한 정답 데이터를 비교하여 비교결과를 음성데이터의 정답 여부로서 출력하는 음성데이터 처리부와, 외부로부터 전달받은 사진데이터와 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 각각 처리하여, 처리된 사진데이터와 상기 처리된 사진데이터에 대한 정답 데이터를 생성하고, 이를 매칭하여 새로운 학습자료로서 생성하는 자료생성 처리부를 포함하는 컨텐츠 처리부, 그리고 상기 컨텐츠 처리부에서 생성된 학습자료를 저장하거나 외부의 서버에 저장된 학습자료를 전달받아 저장하는 컨텐츠 저장부를 포함하는 것을 특징으로 한다. 이로 인해, 어린이의 학습 발달 정도에 따른 효과적인 학습 단계를 제공하게 되어, 어린이의 학습에 대한 흥미를 증진하고 연령 또는 학습 발달 단계에 따라 효율적으로 학습을 진행할 수 있는 효과가 있다.

Description

음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템{EDUCATIONAL TERMINAL BASED VOICE RECOGNITION, EDUCATION SYSTEM BASED VOICE RECOGNITION}
본 발명은 음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템에 관한 것이다.
학습을 보조하기 위한 시스템으로서, 디지털 디스플레이장치에 학습 화면을 출력하고, 출력된 학습 화면을 학습자가 모니터링하며 학습의 효과를 창출하는 학습 구조가 이미 개시되어 있다.
학습의 주체가 되는 학습자는 출력된 학습 화면을 모니터링하여 학습 결과를 입력하고, 입력된 학습 결과에 따라 정답 여부를 디지털 디스플레이장치에 출력하여 학습을 수행하도록 한다.
그리고, 이러한 학습 구조에 있어서, 학습자는 음성 데이터 형태의 학습 결과를 입력하고, 처리부에서는 이를 수신 및 분석하여 정답 여부를 판단하여 판단 결과를 디지털 디스플레이장치에 출력할 수 있다.
이처럼 학습자의 주도적인 학습을 요구하는 종래의 학습 구조로서, 대한민국 등록특허 제1031405호, 음성합성과 음성인식 기능이 채택된 단말기를 이용한 학습 방법에서는 음성인식을 이용한 학습 방법을 개시하고 있다.
그러나, 등록특허의 경우 정확한 음성데이터를 입력해야 효율적인 음성인식을 수행할 수 있어 유아용 학습 도구로 이용하기에는 음성 인식 효율이 현저히 낮아 학습 효과를 창출하는 데 한계가 있다.
그리고, 등록특허의 경우 학습 문제와 그에 대한 정답을 직접 입력하여 스스로 문제출제를 할 수 있는 것을 특징으로 하나, 단말기 키패드 상의 문자 또는 숫자 등을 조합하여 문제를 출제하는 것에 대해서만 제시하고 있어, 미디어 콘텐츠를 통한 문제출제, 그리고 다수의 학습자들이 이를 공유할 수 있는 구조가 필요한 실정이다.
본 발명이 이루고자 하는 기술적 과제는 음성인식 범위를 확대시켜 음성인식률이 향상된 학습 도구를 제공하기 위한 것이다.
본 발명이 이루고자 하는 다른 기술적 과제는 학습자가 사진 및 음성데이터를 입력하여 문제를 생성하고, 생성된 문제를 다른 학습자들과 공유하여 학습 효율을 증진하기 위한 학습 시스템을 제공하기 위한 것이다.
본 발명의 한 실시예에 따른 음성인식 기반의 학습용 단말은 학습 과정에서 발생한 학습결과인 음성데이터를 외부로부터 전달받아 음성인식 처리하고, 처리된 음성데이터와 상기 학습 과정에 대한 정답 데이터를 비교하여 비교결과를 음성데이터의 정답 여부로서 출력하는 음성데이터 처리부와, 외부로부터 전달받은 사진데이터와 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호에 따라 상기 사진데이터에 대한 정답 데이터를 생성하고, 이를 매칭하여 새로운 학습자료로서 생성하는 자료생성 처리부를 포함하는 컨텐츠 처리부, 그리고 상기 컨텐츠 처리부에서 생성된 학습자료를 저장하거나 외부의 서버에 저장된 학습자료를 전달받아 저장하는 컨텐츠 저장부를 포함하는 것을 특징으로 한다.
상기 음성데이터 처리부는, 상기 학습과정에서 발생한 학습결과인 음성데이터를 음성인식 처리를 통해 텍스트로 변환하는 텍스트 변환부, 상기 텍스트 변환부에서 변환된 텍스트를 초성, 중성, 종성의 음절 단위로 분리하는 텍스트 분리부, 그리고 상기 텍스트 분리부에서 음절 단위로 분리된 초성, 중성, 종성을 전달받아 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 텍스트 비교부를 포함하는 것을 특징으로 한다.
한 예에서, 상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 초성을 변환하여, 유사 초성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 한다.
상기 텍스트 비교부는 된소리, 거센소리 및 예사소리 간에 상기 유사 초성을 변환하여 비교를 수행하는 것을 특징으로 한다.
상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 중성을 변환하여, 유사 중성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 한다.
상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 중/종성을 변환하여, 유사 중/중성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 한다.
상기 텍스트 비교부는 외부로부터 전달받은 입력신호에 따라, 상기 음절 단위로 분리된 초성, 중성, 종성 중 중/종성의 인식 허용 범위를 다르게 하여 상기 유사 중/종성을 변환하여 비교를 수행하는 것을 특징으로 한다.
상기 컨텐츠 처리부는, 외부로부터 전달받은 사진데이터를 편집 처리하는 사진 편집부, 상기 사진 편집부에서 편집된 사진데이터를 압축 처리하는 사진 압축부, 그리고 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호에 따라, 상기 압축 처리된 사진데이터에 대한 태그정보를 지정하는 태그 지정부를 포함하는 사진데이터 처리부를 더 포함하여, 외부로부터 전달받은 사진데이터를 처리하여 상기 자료생성 처리부로 전달하는 것을 특징으로 한다.
상기 학습 과정을 출력하는 디스플레이장치 또는 스피커장치를 포함하는 컨텐츠 출력부를 더 포함하는 것을 특징으로 한다.
상기 학습 과정에서 발생한 학습결과인 음성데이터, 상기 사진데이터, 또는 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 외부로부터 전달받는 컨텐츠 수신부를 더 포함하는 것을 특징으로 한다.
상기 컨텐츠 수신부는 유선통신 또는 무선통신을 통해 외부로부터 상기 학습 과정에서 발생한 학습결과인 음성데이터, 상기 사진데이터, 또는 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 전달받는 것을 특징으로 한다.
상기 컨텐츠 수신부는 WiFi 또는 Bluetooth 형태의 무선통신을 통해 외부로부터 상기 학습 과정에서 발생한 학습결과인 음성데이터, 상기 사진데이터, 또는 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 전달받는 것을 특징으로 한다.
본 발명의 한 실시예에 따른 음성인식 기반의 학습 시스템은 학습 과정에서 발생한 학습결과인 음성데이터를 외부로부터 전달받아 음성인식 처리하고, 처리된 음성데이터와 상기 학습 과정에 대한 정답 데이터를 비교하여 비교결과를 음성데이터의 정답 여부로서 출력하는 음성데이터 처리부와, 외부로부터 전달받은 사진데이터와 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호에 따라 상기 사진데이터에 대한 정답 데이터를 생성하고, 이를 매칭하여 새로운 학습자료로서 생성하는 자료생성 처리부를 포함하는 컨텐츠 처리부, 그리고 상기 컨텐츠 처리부에서 생성된 학습자료를 저장하거나 외부로부터 학습자료를 전달받아 저장하는 컨텐츠 저장부를 포함하는 학습용 단말, 그리고 상기 학습용 단말과 접속되어 상기 컨텐츠 처리부에서 생성된 학습자료를 전달받아 저장하고, 상기 학습용 단말에서 발생한 학습자료 요청에 따라 다른 학습용 단말로부터 전달받아 저장하고 있는 학습자료를 상기 학습자료 요청을 발생한 해당 학습용 단말로 전달하는 서버를 포함하는 것을 특징으로 한다.
한 예에서, 학습 과정에서 발생한 학습결과인 음성데이터를 발생하여 상기 학습용 단말로 전달하는 학습용 보조 단말을 더 포함하는 것을 특징으로 한다.
상기 학습용 보조 단말은 마이크인 것을 특징으로 한다.
상기 사진데이터, 그리고 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 발생하여 상기 학습용 단말로 전달하는 학습자료 생성 단말을 더 포함하는 것을 특징으로 한다.
상기 학습자료 생성 단말은 상기 사진데이터를 생성하기 위한 카메라, 상기 사진데이터와 함께 입력된 음성데이터를 생성하기 위한 마이크, 그리고 상기 상기 사진데이터와 함께 입력된 입력신호를 생성하기 위한 입력장치 중 적어도 하나를 포함하는 것을 특징으로 한다.
상기 학습자료 생성 단말은 스마트폰 또는 태블릿 피씨인 것을 특징으로 한다.
상기 학습자료 생성 단말은 상기 학습용 단말과 무선 통신을 통해 상기 사진데이터, 그리고 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 전달하는 것을 특징으로 한다.
상기 음성데이터 처리부는, 상기 학습과정에서 발생한 학습결과인 음성데이터를 음성인식 처리를 통해 텍스트로 변환하는 텍스트 변환부, 상기 텍스트 변환부에서 변환된 텍스트를 초성, 중성, 종성의 음절 단위로 분리하는 텍스트 분리부, 그리고 상기 텍스트 분리부에서 음절 단위로 분리된 초성, 중성, 종성을 전달받아 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 텍스트 비교부를 포함하는 것을 특징으로 한다.
상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 초성을 변환하여, 유사 초성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 한다.
상기 텍스트 비교부는 된소리, 거센소리 및 예사소리 간에 상기 유사 초성을 변환하여 비교를 수행하는 것을 특징으로 한다.
상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 중성을 변환하여, 유사 중성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 한다.
상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 중/종성을 변환하여, 유사 중/중성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 한다.
상기 텍스트 비교부는 외부로부터 전달받은 입력신호에 따라, 상기 음절 단위로 분리된 초성, 중성, 종성 중 중/종성의 인식 허용 범위를 다르게 하여 상기 유사 중/종성을 변환하여 비교를 수행하는 것을 특징으로 한다.
상기 컨텐츠 처리부는, 외부로부터 전달받은 사진데이터를 편집 처리하는 사진 편집부, 상기 사진 편집부에서 편집된 사진데이터를 압축 처리하는 사진 압축부, 그리고 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호에 따라, 상기 압축 처리된 사진데이터에 대한 태그정보를 지정하는 태그 지정부를 포함하는 사진데이터 처리부를 더 포함하여, 외부로부터 전달받은 사진데이터를 처리하여 상기 자료생성 처리부로 전달하는 것을 특징으로 한다.
상기 학습 과정을 출력하는 디스플레이장치 또는 스피커장치를 포함하는 컨텐츠 출력부를 더 포함하는 것을 특징으로 한다.
이러한 특징에 따르면, 학습용 보조 단말에서 발생된 음성 데이터를 학습용 단말에서 분석하되, 학습용 단말에서 음성인식 범위를 조절할 수 있어 학습자인 유아의 성장 정도에 따라 학습 단계를 진행할 수 있는 효과가 있다.
그리고, 학습자료 생성 단말에서 사진데이터 또는 음성데이터를 발생하여 학습용 단말에 저장된 학습자료 외의 새로운 학습자료를 컨텐츠로서 생성하여 학습 효과를 향상시킬 수 있고, 생성된 새로운 학습자료를 공유하여 학습자료의 가용성이 향상되는 효과가 있다.
도 1은 본 발명의 한 실시예에 따른 음성인식 기반의 학습 시스템의 구조를 나타낸 블록도이다.
도 2는 본 발명의 한 실시예에 따른 음성인식 기반의 학습용 단말의 구조를 나타낸 블록도이다.
도 3은 본 발명의 한 실시예에 따른 음성인식 기반의 학습용 단말에서 컨텐츠 처리부의 구조를 나타낸 블록도이다.
도 4는 본 발명의 한 실시예에 따른 음성인식 기반의 학습용 단말에서 음성데이터 처리부의 구조를 나타낸 블록도이다.
도 5는 본 발명의 한 실시예에 따른 음성인식 기반의 학습용 단말에서 사진데이터 처리부의 구조를 나타낸 블록도이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
그러면 첨부한 도면을 참고로 하여 본 발명의 한 실시예에 따른 음성인식 기반의 학습 시스템의 구조를 설명한다.
먼저, 도 1을 참고로 하여 본 발명의 한 실시예에 따른 음성인식 기반의 학습 시스템에 대해 설명하면, 본 발명의 한 실시예에 따른 음성인식 기반의 학습 시스템은 학습용 단말(100), 학습용 보조 단말(200), 학습자료 생성 단말(300), 그리고 서버(400)를 포함한다.
학습용 단말(100)은 학습자료를 출력하거나 외부로부터 학습결과를 전달받아 처리하고, 생성 요청된 학습자료를 전달받아 학습자료로서 생성하며, 학습자료를 출력하기 위한 디스플레이장치를 구비하는 것이 좋다.
학습용 보조 단말(200)은 학습결과를 생성하여 학습용 단말(100)로 전송한다.
이때, 생성된 학습결과는 음성데이터일 수 있다.
그리고 이때, 학습용 보조 단말(200)은 음성데이터를 생성하기 위해 마이크 형태의 입력장치를 포함하여 형성되는 것이 좋다.
한 예에서, 학습용 보조 단말(200)이 도 1에 도시한 것처럼 학습용 단말(100)과 별개로 형성된 경우, 학습용 단말(100)과 유선으로 연결되어 생성한 음성데이터인 학습결과를 학습용 단말(100)로 전달한다.
그러나, 다른 한 예에서, 학습용 보조 단말(200)은 무선 통신을 통해 학습용 단말(100)과 연결되어, 생성한 음성데이터인 학습결과를 학습용 단말(100)로 전달할 수 있다.
이때, 학습용 보조 단말(200)과 학습용 단말(100)은 동일한 프로토콜의 무선통신을 수행하도록 형성되어, 해당 무선 통신의 프로토콜을 통해 생성된 음성데이터의 학습결과를 송수신하는 것이 좋다.
한 예에서, 학습용 보조 단말(200)과 학습용 단말(100) 간에 수행되는 무선 통신은 WiFi, 블루투스(Bluetooth) 등이 해당된다.
학습용 보조 단말(200)은 사용자 단말인 스마트폰, 태블릿 피씨 등의 형태로 형성될 수 있다.
그리고, 학습자료 생성 단말(300)은 학습자료를 생성 요청하여 학습용 단말(100)로 전송한다.
이때, 생성 요청된 학습자료는 음성데이터 및 사진데이터 중 적어도 하나일 수 있다.
학습자료 생성 단말(300)은 음성데이터를 생성하기 위한 마이크 형태의 입력장치와, 사진데이터를 생성하기 위한 카메라 형태의 입력장치를 포함하여 형성되는 것이 좋다.
그리고 이때, 학습자료 생성 단말(300)은 입력신호를 발생하기 위한 터치입력부 또는 키패드부를 더 포함하여 형성되는 것이 좋다.
이러한 학습자료 생성 단말(300)은 학습용 단말(100)과 유선 통신 또는 무선 통신을 통해, 생성한 사진데이터, 음성데이터 또는 입력신호를 학습용 단말(100)로 전송한다.
이때, 학습자료 생성 단말(300)이 학습용 단말(100)과 무선 통신을 통해 사진데이터, 음성데이터 또는 입력신호를 학습용 단말(100)로 전송하는 경우, 학습자료 생성 단말(300)과 학습용 단말(100)은 동일한 프로토콜의 무선통신을 수행하도록 무선통신모듈을 각각 포함하여 형성되는 것이 좋다.
한 예에서, 학습자료 생성 단말(300)과 학습용 단말(100) 간에 수행되는 무선 통신은 WiFi, 블루투스(Bluetooth)을 통해 무선 연결될 수 있다.
이러한 학습자료 생성 단말(300)은 사용자 단말인 스마트폰, 태블릿 피씨 등의 형태로 형성될 수 있다.
이처럼, 학습용 보조 단말(200)과 학습자료 생성 단말(300)이 학습용 단말(100)과 별개로 형성되어 각각 연결되거나 접속하는 형태를 통해 음성데이터 형태의 학습결과와, 사진데이터, 음성데이터 또는 입력신호 형태의 학습자료 생성 요청을 학습용 단말(100)로 전송할 수 있으나, 다른 한 예에서, 학습용 보조 단말(200)과 학습자료 생성 단말(300)은 학습용 단말(100) 내부에 형성되는 구조로 형성될 수 있다.
그리고, 서버(400)는 학습용 단말(100)과 연결되어 학습용 단말(100)로부터 학습자료를 전달받아 저장하거나, 저장하고 있는 학습자료를 학습용 단말(100)로 전달한다.
이러한 구조를 갖는 음성인식 기반의 학습 시스템에서, 도 2 내지 도 5를 참고로 하여 학습용 단말(100)의 구조를 좀더 자세하게 설명하면, 학습용 보조 단말(200)과 학습자료 생성 단말(300) 및 서버(400)와 연결되는 학습용 단말(100)은 컨텐츠 저장부(110), 컨텐츠 처리부(120), 컨텐츠 출력부(130) 및 컨텐츠 수신부(140)를 포함하여 구성된다.
컨텐츠 저장부(110)는 컨텐츠 처리부(120)로부터 처리된 컨텐츠를 전달받아 저장한다.
컨텐츠 처리부(120)는 컨텐츠 수신부(140)로부터 수신된 컨텐츠를 전달받아 처리하여, 처리된 컨텐츠로서 컨텐츠 저장부(110)로 전달한다.
그리고, 컨텐츠 출력부(130)는 컨텐츠 처리부(120)로부터 처리된 컨텐츠를 전달받아 출력하고, 컨텐츠 수신부(140)로부터 수신된 컨텐츠를 전달받아 출력하고, 컨텐츠 저장부(110)에 저장된 컨텐츠를 전달받아 출력한다.
이때, 컨텐츠 출력부(130)는 디스플레이장치와 스피커를 포함하고, 디스플레이장치는 처리된 컨텐츠, 수신된 컨텐츠 및 저장된 컨텐츠를 각각 출력한다.
이러한 컨텐츠 출력부(130)는 학습자료 및 이를 이용한 일련의 학습과정을 출력하는데, 수신된 컨텐츠에 따라 적용되는 학습과정을 실시간으로 출력하며, 저장된 컨텐츠를 확인하는 과정도 실시간으로 출력한다.
그리고, 컨텐츠 수신부(140)는 외부로부터 수신한 컨텐츠를 컨텐츠 출력부(130)로 전달하여 디스플레이장치에 출력하고, 컨텐츠 처리부(120)로 전달하여 처리한다.
이때, 컨텐츠 수신부(140)는 학습용 보조 단말(200)로부터 전달받은 음성데이터이거나, 학습자료 생성 단말(300)로부터 전달받은 생성 요청된 학습자료이다.
위에서 이미 설명한 것처럼, 컨텐츠 수신부(140)가 학습자료 생성 단말(300)로부터 전달받는 생성 요청된 학습자료는, 사진데이터, 음성데이터 또는 입력신호이다.
컨텐츠 수신부(140)는 유선 케이블 또는 무선통신 모듈을 통해 학습용 보조 단말(200) 및 학습자료 생성 단말(300)과 연결되어 학습용 보조 단말(200) 및 학습자료 생성 단말(300)로부터 데이터들을 수신한다.
한 예에서, 이러한 구조를 갖는 학습용 단말(100)은 디스플레이장치를 포함하는 티브이나 모니터 형태로 형성될 수 있는데, 이때, 출력화면은 컨텐츠 출력부(130)이고, 컨텐츠 저장부(110), 컨텐츠 처리부(120) 및 컨텐츠 수신부(140)는 그 내부에 각각 형성될 수 있다.
그리고, 다른 한 예에서, 학습용 단말(100)은 사용자 단말 형태로 형성될 수 있고, 스마트폰 또는 태블릿 피씨 형태로 형성될 수 있다.
또한, 학습용 단말(100)이 사용자 단말 형태로 형성된 경우, 위에서 이미 설명한 것처럼, 학습용 단말(100)은 학습용 보조 단말(200)과 학습자료 생성 단말(100)을 내부에 포함하는 구조로 형성될 수 있다.
도 3 내지 도 5를 참고로 하여 학습용 단말(100)의 컨텐츠 처리부(120)의 구조 및 처리에 대해 좀더 자세히 설명하면, 컨텐츠 처리부(120)는 수신된 컨텐츠를 처리하기 위한 구조로서, 음성데이터 처리부(121), 사진데이터 처리부(122) 및 자료생성 처리부(123)를 포함한다.
이때, 음성데이터 처리부(121)는 학습용 보조 단말(200)에서 생성되어 학습용 단말(100)로 전달된 음성데이터를 분석하여 정답데이터와 비교하는 처리와, 학습자료 생성 단말(300)에서 생성되어 학습용 단말(100)로 전달된 음성데이터를 분석하여 자료생성 처리부(123)로 전달하는 처리를 수행한다.
좀더 자세하게는, 음성데이터 처리부(121)는 도 4에 도시한 것처럼, 텍스트 변환부(1211), 텍스트 분리부(1212) 및 분리 텍스트 비교부(1213)를 포함하고, 텍스트 변환부(1211)는 학습용 보조 단말(200) 및 학습자료 생성 단말(300)로부터 전달받은 음성데이터를 텍스트로 변환한다.
한 예에서, 텍스트 변환부(1211)는 음성데이터를 텍스트 데이터로 변환하는데, 이는, 구글 사에서 제공하는 보이스 레코그나이저 서비스를 이용할 수 있다.
이때, 텍스트 변환부(1211)가 학습용 보조 단말(200)로부터 전달받은 음성데이터를 텍스트로 변환한 경우, 변환된 텍스트를 텍스트 분리부(1212)로 전달한다.
그러나 이때, 텍스트 변환부(1211)가 학습자료 생성 단말(300)로부터 전달받은 음성 데이터를 텍스트로 변환한 경우, 변환된 텍스트를 자료 생성 처리부(123)로 전달한다.
그리고, 텍스트 분리부(1212)는 텍스트 변환부(1211)로부터 텍스트를 전달받아, 초성, 중성 및 종성으로 각각 분리하여, 분리된 음절을 분리 텍스트 비교부(1213)로 전달한다.
예로써, 텍스트 분리부(1212)가 텍스트 변환부(1211)로부터 전달받은 텍스트가 '바나나'인 경우, 텍스트 분리부(1212)는 '바나나'를 'ㅂ', 'ㅏ', 'ㄴ', 'ㅏ', 'ㄴ', 'ㅏ'로 각각의 음절로 분리한다.
이때, 'ㅂ'과 'ㄴ'은 각각 초성이고, 'ㅏ'는 중성이다.
다른 예로써, 텍스트 분리부(1212)가 텍스트 변환부(1211)로부터 전달받은 텍스트가 '딸기'인 경우, 텍스트 분리부(1212)는 '딸기'를 'ㄸ', 'ㅏ', 'ㄹ', 'ㄱ', 'ㅣ'로 각각의 음절로 분리하며, 이때, 'ㄸ', 'ㄱ'는 초성, 'ㅏ', 'ㅣ'는 중성이고 'ㄹ'은 종성이다.
분리 텍스트 비교부(1213)은 텍스트 분리부(1212)에서 음절 단위로 분리된 초성, 중성 및 종성을 전달받아, 정답 음절과 비교한다.
이때, 텍스트 비교부(1213)는 텍스트 분리부(1212)로부터 전달받은 음절 단위의 초성, 중성 및 종성을 정답 음절과 비교하기 위해서, 정답을 음절 단위로 분리하는 처리를 먼저 수행한다.
더욱 자세하게는, 텍스트 비교부(1213)는 텍스트 분리부(1212)로부터 음절 단위의 초성, 중성 및 종성을 전달받을 때, 전달받은 음절 단위의 초성, 중성 및 종성이 어떤 학습 단계에서 발생 했는지, 즉, 어떤 정답을 요구하는 문제에서 발생한 음절인 지를 미리 알고 있어, 해당 정답을 음절 단위로 미리 분리하여 구비하였다가, 이를 비교하여 비교결과를 출력한다.
예로써, 텍스트 비교부(1213)가 텍스트 분리부(1212)로부터 'ㄸ', 'ㅏ', 'ㄹ', 'ㄱ', 'ㅣ'라는 초성, 중성 및 종성 음절들을 전달받을 때, 텍스트 비교부(1213)는 해당 음절이 발생한 학습 단계인 문제의 정답이 '딸기'임을 미리 알고 있으므로, 정답인 '딸기'를 음절단위로 미리 분리하여 구비하였다가, 전달받은 음절들과 비교한다.
이때, 입력된 음절이 미리 구비해 둔 음절과 동일하므로, 분리 텍스트 비교부(1213)는 텍스트 일치 신호를 출력하여 컨텐츠 출력부(140)로 전달한다.
그러나 이때, 입력된 음절이 'ㄷ', 'ㅏ', 'ㄹ', 'ㄱ', 'ㅣ'로, 미리 구비해 둔 음절과 동일하지 않은 경우, 텍스트 불일치 신호를 출력하여 컨텐츠 출력부(140)로 전달한다.
이처럼, 분리 텍스트 비교부(1213)는 해당 정답에 대한 음절을 미리 분리해 두었다가, 텍스트 분리부(1212)로부터 전달받은 분리된 음절을 비교하여 텍스트 일치 여부를 판단한다.
그러나, 입력된 음성데이터를 정답 데이터와 비교하여 텍스트 일치 여부를 판단하는 것은, 발음이 부정확한 유아의 음성데이터에 적용하기에는 어렵다.
따라서, 본 발명의 학습용 단말(100) 및 이를 포함하는 음성인식 기반의 학습 시스템에서는 유아의 부정확한 발음에 의해 생성된 음성데이터에 단계별 인식 허용 범위를 적용하여 분리된 음절을 변형하고, 변형된 데이터를 미리 구비해둔 음절, 즉, 정답에 대한 음절과 비교하여 텍스트 일치 여부를 판단한다.
분리 텍스트 비교부(1213)의 단계별 인식 허용 범위는 제1 단계, 제2 단계 및 제3 단계로 구분될 수 있는데, 제1 단계에 따른 인식 허용 범위는 분리된 음절을 유사 초성 변환을 그 인식 허용 범위로 하고, 제2 단계에 따른 인식 허용 범위는 유사 초성 변환 또는 유사 중성 변환을 그 인식 허용 범위로 한다.
그리고, 제3 단계에 따른 인식 허용 범위는 유사 초성 변환, 유사 중성 변환 또는 유사 중/종성 변환을 그 인식 허용 범위로 한다.
이러한 제1 내지 제3 단계에 따른 인식 허용 범위를 적용한 비교 대상 음절과 정답에 대한 음절을 비교하여 텍스트 일치 여부를 판단하는 과정을 예를 들어 살펴보면, 먼저, 제1 단계에 따른 인식 허용 범위를 적용한 경우, 비교 대상 음절인 'ㄷ', 'ㅏ', 'ㄹ', 'ㄱ', 'ㅣ'은 'ㄸ'가 유사 초성인 'ㄷ'로 변환된 형태이므로, 첫 번째 초성인 'ㄷ'를 'ㄸ'로 변형하여 변형된 데이터를 생성한다.
이에 따라, 변형된 데이터는 'ㄸ', 'ㅏ', 'ㄹ', 'ㄱ', 'ㅣ'의 음절을 갖게 되며, 분리 텍스트 비교부(1213)는 변형된 데이터와 정답에 대한 음절을 비교하여 텍스트 일치 신호를 출력하여 컨텐츠 출력부(140)로 전달한다.
그리고, 제1 단계에 따른 인식 허용 범위에서는 위에서 설명한 것처럼 된소리와 예사소리 사이에서 변형될 수 있으며, 된소리, 거센소리, 예사소리 사이에서 변형될 수도 있다.
예로써, 비교 대상 음절이 'ㅌ', 'ㅏ', 'ㄹ', 'ㄱ', 'ㅣ'인 경우에도 'ㅌ'를 'ㄸ'로 변형하여 변형된 데이터를 생성할 수 있다.
또한, 제1 단계에 따른 인식 허용 범위는 유사발음을 갖는 초성 사이에서 변형될 수 있으며, 정답이 'ㄴ', 'ㅏ', 'ㅂ', 'ㅣ' 인 문제에서 비교 대상인 분리된 음절이 'ㄹ', 'ㅏ', 'ㅂ', 'ㅣ'인 경우, 첫 번째 초성인 'ㄹ'를 'ㄴ'로 변형하여 변형된 데이터를 생성하여 정답에 대한 음절과 비교한다.
그리고, 제2 단계에 따른 인식 허용 범위에서는 유사 초성 변환 또는 유사 중성 변환을 수행하여 변형된 데이터를 생성하는데, 예로써, 정답이 'ㅂ', 'ㅏ', 'ㄴ', 'ㅏ', 'ㄴ', 'ㅏ'인 문제에서, 비교 대상인 분리된 음절이 'ㅃ', 'ㅓ', 'ㄴ', 'ㅏ', 'ㄴ', 'ㅏ'인 경우, 첫 번째 초성인 'ㅃ'를 'ㅂ'로 변형하고, 첫 번째 초성인 'ㅓ'를 'ㅏ'로 변형하여 변형된 데이터('ㅂ', 'ㅏ', 'ㄴ', 'ㅏ', 'ㄴ', 'ㅏ')를 생성한다.
이때, 분리 텍스트 비교부(1213)는 변형된 데이터를 정답에 대한 음절과 비교하여 텍스트 일치 신호를 출력하고, 이를 컨텐츠 출력부(140)로 전달한다.
위의 예시에서는, 유사 초성 변환 및 유사 중성 변환을 모두 수행하여 변형된 데이터를 생성하였으나, 제2 단계에 따른 인식 허용 범위에서 유사 중성 변환만을 수행하여 변형된 데이터를 생성할 수 있다.
마지막으로, 제3 단계에 따른 인식 허용 범위에서는 유사 초성 변환, 유사 중성 변환 또는 유사 중/종성 변환을 수행하여 변형된 데이터를 생성하는데, 중/종성 변환은 ㅐ, ㅔ, ㅚ 등의 이중모음에 대해 수행된다.
제3 단계에 따른 인식 허용 범위의 예로써, 정답이 'ㅊ', 'ㅏ', 'ㅁ', 'ㅇ', 'ㅚ'인 문제에서, 비교 대상인 분리된 음절이 'ㅈ', 'ㅏ', 'ㅁ', 'ㅇ', 'ㅐ'인 경우, 첫 번째 초성인 'ㅈ'을 유사 초성인 'ㅊ'로 변형하고, 마지막 중/종성인 'ㅐ'를 유사 중/종성인 'ㅚ'로 변형하여 변형된 데이터('ㅊ', 'ㅏ', 'ㅁ', 'ㅇ', 'ㅚ')를 생성한다.
이때, 분리 텍스트 비교부(1213)은 변형된 데이터를 정답에 대한 음절과 비교하여 텍스트 일치 신호를 출력하고, 이를 컨텐츠 출력부(140)로 전달한다.
그리고, 분리 텍스트 비교부(1213)는 제3 단계에 따른 인식 허용 범위에 의해 유사 중/종성에 대해서만 변형을 수행하여 변형된 데이터를 생성하고 이를 정답에 대한 음절과 비교할 수 있다.
이처럼, 분리 텍스트 비교부(1213)는 제1 내지 제3 단계에 따른 음절 변형에 따라 텍스트 비교를 수행하여, 인식 허용 범위를 다양하게 하여 비교 대상 음절을 정답에 대한 음절과 비교할 수 있다.
제1 내지 제3 단계에 따른 음절 변형은 정해진 순번 없이 분리 텍스트 비교부(1213)에서 자체적으로 적용하여 변형된 데이터를 생성할 수 있다.
이로 인해, 발음이 부정확한 유아가 발생한 음성데이터로부터 생성된 음절 데이터의 정답 허용 범위를 늘려, 아이의 성장상태에 맞게 학습을 수행할 수 있게 된다.
그리고 이때, 유사 중성 변환과 유사 중/종성 변환은 아래의 표 1에 따라 적용될 수 있다.
원 발음 근접 발음
1단계 2단계 3단계
위의 표 1에서, 1단계, 2단계, 3단계로 설정될수록 인식 허용 범위가 높아진다. 이는 설정에 의해 적용될 수 있는 것으로, 학습자인 유아의 연령이 어리거나 발음이 부정확한 학습자인 경우 인식 대상 범위를 확대시켜 분석하기 위함이다.
예로써, 발음이 부정확한 학습자인 경우 3단계까지 인식 대상 범위를 지정하고, 상대적으로 발음이 정확한 학습자이거나 언어 능력이 향상되고 있는 학습자의 경우 1단계로 인식 대상 범위를 지정할 수 있다.
이러한 인식 대상 범위 지정은 학습자료 생성 단말(300)에서 생성한 입력신호로부터 설정될 수 있으며, 입력신호에 따라 설정된 인식 대상 범위는 학습용 단말(100)의 컨텐츠 처리부(120)로 전달됨으로써, 분리 텍스트 비교부(1213)의 변형된 데이터 생성 시 사용되게 된다.
도 4를 참고로 하여 설명한 음성데이터 처리부(121)의 구조에 따라, 컨텐츠 처리부(120)는 학습용 보조 단말(200)로부터 입력된 음성데이터를 분석하고, 변형된 데이터를 생성하여 확장된 인식 대상 범위에서 비교 대상 음절인 정답에 대한 음절과 비교를 수행함으로써 텍스트 일치 여부, 즉 학습용 보조 단말(200)에서 입력한 음성데이터의 정답 여부를 판별한다.
다시 도 3에 도시한 컨텐츠 처리부(120)의 사진데이터 처리부(122)를 도 5를 참고로 하여 설명하면, 사진데이터 처리부(122)는 사진 편집부(1221), 사진 압축부(1222) 및 태그 지정부(1223)를 포함하는 구조로 형성된다.
이때, 사진데이터 처리부(122)는 학습자료 생성 단말(300)에서 생성되어 학습용 단말(100)로 전달된 사진데이터를 처리하는 부분으로서, 사진 편집부(1221)는 사진데이터에서 학습자료로 사용할 부분을 자르는 편집을 수행한다.
예로써, 처리 중인 사진데이터는 학습용 단말(100)의 컨텐츠 출력부(130)에 실시간 출력되고, 학습자료 생성 단말(300)에서 학습용 단말(100)로 전달되는 입력 신호에 따라 편집 처리된다.
그리고, 사진 압축부(1222)는 사진 편집부(1221)에서 편집 처리된 사진데이터를 압축 처리하며, 태그 지정부(1223)는 입력 신호에 따라 압축 처리된 사진데이터 상에 태그정보를 지정한다.
이때, 태그 지정부(1223)는 학습자료 생성 단말(300)에서 생성된 입력 신호를 전달받아 태그를 지정하고, 사진데이터 상에 태그를 지정할 때 입력 신호에 따라 태그 문구를 지정할 수 있다.
본 발명의 한 실시예에서, 이러한 사진데이터 처리부(122)는 학습용 단말(100)에 포함되도록 형성될 수 있지만, 다른 실시예에서, 학습자료 생성 단말(200)에 형성되는 구조로 형성됨으로써, 사진데이터를 형성하는 학습자료 생성 단말(200)에서 사진데이터 형성 이외에도 사진 편집, 사진 압축 및 태그 정보 지정을 수행하도록 할 수 있다.
이처럼, 사진데이터 처리부(122)가 사진데이터를 형성함에 따라, 학습자료 생성 단말(200)에서 생성된 사진데이터가 학습자료로 생성되도록 처리할 수 있다.
자세하게는, 유아의 언어 학습을 위한 학습 구조에서, 학습용 단말(100)에 출력되는 사진데이터를 보고 학습용 보조 단말(200)을 통해 음성데이터를 입력하여 정답을 맞추는 경우, 학습용 단말(100)에 저장된 사진데이터 및 문제들만으로는 출제 문제에 한계가 있고, 학습자에 대한 맞춤형 컨텐츠 제공이 어렵다. 따라서, 학습자료 생성 단말(300)에서는 학습자에 대한 맞춤형 컨텐츠인 사진데이터와 이에 대한 정답인 음성데이터를 생성하여 학습자료를 생성하여 학습용 단말(100)에 제공한다.
따라서, 사진데이터 및 음성데이터 생성을 위한 학습자료 생성 단말(300)은 사진데이터를 학습용 단말(100)에 전달하여 사진데이터 처리부(122)에서 처리하는 것 이외에도 생성된 음성데이터 및 입력 신호를 학습용 단말(100)에 전달하여, 학습용 단말(100)은 사진데이터에 음성데이터 및 입력 신호를 매핑하여 자료생성 처리를 수행한다.
이때, 컨텐츠 처리부(120)의 자료생성 처리부(123)는 사진데이터 처리부(122)에서 처리된 사진데이터에, 학습자료 생성 단말(300)로부터 전달받은 음성데이터 및 입력 신호를 매핑하여 새로운 학습자료를 생성한다.
예로써, 자료생성 처리부(123)는 처리된 사진데이터에 대응되어 발생한 음성데이터를 분석하여 텍스트 형태로 변환하고, 변환된 텍스트를 학습용 단말(100)의 컨텐츠 출력부(130)에 출력하여 학습자료 생성 단말(300)로부터 해당 텍스트가 입력된 음성데이터와 일치하는 지의 여부에 대한 입력 신호에 따라 처리된 사진데이터와 해당 텍스트를 매칭시켜 자료로서 저장한다.
한 예에서, 학습자료 생성 단말(300)에서 생성한 음성데이터를 자료생성 처리부(123)에서 텍스트로 변환한 결과가 학습용 단말(100) 또는 학습자료 생성 단말(300)에 출력되고, 학습자료 생성 단말(300)에서 발생한 입력신호에 따라 변환되어 출력된 텍스트의 입력이 완료된다.
즉, 학습자료 생성 단말(300)에서 발생한 입력신호가 학습자료 생성 단말(300)에 출력된 텍스트가 잘못되었다는 것을 의미하는 신호인 경우, 자료생성 처리부(123)는 학습자료 생성 단말(300)에서 발생한 음성데이터를 변환한 해당 텍스트를 폐기 처리하고, 학습자료 생성 단말(300)로 새로운 음성데이터 생성을 요청한다.
그러나 이때, 학습자료 생성 단말(300)에서 발생한 입력신호가 학습자료 생성 단말(300)에 출력된 텍스트가 정상으로 변환되었다는 것을 의미하는 신호인 경우, 자료생성 처리부(123)는 변환한 해당 텍스트를 입력된 사진데이터에 매칭하여 자료로서 저장한다.
자료생성 처리부(123)가 사진데이터와 이에 대한 텍스트를 매칭시켜 저장할 때, 자료생성 처리부(123)는 학습자료 생성 단말(300)에서 발생한 태그정보를 태그 지정부(1223)로부터 전달받아 함께 매칭하여 저장한다.
이때, 자료생성 처리부(123)는 생성된 사진데이터와 이에 대한 텍스트 및 태그정보를 컨텐츠 저장부(110)에 학습자료로서 저장한다.
이처럼, 자료생성 처리부(123)는 사진데이터에 대한 정답 데이터인 음성데이터를 전달받아 텍스트로 변환하지만, 다른 한 예에서, 학습자료 생성 단말(300)이 정답 데이터를 음성데이터가 아닌 텍스트 형태의 입력신호로 생성하여 학습용 단말(100)로 전달함으로써, 자료생성 처리부(123)는 학습자료 생성 단말(300)로부터 텍스트 형태의 입력신호를 전달받아 사진데이터에 매칭하고, 학습자료 생성 단말(300)에서 발생한 입력신호로부터 지정된 태그정보도 함께 매칭하여 학습자료로서 컨텐츠 저장부(110)에 저장한다.
컨텐츠 처리부(120)는 도 3 내지 도 5를 참고로 하여 설명한 것처럼, 컨텐츠 처리부(120)가 구성됨에 따라, 컨텐츠 처리부(120)는 학습자료 생성 단말(300)로부터 전달받은 사진데이터, 음성데이터 및 입력신호에 따라 학습자료인 컨텐츠를 생성하여 컨텐츠 저장부(110)로 저장한다.
컨텐츠 저장부(110)는 컨텐츠 처리부(120)로부터 전달받아 저장하는 컨텐츠, 즉, 학습자료들을 카테고리 별로 분류하여 저장하고 있을 수 있다.
그리고, 컨텐츠 저장부(110)는 학습자료 생성 단말(300)에서 발생한 입력신호에 따라 저장하고 있는 컨텐츠인 학습자료를 외부로 송출하거나, 입력신호에 따라 외부로부터 컨텐츠인 학습자료를 전달받아 저장할 수 있다.
이러한 학습용 단말(100)은 서버(400)와 유선통신 또는 이동통신 등의 무선통신을 통해 접속되어 학습자료를 서버(400)로 전달하거나, 학습자료를 서버(400)로부터 전달받는다.
본 발명의 한 실시예에 따른 음성인식 기반의 학습 시스템이 도 1 내지 도 5를 참고로 하여 설명한 구조로 형성됨에 따라, 음성인식 기반의 학습용 단말인 도 1의 학습용 단말(100)은 학습 과정에서 발생한 음성데이터를 효과적으로 인식할 수 있고, 학습자료를 자체적으로 생성함으로써 학습자에 특성화된 학습자료를 생성할 수 있다.
그리고, 음성인식 기반의 학습 시스템은 음성인식을 통한 학습효과를 갖되, 학습자료 생성 단말(300)에서 생성한 컨텐츠인 학습자료를 공유할 수 있도록 서버(400)에서 중개하므로, 서로 다른 학습자료 생성 단말(300)에서 학습자료를 용이하게 업로드하고 다운로드하여 학습에 활용할 수 있게 된다.
이러한 본 발명의 음성인식 기반의 학습 시스템에서, 학습용 단말(100)과 학습자료 생성 단말(300)이 스마트폰이고, 학습용 보조 단말(200)이 마이크 입력장치로 형성되며 서버(400)를 포함하는 구조를 갖고, 학습용 보조 단말(200)은 학습자인 어린이이고, 학습자료 생성 단말(300)은 학부모인 경우를 예로 들어, 본 발명의 동작에 대한 실시예를 설명한다.
먼저, 학습자인 어린이의 어학 학습을 위해서, 부모가 학습용 단말(100)을 구동시켜 학습과정을 시작하면, 학습용 단말(100)의 컨텐츠 출력부(130)에서 학습화면을 출력하고 이에 따른 소리를 함께 출력한다.
그런 다음, 어린이는 학습용 단말(100)에 출력된 학습화면을 바라보며 정답을 학습용 보조 단말(200)인 마이크 입력장치에 대고 말한다.
이로 인해, 학습용 보조 단말(200)은 어린이의 목소리를 음성데이터로서 인식하여 해당 음성데이터를 학습용 단말(100)로 전송하고, 학습용 단말(100)은 수신한 음성데이터를 분석하여 출력중인 학습화면에 대한 정답 데이터와 비교한다.
이때, 음성데이터의 분석은 학습용 단말(100)의 컨텐츠 처리부(120), 그 중에서도 음성데이터 처리부(121)에서 이루어지며, 인식 허용 범위 단계를 서로 다르게 적용하며 입력된 음성데이터와 정답 데이터를 비교할 수 있다.
그리고 이때, 부모가 학습자료 생성 단말(300)을 통해 인식 허용 범위를 설정하는 입력신호를 생성하여 학습용 단말(100)로 전달함으로써, 어린이의 언어 능력에 따라 인식 범위를 조절한다.
이처럼, 인식 범위를 조절함에 따라, 학습용 단말(100)에서 어린이의 학습 발달 정도에 따른 효과적인 학습 단계를 제공하게 되어, 어린이의 학습에 대한 흥미를 증진하고 연령 또는 학습 발달 단계에 따라 효율적으로 학습을 진행할 수 있는 효과가 있다.
그리고, 부모는 학습자료 생성 단말(300)을 이용하여 학습자료로 사용할 사진을 촬영하고, 이에 대한 정답을 음성데이터 또는 텍스트 형태의 입력신호로 생성하여 학습용 단말(100)로 전달하고, 학습용 단말(100)은 전달받은 데이터들을 이용하여 새로운 학습자료로 생성함으로써, 부모가 어린이 개개인의 취향을 고려하여 직접 학습자료를 생성할 수 있어 최적의 문제를 생성할 수 있고, 문제의 다양성을 창출할 수 있다.
또한, 학습용 단말(100)은 생성된 학습자료를 저장하였다가, 서버(400)에 업로드하거나 서버(400)에 저장된 학습자료를 다운로드하여 학습용 단말(100)에 추가적으로 저장하여, 부모가 생성하여 각각의 학습용 단말(100)에 저장한 새로운 학습자료를 서로 다른 학습용 단말(100)에서 공유하여 보다 높은 학습자료를 제공하고 제공받을 수 있게 된다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
100 : 학습용 단말 110 : 컨텐츠 저장부
120 : 컨텐츠 처리부 130 : 컨텐츠 출력부
140 : 컨텐츠 수신부 200 : 학습용 보조 단말
300 : 학습자료 생성 단말 400 : 서버

Claims (27)

  1. 학습 과정에서 발생한 학습결과인 음성데이터를 외부로부터 전달받아 음성인식 처리하고, 처리된 음성데이터와 상기 학습 과정에 대한 정답 데이터를 비교하여 비교결과를 음성데이터의 정답 여부로서 출력하는 음성데이터 처리부와, 외부로부터 전달받은 사진데이터와 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호에 따라 상기 사진데이터에 대한 정답 데이터를 생성하고, 이를 매칭하여 새로운 학습자료로서 생성하는 자료생성 처리부를 포함하는 컨텐츠 처리부, 그리고
    상기 컨텐츠 처리부에서 생성된 학습자료를 저장하거나 외부의 서버에 저장된 학습자료를 전달받아 저장하는 컨텐츠 저장부
    를 포함하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  2. 제1항에 있어서,
    상기 음성데이터 처리부는,
    상기 학습과정에서 발생한 학습결과인 음성데이터를 음성인식 처리를 통해 텍스트로 변환하는 텍스트 변환부,
    상기 텍스트 변환부에서 변환된 텍스트를 초성, 중성, 종성의 음절 단위로 분리하는 텍스트 분리부, 그리고
    상기 텍스트 분리부에서 음절 단위로 분리된 초성, 중성, 종성을 전달받아 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 텍스트 비교부
    를 포함하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  3. 제2항에 있어서,
    상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 초성을 변환하여, 유사 초성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  4. 제3항에 있어서,
    상기 텍스트 비교부는 된소리, 거센소리 및 예사소리 간에 상기 유사 초성을 변환하여 비교를 수행하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  5. 제2항에 있어서,
    상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 중성을 변환하여, 유사 중성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  6. 제2항에 있어서,
    상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 중/종성을 변환하여, 유사 중/중성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  7. 제6항에 있어서,
    상기 텍스트 비교부는 외부로부터 전달받은 입력신호에 따라, 상기 음절 단위로 분리된 초성, 중성, 종성 중 중/종성의 인식 허용 범위를 다르게 하여 상기 유사 중/종성을 변환하여 비교를 수행하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  8. 제1항에 있어서,
    상기 컨텐츠 처리부는,
    외부로부터 전달받은 사진데이터를 편집 처리하는 사진 편집부,
    상기 사진 편집부에서 편집된 사진데이터를 압축 처리하는 사진 압축부, 그리고
    상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호에 따라, 상기 압축 처리된 사진데이터에 대한 태그정보를 지정하는 태그 지정부
    를 포함하는 사진데이터 처리부를 더 포함하여, 외부로부터 전달받은 사진데이터를 처리하여 상기 자료생성 처리부로 전달하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  9. 제1항에 있어서,
    상기 학습 과정을 출력하는 디스플레이장치 또는 스피커장치를 포함하는 컨텐츠 출력부를 더 포함하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  10. 제1항에 있어서,
    상기 학습 과정에서 발생한 학습결과인 음성데이터, 상기 사진데이터, 또는 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 외부로부터 전달받는 컨텐츠 수신부를 더 포함하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  11. 제10항에 있어서,
    상기 컨텐츠 수신부는 유선통신 또는 무선통신을 통해 외부로부터 상기 학습 과정에서 발생한 학습결과인 음성데이터, 상기 사진데이터, 또는 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 전달받는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  12. 제11항에 있어서,
    상기 컨텐츠 수신부는 WiFi 또는 Bluetooth 형태의 무선통신을 통해 외부로부터 상기 학습 과정에서 발생한 학습결과인 음성데이터, 상기 사진데이터, 또는 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 전달받는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  13. 학습 과정에서 발생한 학습결과인 음성데이터를 외부로부터 전달받아 음성인식 처리하고, 처리된 음성데이터와 상기 학습 과정에 대한 정답 데이터를 비교하여 비교결과를 음성데이터의 정답 여부로서 출력하는 음성데이터 처리부와, 외부로부터 전달받은 사진데이터와 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호에 따라 상기 사진데이터에 대한 정답 데이터를 생성하고, 이를 매칭하여 새로운 학습자료로서 생성하는 자료생성 처리부를 포함하는 컨텐츠 처리부, 그리고 상기 컨텐츠 처리부에서 생성된 학습자료를 저장하거나 외부로부터 학습자료를 전달받아 저장하는 컨텐츠 저장부를 포함하는 학습용 단말, 그리고
    상기 학습용 단말과 접속되어 상기 컨텐츠 처리부에서 생성된 학습자료를 전달받아 저장하고, 상기 학습용 단말에서 발생한 학습자료 요청에 따라 다른 학습용 단말로부터 전달받아 저장하고 있는 학습자료를 상기 학습자료 요청을 발생한 해당 학습용 단말로 전달하는 서버
    를 포함하는 것을 특징으로 하는 음성인식 기반의 학습 시스템.
  14. 제13항에 있어서,
    학습 과정에서 발생한 학습결과인 음성데이터를 발생하여 상기 학습용 단말로 전달하는 학습용 보조 단말을 더 포함하는 것을 특징으로 하는 음성인식 기반의 학습 시스템.
  15. 제14항에 있어서,
    상기 학습용 보조 단말은 마이크인 것을 특징으로 하는 음성인식 기반의 학습 시스템.
  16. 제13항에 있어서,
    상기 사진데이터, 그리고 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 발생하여 상기 학습용 단말로 전달하는 학습자료 생성 단말을 더 포함하는 것을 특징으로 하는 음성인식 기반의 학습 시스템.
  17. 제16항에 있어서,
    상기 학습자료 생성 단말은 상기 사진데이터를 생성하기 위한 카메라, 상기 사진데이터와 함께 입력된 음성데이터를 생성하기 위한 마이크, 그리고 상기 사진데이터와 함께 입력된 입력신호를 생성하기 위한 입력장치 중 적어도 하나를 포함하는 것을 특징으로 하는 음성인식 기반의 학습 시스템.
  18. 제16항에 있어서,
    상기 학습자료 생성 단말은 스마트폰 또는 태블릿 피씨인 것을 특징으로 하는 음성인식 기반의 학습 시스템.
  19. 제16항에 있어서,
    상기 학습자료 생성 단말은 상기 학습용 단말과 무선 통신을 통해 상기 사진데이터, 그리고 상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호를 전달하는 것을 특징으로 하는 음성인식 기반의 학습 시스템.
  20. 제13항에 있어서,
    상기 음성데이터 처리부는,
    상기 학습과정에서 발생한 학습결과인 음성데이터를 음성인식 처리를 통해 텍스트로 변환하는 텍스트 변환부,
    상기 텍스트 변환부에서 변환된 텍스트를 초성, 중성, 종성의 음절 단위로 분리하는 텍스트 분리부, 그리고
    상기 텍스트 분리부에서 음절 단위로 분리된 초성, 중성, 종성을 전달받아 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 텍스트 비교부
    를 포함하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  21. 제20항에 있어서,
    상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 초성을 변환하여, 유사 초성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  22. 제21항에 있어서,
    상기 텍스트 비교부는 된소리, 거센소리 및 예사소리 간에 상기 유사 초성을 변환하여 비교를 수행하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  23. 제20항에 있어서,
    상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 중성을 변환하여, 유사 중성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  24. 제20항에 있어서,
    상기 텍스트 비교부는 상기 음절 단위로 분리된 초성, 중성, 종성 중 유사 중/종성을 변환하여, 유사 중/중성 변환된 음절 단위의 초성, 중성, 종성을 상기 학습 과정에 대한 정답 데이터에 대한 음절과 비교하여, 상기 변환된 텍스트와 정답 데이터에 대한 텍스트의 일치 여부를 출력하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  25. 제24항에 있어서,
    상기 텍스트 비교부는 외부로부터 전달받은 입력신호에 따라, 상기 음절 단위로 분리된 초성, 중성, 종성 중 중/종성의 인식 허용 범위를 다르게 하여 상기 유사 중/종성을 변환하여 비교를 수행하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  26. 제13항에 있어서,
    상기 컨텐츠 처리부는,
    외부로부터 전달받은 사진데이터를 편집 처리하는 사진 편집부,
    상기 사진 편집부에서 편집된 사진데이터를 압축 처리하는 사진 압축부, 그리고
    상기 사진데이터와 함께 입력된 음성데이터 또는 입력신호에 따라, 상기 압축 처리된 사진데이터에 대한 태그정보를 지정하는 태그 지정부
    를 포함하는 사진데이터 처리부를 더 포함하여, 외부로부터 전달받은 사진데이터를 처리하여 상기 자료생성 처리부로 전달하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
  27. 제13항에 있어서,
    상기 학습 과정을 출력하는 디스플레이장치 또는 스피커장치를 포함하는 컨텐츠 출력부를 더 포함하는 것을 특징으로 하는 음성인식 기반의 학습용 단말.
KR1020150080435A 2015-06-08 2015-06-08 음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템 KR20160144104A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150080435A KR20160144104A (ko) 2015-06-08 2015-06-08 음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150080435A KR20160144104A (ko) 2015-06-08 2015-06-08 음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템

Publications (1)

Publication Number Publication Date
KR20160144104A true KR20160144104A (ko) 2016-12-16

Family

ID=57735846

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150080435A KR20160144104A (ko) 2015-06-08 2015-06-08 음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템

Country Status (1)

Country Link
KR (1) KR20160144104A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101926826B1 (ko) * 2018-06-20 2019-03-07 하이랩 주식회사 유아용 다중언어 학습 시스템
KR20220155012A (ko) * 2021-05-14 2022-11-22 (주)오맥스 실물화상기 및 이를 이용한 콘텐츠 제작 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101926826B1 (ko) * 2018-06-20 2019-03-07 하이랩 주식회사 유아용 다중언어 학습 시스템
KR20220155012A (ko) * 2021-05-14 2022-11-22 (주)오맥스 실물화상기 및 이를 이용한 콘텐츠 제작 방법

Similar Documents

Publication Publication Date Title
US10276164B2 (en) Multi-speaker speech recognition correction system
JP4867804B2 (ja) 音声認識装置及び会議システム
JP5750380B2 (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
KR102044689B1 (ko) 방송자막 제작 시스템 및 방법
CN111226224A (zh) 用于翻译语音信号的方法及电子设备
US11528568B1 (en) Assisted hearing aid with synthetic substitution
CN109346057A (zh) 一种智能儿童玩具的语音处理系统
CN113205793B (zh) 音频生成方法、装置、存储介质及电子设备
CN114121006A (zh) 虚拟角色的形象输出方法、装置、设备以及存储介质
US10269349B2 (en) Voice interactive device and voice interaction method
KR20160144104A (ko) 음성인식 기반의 학습용 단말, 음성인식 기반의 학습 시스템
CN111339881A (zh) 基于情绪识别的宝宝成长监护方法及系统
KR102126609B1 (ko) 독서 엔터테이닝 장치 및 이의 구동 방법
JP6832503B2 (ja) 情報提示方法、情報提示プログラム及び情報提示システム
JP6172770B2 (ja) 要約筆記支援システム、情報配信装置、要約筆記支援方法、及びプログラム
CN111415662A (zh) 用于生成视频的方法、装置、设备和介质
JP7130290B2 (ja) 情報抽出装置
JP6889597B2 (ja) ロボット
CN113299309A (zh) 语音翻译方法及装置、计算机可读介质和电子设备
KR101926826B1 (ko) 유아용 다중언어 학습 시스템
WO2021102647A1 (zh) 数据处理方法、装置和存储介质
JP2016186646A (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
JP6696878B2 (ja) 音声処理装置、ウェアラブル端末、携帯端末、および音声処理方法
JP2015187738A (ja) 音声翻訳装置、音声翻訳方法および音声翻訳プログラム
CN109346058B (zh) 一种语音声学特征扩大系统

Legal Events

Date Code Title Description
E601 Decision to refuse application