KR20200065323A - OpenCV와 STT기술을 이용한 청각장애우를 위한 발음 교정 학습 솔루션 - Google Patents

OpenCV와 STT기술을 이용한 청각장애우를 위한 발음 교정 학습 솔루션 Download PDF

Info

Publication number
KR20200065323A
KR20200065323A KR1020180151678A KR20180151678A KR20200065323A KR 20200065323 A KR20200065323 A KR 20200065323A KR 1020180151678 A KR1020180151678 A KR 1020180151678A KR 20180151678 A KR20180151678 A KR 20180151678A KR 20200065323 A KR20200065323 A KR 20200065323A
Authority
KR
South Korea
Prior art keywords
pronunciation
user
opencv
data
technology
Prior art date
Application number
KR1020180151678A
Other languages
English (en)
Inventor
최원철
Original Assignee
우송대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 우송대학교 산학협력단 filed Critical 우송대학교 산학협력단
Priority to KR1020180151678A priority Critical patent/KR20200065323A/ko
Publication of KR20200065323A publication Critical patent/KR20200065323A/ko

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/04Speaking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/24Speech recognition using non-acoustical features
    • G10L15/25Speech recognition using non-acoustical features using position of the lips, movement of the lips or face analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

본 발명은 발음시 자신의 발음이 어떤 식으로 발음이 되는지 텍스트로 확인하여 부정확한 발음이 발생이 되는 부분을 정확한 발음에 대한 솔루션을 제공하여 사용자의 발음을 교정할 수 있다. 이에 대한 시스템 흐름도를 제안한다.

Description

OpenCV와 STT기술을 이용한 청각장애우를 위한 발음 교정 학습 솔루션{Pronunciation Learning Solutions for the Deaf with OpenCV and STT Technology}
본 발명은 영상처리기술과 음성을 텍스트화하는 알고리즘을 활용한다.
영상분석기술
음성을 텍스트화 하는 기술
발음 교정 분석 기술
본 발명에서 사용되는 기술은 OpenCV와 STT기술로, OpenCV를 통해 사용자의 구강구조만을 파악하여 정확한 발음을 하는 표준 데이터와 비교를 하고, STT기술을 사용하여 발음시 자신의 발음이 어떤 식으로 발음이 되는지 텍스트로 확인하여 부정확한 발음이 발생이 되는 부분을 정확한 발음에 대한 솔루션을 제공하여 사용자의 발음을 교정할 수 있다.
이하에서는 본 발명에 의한 OpenCV와 STT을 이용한 발음 교정 기술의 구성 및 그 작용에 대하여 상세히 설명하고자 한다.
컴퓨터에 카메라와 마이크를 설치하고 이는 발음교정 프로그램에서 작동하게 된다. 원하는 발음에 해당하는 문장을 작성하고, 설정된 문장을 발음하는 동안 카메라는 OpenCV기술을 활용하여, 사용자의 얼굴에서 턱, 입술, 혀의 데이터를 추출하여 표준 데이터와 비교하는 작업을 진행하게 된다. 마이크는 사용자의 발음한 음성의 데이터를 받아와 분석하여 사용자가 교정을 원하는 문장과 사용자가 발음한 문장을 비교하여 데이터를 산출하여 데이터베이스에 결과 데이터를 저장하고, 그 데이터와 사용자의 OpenCV를 통해 얻어낸 구강구조의 데이터와 같이 분석하여 사용자의 발음시 어느 부분에서 문제가 생기는지 확인하고, 그에 맞는 솔루션을 제공하게 된다. 회차를 거듭하여 사용자가 얼마나 교정이 바르게 되었는지도 체크 할 수 있도록 한다.
의사소통에서 가장 중요한 것은 대화이다. 선천적이나 후천적의 청각 장애우들은 대화에서 큰 어려움을 겪고 있다. 그들에게는 수화라는 훌륭한 의사소통 방법이 있지만, 일반인중에 수화를 아는 자는 소수라고 할 정도로 적다. 발음 교정 학습 솔루션을 이용하여 청각 장애우들의 발음 교정을 도와 일상생활에서의 의사소통에서 느끼는 불편함을 줄일 수 있다.
청각장애우가 말을 하면 음성과 입모양을 수신하여 분석한다.
입모양을 분석하여 텍스트화한다.
음성을 분석하여 텍스트화한다.
텍스트화된 2개의 정보를 분석해 일치여부를 판독한다.
컴퓨터에 카메라와 마이크를 설치하고 이는 발음교정 프로그램에서 작동하게 된다. 원하는 발음에 해당하는 문장을 작성하고, 설정된 문장을 발음하는 동안 카메라는 OpenCV기술을 활용하여, 사용자의 얼굴에서 턱, 입술, 혀의 데이터를 추출하여 표준 데이터와 비교하는 작업을 진행하게 된다. 마이크는 사용자의 발음한 음성의 데이터를 받아와 분석하여 사용자가 교정을 원하는 문장과 사용자가 발음한 문장을 비교하여 데이터를 산출하여 데이터베이스에 결과 데이터를 저장하고, 그 데이터와 사용자의 OpenCV를 통해 얻어낸 구강구조의 데이터와 같이 분석하여 사용자의 발음시 어느 부분에서 문제가 생기는지 확인하고, 그에 맞는 솔루션을 제공하게 된다. 회차를 거듭하여 사용자가 얼마나 교정이 바르게 되었는지도 체크 할 수 있도록 한다.
.

Claims (1)

  1. 발음교정 시스템 흐름도
KR1020180151678A 2018-11-30 2018-11-30 OpenCV와 STT기술을 이용한 청각장애우를 위한 발음 교정 학습 솔루션 KR20200065323A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180151678A KR20200065323A (ko) 2018-11-30 2018-11-30 OpenCV와 STT기술을 이용한 청각장애우를 위한 발음 교정 학습 솔루션

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180151678A KR20200065323A (ko) 2018-11-30 2018-11-30 OpenCV와 STT기술을 이용한 청각장애우를 위한 발음 교정 학습 솔루션

Publications (1)

Publication Number Publication Date
KR20200065323A true KR20200065323A (ko) 2020-06-09

Family

ID=71082831

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180151678A KR20200065323A (ko) 2018-11-30 2018-11-30 OpenCV와 STT기술을 이용한 청각장애우를 위한 발음 교정 학습 솔루션

Country Status (1)

Country Link
KR (1) KR20200065323A (ko)

Similar Documents

Publication Publication Date Title
CN106575500B (zh) 基于面部结构合成话音的方法和装置
US11145222B2 (en) Language learning system, language learning support server, and computer program product
Fernandez-Lopez et al. Towards estimating the upper bound of visual-speech recognition: The visual lip-reading feasibility database
US11810471B2 (en) Computer implemented method and apparatus for recognition of speech patterns and feedback
KR20150024180A (ko) 발음 교정 장치 및 방법
US20160321953A1 (en) Pronunciation learning support system utilizing three-dimensional multimedia and pronunciation learning support method thereof
Daniels et al. The suitability of cloud-based speech recognition engines for language learning.
WO2021074721A2 (en) System for automatic assessment of fluency in spoken language and a method thereof
Stemberger et al. Phonetic transcription for speech-language pathology in the 21st century
Regala-Flores Phonological features of basilectal Philippine English: An exploratory study
KR20200087623A (ko) 외국어 교육을 위한 발음 정확도 평가 장치 및 방법
Pellegrini et al. Automatic assessment of speech capability loss in disordered speech
KR20130068598A (ko) 외국어 학습자의 발음 평가 장치 및 방법
JP2002244842A (ja) 音声通訳システム及び音声通訳プログラム
Revathi et al. A challenging task in recognizing the speech of the Hearing impaired using normal hearing models in classical Tamil language.
KR102245941B1 (ko) 연속대화기반 언어발달장애 검사 시스템 및 그 방법
US11508260B2 (en) Deaf-specific language learning system and method
KR102557092B1 (ko) 투명 디스플레이를 이용한 자동 통번역 및 대화 보조 시스템
KR20200065323A (ko) OpenCV와 STT기술을 이용한 청각장애우를 위한 발음 교정 학습 솔루션
Ofori et al. Exploring the feasibility of a proposed Ghanaian English pronunciation standard
JP2002244841A (ja) 音声表示システム及び音声表示プログラム
KR102207812B1 (ko) 발화 장애인들 및 외국인의 보편적 의사소통을 위한 음성 개선 방법
KR20130065064A (ko) 음성인식정보를 수화정보로 자동변환시켜 제공하는 시스템
Le Roux An acoustic comparison: Setswana vowels versus the cardinal vowels
Narwekar et al. A comparative study of articulatory features from facial video and acoustic-to-articulatory inversion for phonetic discrimination

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application