KR20210011896A - 발음 교정 시스템의 구동 방법 - Google Patents
발음 교정 시스템의 구동 방법 Download PDFInfo
- Publication number
- KR20210011896A KR20210011896A KR1020200091342A KR20200091342A KR20210011896A KR 20210011896 A KR20210011896 A KR 20210011896A KR 1020200091342 A KR1020200091342 A KR 1020200091342A KR 20200091342 A KR20200091342 A KR 20200091342A KR 20210011896 A KR20210011896 A KR 20210011896A
- Authority
- KR
- South Korea
- Prior art keywords
- pronunciation
- text
- candidate
- candidate pronunciation
- forming
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09B—EDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
- G09B19/00—Teaching not covered by other main groups of this subclass
- G09B19/04—Speaking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
본 발명에서 제공하는 발음 교정 시스템의 구동 방법은 평가 기준 본문을 기준으로 평가 기준 본문의 발음 형태인 발음 본문을 형성하는 단계, 발음 본문을 기준으로 유사하게 잘못 발음될 수 있는 복수개의 후보 발음 본문을 포함하는 후보 발음 본문 그룹을 형성하는 단계, 후보 발음 본문 그룹의 후보 발음 본문에 해당하는 후보 발음 음성 데이터를 포함하는 후보 발음 음성 데이터 그룹을 형성하는 단계, 입력된 사용자 음성 데이터와 후보 발음 음성 데이터 그룹의 후보 발음 음성 데이터의 일치도를 비교하여, 최우선 발음 음성 데이터를 선정하는 단계 및 최우선 발음 음성 데이터과 매칭되는 최종 후보 발음 본문을 선정하는 단계를 포함한다.
Description
본 발명은 발음 교정 시스템의 구동 방법에 관한 것이다. 보다 자세하게는, 잘못된 발음을 표시하고 교정할 수 있게 도와주는 발음 교정 시스템의 구동 방법에 관한 것이다.
청각 장애인은 자신의 발음을 들을 수 없거나, 듣기가 어렵기 때문에, 자신이 올바르게 발음했는지를 알기 어렵다. 대부분의 청각 장애인이 말을 배우기 어려운 것은 자신의 발음이 올바르게 되었는지를 들어서 알 수 없기 때문이다.
한편, 음성인식을 위한 기술은 최근 많은 발전을 보이고 있다. 이러한 모든 음성인식 시스템은 해당 단어와 이러한 단어와 관련 되는 음성 데이터들을 매칭하여 가장 가까운 단어들을 찾는 것이다. 따라서 음성 데이터가 입력되었을 때에 결과 값은 입력된 음성 데이터를 기준으로 가장 가까운 단어를 찾는 것이며, 이것에 대한 발음이 올바른 지의 유무를 판단하지는 않는다. 이것은 입력 수단으로서 음성 인식을 이용하기 때문이다. 하지만 이를 통해서는 올바른 음성이 발음되었는지는 판정하기 어렵다.
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로, 제시된 본문을 올바르게 발음했는지를 판정하는 발음 교정 시스템의 구동 방법을 제공하고자 한다.
이러한 과제를 해결하고자, 본 발명에서 제공하는 발음 교정 시스템의 구동 방법은 평가 기준 본문을 기준으로 평가 기준 본문의 발음 형태인 발음 본문을 형성하는 단계, 발음 본문을 기준으로 유사하게 잘못 발음될 수 있는 복수개의 후보 발음 본문을 포함하는 후보 발음 본문 그룹을 형성하는 단계, 후보 발음 본문 그룹의 후보 발음 본문에 해당하는 후보 발음 음성 데이터를 포함하는 후보 발음 음성 데이터 그룹을 형성하는 단계, 입력된 사용자 음성 데이터와 후보 발음 음성 데이터 그룹의 후보 발음 음성 데이터의 일치도를 비교하여, 최우선 발음 음성 데이터를 선정하는 단계 및 최우선 발음 음성 데이터과 매칭되는 최종 후보 발음 본문을 선정하는 단계를 포함한다.
일 실시예에 있어서, 복수개의 기준 본문과 기준 본문에 대응되는 발음 음성 데이터를 이용하여 해당 기준 본문에 대응하는 발음 음성 데이터를 학습시키는 학습 단계를 더 포함하는 것을 특징으로 할 수 있다.
일 실시예에 있어서, 발음 본문을 기준으로 유사하게 잘못 발음될 수 있는 복수개의 후보 발음 본문을 포함하는 후보 발음 본문 그룹을 형성하는 단계는, 발음 본문에서 적어도 하나 이상의 음소를 교체하여 형성하는 것을 특징으로 할 수 있다.
일 실시예에 있어서, 후보 발음 음성 데이터 그룹을 형성하는 단계는, 후보 발음 본문을 음절 단위로 분할하여 이에 대응하는 음성 데이터를 조합하여, 후보 발음 본문에 대한 후보 발음 음성 데이터를 형성하는 것을 특징으로 할 수 있다.
일 실시예에 있어서, 후보 발음 본문 그룹을 형성하는 단계는, 제한된 개수의 후보 발음 본문을 포함하는 선별된 후보 발음 본문 그룹을 형성하는 것을 특징으로 할 수 있다.
일 실시예에 있어서, 최종 후보 발음 본문과 평가 기준 본문을 비교하여 잘못된 발음 부분을 표시하는 단계를 더 포함하는 것을 특징으로 할 수 있다.
일 실시예에 있어서, 잘못된 발음 부분을 표시하는 단계는, 최종 후보 발음 본문과 평가 기준 본문의 비교는 음절을 기준으로 표시되는 것을 특징으로 할 수 있다.
일 실시예에 있어서, 후보 발음 음성 데이터 그룹을 형성하는 단계는, 후보 발음 본문에 대응하는 조합되지 않은 단일 음성 데이터로 후보 발음 본문에 대한 후보 발음 음성 데이터를 형성하는 것을 특징으로 할 수 있다.
일 실시예에 있어서, 후보 발음 본문 그룹을 형성하는 단계는, 제한된 개수의 후보 발음 본문을 포함하는 선별된 후보 발음 본문 그룹을 형성하고, 후보 발음 음성 데이터 그룹을 형성하는 단계는, 선별된 후보 발음 본문 그룹 내의 후보 발음 본문에 해당하는 후보 발음 음성 데이터를 외부로부터 전송 받아 선별된 후보 발음 음성 데이터 그룹을 형성하는 것을 특징으로 할 수 있다.
일 실시예에 있어서, 후보 발음 본문 그룹을 형성하는 단계는, 제한된 개수의 후보 발음 본문을 포함하는 선별된 후보 발음 본문 그룹을 형성하고, 제한된 개수의 후보 발음 본문은 상기 발음 본문의 음성 데이터와 유사도가 높은 음성 데이터를 가지는 후보 발음 본문을 선별하여 선별된 후보 발음 본문 그룹을 형성하는 것을 특징으로 할 수 있다.
상기와 같은 본 발명에 따르면, 발음 교정 시스템의 구동 방법은 단어 기준으로 음성을 인식하지 않고, 발음 기준으로 음성을 인식하여 잘못된 발음을 인지할 수 있다.
이를 통해, 사용자는 자신이 어떤 부분에서 어떻게 발음을 잘 못 하였는지를 인식하고, 이를 교정할 수 있는 근거로 활용할 수 있다. 반복적인 음성인식을 통해 잘못된 발음에서 올바른 발음으로 교정하는 단계를 사용자가 인지하고 학습할 수 있다.
특히, 대용량의 음성 데이터를 모두 사용자 단말에 내장하거나, 서버로 전달받는 것이 아니라, 해당 단어 중 선별된 일부 후보 본문에 대한 음성 데이터를 활용하기 때문에, 빠른 속도로 잘못된 발음을 인지할 수 있다.
또한, 휴대폰을 사용하는 경우에는 이러한 제한된 리소스에서도 적용할 수 있어, 대용량 처리 시스템을 사용하지 않고도, 이동형 단말기 시스템 상에서 잘못된 발음에 대한 교정이 가능하다.
도 1은 본 발명의 일 실시예에 따른 발음 교정 시스템의 구동 방법이 적용되는 순서도이다.
도 2는 도 1의 실시예에 따른 발음 교정 시스템을 설명하는 도면이다.
도 3 내지 도 6은 도 1의 실시예에 따른 발음 교정 시스템의 구동 방법을 설명하기 위한 도면이다.
도 7은 본 발명의 다른 실시예에 따른 발음 교정 시스템의 구동 방법이 적용되는 순서도이다.
도 2는 도 1의 실시예에 따른 발음 교정 시스템을 설명하는 도면이다.
도 3 내지 도 6은 도 1의 실시예에 따른 발음 교정 시스템의 구동 방법을 설명하기 위한 도면이다.
도 7은 본 발명의 다른 실시예에 따른 발음 교정 시스템의 구동 방법이 적용되는 순서도이다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈" 및 "부"는 명세서 작성의 용이함만이 고려되어 부여되거나 혼용되는 것으로서, 그 자체로 서로 구별되는 의미 또는 역할을 갖는 것은 아니다. 또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
또한, 본원 명세서 전체에서, 어떤 부분이 어떤 구성요소를 “포함”한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
본 발명은 본 발명의 및 필수적 특징을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있음은 당업자에게 자명하다.
이하, 도면들을 참조하여 본 발명의 실시 예에 대해 상세히 설명하기로 한다. 도면상에서 동일 부호는 동일한 요소를 지칭한다.
용어의 정의와 해설
평가 기준 본문은 발음 평가의 기준이 되는 문장, 단어, 어절 등을 의미한다. 예를 들어, '오랜만이야'에 대한 발음을 평가하는 경우 평가 기준 본문은 '오랜만이야'이다.
발음 본문은 해당 본문을 발음되는 형태로 변환한 본문을 의미한다. 예를 들어, '오랜만이야'에 대한 발음을 평가하는 경우, 발음 본문은 '오랜마니야'이다.
후보 발음 본문은 해당 발음 본문을 기준으로 잘못 발음될 수 있는 여러 후보들의 발음을 의미하며, 단일 또는 복수개가 될 수 있다. 예를 들어, '오랜마니야'의 발음 본문을 기준으로, 후보 발음 본문은 '오랜마이야', '노랭마니야' 등이 있을 수 있다.
발음 교정 시스템의 구동 방법
도 1은 본 발명의 일 실시예에 따른 발음 교정 시스템의 구동 방법이 적용되는 순서도이다. 도 2는 도 1의 실시예에 따른 발음 교정 시스템을 설명하는 도면이다.
도 1을 참조하면, 본 실시예에 따른 발음 교정 시스템의 구동 방법은 평가 기준 본문을 기준으로 상기 평가 기준 본문의 발음 형태인 발음 본문을 형성하는 단계(S100), 상기 발음 본문을 기준으로 유사하게 잘못 발음될 수 있는 복수개의 후보 발음 본문을 포함하는 후보 발음 본문 그룹을 형성하는 단계(S200), 상기 후보 발음 본문 그룹의 후보 발음 본문에 해당하는 후보 발음 음성 데이터를 포함하는 후보 발음 음성 데이터 그룹을 형성하는 단계(S300), 입력된 사용자 음성 데이터와 상기 후보 발음 음성 데이터 그룹의 후보 발음 음성 데이터의 일치도를 비교하여, 최우선 발음 음성 데이터를 선정하는 단계(S400) 및 상기 최우선 발음 음성 데이터과 매칭되는 최종 후보 발음 본문을 선정하는 단계(S500)를 포함한다.
각 단계의 구동 방법에 대해서는 추후 구체적으로 설명하나, 전체적인 구동을 간략히 설명하면, 평가 기준 본문(100)을 발음 형태인 발음 본문(200)으로 변형한 후, 이를 기준으로 다양한 후보 발음 본문 그룹을 형성한다. 후보 발음 본문은 텍스트 자료이므로, 이를 다시 음성 데이터 그룹으로 변환하거나 관련 데이터들을 조합한 후, 입력된 음성으로부터 이러한 음성 데이터 그룹 내에 속한 최적의 유사 데이터를 선별한다. 이를 통해 최종 후보 발음 본문을 선정한다.
도 2를 참조하여 설명하면, 사용자는 평가 기준 본문(100)을 제시 받고, 이를 바탕으로 계산된 발음 본문(200)을 같이 제시 받는다. 사용자는 평가 기준 본문(100) 또는 발음 본문(200)을 보고 단말기의 마이크를 통해 음성을 입력하고, 이를 통해 판별된 최종 후보 발음 본문 표시 형태(601)를 볼 수 있다. 이로써 잘못된 부분이 어떤 부분이며, 어떻게 잘못 발음 되었는지를 판정할 수 있다.
아래의 다시하기 버튼을 이용하여, 추가적으로 반복적인 음성 입력을 통하여 자신의 발음을 계속적으로 교정하는 것이 가능하다. 이로써, 실제 음성을 듣지 않더라도 눈으로 보는 것 만으로 잘못된 발음을 교정할 수 있게 된다.
발음 교정 시스템의 구체적인 구동 방법
도 3 내지 도 6은 도 1의 실시예에 따른 발음 교정 시스템의 구동 방법을 설명하기 위한 도면이다.
도 3을 먼저 참조하면, '오랜만이야'라는 문장을 기준으로 어떠한 프로세스로 진행되는지를 알 수 있다. 평가기준 본문(100)은 '오랜만이야'이다. 이것은 발음 본문(200)으로는 '오랜마니야'로 변환 된다.
발음 본문(200)을 형성하는 것은 구개 음화와 같은 국문 발음 체계의 다양한 법칙이 적용된다. 내부의 알고리즘을 이용하여 이러한 국문 발음 법칙이 적용된 발음 본문(200)을 계산한다.
도 4는 본 실시예에 따른 후보 발음 본문 그룹(300)을 설명하기 위한 도면이다.
도 4를 참조하면, 발음 본문(200)을 기준으로 복수개의 후보 발음 본문을 계산하고, 이를 포함하는 후보 발음 본문 그룹(300)을 형성한다. 국어는 하나의 음절 내에 포함되는 음소를 가지고 있으므로, 이를 바탕으로 가능한 모든 경우의 수를 고려하여 후보 발음 본문을 계산할 수 있다. 기본적인 후보 발음 본문 그룹(300) 내에서는 가능한 모든 변형이 적용되는 후보 발음 본문을 포함한다.
대신, 발음 본문(200)을 참조하여, 글자수를 동일하게 하는 등의 제한이 가능하다. 또는 모든 경우의 수를 고려하지 않고, 기본적인 발음 본문(200)을 기준으로 변형이 가능한 차수(depth)를 선정하여 1차, 2차… n차 변형까지만 허용하는 제한을 둘 수 있다.
언급해야 할 것은 후보 발음 본문 그룹(300) 내에 포함되는 본문은 일반적으로 평문에서 사용되는 본문이 아니라, 발음을 기준으로 형성된다는 점이다. 예를 들어, 받침의 발음은 'ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅇ'의 7개 자음만 발음한다. 따라서 후보 발음 본문도 이러한 제한 속에서 변형된다.
도 5는 본 실시예에 따른 후보 발음 음성데이터 그룹(400)을 설명하기 위한 도면이다.
도 5를 참조하면, 후보 발음 본문 그룹(300)의 후보 발음 본문은 텍스트를 기반으로 형성된 것이며, 실제 발음 데이터를 포함하고 있지 않다. 후보 발음 음성 데이터 그룹(400)은 후보 발음 본문을 기준으로 일대일 매칭이 되는 음성 데이터를 준비한다.
또한 후보 발음 음성 데이터는 별도의 프로세스를 통하여 계속적인 학습을 통하여 업데이트 될 수 있다. 이러한 학습을 누적하는 만큼 정확한 발음에 대한 평가의 정확도가 상승한다.
후보 발음 음성 데이터는 이미 발음이 학습된 모델 내에서, 음소를 기준으로 조합하거나, 음절을 기준으로 조합하거나, 본문을 기준으로 선정 또는 조합하여 형성할 수 있다. 자주 사용되는 것은 음절을 기준으로 후보 발음 본문으로부터 해당 음절에 해당하는 음성 데이터를 조합하고, 필요한 경우 후처리하여, 이를 형성할 수 있다.
도 6은 본 실시예에 따른 최우선 발음 음성 데이터(500) 선정을 설명하기 위한 도면이다.
도 6을 참조하면, 최우선 발음 음성 데이터(500)는 마이크 등을 통해 사용자의 발음이 입력되고, 입력된 사용자의 발음 데이터와 후보 발음 음성데이터 그룹(400) 내에 있는 가장 일치하는 발음 데이터를 선별하여 결정한다.
후보 발음 음성데이터 그룹(400)은 방대한 양의 후보 발음 음성 데이터를 포함할 수 있고, 음성 데이터의 품질에 따라 일치성을 비교하는 프로세스는 매우 높은 용량의 리소스를 사용하거나, 오랜 시간이 걸릴 수 있다. 이를 최적화 하는 방법이 요구될 수 있으며, 이는 후술될 실시예에서 설명한다.
최우선 발음 음성 데이터(500)가 선정된 경우 이와 매칭되는 최종 후보 발음 본문(600)을 선택하여 결정한다. 실제로 사용자가 어떠한 발음을 진행하였는지를 판별할 수 있다.
부가적으로 최초 발음 본문(200)과 최종 후보 발음 본문(600)을 비교하여, 잘 발음된 부분과 잘못 발음된 부분을 선별하여 표시할 수 있다. 이것은 음소 단위에서부터 가능하며, 음절 단위로 보통 표시될 수 있다. 음절 단위로 올바르게 발음된 음절과 잘못 발음된 음절을 다르게 표시하여 사용자는 자신이 틀리게 발음한 부분을 파악할 수 있다.
리소스 최적화를 위한 실시예
도 7은 본 발명의 다른 실시예에 따른 발음 교정 시스템의 구동 방법이 적용되는 순서도이다.
도 7을 도 1과 비교하여 살펴보면, 선별된 후보 발음 본문 그룹 형성 단계(S210) 및 선별된 후보 발음 음성 데이터 그룹 형성 단계(S310)이 다르며, 이외의 단계는 동일하게 적용된다. 따라서 중복되는 설명은 생략한다.
후보 발음 본문 그룹(300)은 발음 본문(200)을 기준으로 변형 가능한 다양한 후보 본문을 포함할 수 있다. 하지만, 초성-중성-종성 기준으로 형성되는 음절 내 음소 단위의 변형을 고려하면, 일반적인 단말기의 처리 용량을 초과하는 음성 데이터가 필요하고, 처리 시간이 필요할 수 있다. 따라서 사용자는 한번 발음을 입력한 후 매우 오랜 시간동안 기다려야 하거나, 대용량의 컴퓨터를 사용해야할 수 있다.
이러한 처리 용량의 한계점은 후보 발음 본문 그룹(300)을 선별하는 과정에서 최적화가 가능하다. 가능한 모든 경우의 후보 발음 본문을 포함하여 후보 발음 본문 그룹(300)을 형성하는 것이 아니라, 특정한 조건에 부합하는 선별된 후보 발음 본문 그룹(300)을 마련할 수 있다. 따라서 비교할 대상의 개수가 줄어들게 되므로, 적은 리소스를 가지는 단말기 등에서도 사용이 가능하다.
선별된 후보 발음 본문 그룹(300)을 형성하는 기준은 발음 본문을 기준으로 변형이 적은 후보들을 선별하는 방법이 적용될 수 있다. 한편으로는 발음 본문(200)의 음성 데이터를 기준으로 해당 음성 데이터와 유사한 값의 음성 데이터를 가지는 후보 발음 본문으로 선별된 후보 발음 본문 그룹(300)을 형성할 수 있다.
또 다른 한편으로는 축적되는 사용자의 데이터를 학습하여, 사용자들이 틀리기 쉬운 형태의 후보 발음 본문을 추출하여 학습된 결과에 의해 선별된 후보 발음 본문 그룹(300)을 형성할 수 있다.
바람직한 선별된 후보 발음 본문 그룹(300)의 후보 발음 본문의 수는 수개에서 수십 개 내로 제한할 수 있다.
특히, 고품질의 음성 데이터는 많은 용량을 필요로 하므로, 휴대폰 단말기에서 사용하고자 하는 경우 모든 음성 데이터를 저장하는 것은 불가능할 수 있다. 따라서, 선별된 후보 발음 본문 그룹(300)을 기준으로 이에 해당하는 후보 발음 음성 데이터는 서버로부터 단말기 또는 PC로 전송하여 사용할 수 있게 한다. 이를 통해 휴대폰 단말기에서도 다양한 형태의 평가 기준 본문에 대한 후보 발음 음성 데이터를 활용할 수 있게 된다.
본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 본 발명에 따른 구성요소를 치환, 변형 및 변경할 수 있다는 것이 명백할 것이다.
100 : 평가 기준 본문
200 : 발음 본문
300 : 후보 발음 본문 그룹
400 : 후보 발음 음성 데이터 그룹
500 : 최우선 발음 음성 데이터
600 : 최종 후보 발음 본문
601 : 최종 후보 발음 본문 표시 형태
200 : 발음 본문
300 : 후보 발음 본문 그룹
400 : 후보 발음 음성 데이터 그룹
500 : 최우선 발음 음성 데이터
600 : 최종 후보 발음 본문
601 : 최종 후보 발음 본문 표시 형태
Claims (10)
- 평가 기준 본문을 기준으로 상기 평가 기준 본문의 발음 형태인 발음 본문을 형성하는 단계(S100);
상기 발음 본문을 기준으로 유사하게 잘못 발음될 수 있는 복수개의 후보 발음 본문을 포함하는 후보 발음 본문 그룹을 형성하는 단계(S200);
상기 후보 발음 본문 그룹의 후보 발음 본문에 해당하는 후보 발음 음성 데이터를 포함하는 후보 발음 음성 데이터 그룹을 형성하는 단계(S300);
입력된 사용자 음성 데이터와 상기 후보 발음 음성 데이터 그룹의 후보 발음 음성 데이터의 일치도를 비교하여, 최우선 발음 음성 데이터를 선정하는 단계(S400); 및
상기 최우선 발음 음성 데이터과 매칭되는 최종 후보 발음 본문을 선정하는 단계(S500);를 포함하는 발음 교정 시스템의 구동 방법.
- 제1항에 있어서,
복수개의 기준 본문과 상기 기준 본문에 대응되는 발음 음성 데이터를 이용하여 해당 기준 본문에 대응하는 발음 음성 데이터를 학습시키는 학습 단계(S10)를 더 포함하는 것을 특징으로 하는 발음 교정 시스템의 구동 방법.
- 제2항에 있어서,
상기 발음 본문을 기준으로 유사하게 잘못 발음될 수 있는 복수개의 후보 발음 본문을 포함하는 후보 발음 본문 그룹을 형성하는 단계(S200)는,
상기 발음 본문에서 적어도 하나 이상의 음소를 교체하여 형성하는 것을 특징으로 하는 발음 교정 시스템의 구동 방법.
- 제2항에 있어서,
상기 후보 발음 음성 데이터 그룹을 형성하는 단계(S300)는,
상기 후보 발음 본문을 음절 단위로 분할하여 이에 대응하는 음성 데이터를 조합하여, 상기 후보 발음 본문에 대한 후보 발음 음성 데이터를 형성하는 것을 특징으로 하는 발음 교정 시스템의 구동 방법.
- 제2항에 있어서,
상기 후보 발음 본문 그룹을 형성하는 단계(S200)는,
제한된 개수의 후보 발음 본문을 포함하는 선별된 후보 발음 본문 그룹을 형성하는 것을 특징으로 하는 발음 교정 시스템의 구동 방법.
- 제2항에 있어서,
상기 최종 후보 발음 본문과 상기 발음 본문을 비교하여 잘못된 발음 부분을 표시하는 단계(S600)를 더 포함하는 것을 특징으로 하는 발음 교정 시스템의 구동 방법.
- 제6항에 있어서,
상기 잘못된 발음 부분을 표시하는 단계(S600)는,
상기 최종 후보 발음 본문과 상기 발음 본문의 비교는 음절을 기준으로 표시되는 것을 특징으로 하는 발음 교정 시스템의 구동 방법.
- 제2항에 있어서,
상기 후보 발음 음성 데이터 그룹을 형성하는 단계(S300)는,
상기 후보 발음 본문에 대응하는 조합되지 않은 단일 음성 데이터로 상기 후보 발음 본문에 대한 후보 발음 음성 데이터를 형성하는 것을 특징으로 하는 발음 교정 시스템의 구동 방법.
- 제8항에 있어서,
상기 후보 발음 본문 그룹을 형성하는 단계(S200)는,
제한된 개수의 후보 발음 본문을 포함하는 선별된 후보 발음 본문 그룹을 형성하고,
상기 후보 발음 음성 데이터 그룹을 형성하는 단계(S300)는,
상기 선별된 후보 발음 본문 그룹 내의 후보 발음 본문에 해당하는 후보 발음 음성 데이터를 외부로부터 전송 받아 선별된 후보 발음 음성 데이터 그룹을 형성하는 것을 특징으로 하는 발음 교정 시스템의 구동 방법.
- 제8항에 있어서,
상기 후보 발음 본문 그룹을 형성하는 단계(S200)는,
제한된 개수의 후보 발음 본문을 포함하는 선별된 후보 발음 본문 그룹을 형성하고,
상기 제한된 개수의 후보 발음 본문은 상기 발음 본문의 음성 데이터와 유사도가 높은 음성 데이터를 가지는 후보 발음 본문을 선별하여 선별된 후보 발음 본문 그룹을 형성하는 것을 특징으로 하는 발음 교정 시스템의 구동 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190088912 | 2019-07-23 | ||
KR1020190088912 | 2019-07-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210011896A true KR20210011896A (ko) | 2021-02-02 |
KR102361205B1 KR102361205B1 (ko) | 2022-02-11 |
Family
ID=74559889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200091342A KR102361205B1 (ko) | 2019-07-23 | 2020-07-23 | 발음 교정 시스템의 구동 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102361205B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102715210B1 (ko) * | 2024-03-12 | 2024-10-11 | 주식회사 리턴제로 | 한국어 발음 평가 모델을 학습하기 위한 학습데이터 생성 장치 및 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130091128A (ko) * | 2012-02-07 | 2013-08-16 | 에스케이씨앤씨 주식회사 | 음성인식을 이용한 발음 평가 방법 및 이를 적용한 전자기기 |
KR101562222B1 (ko) * | 2014-07-22 | 2015-10-23 | 조광호 | 발음의 정확도 평가 장치 및 그 방법 |
KR20160072877A (ko) * | 2014-12-15 | 2016-06-24 | 중앙대학교 산학협력단 | 영어 발음 훈련 방법 및 그 장치 |
KR20170090815A (ko) * | 2016-01-29 | 2017-08-08 | 한국전자통신연구원 | 음성 인식 장치 및 이의 동작방법 |
KR20180025559A (ko) * | 2016-09-01 | 2018-03-09 | 에스케이텔레콤 주식회사 | 발음 사전 학습 방법 및 장치 |
-
2020
- 2020-07-23 KR KR1020200091342A patent/KR102361205B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20130091128A (ko) * | 2012-02-07 | 2013-08-16 | 에스케이씨앤씨 주식회사 | 음성인식을 이용한 발음 평가 방법 및 이를 적용한 전자기기 |
KR101562222B1 (ko) * | 2014-07-22 | 2015-10-23 | 조광호 | 발음의 정확도 평가 장치 및 그 방법 |
KR20160072877A (ko) * | 2014-12-15 | 2016-06-24 | 중앙대학교 산학협력단 | 영어 발음 훈련 방법 및 그 장치 |
KR20170090815A (ko) * | 2016-01-29 | 2017-08-08 | 한국전자통신연구원 | 음성 인식 장치 및 이의 동작방법 |
KR20180025559A (ko) * | 2016-09-01 | 2018-03-09 | 에스케이텔레콤 주식회사 | 발음 사전 학습 방법 및 장치 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102715210B1 (ko) * | 2024-03-12 | 2024-10-11 | 주식회사 리턴제로 | 한국어 발음 평가 모델을 학습하기 위한 학습데이터 생성 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR102361205B1 (ko) | 2022-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102191425B1 (ko) | 인터랙티브 캐릭터 기반 외국어 학습 장치 및 방법 | |
US7996209B2 (en) | Method and system of generating and detecting confusing phones of pronunciation | |
US7702512B2 (en) | Natural error handling in speech recognition | |
US6785650B2 (en) | Hierarchical transcription and display of input speech | |
US8126714B2 (en) | Voice search device | |
US11810471B2 (en) | Computer implemented method and apparatus for recognition of speech patterns and feedback | |
US20060293889A1 (en) | Error correction for speech recognition systems | |
KR20200080914A (ko) | 언어학습을 위한 양국어 자유 대화 시스템 및 방법 | |
CN112346696B (zh) | 虚拟助理的语音比较 | |
US20170337922A1 (en) | System and methods for modifying user pronunciation to achieve better recognition results | |
KR20210011896A (ko) | 발음 교정 시스템의 구동 방법 | |
KR20150103809A (ko) | 유사발음 학습 방법 및 장치 | |
JP4296290B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
KR20240096898A (ko) | 격자 음성 교정 | |
US11341961B2 (en) | Multi-lingual speech recognition and theme-semanteme analysis method and device | |
JP2014038150A (ja) | 音声対話システム及び音声対話方法 | |
JP2015099335A (ja) | 情報処理装置およびその方法 | |
KR102476497B1 (ko) | 언어 대응 화상 출력 장치, 방법 및 시스템 | |
KR101983031B1 (ko) | 언어 교육 방법 및 언어 교육 시스템 | |
KR20220033186A (ko) | 영어 발음에 대한 학습 서비스를 제공하는 서버, 방법 및 컴퓨터 프로그램 | |
CN109671308B (zh) | 一种发音口型矫正系统的生成方法 | |
KR20220070647A (ko) | 언어, 청각 장애인 및 외국인 상호 대화 시스템 | |
KR20240030841A (ko) | 로봇을 이용한 영어문법교정시스템 | |
Odriozola Sustaeta | Speech recognition based strategies for on-line Computer Assisted Language Learning (CALL) systems in Basque | |
KR20220036239A (ko) | 딥러닝 기반의 발음 평가 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |