KR20150056366A - 운율을 변환시키는 장치 및 방법 - Google Patents

운율을 변환시키는 장치 및 방법 Download PDF

Info

Publication number
KR20150056366A
KR20150056366A KR1020130139301A KR20130139301A KR20150056366A KR 20150056366 A KR20150056366 A KR 20150056366A KR 1020130139301 A KR1020130139301 A KR 1020130139301A KR 20130139301 A KR20130139301 A KR 20130139301A KR 20150056366 A KR20150056366 A KR 20150056366A
Authority
KR
South Korea
Prior art keywords
morpheme
rhyme
component
phoneme
rhyme component
Prior art date
Application number
KR1020130139301A
Other languages
English (en)
Inventor
최재우
Original Assignee
주식회사 디오텍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 디오텍 filed Critical 주식회사 디오텍
Priority to KR1020130139301A priority Critical patent/KR20150056366A/ko
Publication of KR20150056366A publication Critical patent/KR20150056366A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search

Abstract

본 발명은 운율을 변환시키는 장치 및 방법에 관한 것으로서, 본 발명에 따른 운율 변환 방법은, 제1 형태소 및 제1 형태소와 음소가 동일한 제2 형태소를 음성 형태로 획득하는 단계, 제1 형태소의 운율 구성요소를 추출하는 단계, 제1 형태소의 운율 구성요소에 대응되는 제2 형태소의 운율 구성요소를 추출하는 단계, 및 제1 형태소의 운율 구성요소와 제2 형태소의 운율 구성요소가 실질적으로 동일하게 되도록, 제1 형태소의 운율 구성요소를 변환시키는 단계를 포함한다.

Description

운율을 변환시키는 장치 및 방법 {APPARATUS AND METHOD FOR TRANSFORMING A PROSODY}
본 발명은 운율을 변환시키는 장치 및 방법에 관한 것으로서, 보다 상세하게는, 외국어 학습에 적합하도록 제1 형태소의 운율과 실질적으로 동일하게 제2 형태소의 운율을 변환시키는 장치 및 방법에 관한 것이다.
국제화 그리고 세계화 시대를 맞이하여 기업들의 다국적화가 빠른 속도로 진행됨에 따라 외국어 학습의 중요성이 부각되고 있다. 특히, 글로벌 네트워크에 대한 필요성이 강조되면서 외국인들과 직접 커뮤니케이션을 수행하기 위한 외국어 말하기 학습의 중요성이 크게 부각되고 있다.
이러한 추세에 발맞추어 외국어 말하기 학습을 효과적으로 수행할 수 있는 여러 방법들이 소개되었다. 그 중에서도, 원어민이 발음하는 예시적인 문장을 듣고 짧은 시간 내에 예시적인 문장을 직접 소리 내어 따라 하는, 소위 섀도잉 (shadowing) 학습 방법이 학습자들에게 인기를 얻고 있다. 섀도잉 학습 방법은 문장 단위로 소리를 인식할 수 있고 긴 문장에 대한 이해력을 높일 수 있는 장점을 가지기 때문에, 외국어에 익숙하지 않은 학습자에게도 상당히 효과적인 것으로 알려져 있다.
그러나, 원어민이 발음하는 예시적인 문장을 듣는다고 하여도, 원어민이 아닌 학습자가 예시적인 문장을 원어민처럼 발음하는 것이 쉽지 않다. 왜냐하면, 원어민이 발음한 문장에는 원어민이 아닌 학습자에게 익숙하지 않은 다양한 요인들이 존재하기 때문이다. 이를 테면. 자신과는 다른 원어민의 음색 자체가 학습자에게 익숙하지 아니하고, 외국어 문장에만 존재하는 모국어에 없는 발음 (이를 테면, 한국어에 존재하지 않는 발음인 영어 [f] 발음) 이 학습자에게 익숙하지 아니하며, 외국어 단어들 각각에 존재하는 해당 문화권에서 오랫동안 형성된 고유의 운율이 학습자에게 익숙하지 아니하다. 더욱이, 이러한 운율은 감정적인 요소를 많이 포함하고 있어 이론적으로 쉽게 체득할 수 없는 것이기 때문에 학습자가 예시적인 문장을 원어민처럼 발음할 수 없게 하는 주요한 요인이 되고 있다.
결과적으로, 학습자는 자신의 발음이 원어민과 상이하다는 것을 느끼지만 구체적으로 어떠한 부분이 잘못되었는지 쉽게 인지할 수 없으며, 익숙하지 않은 다양한 요인들로 인해 외국어 말하기 학습에 어려움을 경험하게 되고 피곤함을 느끼게 된다.
이에, 원어민이 아닌 학습자가 외국어 말하기 학습 시에 느끼게 되는 다양한 어려움들을 고려하여, 학습자가 용이하게 외국어 말하기 학습을 수행할 수 있게 하는 새로운 기술이 요구되고 있다.
본 발명이 해결하고자 하는 과제는 학습자가 외국어 말하기 학습을 용이하게 수행할 수 있게 하는 장치 및 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 과제는 외국어 말하기 학습 시에 학습자가 부족한 점을 쉽게 인지할 수 있게 하는 장치 및 방법을 제공하는 것이다.
본 발명이 해결하고자 하는 과제는 보다 친숙한 형태의 예시적인 외국어 문장을 제공할 수 있는 장치 및 방법을 제공하는 것이다.
본 발명의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른, 운율 변환 방법은 제1 형태소 및 제1 형태소와 음소가 동일한 제2 형태소를 음성 형태로 획득하는 단계, 제1 형태소의 운율 구성요소를 추출하는 단계, 제1 형태소의 운율 구성요소에 대응되는 제2 형태소의 운율 구성요소를 추출하는 단계, 및 제1 형태소의 운율 구성요소와 제2 형태소의 운율 구성요소가 실질적으로 동일하게 되도록, 제1 형태소의 운율 구성요소를 변환시키는 단계를 포함한다.
본 발명의 다른 특징에 따르면, 운율 구성요소는 음 높이 (pitch), 음 길이 (length), 음 크기 (loudness) 및 선후 음 연접 여부 중 적어도 하나를 포함할 수 있다.
본 발명의 다른 특징에 따르면, 제1 형태소 및 제2 형태소가 획득되는 단계 이전에, 형태소를 분석하기 위한 하나의 형태소 판단 언어를 설정하는 단계를 더 포함할 수 있다.
본 발명의 다른 특징에 따르면, 제1 형태소 및 제2 형태소가 획득되는 단계 이전에, 음소가 서로 동일한지 여부를 판단하기 위한 하나의 음소 판단 언어를 설정하는 단계를 더 포함할 수 있다.
본 발명의 다른 특징에 따르면, 제1 형태소 및 제2 형태소가 획득되는 단계 이전에, 형태소를 분석하기 위한 하나의 형태소 판단 언어를 설정하는 단계, 및 음소가 서로 동일한지 여부를 판단하기 위한 하나의 음소 판단 언어를 설정하는 단계를 더 포함하며, 형태소 판단 언어와 음소 판단 언어는 서로 상이할 수 있다.
본 발명의 다른 특징에 따르면, 제1 형태소의 운율 구성요소를 변환시키는 단계는, 제1 형태소의 주파수와 제2 형태소의 주파수가 실질적으로 동일하게 되도록, 제1 형태소의 주파수를 변환시키는 단계를 포함할 수 있다.
본 발명의 다른 특징에 따르면, 제1 형태소의 운율 구성요소를 변환시키는 단계는, 제1 형태소의 발음 지속 시간과 제2 형태소의 발음 지속 시간이 실질적으로 동일하게 되도록, 제1 형태소의 발음 지속 시간을 변환시키는 단계를 포함할 수 있다.
본 발명의 다른 특징에 따르면, 제1 형태소의 운율 구성요소를 변환시키는 단계는, 제1 형태소의 데시벨 (dB) 과 제2 형태소의 데시벨 (dB) 이 실질적으로 동일하게 되도록, 제1 형태소의 데시벨 (dB) 을 변환시키는 단계를 포함할 수 있다.
본 발명의 다른 특징에 따르면, 제1 형태소의 운율 구성요소를 변환시키는 단계는, 제1 형태소가 앞의 형태소와 개방 연접하도록 또는 긴밀 연접하도록, 그리고 뒤의 형태소와 개방 연접하도록 또는 긴밀 연접하도록 변환시키는 단계를 포함할 수 있다.
전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른, 운율 변환 장치는 제1 형태소 및 제1 형태소와 음소가 동일한 제2 형태소를 음성 형태로 획득하는, 형태소 획득부, 제1 형태소의 운율 구성요소, 및 제1 형태소의 운율 구성요소에 대응되는 제2 형태소의 운율 구성요소를 추출하는, 운율 구성요소 추출부, 및 제1 형태소의 운율 구성요소와 제2 형태소의 운율 구성요소가 실질적으로 동일하게 되도록, 제1 형태소의 운율 구성요소를 변환시키는, 운율 변환부를 포함한다.
전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른, 명령어 세트들을 저장하는 컴퓨터 판독가능매체는, 명령어 세트들은, 컴퓨팅 장치에 의해 실행되는 경우에 컴퓨팅 장치로 하여금, 제1 형태소 및 제1 형태소와 음소가 동일한 제2 형태소를 음성 형태로 획득하도록 하고, 제1 형태소의 운율 구성요소를 추출하도록 하고, 제1 형태소의 운율 구성요소에 대응되는 제2 형태소의 운율 구성요소를 추출하도록 하고, 그리고 제1 형태소의 운율 구성요소와 제2 형태소의 운율 구성요소가 실질적으로 동일하게끔 제1 형태소의 운율 구성요소가 변환되도록 한다.
기타 실시예의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
본 발명에 따르면, 학습자가 외국어 말하기 학습을 용이하게 수행할 수 있게 된다.
본 발명에 따르면, 외국어 말하기 학습 시에 학습자가 부족한 점을 쉽게 인지할 수 있게 된다.
본 발명에 따르면, 보다 친숙한 형태의 예시적인 외국어 문장을 제공할 수 있게 된다.
본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 명세서 내에 포함되어 있다.
도 1은 본 발명의 일 실시예에 따른, 운율 변환 장치에 관한 개략적인 블록도이다.
도 2는 본 발명의 일 실시예에 따른, 운율을 변환시키는 방법에 관한 흐름도이다.
도 3a 내지 도 3c는 형태소의 운율을 변환하는 본 발명의 일 실시예를 나타내는 도면이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
비록 제 1, 제 2 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서 이하에서 언급되는 제 1 구성요소는 본 발명의 기술적 사상 내에서 제 2 구성요소일 수도 있음은 물론이다.
명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
본 발명의 여러 실시예들의 각각 특징들이 부분적으로 또는 전체적으로 서로 결합 또는 조합 가능하며, 당업자가 충분히 이해할 수 있듯이 기술적으로 다양한 연동 및 구동이 가능하며, 각 실시예들이 서로에 대하여 독립적으로 실시 가능할 수도 있고 연관 관계로 함께 실시 가능할 수도 있다.
이하, 첨부된 도면을 참조하여 본 발명의 다양한 실시예들을 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른, 운율 변환 장치 (100)에 관한 개략적인 블록도이다.
도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 운율 변환 장치 (100) 는 형태소 획득부 (110), 운율 구성요소 추출부 (120) 및 운율 변환부 (130) 를 포함한다. 나아가, 도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 운율 변환 장치 (100) 는 구현 형태에 따라서 제어부 (140) 를 더 포함할 수 있다.
운율 변환 장치 (100) 는 음소가 동일한 두 개의 형태소의 운율이 일치되도록 하나의 형태소의 운율을 변환시키는 장치이다. 운율 변환 장치 (100) 는 개인용 컴퓨터 (예를 들어, 데스크탑 컴퓨터, 노트북 컴퓨터 등), 워크스테이션, PDA, 웹 패드, 이동 전화기 등과 같이 메모리 수단을 구비하고 마이크로 프로세서를 탑재하여 연산 능력을 갖추고 있는 디지털 기기일 수 있다.
형태소 획득부 (110) 는 제1 형태소 및 제1 형태소와 음소가 동일한 제2 형태소를 획득한다. 여기서, 형태소는 의미를 갖는 가장 작은 말의 단위로서 고유의 운율을 가질 수 있는 최소 단위를 지칭한다. 또한, 음소는 운율학적인 요소인 음운과 구별될 수 있는, 단어의 의미를 구별 짓는 최소의 소리 단위를 지칭한다. 음소는 ㄱ, ㄲ, ㅋ, ㄴ, ㅏ, ㅓ 등과 같은 자음, 모음, 반모음을 포함하며, 음소 하나 이상이 결합하여 형태소를 이룰 수 있다. 그러한 의미에서, 음소는 형태소의 하위 개념으로 간주될 수 있다.
운율 구성요소 추출부 (120) 는 제1 형태소의 운율 구성요소와 제2 형태소의 운율 구성요소를 추출한다. 운율 구성요소는 형태소 각각의 운율을 결정하는 구성요소를 지칭한다. 운율 구성요소는 음 높이 (pitch), 음 길이 (length), 음 크기 (loudness), 선후 음 연접 여부를 포함할 수 있으며, 이에 대해서는 후술한다.
운율 변환부 (130) 는 추출된 제1 형태소의 운율 구성요소와 추출된 제2 형태소의 운율 구성요소가 동일하게 되도록, 추출된 제1 형태소의 운율 구성요소를 변환시킨다.
제어부 (140) 는 형태소 획득부 (110), 운율 구성요소 추출부 (120) 및 운율 변환부 (130) 간의 데이터의 흐름을 제어하는 기능을 수행한다. 다시 말하여, 제어부 (140) 는 외부로부터의 또는 운율 변환 장치 (100) 의 각 구성요소 간의 데이터의 흐름을 제어함으로써, 형태소 획득부 (110), 운율 구성요소 추출부 (120) 및 운율 변환부 (130) 에서 각각 고유 기능이 수행되도록 제어한다. 또한, 제어부 (140) 는 사용자로부터의 입력에 의해 또는 자동적으로 형태소를 분석하기 위한 하나의 형태소 판단 언어 및 음소가 서로 동일한지 여부를 판단하기 위한 하나의 음소 판단 언어를 설정할 수 있다.
도 2는 본 발명의 일 실시예에 따른, 운율을 변환시키는 방법에 관한 흐름도이다.
도 2를 참조하면, 형태소를 분석하기 위한 하나의 형태소 판단 언어를 선택할 수 있다 (S210).
동일한 발음이라도 언어의 종류에 따라 형태소는 다르게 판단될 수 있다. 이를 테면, 발음된 “ㅍ/ㅣ/ㅈ/ㅏ”는 한국어에서 두 개의 형태소인 것으로, 즉 꽃봉오리 따위가 벌어지는 것을 의미하는 실질 형태소 “피”와 형식 형태소 “자”인 것으로 판단될 수 있지만, 영어에서는 하나의 형태소 “pizza”인 것으로 판단될 수 있다. 따라서, 발음된 언어의 형태소를 명확하게 분석하기 위해서는 기준이 되는 형태소 판단 언어가 설정되어야 한다. 본 명세서에서는 형태소를 분석하기 위한 형태소 판단 언어가 영어인 것으로 상정한다.
다음으로, 도 2을 더 참조하면, 음소가 서로 동일한지 여부를 판단하기 위한 하나의 음소 판단 언어를 설정할 수 있다 (S220).
음소는 언어의 종류에 따라 다르게 인식될 수 있다. 이를 테면 한국어 화자들은 서로 상이한 영어 음소 “r”과 “l”을 하나의 음소 “ㄹ”로 인식할 수 있다. 따라서, 음소가 서로 동일한지 여부를 명확하게 판단하기 위해서는 기준이 되는 하나의 음소 판단 언어가 설정되어야 한다. 본 명세서에서는 음소가 동일한지 여부를 판단하기 위한 하나의 음소 판단 언어가 한국어인 것으로 상정한다.
다음으로, 도 2를 더 참조하면, 제1 형태소, 및 제1 형태소와 음소가 동일한 제2 형태소가 음성 형태로 획득된다 (S230).
제1 형태소는 사용자의 음성으로부터 획득될 수 있다. 다시 말해서, 사용자가 화자가 되어 제1 형태소를 구성하는 음소들을 직접 발음함으로써, 제1 형태소가 음성 형태로 획득될 수 있다.
제2 형태소는 데이터베이스로부터 음성 형태로 획득될 수 있다. 이를 테면, 제2 형태소는 데이터베이스에 음성 형태로 저장된 음성 파일을 추출하여 획득될 수 있다.
구현 방법에 따라, 제2 형태소는 문자 음성 변환 기술을 이용하여 획득될 수 있다. 이를 테면, 문자 형태로 기록된 제2 형태소를 음성으로 출력하는 기술을 이용하여 제2 형태소가 음성 형태로 획득될 수 있다. 이를 위해, 공지의 다양한 문자 음성 변환 기술이 본 발명에 채용될 수 있다.
제1 형태소의 음소와 제2 형태소의 음소가 서로 동일한지 여부를 판단할 때에, 미리 설정된 하나의 음소 판단 언어 (본 발명에서는 한국어) 를 이용할 수 있다. 따라서, 원어민이 발음한 “r/a/i/t” 형태의 제1 형태소가 획득되고, 또한 원어민이 발음한 “l/a/i/t” 형태의 제2 형태소가 획득된 경우에도, 한국어를 기준으로 제1 형태소의 음소와 제2 형태소의 음소는 모두 “ㄹ/ㅏ/ㅣ/ㅌ/ㅡ”로 인식되어, 제1 형태소의 음소와 제2 형태소의 음소는 서로 동일한 것으로 판단될 수 있다.
제1 형태소와 제2 형태소의 음소가 서로 동일한지 여부를 판단하기 위해서 음성 형태의 제1 형태소 및 제2 형태소를 텍스트 형태로 변환할 수 있다. 이를 위해, 공지의 음성 문자 변환 기술이 본 발명에 채용될 수 있다. 음성 형태의 제1 형태소 및 제2 형태소를 텍스트 형태로 변환할 때에 제1 형태소 및 제2 형태소는 미리 설정된 하나의 음소 판단 언어의 (본 발명에서는 한국어의) 텍스트로 변환될 수 있다. 이를 테면, 원어민이 발음한 “r/a/i/t” 형태의 제1 형태소가 획득된 경우에 제1 형태소를 한국어 텍스트 “라이트”로 변환하고, 원어민이 발음한 “l/a/i/t” 형태의 제2 형태소가 획득된 경우에도 제2 형태소를 한국어 텍스트 “라이트”로 변환할 수 있다. 이때에, 음성 형태의 제1 형태소 및 제2 형태소를 미리 설정된 음소 판단 언어의 음소 단위로 변환하는 것도 가능하다. 이를 테면, 원어민이 발음한 “r/a/i/t” 형태의 제1 형태소는 한국어 텍스트의 음소 단위 “ㄹ/ㅏ/ㅣ/ㅌ/ㅡ”로 변환될 수도 있다. 이후에, 공지의 텍스트 비교 기술을 이용하여 텍스트 형태로 변환된 제1 형태소 및 제2 형태소의 음소가 서로 동일한 지 여부가 판단된다.
다음으로, 도 2를 더 참조하면, 음성 형태인 제1 형태소의 운율 구성요소를 추출한다 (S240).
운율 구성요소는 음 높이 (pitch), 음 길이 (length), 음 크기 (loudness), 선후 음 연접 여부를 포함한다. 따라서, 단계 S240에서는 제1 형태소의 음 높이, 제1 형태소의 음 길이, 제1 형태소의 음 크기, 제1 형태소의 선후 음 연접 여부 중 하나 이상이 추출될 수 있다. 여기서, 음 높이는 사람이 귀로 느끼는 음의 높이를 의미하며, 음의 주파수에 실질적으로 밀접한 관계가 있다. 또한, 음 길이는 해당 음이 발음되는 지속 시간을 의미한다. 또한, 음 크기는 사람이 청각으로 느낄 수 있는 음의 크고 작은 정도를 의미하며, 주파수와 음의 상대적인 크기를 나타내는 단위인 데시벨 (decibel; dB) 과 밀접한 관계가 있다. 또한, 선후 음 연접 여부는 앞의 음에서 해당 형태소로 옮겨갈 때에 그리고 해당 형태소에서 뒤의 음으로 옮겨갈 때에 경계 (boundary) 또는 휴지가 존재하는 지 여부를 의미한다. 제1 형태소의 앞에 또는 뒤에 존재하는 다른 형태소를 인식할 수 있는 경우에만 제1 형태소의 운율 구성요소로서 제1 형태소의 선후 음 연접 여부가 추출될 수 있을 것이다.
다음으로, 도 2를 더 참조하면, 추출된 제1 형태소의 운율 구성요소에 대응되는 제2 형태소의 운율 구성요소가 추출된다 (S250).
이를 테면, 단계 240에서 제1 형태소의 운율 구성요소로서 제1 형태소의 음 높이가 추출된 경우에는 단계 250에서 제2 형태소의 음 높이가 추출되고, 단계 240에서 제1 형태소의 운율 구성요소로서 복수의 운율 구성요소가 추출된 경우에는 단계 250에서 이에 대응되는 제2 형태소의 복수의 운율 구성요소가 추출된다.
다음으로, 도 2를 더 참조하면, 추출된 제1 형태소의 운율 구성요소와 추출된 제2 형태소의 운율 구성요소가 실질적으로 동일하게 되도록, 추출된 제1 형태소의 운율 구성요소를 변환시킨다 (S260).
단계 240에서 제1 형태소의 운율 구성요소로서 제1 형태소의 음 높이가 추출되고, 이에 대응되게 단계 250에서 제2 형태소의 운율 구성요소로서 제2 형태소의 음 높이가 추출된 경우, 제1 형태소의 음 높이와 제2 형태소의 음 높이가 실질적으로 일치되도록 제1 형태소의 음 높이를 변환시킬 수 있다. 이는 제1 형태소의 음의 주파수가 제2 형태소의 음의 주파수와 일치되도록 제1 형태소의 음의 주파수를 변경시키는 것을 의미할 수 있다.
단계 240에서 제1 형태소의 운율 구성요소로서 제1 형태소의 음 길이가 추출되고, 이에 대응되게 단계 250에서 제2 형태소의 운율 구성요소로서 제2 형태소의 음 길이가 추출된 경우, 제1 형태소의 음 길이와 제2 형태소의 음 길이가 실질적으로 일치되도록 제1 형태소의 음 길이를 변환시킬 수 있다. 이는 제1 형태소의 발음 지속 시간이 제2 형태소의 발음 지속 시간과 일치되도록 제1 형태소의 발음 지속 시간을 변경시키는 것을 의미할 수 있다.
단계 240에서 제1 형태소의 운율 구성요소로서 제1 형태소의 음 크기가 추출되고, 이에 대응되게 단계 250에서 제2 형태소의 운율 구성요소로서 제2 형태소의 음 크기가 추출된 경우, 제1 형태소의 음 크기와 제2 형태소의 음 크기가 실질적으로 일치되도록 제1 형태소의 음 크기를 변환시킬 수 있다. 이는 제1 형태소의 데시벨 (dB) 이 제2 형태소의 데시벨 (dB) 과 일치되도록 제1 형태소의 데시벨 (dB) 을 변경시키는 것을 의미할 수 있다. 구현 방법에 따라서는, 데시벨 (dB) 대신에 제1 형태소의 음 크기와 제2 형태소의 음 크기가 실질적으로 일치되도록 제1 형태소의 손 (sone), 폰 (phon) 또는 멜 (mel) 을 변경시킬 수도 있다.
단계 240에서 제1 형태소의 운율 구성요소로서 제1 형태소의 선후 음 연접 여부가 추출되고, 이에 대응되게 단계 250에서 제2 형태소의 운율 구성요소로서 제2 형태소의 선후 음 연접 여부가 추출된 경우, 제1 형태소의 선후 음 연접 여부와 제2 형태소의 선후 음 연접 여부가 실질적으로 일치되도록 제1 형태소의 선후 음 연접 여부를 변환시킬 수 있다. 이는 제1 형태소가 앞의 형태소와 개방 연접 (발음을 잠시 끊고 다음 음을 새롭게 발음하게 되는 이행상의 특징) 하도록 또는 긴밀 연접 (발음이 끊기지 않는 음들의 연결) 하도록, 그리고 뒤의 형태소와 개방 연접 하도록 또는 긴밀 연접 하도록 변경시키는 것을 의미할 수 있다.
도 3a 내지 도 3c는 형태소의 운율을 변환하는 본 발명의 일 실시예를 나타내는 도면이다. 도 3a 내지 도 3c에서 음 높이는 주파수로서 검은색으로 표시되며, 음 길이는 가로 축의 점선 간의 간격으로 표시되며, 음 크기는 높낮이로서 주황색으로 표시된다.
도 3a를 참조하면, 한국인인 사용자의 음성으로부터 제1 형태소 (310) “have“가 획득되고, 제1 형태소 (310) 의 운율 구성요소로서 음 높이, 음 길이, 음 세기가 추출된 것을 확인할 수 있다.
도 3b를 참조하면, 데이터베이스 내의 원어민의 음성 파일로부터 제2 형태소 (320) “have”가 획득되고, 추출된 제1 형태소의 운율 구성요소에 대응되게 제2 형태소의 운율 구성요소로서 음 높이, 음 길이, 음 세기가 추출된 것을 확인할 수 있다.
도 3a 및 도 3b에 도시된 바와 같이, 한국인과 원어민은 동일한 음소 “ㅎ/H/ㅂ/ㅡ“를 발음하였지만, 그 운율 구성요소, 즉 음 높이, 음 길이, 음 세기는 매우 상이할 수 있다.
도 3c를 참조하면, 제1 형태소 (310) 와 제2 형태소 (320) 의 음 높이, 음 길이 및 음 세기가 일치되도록, 제1 형태소 (310) 의 음 높이, 음 길이 및 음 세기가, 상부에 도시된 (도 3a와 같은) 원래의 데이터에서, 하부에 도시된 (도 3b와 실질적으로 동일한) 데이터로 변환된 것을 확인할 수 있다.
한국인인 사용자가 발음한 제1 형태소 (310) 의 운율은 원어민이 발음한 제2 형태소 (320) 의 운율과 실질적으로 동일하게 변환되었다. 이러한 경우에도 제1 형태소 (310) 의 운율만 변환되었을 뿐 제1 형태소 (310) 의 음색은 변화하지 아니한다. 따라서, 사용자는 자신의 음색으로 발음된, 그러나 원어민과 동일한 형태의 운율을 가지는 제1 형태소 (310) 를 여러 번 청취할 수 있다. 그 결과, 학습자는 자신이 어떠한 운율로 제1 형태소 (310) 를 발음해야 할 것인지 용이하게 인식할 수 있게 되며, 이에 따라 외국어 말하기 학습을 효과적으로 수행할 수 있게 된다. 더욱이, 학습자는 다양한 운율 구성요소들 중 일부 만을 변환시켜서 특히 자신이 어떠한 부분에 약점이 있는지를 쉽게 인지할 수 있게 된다.
본 명세서에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
본 명세서에서, 각 블록은 특정된 논리적 기능 (들) 을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실행 예들에서는 블록들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
본 명세서에 개시된 실시예들과 관련하여 설명된 방법 또는 알고리즘의 단계는 프로세서에 의해 실행되는 하드웨어, 소프트웨어 모듈 또는 그 2 개의 결합으로 직접 구현될 수도 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 착탈형 디스크, CD-ROM 또는 당업계에 알려진 임의의 다른 형태의 저장 매체에 상주할 수도 있다. 예시적인 저장 매체는 프로세서에 커플링 되며, 그 프로세서는 저장 매체로부터 정보를 판독할 수 있고 저장 매체에 정보를 기입할 수 있다. 다른 방법으로, 저장 매체는 프로세서와 일체형일 수도 있다. 프로세서 및 저장 매체는 주문형 집적회로 (ASIC) 내에 상주할 수도 있다. ASIC는 사용자 단말기 내에 상주할 수도 있다. 다른 방법으로, 프로세서 및 저장 매체는 사용자 단말기 내에 개별 컴포넌트로서 상주할 수도 있다.
이상으로 실시예를 들어 본 발명을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것은 아니고, 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형 실시될 수 있다. 따라서 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 운율 변환 장치
110: 형태소 획득부
120: 운율 구성요소 추출부
130: 운율 변환부
310: 제1 형태소
320: 제2 형태소

Claims (11)

  1. 제1 형태소 및 상기 제1 형태소와 음소가 동일한 제2 형태소를 음성 형태로 획득하는 단계;
    상기 제1 형태소의 운율 구성요소를 추출하는 단계;
    상기 제1 형태소의 상기 운율 구성요소에 대응되는 상기 제2 형태소의 운율 구성요소를 추출하는 단계; 및
    상기 제1 형태소의 상기 운율 구성요소와 상기 제2 형태소의 상기 운율 구성요소가 실질적으로 동일하게 되도록, 상기 제1 형태소의 상기 운율 구성요소를 변환시키는 단계를 포함하는 것을 특징으로 하는, 운율 변환 방법.
  2. 제1 항에 있어서,
    상기 운율 구성요소는 음 높이 (pitch), 음 길이 (length), 음 크기 (loudness) 및 선후 음 연접 여부 중 적어도 하나를 포함하는 것을 특징으로 하는, 운율 변환 방법.
  3. 제1 항에 있어서,
    상기 제1 형태소 및 상기 제2 형태소가 획득되는 단계 이전에, 형태소를 분석하기 위한 하나의 형태소 판단 언어를 설정하는 단계를 더 포함하는 것을 특징으로 하는, 운율 변환 방법.
  4. 제1 항에 있어서,
    상기 제1 형태소 및 상기 제2 형태소가 획득되는 단계 이전에, 음소가 서로 동일한지 여부를 판단하기 위한 하나의 음소 판단 언어를 설정하는 단계를 더 포함하는 것을 특징으로 하는, 운율 변환 방법.
  5. 제1 항에 있어서,
    상기 제1 형태소 및 상기 제2 형태소가 획득되는 단계 이전에,
    형태소를 분석하기 위한 하나의 형태소 판단 언어를 설정하는 단계; 및
    음소가 서로 동일한지 여부를 판단하기 위한 하나의 음소 판단 언어를 설정하는 단계를 더 포함하며,
    상기 형태소 판단 언어와 상기 음소 판단 언어는 서로 상이한 것을 특징으로 하는, 운율 변환 방법.
  6. 제1 항에 있어서,
    상기 제1 형태소의 상기 운율 구성요소를 변환시키는 단계는, 상기 제1 형태소의 주파수와 상기 제2 형태소의 주파수가 실질적으로 동일하게 되도록, 상기 제1 형태소의 주파수를 변환시키는 단계를 포함하는, 운율 변환 방법.
  7. 제1 항에 있어서,
    상기 제1 형태소의 상기 운율 구성요소를 변환시키는 단계는, 상기 제1 형태소의 발음 지속 시간과 상기 제2 형태소의 발음 지속 시간이 실질적으로 동일하게 되도록, 상기 제1 형태소의 발음 지속 시간을 변환시키는 단계를 포함하는, 운율 변환 방법.
  8. 제1 항에 있어서,
    상기 제1 형태소의 상기 운율 구성요소를 변환시키는 단계는, 상기 제1 형태소의 데시벨 (dB) 과 상기 제2 형태소의 데시벨 (dB) 이 실질적으로 동일하게 되도록, 상기 제1 형태소의 데시벨 (dB) 을 변환시키는 단계를 포함하는, 운율 변환 방법.
  9. 제1 항에 있어서,
    상기 제1 형태소의 상기 운율 구성요소를 변환시키는 단계는, 제1 형태소가 앞의 형태소와 개방 연접하도록 또는 긴밀 연접하도록, 그리고 뒤의 형태소와 개방 연접하도록 또는 긴밀 연접하도록 변환시키는 단계를 포함하는, 운율 변환 방법.
  10. 제1 형태소 및 상기 제1 형태소와 음소가 동일한 제2 형태소를 음성 형태로 획득하는, 형태소 획득부;
    상기 제1 형태소의 운율 구성요소, 및 상기 제1 형태소의 상기 운율 구성요소에 대응되는 상기 제2 형태소의 운율 구성요소를 추출하는, 운율 구성요소 추출부; 및
    상기 제1 형태소의 상기 운율 구성요소와 상기 제2 형태소의 상기 운율 구성요소가 실질적으로 동일하게 되도록, 상기 제1 형태소의 상기 운율 구성요소를 변환시키는, 운율 변환부를 포함하는, 운율 변환 장치.
  11. 명령어 세트들을 저장하는 컴퓨터 판독가능매체로서,
    상기 명령어 세트들은, 컴퓨팅 장치에 의해 실행되는 경우에 상기 컴퓨팅 장치로 하여금,
    제1 형태소 및 상기 제1 형태소와 음소가 동일한 제2 형태소를 음성 형태로 획득하도록 하고,
    상기 제1 형태소의 운율 구성요소를 추출하도록 하고,
    상기 제1 형태소의 상기 운율 구성요소에 대응되는 상기 제2 형태소의 운율 구성요소를 추출하도록 하고, 그리고
    상기 제1 형태소의 상기 운율 구성요소와 상기 제2 형태소의 상기 운율 구성요소가 실질적으로 동일하게끔 상기 제1 형태소의 상기 운율 구성요소가 변환되도록 하는, 컴퓨터 판독가능 매체.
KR1020130139301A 2013-11-15 2013-11-15 운율을 변환시키는 장치 및 방법 KR20150056366A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130139301A KR20150056366A (ko) 2013-11-15 2013-11-15 운율을 변환시키는 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130139301A KR20150056366A (ko) 2013-11-15 2013-11-15 운율을 변환시키는 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20150056366A true KR20150056366A (ko) 2015-05-26

Family

ID=53391696

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130139301A KR20150056366A (ko) 2013-11-15 2013-11-15 운율을 변환시키는 장치 및 방법

Country Status (1)

Country Link
KR (1) KR20150056366A (ko)

Similar Documents

Publication Publication Date Title
RU2632424C2 (ru) Способ и сервер для синтеза речи по тексту
Isewon et al. Design and implementation of text to speech conversion for visually impaired people
Janse Word perception in fast speech: artificially time-compressed vs. naturally produced fast speech
US20090006098A1 (en) Text-to-speech apparatus
US8315873B2 (en) Sentence reading aloud apparatus, control method for controlling the same, and control program for controlling the same
JP2005502102A (ja) 音声−音声生成システムおよび方法
US9508338B1 (en) Inserting breath sounds into text-to-speech output
CN104899192B (zh) 用于自动通译的设备和方法
Levis et al. Prominence and information structure in pronunciation teaching materials
US10224021B2 (en) Method, apparatus and program capable of outputting response perceivable to a user as natural-sounding
JP6013104B2 (ja) 音声合成方法、装置、及びプログラム
JP2010169973A (ja) 外国語学習支援システム、及びプログラム
JP4964695B2 (ja) 音声合成装置及び音声合成方法並びにプログラム
JP2006139162A (ja) 語学学習装置
JP2005031150A (ja) 音声処理装置および方法
JP6289950B2 (ja) 読み上げ装置、読み上げ方法及びプログラム
RU153322U1 (ru) Устройство для обучения разговорной(устной) речи с визуальной обратной связью
KR20150056366A (ko) 운율을 변환시키는 장치 및 방법
KR20150108144A (ko) 운율의 변환을 이용하는 외국어 말하기 학습 방법 및 장치
Hlaing et al. Myanmar speech synthesis system by using phoneme concatenation method
Sudhakar et al. Development of Concatenative Syllable-Based Text to Speech Synthesis System for Tamil
Roux et al. Incorporating Speech Synthesis in the Development of a Mobile Platform for e-learning.
Iyanda et al. Development of a Yorúbà Textto-Speech System Using Festival
JP7039637B2 (ja) 情報処理装置、情報処理方法、情報処理システム、情報処理プログラム
JP2006302149A (ja) 日本語入力装置

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination