KR20140059910A - 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치 - Google Patents

언어의 발음표기를 기반으로 하는 만국어 음성 출력장치 Download PDF

Info

Publication number
KR20140059910A
KR20140059910A KR1020120126160A KR20120126160A KR20140059910A KR 20140059910 A KR20140059910 A KR 20140059910A KR 1020120126160 A KR1020120126160 A KR 1020120126160A KR 20120126160 A KR20120126160 A KR 20120126160A KR 20140059910 A KR20140059910 A KR 20140059910A
Authority
KR
South Korea
Prior art keywords
pronunciation
korean
input unit
hangul
syllable
Prior art date
Application number
KR1020120126160A
Other languages
English (en)
Inventor
신부용
김진한
Original Assignee
주식회사 케이티
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티, 한국과학기술원 filed Critical 주식회사 케이티
Priority to KR1020120126160A priority Critical patent/KR20140059910A/ko
Publication of KR20140059910A publication Critical patent/KR20140059910A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L2013/083Special characters, e.g. punctuation marks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)

Abstract

본 발명에 따른 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치는 다양한 언어의 발음을 한글로 입력하기 위한 한글자음 입력부; 상기 다양한 언어의 발음을 상기 한글로 입력하기 위한 한글 모음 입력부; 상기 다양한 언어의 억양, 액센트 및 음의 장단 중 어느 하나 이상을 입력하는 특수 발음 입력부; 상기 다양한 언어의 단위음절의 발음에 대응하는 한글 표기와 상기 한글 표기를 수치화 한 한글 표기정보 및 상기 다양한 언어의 발음에 대한 각 음절에 대응하는 음절별 녹음음성정보를 저장하고 있는 데이터베이스; 상기 한글 표기정보를 사용하여, 상기 한글자음 입력부, 상기 한글모음 입력부 및 상기 특수 발음 입력부를 통해 입력되는 발음을 수치 부호화하고, 수치 부호화된 값에 따라 상기 음절별 녹음음성정보로부터 상기 입력되는 발음에 대응하는 음성의 출력을 제어하는 음성출력 제어부; 및 상기 음성출력 제어부의 제어에 따라, 상기 입력되는 발음에 대응하는 음성을 출력하는 음성 출력부를 포함하는 것을 특징으로 한다.

Description

언어의 발음표기를 기반으로 하는 만국어 음성 출력장치{An Universal Text To Speech System based on the Phonetic Description of Languages}
본 발명은 어떤 언어에도 적용할 수 있는 음성출력 기술에 관한 것으로, 보다 상세하게는 특정언어에서 사용되는 모든 단위 음절별 음성정보를 한글로 표기하여 저장한 음절 데이터베이스를 구축하고, 음성으로 출력하고자 하는 어휘(또는 문장)의 발음을 한글로 표기하여 입력함으로써, 입력된 발음에 대응하는 음성(voice)을 상기 음절 DB로부터 검색하여 출력하도록 하는 TTS(Text To Speech)기술에 관한 것이다.
근래 국제간의 교류가 증가하고 있어 다언어 사용의 필요가 늘고 있으며 한 나라 안에서도 다언어 사용의 수요가 늘고 있다. 우리나라에는 수많은 다문화 가정이 생겨나고 있으며 해외관광객과 근로자들의 입국이 증가하여 이러한 다언어 수요가 급증하고 있다. 중국에는 8개 언어군으로 분류되는 290 여 개의 방언이 쓰이고 있으며 인도에는 공식적 언어만 22개 유럽 연합에는 공용어가 23개 있어 공식문서는 23 가지 언어로 만들어져야 한다.
이러한 다언어 간의 소통 수요를 충족시키려면 다언어에 대한 상호 전환기능이 필요하며 이들에 대한 음성 출력이 요구된다.
그런데, 기존의 문서 음성전환 기술(TTS)은 여러가지 문제점으로 인해 개발의 어려움을 겪거나 효용성이 떨어진다.
첫째, 적용 언어의 제한성이다. 기존의 TTS(Text to Speech) 기술은 해당 언어의 철자법에 맞추어입력해야 하므로 특정언어에 국한하여 사용될 수밖에 없어 모든 언어가 고유의 TTS 기술을 개발하여 사용하여야 한다. 예를 들어, 영어 TTS를 사용하려면 영어 철자법에 맞게 알파벳으로 표기하여 입력해야 하며 불어 TTS를 사용하려면 불어 철자법에 맞게 입력해야 한다.
둘째, 철자법에 맞게 적은 문서를 음성으로 전환시키려 할 때 생기는 문제이다. 한국어와 일부 언어를 제외하면 철자법과 발음의 관계가 모호하여 전환방법을 만들기 어려워 많은 노력을 들이거나 아니면 부정확해진다. 또한 대규모 저장 용량을 요하게 되는 것이다. 이 때문에 저장 용량 문제를 해결하기 위해 대개 웹 베이스로 개발된다.
세째, 기존의 TTS 기술의 적용에 따른 문제이다. 기존의 TTS 기술은 자연계에서 음성이 만들어 내는 연속적 소리파 (Continuous sound wave)에서 단위 음편(소리의 조각)을 떼어내어 데이터베이스화 한 후 이를 조합하여 원하는 음성을 표출해 내는 방식과 모든 어휘를 하나씩 녹음해 데이터베이스를 만들고 사전처럼 찾아 쓰는 방법으로 나뉜다. 그러나, 전자의 방식인 경우에는 음편을 떼어내는 일도 어렵거니와 인위적으로 본래 이질적이었던 음편들을 끼워 붙이는 과정에서 자연스러움을 잃거나 이를 살리기 위해 많은 노력을 요하게 된다. 후자의 방식인 사전처럼 만들어 쓰는 방법에서는 과연 얼마나 많은 단어를 입력해 두어야 할지에 대한 문제에 부딪치게 된다. 사용성을 높이려면 매우 큰 데이터베이스가 구축되어야 하며 그렇지 않으면 사용성이 떨어진다. 즉, 기존의 TTS는 언어의 스펠링(Spelling) 즉 어휘의 철자를 입력하여 이에 대응하는 음성을 출력하는 것이므로, 어휘 각각에 대응하는 음성 정보 모두를 구비해야 하므로 데이터의 용량이 커질 수 밖에 없다.
본 발명이 해결하고자 하는 과제는 각 언어에서 실제로 사용되고 있는 단위 음절의 발음을 한글표기와 함께 저장한 데이터 베이스를 구축하고, 음성으로 출력하고자 하는 어휘나 문장을 철자법이 아닌 발음을 한글로 표기하여 입력함으로써, 입력된 발음에 대응하는 음성을 데이터 베이스로부터 검색하여 출력하도록 하는 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치에 관한 것이다. 모든 언어의 발음은 한글로 표기가 가능하므로 이 장치는 모든 언어에 동시에 적용할 수 있는 것이다.
상기의 과제를 해결하기 위한 본 발명에 따른 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치는 다양한 언어의 발음을 한글로 입력하기 위한 한글자음 입력부; 상기 다양한 언어의 발음을 상기 한글로 입력하기 위한 한글 모음 입력부; 상기 다양한 언어의 억양, 액센트 및 음의 장단 중 어느 하나 이상을 입력하는 특수 발음 입력부; 상기 다양한 언어의 단위음절의 발음에 대응하는 한글 표기와 상기 한글 표기를 수치화 한 한글 표기정보 및 상기 다양한 언어의 발음에 대한 각 음절에 대응하는 음절별 녹음음성정보를 저장하고 있는 데이터베이스; 상기 한글 표기정보를 사용하여, 상기 한글자음 입력부, 상기 한글모음 입력부 및 상기 특수 발음 입력부를 통해 입력되는 발음을 수치 부호화하고, 수치 부호화된 값에 따라 상기 음절별 녹음음성정보로부터 상기 입력되는 발음에 대응하는 음성의 출력을 제어하는 음성출력 제어부; 및 상기 음성출력 제어부의 제어에 따라, 상기 입력되는 발음에 대응하는 음성을 출력하는 음성 출력부를 포함하는 것을 특징으로 한다.
상기 한글 표기정보는 상기 한글의 자음에 해당하는 ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅈ, ㅎ 및 ㅇ과 상기 한글의 모음에 해당하는 ㅣ,ㅏ, ㅓ, ㅡ, ㅗ, ㅜ, ㅐ, ㅔ, ㅚ 및 ·에 각각 0 내지 9 중 어느 하나의 숫자가 할당되어 있는 것을 특징으로 한다.
상기 한글 표기정보는 중국어의 4성 억양과 영어 액센트 및 음의 장단에 각각 0 내지 9 중 어느 하나의 숫자가 할당되어 있는 것을 특징으로 한다.
상기 음절별 녹음음성정보는 상기 다양한 언어 중에는 한국어, 영어, 중국어, 일본어, 프랑스어, 스페인어 및 러시아어 중 적어도 어느 하나 이상이 표현하는 발음의 음절 각각에 대한 음성정보를 포함하는 것을 특징으로 한다.
상기 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치는, 휴대용 전자기기 및 비휴대용 전자기기 중 적어도 어느 하나 이상에 탑재되는 것을 특징으로 한다.
본 발명에 따르면, 다언어의 단위 음절 발음을 한글기반으로 표기하고 또한 수치화하여 저장하고, 한글로 표기하여 입력된 어휘나 문장의 음절 발음에 대응하는 음성을 검색하여 출력하도록 함으로써, 어떤 언어의 발음이라도 이와 대응하는 음성을 제한 없이 출력할 수 있다.
또한, 본 발명은 자연계에서 만들어진 음성 자원(Source)에서 음편을 추출하는 것이 아니라 언어에서 실제로 사용되는 발음의 단위 음절에 따른 음성정보만을 녹음하여 데이터베이스화 한 상태에서, 이러한, 데이터베이스를 이용해, 발음에 대응하는 음성을 출력하도록 한다는 점에서, 모든 언어의 어휘에 대한 철자법 정보나 음성정보를 데이터베이스에 저장하지 않아도 되므로, 데이터베이스 규모를 최소화 할 수 있다.
도 1은 본 발명에 따른 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치를 설명하기 위한 일 실시예의 블록도이다.
도 2는 한글 자음 입력부, 한글모음 입력부 및 특수발음 입력부의 입력 키패드를 설명하기 위한 일 예의 참조도이다.
도 3은 한글기반의 만국 발음표기와 수치화를 위한 한글 표기정보의 일 예를 도시한 참조도이다.
도 4는 한국어, 영어, 중국어, 일본어의 단위 음절의 발음에 대한 한글표기와 그 수치화를 예시한 일 예의 참조도이다.
이하, 본 발명에 따른 언어의 발음을 기반으로 하는 음성 출력장치를 첨부된 도면을 참조하여 상세히 설명한다.
도 1은 본 발명에 따른 언어의 발음을 기반으로 하는 음성 출력장치를 설명하기 위한 일 실시예의 블록도로서, 한글자음 입력부(100), 한글모음 입력부(110), 특수발음 입력부(120), 데이터베이스(130), 음성출력 제어부(140) 및 출력부(150)로 구성된다.
한글자음 입력부(100)는 다양한 언어의 자음 발음을 한글로 입력한다. 이를 위해, 한글자음 입력부(100)는 한글 자음 입력 키패드를 구비한다.
도 2는 한글 자음 입력부, 한글모음 입력부 및 특수발음 입력부의 입력 키패드를 설명하기 위한 일 예의 참조도이다. 도 2에 도시된 바와 같이, 한글 자음 입력 키패드(200)는 한글 자음에 해당하는 "ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅈ, ㅎ 및 ㅇ"의 키패드를 갖는다.
이때, 상기에 열거하지 않은 자음 즉, "ㅊ, ㅋ, ㅌ, ㅍ"은 각각 "ㅈ+ㅎ=ㅊ, ㄱ+ㅎ=ㅋ, ㄷ+ㅎ=ㅌ, ㅂ+ㅎ=ㅍ" 의 소리 구조를 갖는다. 따라서, 한글자음 입력부(100)는 "ㅈ"과 "ㅎ"가 연속해서 선택된 경우에 "ㅊ"으로 입력하고, "ㄱ"과 "ㅎ"가 연속해서 선택된 경우에 "ㅋ"으로 입력하고, "ㄷ"과 "ㅎ"가 연속해서 선택된 경우에 "ㅌ"으로 입력하고, "ㅂ"과 "ㅎ"가 연속해서 선택된 경우에 "ㅍ"으로 입력한다.
또한 “ㄱ”을 연속해서 두 번 누르면 “ㄲ”, “ㄷ” 을 연속으로 입력하면 “ㄸ”이 되고 “ㅂ", "ㅅ”, “ㅈ" 을 연속으로 입력하면 각각 "ㅃ", "ㅆ", "ㅉ" 이 되며 현재 사용하지 않는 순경음 "ㅂ(ㅂㅇ)" 은 "ㅇ" 과 "ㅂ" 을 연속으로 입력하여 구현하고, 영어의 "z"는 "ㅇ"과 "ㅈ"을 연속으로 입력하는 등 무한한 조합이 가능하다.
한글모음 입력부(110)는 다양한 언어의 모음 발음을 한글로 입력한다. 이를 위해, 한글모음 입력부(110)는 한글 모음 입력 키패드를 구비한다. 도 2에 도시된 바와 같이, 한글 모음 입력 키패드(210)는 한글 모음에 해당하는 ㅣ,ㅏ, ㅓ, ㅡ, ㅗ, ㅜ, ㅐ, ㅔ, ㅚ 및 ·(아래아)의 키패드를 갖는다.
이때, 상기에 열거하지 않은 모음 중 "ㅑ,ㅕ, ㅛ, ㅠ" 등은 각각 "ㅏ+ ·=ㅑ, ㅓ+·=ㅕ, ㅗ+·=ㅛ, ㅜ+·=ㅠ" 의 소리 구조를 갖는다. 따라서, 한글모음 입력부(100)는 "ㅏ"과 "·"가 연속해서 선택된 경우에 "ㅑ"으로 입력하고, "ㅓ"과 "·"가 연속해서 선택된 경우에 "ㅕ"으로 입력하고, "ㅗ"과 "·"가 연속해서 선택된 경우에 "ㅛ"으로 입력하고, "ㅜ"과 "·"가 연속해서 선택된 경우에 "ㅠ"으로 입력한다.
또한 "ㅗ" 와 "ㅏ" 를 연속으로 입력하면 “ㅘ” 가 되고 “ㅜ" 와 "ㅓ"를 연속으로 입력하면 “ㅝ" 가 되는 등 복합모음을 구현할 수 있다.
특수발음 입력부(120)는 다양한 언어의 억양, 액센트 및 음의 장단 중 어느 하나 이상을 입력한다. 이를 위해, 특수발음 입력부(120)는 특수발음 입력 키패드를 구비한다. 이때, 상기에 열거하지 않은 억양이 필요하다면 한 개 이상의 억양 부호를 연속으로 입력하는 방식으로 추가 도입할 수 있을 것이다. 도 2에 도시된 바와 같이, 특수발음 입력 키패드는 중국어의 4성 억양 키패드(220), 영어 액센트 키패드, 베트남어의 2중 꺽임 억양 키패드(240) 및 음의 장단 키패드(250)를 각각 갖는다.
데이터베이스(130)는 다양한 언어의 단위음절 발음에 대응하는 한글 표기를 수치화 한 한글 표기정보 및 이들 한글표기에 대응하는 음절별 녹음음성정보를 각각 저장하고 있다.
도 3은 한글기반의 만국 발음표기를 위한 한글 표기정보의 일 예를 도시한 참조도이다.
도 3에 도시된 바와 같이, 한글 표기정보는 한글의 기본 자음 10개와 기본 모음 10개, 그리고 억양 표현 10개를 조합하여 모든 언어의 발음을 표기할 수 있도록 한 것으로, 자음, 모음 및 억양 표현 등에 대해 각각 수치(Code)화 한 테이블 정보이다. 즉, 한글 자음에 해당하는 ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅈ, ㅎ 및 ㅇ에 대해 각각 0 내지 9 중 어느 하나의 숫자로 할당되어 있다. 또한, 한글 모음에 해당하는 ㅣ,ㅏ, ㅓ, ㅡ, ㅗ, ㅜ, ㅐ, ㅔ, ㅚ 및 ·에 각각 0 내지 9 중 어느 하나의 숫자로 할당되어 있다. 또한, 중국어의 4성 억양과 영어 액센트 및 음의 장단 등에 각각 0 내지 9 중 어느 하나의 숫자로 할당되어 있다.
또한, 도 4는 한국어, 영어, 중국어, 일본어의 단위 음절의 발음에 대한 한글표기와 그 수치화를 예시한 일 예의 참조도이다. 단위 음절은 초성자음과 모음 및 종성자음으로 이루어지는 것으로 보았으며 수치화에 있어서 모음은 양 쪽에 점(.)을 찍어 자음과 구별하도록 하였다. 복모음과 이중모음은 하나의 모음으로 보았기 때문에 영어 음절에서 “가ㅣ”와 “가ㅣㄷ” 는 모두 1음절이며 각각 “1.21.” 과 “1.21.3” 으로 수치화된다.
음절별 녹음음성정보는 각 언어의 발음에 따른 각 음절에 대응하는 음성을 서로 매칭해 놓은 정보를 의미한다. 이 음절별 녹음음성정보는 한국어, 영어, 중국어, 일본어, 프랑스어, 스페인어 및 러시아어 등 다양한 언어 중 선택된 언어에 대해 구축할 수 있다.
예를 들어, 중국어에는 415 개의 음절만이 있고 4성으로 적용해도 성조가 없이 발음되는 경우까지 고려하면 2,075 개의 음절만 있으면 된다. 일본어에는 215개 음절이 있고 영어에서 쓰이는 음절도 약 1,200 개에 불과하여 억양을 적용해도 2500 개가 될 뿐이다. 또한, 한국어는 초성자음 19개, 모음 21개, 종성자음 21 개로 되는 음절 8,379 개와 종성 자음이 없는 399개를 포함해 총 8,778개가 있지만 이는 가능한 표기 혹은 글자의 수이고 실제로 사용되는 음절은 1,283 개라 한다(신지영저, 한국어와 말소리).
그렇다면 한, 영, 중, 일어 등에서 쓰는 음절은 다 합해도 6,300 개에 불과하며 이들 음절 중에는 중복되는 것이 많다. 예를 들어 "마"라는 음절은 한국어뿐 아니라 영어와 중국어 일어에 다 들어 있다. 또한 일본어에서 사용되는 음절은 거의 영어나 한국어에서 사용된다는 점도 감안할 수 있다. 따라서 통상적으로 인간이 언어에서 쓰는 음절은 전부 해서 5,000 개 정도에 불과하다. 이에 따라, 본 발명에 따른 음절별 음성정보는 상기한 5,000 개의 음절과 이에 대응하는 음성을 매칭하여 등록해 놓은 정보이다. 다만, 본 발명에 따른 음절별 음성정보는 한국어, 일본어, 중국어, 영어 이외에, 프랑스어, 스페인어, 러시아어 등 다양한 언어를 반영해 5000개 이상의 음절에 대한 정보를 가질 수도 있다.
음성출력 제어부(140)는 한글 표기 테이블 정보를 사용하여, 한글자음 입력부(100), 한글모음 입력부(110) 및 특수 발음 입력부(120)를 통해 입력되는 발음을 수치 부호화하고, 수치 부호화된 값에 따라 음절별 음성정보로부터 입력 발음에 대응하는 음성의 출력을 제어한다.
예를 들어, 중국어의 "酒" 또는 "撤"에 대한 음성을 출력하기 위해, 한글 발음에 해당하는 "사"에 해당하는 발음을 한글자음 입력부(100)의 "ㅅ" 키패드와 한글모음 입력부(110)의 "ㅏ" 키패드와 중국어 4성 중 특수발음 입력부(120)의 "3성" 키패드를 통해 입력하게 되면, 음성출력 제어부(140)는 "ㅅ" 의 수치화 값 "7", "ㅏ" 의 수치화 값 "2" 및 "3성"의 수치화 값 "3"을 한글 표기 테이블 정보로부터 각각 추출함으로써, "사3 "에 대응하는 수치화 값 즉 "7.2.3"을 산출할 수 있다. 이 표기에서 모음 "ㅏ" 는 양쪽에 점(.) 을 찍어 구별 되었으며, 중국어 성조 3 은 모음 뒤에서 역시 점(.) 을 찍어 종성 자음과 구별하게 된다. 이 후, 음성출력 제어부(140)는 "사3 " 라는 음절의 수치화된 값 "7.2.3"에 대응하는 음성을 5000개 이상의 음절에 각각 대응하는 음성정보를 갖고 있는 음절별 녹음음성정보로부터 검색하여 추출한다. 그 후, 음성출력 제어부(140)는 추출된 음성을 음성 출력부(150)을 통해 출력하도록 제어한다.
또 다른 예로, 영어의 "student"라는 음성을 출력하기 위해, "student"의 한글 발음에 해당하는 "스튜--든트" 중 "스"에 대해서 한글자음 입력부(100)의 "ㅅ" 키패드와 한글모음 입력부(110)의 "ㅡ" 키패드를 이용해 입력하고, "튜"에 대해서 한글자음 입력부(100)의 "ㄷ+ㅎ" 키패드와 한글모음 입력부(110)의 "ㅜ+·" 키패드를 이용해 입력하고, 억양 중 장음에 해당하는 "--"에 대해서는 특수 발음 입력부(120)의 "--" 키패드를 이용해 입력하고, "든"에 대해서 한글자음 입력부(100)의 "ㄷ" 키패드와 한글모음 입력부(110)의 "ㅡ" 키패드와 한글자음 입력부(100)의 "ㄴ" 키패드를 이용해 입력하고, "트"에 대해서 한글자음 입력부(100)의 "ㄷ+ㅎ" 키패드와 한글모음 입력부(110)의 "ㅡ" 키패드를 이용해 입력할 수 있다. 그러면, 음성출력 제어부(140)는 한글 표기 테이블 정보로부터 "ㅅ" 의 수치화 값 "7", "ㅡ" 의 수치화 값 "4" 를 추출하고, "ㅌ" 의 수치화 값 "39", "ㅠ" 의 수치화 값 "60" 를 추출하고, "--"의 수치화 값 "7"을 추출하고, "ㄷ" 의 수치화 값 "3", "ㅡ" 의 수치화 값 "4", "ㄴ" 의 수치화 값 "2"를 추출하고, "ㅌ" 의 수치화 값 "39", "ㅡ" 의 수치화 값 "4" 를 각각 추출한다. 이에 따라, 음성출력 제어부(140)는 "스튜--든트" 의 각 음절에 대응하는 수치화 값 즉 "7.4. 39.60.7. 3.4.2. 39.4."을 산출할 수 있다. 이 후, 음성출력 제어부(140)는 "스튜--든트" 라는 각 음절의 수치화된 값 "7.4. 39.60.7. 3.4.2. 39.4."에 대응하는 음성을 음절별 녹음음성정보로부터 추출한다. 그 후, 음성출력 제어부(140)는 추출된 음성을 음성 출력부(150)을 통해 출력하도록 제어한다.
음성 출력부(150)는 음성출력 제어부(140)의 제어에 따라, 음성출력 제어부(140)에 의해 추출된 음성을 출력한다. 이를 위해, 음성 출력부(150)는 음성 증폭 및 출력을 위한 스피커를 포함하고 있다.
이렇게 발음 표기를 기초로 다양한 언어의 발음을 판별하여 음성을 출력할 수 있는 것은, 한글로는 어떤 언어라도 그 음소 (Phoneme) 를 1:1 로 거의 정확하게 표기할 수 있고 또한 언어별로 같은 발음이 중복되는 일이 거의 없기 때문에 가능한 것이다. 예를 들어 "스튜--든트"를 입력했을 경우 이것이 영어인지 중국어인지 구별 할 필요 없이 입력 된 음절의 발음만을 표출해 주면 되는 것이다.
이러한 본원 발명인 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치는 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
100: 한글 자음 입력부
110: 한글 모음 입력부
120: 특수 발음 입력부
130: 데이터베이스
140: 음성 출력 제어부
150: 음성 출력부

Claims (5)

  1. 다양한 언어의 발음을 한글로 입력하기 위한 한글자음 입력부;
    상기 다양한 언어의 발음을 상기 한글로 입력하기 위한 한글 모음 입력부;
    상기 다양한 언어의 억양, 액센트 및 음의 장단 중 어느 하나 이상을 입력하는 특수 발음 입력부;
    상기 다양한 언어의 단위음절의 발음에 대응하는 한글 표기와 상기 한글 표기를 수치화 한 한글 표기정보 및 상기 다양한 언어의 발음에 대한 각 음절에 대응하는 음절별 녹음음성정보를 저장하고 있는 데이터베이스;
    상기 한글 표기정보를 사용하여, 상기 한글자음 입력부, 상기 한글모음 입력부 및 상기 특수 발음 입력부를 통해 입력되는 발음을 수치 부호화하고, 수치 부호화된 값에 따라 상기 음절별 녹음음성정보로부터 상기 입력되는 발음에 대응하는 음성의 출력을 제어하는 음성출력 제어부; 및
    상기 음성출력 제어부의 제어에 따라, 상기 입력되는 발음에 대응하는 음성을 출력하는 음성 출력부를 포함하는 것을 특징으로 하는 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치.
  2. 제1항에 있어서, 상기 한글 표기정보는
    상기 한글의 자음에 해당하는 ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅈ, ㅎ 및 ㅇ과 상기 한글의 모음에 해당하는 ㅣ,ㅏ, ㅓ, ㅡ, ㅗ, ㅜ, ㅐ, ㅔ, ㅚ 및 ·에 각각 0 내지 9 중 어느 하나의 숫자가 할당되어 있고, 조합에 의해 다양한 복수의 자음과 모음의 표기가 가능하도록 하는 것을 특징으로 하는 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치.
  3. 제1항에 있어서, 상기 한글 표기정보는
    중국어의 4성 억양과 영어 액센트 및 음의 장단에 각각 0 내지 9 중 어느 하나의 숫자가 할당되어 있고, 조합에 의해 필요한 억양 표기를 추가할 수 있도록 하는 것을 특징으로 하는 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치.
  4. 제1항에 있어서, 상기 음절별 녹음음성정보는
    상기 다양한 언어 중에는 한국어, 영어, 중국어, 일본어, 프랑스어, 스페인어 및 러시아어 중 적어도 어느 하나 이상이 표현하는 발음의 음절 각각에 대한 음성정보를 포함하는 것을 특징으로 하는 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치는
    휴대용 전자기기 및 비휴대용 전자기기 중 적어도 어느 하나 이상에 탑재되는 것을 특징으로 하는 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치.
KR1020120126160A 2012-11-08 2012-11-08 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치 KR20140059910A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120126160A KR20140059910A (ko) 2012-11-08 2012-11-08 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120126160A KR20140059910A (ko) 2012-11-08 2012-11-08 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치

Publications (1)

Publication Number Publication Date
KR20140059910A true KR20140059910A (ko) 2014-05-19

Family

ID=50889504

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120126160A KR20140059910A (ko) 2012-11-08 2012-11-08 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치

Country Status (1)

Country Link
KR (1) KR20140059910A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024106986A1 (ko) * 2022-11-16 2024-05-23 김정윤 조음 가능한 모든 소리를 표현하는 음성 기호 체계로서의 확장 한글 생성 장치 및 확장 한글을 활용하는 언어학습 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024106986A1 (ko) * 2022-11-16 2024-05-23 김정윤 조음 가능한 모든 소리를 표현하는 음성 기호 체계로서의 확장 한글 생성 장치 및 확장 한글을 활용하는 언어학습 방법

Similar Documents

Publication Publication Date Title
Abate et al. An Amharic speech corpus for large vocabulary continuous speech recognition.
WO2007127656A1 (en) System and method for generating a pronunciation dictionary
Alsharhan et al. Improved Arabic speech recognition system through the automatic generation of fine-grained phonetic transcriptions
Lyudovyk et al. Code-switching speech recognition for closely related languages
Kayte et al. Di-phone-based concatenative speech synthesis systems for marathi language
KR20170057623A (ko) 언어장애인을 위한 다언어 어휘의 발음 합성 및 문자화 장치
Raza et al. Design and development of phonetically rich Urdu speech corpus
KR102517025B1 (ko) 리듬과 운율을 가진 언어에 대한 음성출력장치 및 그 출력방법
KR102517021B1 (ko) 리듬과 운율을 가진 언어에 대한 한글입력장치 및 그 입력방법
Wasala et al. Sinhala grapheme-to-phoneme conversion and rules for schwa epenthesis
KR20140059910A (ko) 언어의 발음표기를 기반으로 하는 만국어 음성 출력장치
Cherifi et al. Arabic grapheme-to-phoneme conversion based on joint multi-gram model
KR101553469B1 (ko) 다언어 어휘 음성 인식 장치 및 방법
Khamdamov et al. Syllable-Based Reading Model for Uzbek Language Speech Synthesizers
Braga et al. to-sound conversion for galician TTS systems
Dijkstra et al. Frisian TTS, an example of bootstrapping TTS for minority languages
Hanane et al. TTS-SA (A text-to-speech system based on standard arabic)
Al-Daradkah et al. Automatic grapheme-to-phoneme conversion of Arabic text
Phaiboon et al. Isarn Dharma Alphabets lexicon for natural language processing
KR102517024B1 (ko) 리듬과 운율을 가진 언어에 대한 운율표시장치 및 그 표시방법
GB2480649A (en) Non-native language spelling correction
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
JPH03245192A (ja) 外国語単語の発音決定方法
Li et al. Corpus design and annotation for speech synthesis and recognition
Singh et al. Punjabi text-to-speech synthesis system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application