KR20020056315A - 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법 - Google Patents

음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법 Download PDF

Info

Publication number
KR20020056315A
KR20020056315A KR1020000085639A KR20000085639A KR20020056315A KR 20020056315 A KR20020056315 A KR 20020056315A KR 1020000085639 A KR1020000085639 A KR 1020000085639A KR 20000085639 A KR20000085639 A KR 20000085639A KR 20020056315 A KR20020056315 A KR 20020056315A
Authority
KR
South Korea
Prior art keywords
pronunciation
category
dictionary
editing
words
Prior art date
Application number
KR1020000085639A
Other languages
English (en)
Other versions
KR100464019B1 (ko
Inventor
김현아
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to KR10-2000-0085639A priority Critical patent/KR100464019B1/ko
Publication of KR20020056315A publication Critical patent/KR20020056315A/ko
Application granted granted Critical
Publication of KR100464019B1 publication Critical patent/KR100464019B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법에 관한 것으로, 기존의 발음 사전을 편집하는 방법은 일반적인 문서 편집기를 이용하여 이루어지기 때문에, 발음 사전의 단어나 문장 리스트만 보아서는 이 단어나 문장의 음운적 특성이 표시되지 않기 때문에 발음 사전의 모든 리스트에 대해서 처음부터 순차적으로 검토해야 하므로 시간이 오래 걸리고, 수정시 오류가 발생할 가능성도 높은 문제점이 있었다. 따라서, 본 발명은 수작업으로 부분적인 오류 수정이 필요한 발음 사전의 텍스트 파일을 편집할 때, 편집 작업이 필요하지 않은 부분과 필요한 부분을 시각적으로 구분하여, 필요한 부분에 대해서만 수정이 이루어질 수 있도록 함으로써, 발음 사전의 편집 시간 및 오류 발생 빈도를 최소화할 수 있도록 하는 효과가 있다.

Description

음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법{PRONUNCIATION STRING DISPLAY METHOD AT THE TIME OF EDIT FOR VOICE RECOGNIZING APPARATUS}
본 발명은 음성 인식기에 사용되는 발음 사전의 편집 기술에 관한 것으로, 특히 발음사전 생성후 음운변화 규칙을 따르지 않는 예외적인 발음열에 대하여 검토 및 편집이 용이하도록 하는 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법에 관한 것이다.
컴퓨터를 사용할 때 불편한 점 중 하나는 명령을 키보드로 입력하는 것이다. 물론, 최근에는 그래픽 인터페이스(CGI)의 발달로 마우스와 키보드를 함께 사용함으로서 편의성이 많이 개선되었으나, 사람끼리의 대화에 비하면 아직 불편한 점이 많은 상태이다.
이러한 음성인식 기술은 현재 여러 연구기관에서 독자적인 기술을 개발하여 발전시키고 있는 상황으로, 그 기술의 종류가 아주 많지만 기본적으로 인식할 단어 및 문장들을 데이터베이스로 만든 발음 사전을 구비하게 된다.
따라서, 음성의 인식률을 높이는데 있어서 발음 사전이 어떻게 구성되어 있는가 하는 것은 매우 중요한 요소가 되는 것이다.
그럼, 종래 음성 인식기의 발음 사전 생성 방법을 설명한다.
일단, 종래의 음성 인식기는 먼저 인식할 단어 및 문장의 리스트를 작성한 후, '발음열 생성 프로그램'을 이용하여 각각의 인식기에서 사용하는 형태에 맞게 발음 사전을 생성한다.
이때, 상기 '발음열 생성 프로그램'은 대부분 한글 자모의 조합 순서와 한국어의 음운 변화 규칙에 기반하여, 단어나 문장을 발음할 때 소리나는 대로 변환한다.
그러나, 음운 변화 규칙을 따르지 않고 예외적으로 소리나는 단어나 문장들에 대해서는 따로 '예외 사전'을 두어서, 이에 해당하는 단어들의 발음열을 제작자가 직접 기재해 놓고, 음운 변화 규칙을 적용하는 대신 예외 사전에 기재된 발음열을 인용하여 발음 사전을 생성하도록 한다.
그런데, 한국어에는 동일한 단어나 문장이라고 할지라도 그 의미나 앞뒤에 함께 쓰이는 단어 문맥에 따라 다르게 발음되는 경우가 있기 때문에, 일반적으로 여러개의 후보 발음열이 생성되는 경우 '발음열 생성 프로그램'마다 일정한 원칙에 의해 우선 순위가 가장 높은 발음열을 선택하여 발음 사전을 구성하게 된다.
예를 들어, '이민세'라는 단어가 사람의 이름을 뜻하는 경우인지 또는 세금의 의미를 뜻하는 경우인지에 따라 각각 소리나는 발음이 다르기 때문에(즉, 세금의 의미일 경우 '이민쎄'로 발음된다), 이 단어를 사용하는 용도에 따라 알맞은 발음열을 발음 사전에 포함시켜야 한다.
따라서, '발음열 생성 프로그램'을 통해 발음 사전을 자동 생성할 경우, 정확성을 높이기 위해서는 수작업을 통한 발음 사전 검토 및 편집 과정을 거쳐야 한다.
이를 통해 여러 가지 형태로 발음될 수 있는 단어나 문장들, 특히 '예외사전'에 포함되어 있지만 실제 사용되는 의미에 따라 일반적인 음운 변화 규칙을 적용할 수도 있고, 예외 사전에 기재된 발음열을 인용하여 사용할 수도 있는 단어나 문장들에 대한 확인 절차가 이루어진다.
이러한 '발음 사전'을 편집하는 방법은 일반적인 문서 편집기를 이용하여 이루어지며, 개발자가 직접 발음 사전의 단어나 문장 리스트를 처음부터 순차적으로 하나씩 검토해 나가는 방식을 취한다.
그러나, 기존의 발음 사전을 편집하는 방법은 일반적인 문서 편집기를 이용하여 이루어지기 때문에, 발음 사전의 단어나 문장 리스트만 보아서는 이 단어나 문장의 음운적 특성이 표시되지 않는다.
즉, 이 단어가 예외 사전에 포함되어 있는지 여부를 한 눈에 알 수 없기 때문에, 일반적인 음운 변화 규칙을 적용하여 단 하나의 발음열을 생성하는 리스트처럼 수정 여부를 검토하지 않아도 될 것 들과의 구분이 명확하지 않다.
따라서, 발음 사전의 모든 리스트에 대해서 처음부터 순차적으로 검토해야 하므로 시간이 오래 걸리고, 수정시 오류가 발생할 가능성도 높은 문제점이 있었다.
따라서, 본 발명은 상기와 같은 종래의 문제점을 해결하기 위하여 창출한 것으로, 수작업으로 부분적인 오류 수정이 필요한 발음 사전의 텍스트 파일을 편집할 때, 편집 작업이 필요하지 않은 부분과 필요한 부분을 시각적으로 구분하여, 필요한 부분에 대해서만 수정이 이루어질 수 있도록 함으로써, 발음 사전의 편집 시간 및 오류 발생 빈도를 최소화할 수 있도록 하는 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법을 제공함에 그 목적이 있다.
도1은 본 발명에 의해 발음 사전이 생성되어 편집이 완료되기 까지의 과정을 설명하기 위해 보인 예시도.
이와 같은 목적을 달성하기 위한 본 발명은, 음성 인식기의 발음 사전 편집에 있어서, 특정한 문자열 범주를 등록하는 제1단계와; 상기 등록된 범주에 다시 다수개의 단어나 문자열을 등록하는 제2단계와; 상기 등록된 범주에 적용할 글꼴 서식을 설정하는 제3단계와; 상기 서식이 설정된 각 범주에 속하는 문자열이 화면에 표시될 때, 기 설정된 서식에 의해 디스플레이시키는 제4단계를 포함하여 이루어진 것을 특징으로 한다.
이하, 본 발명에 따른 일실시예를 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다.
본 발명에서는 음성 인식기에 사용되는 발음 사전 편집시에, 수정을 전혀 고려하지 않아도 되는 부분(문자열)과 수정이 필요할 수도 있는 부분(문자열)을 시각적으로 구분이 가능하도록 디스플레이 하는 특징이 있다.
발음 사전은 라인이나 단락별로 특정한 형식이 반복되는 형태로, 음성 인식의 후보가 되는 단어나 문장의 발음 표기를 포함하고 있다.
이것은 상술한 바와 같이 '발음열 생성 프로그램'을 통해 자동으로 생성되는 것이 보통이지만, 한국어의 음운적 특성상 모든 단어나 문장의 발음 표기를 자동으로 생성할 수 없기 때문에, 부분적인 편집 작업이 필요하게 된다.
또한, 대부분의 발음 사전은 수천개 이상의 단어 및 문장과 그 발음 표기를 포함하기 때문에, 이 리스트를 처음부터 순차적으로 검토하면서 수작업으로 수정하기 위해서는 시간이 많이 소요되고 오류가 발생할 가능성이 크다.
따라서, 본 발명에서는 항상 한가지 형태로만 발음되기 때문에 발음열 자동 생성 과정을 거친 후 수정을 할 필요가 없는 단어(또는 문장) 및 예외 사전에 포함되어 있어 확인이 필요한 단어(또는 문장), 실제 사용되는 의미나 앞뒤에 함께 쓰이는 단어 문맥에 따라 다르게 발음되기 때문에 사용자의 판단에 따라 임의로 발음 표기열을 수정해야 하는 단어(또는 문장) 등을 편집 화면상에서 다르게 디스플레이되도록 함으로써, 편집 시간 및 오류 발생 빈도를 최소화할 수 있도록 하는 특징이 있다.
본 발명에서는 문서 편집 기능의 하나로, 특정한 범주를 등록하고 다시 다수 개의 단어나 문자열을 이 범주에 등록시킨 후, 이 범주에 적용될 글꼴(글자색, 글자체, 글꼴형태 등) 서식을 설정하여 두면, 이 범주에 속하는 문자열이 화면에 표시될 경우, 그 서식에 의해 디스플레이되도록 한다.
예를 들어, '발음열 생성 프로그램'에서 음운 변화 규칙을 따르지 않고 예외적으로 발음되는 단어나 문장을 '인명', '관공서', '부서명' 등과 같이 범주를 분류하고, 그 각각에 대하여 '예외 사전 1', '예외 사전 2', '예외 사전 3'을 포함하도록 했을 경우, 이를 발음 사전 생성 과정에 적용하였다면 발음 사전 편집시에 3개의 범주를 등록하고 각각의 예외 사전에 기재된 단어나 문장들을 각 범주에 등록시킨 후, 각기 다른 글꼴 서식을 설정하여 둔다.
그러면, 발음 사전을 편집하는 화면상에는 등록된 범주에 속하는 문자열이 표시될 때마다, 설정된 서식에 의해 시각적으로 구분이 될 수 있도록 디스플레이되는 것이다.
따라서, 발음 사전의 전체 리스트를 검토하는 대신 수정 검토가 필요없는 부분은 생략하고, 예외 사전에 포함되어 있어 확인이 필요한 단어(또는 문장), 또는 실제 사용되는 의미나 앞뒤에 함께 쓰이는 단어 문맥에 따라 다르게 발음되어 사용자의 판단에 따라 임의로 발음 표기열을 수정해야 하는 단어(또는 문장)와 같이 반드시 검토가 필요한 문자열에 대해서만 발음열 표기를 검토하도록 한다.
상술한 방법에 의해 발음 사전이 생성되어 편집이 완료되기 까지의 과정을 도1의 예시도를 참조하여 설명하면 다음과 같다.
일단, 인식할 단어 및 문장 리스트를 '발음열 생성 프로그램'에 의해 발음 사전을 생성한다.
이때, 상기 '발음열 생성 프로그램'은 예외 사전 및 음운 변화 규칙을 참조하여 발음 사전을 생성하고, 이와 같이 생성된 발음 사전은 개발자에 의해 수작업으로 편집이 이루어지게 된다.
즉, '개발자는 문서 편집 프로그램'에 의해 상기 생성된 발음 사전을 로딩하여 화면에 디스플레이시키는데, 이때 단어 범주 정보 및 각 범주별로 설정된 서식에 디스플레이 된다.
이에 따라, 개발자는 상기 서식에 의해 디스플레이된 부분에서 검토가 필요한 부분을 즉시 찾아서 편집을 수행할 수 있게 된다.
이상에서 설명한 바와 같이 본 발명 음성 인식기의 발음 사전 편집시 발음열디스플레이 방법은, 수작업으로 부분적인 오류 수정이 필요한 텍스트 파일을 편집할 때, 편집 작업이 필요하지 않은 부분과 필요한 부분을 시각적으로 구분하여, 필요한 부분에 대해서만 수정이 이루어질 수 있도록 함으로써, 발음 사전의 편집 시간 및 오류 발생 빈도를 최소화할 수 있도록 하는 효과가 있다.

Claims (2)

  1. 음성 인식기의 발음 사전 편집에 있어서, 특정한 문자열 범주를 등록하는 제1단계와; 상기 등록된 범주에 다시 다수개의 단어나 문자열을 등록하는 제2단계와; 상기 등록된 범주에 적용할 글꼴 서식을 설정하는 제3단계와; 상기 서식이 설정된 각 범주에 속하는 문자열이 화면에 표시될 때, 기 설정된 서식에 의해 디스플레이시키는 제4단계를 포함하여 이루어진 것을 특징으로 하는 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법.
  2. 제1항에 있어서, 상기 서식은 글자색, 글자체, 글꼴 형태 등을 포함하도록 이루어진 것을 특징으로 하는 발음 사전 편집시 발음열 디스플레이 방법.
KR10-2000-0085639A 2000-12-29 2000-12-29 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법 KR100464019B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2000-0085639A KR100464019B1 (ko) 2000-12-29 2000-12-29 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2000-0085639A KR100464019B1 (ko) 2000-12-29 2000-12-29 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법

Publications (2)

Publication Number Publication Date
KR20020056315A true KR20020056315A (ko) 2002-07-10
KR100464019B1 KR100464019B1 (ko) 2004-12-30

Family

ID=27688810

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2000-0085639A KR100464019B1 (ko) 2000-12-29 2000-12-29 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법

Country Status (1)

Country Link
KR (1) KR100464019B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7885656B2 (en) 2004-06-10 2011-02-08 Lg Electronics Inc. Handover execution and communication resumption in wireless access system

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204389A (ja) * 1992-01-23 1993-08-13 Matsushita Electric Ind Co Ltd 音声規則合成用ユーザー辞書登録システム
JPH07219587A (ja) * 1994-01-28 1995-08-18 Canon Inc 音声処理装置および方法
JPH08160988A (ja) * 1994-12-07 1996-06-21 Sony Corp 音声認識装置
JPH08160986A (ja) * 1994-12-07 1996-06-21 Matsushita Electric Ind Co Ltd 音声認識装置
JPH08320864A (ja) * 1995-05-26 1996-12-03 Fujitsu Ltd 音声合成用の辞書登録装置
US7292980B1 (en) * 1999-04-30 2007-11-06 Lucent Technologies Inc. Graphical user interface and method for modifying pronunciations in text-to-speech and speech recognition systems

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7885656B2 (en) 2004-06-10 2011-02-08 Lg Electronics Inc. Handover execution and communication resumption in wireless access system
US7890106B2 (en) 2004-06-10 2011-02-15 Lg Electronics Inc. Handover execution and communication resumption in wireless access system
US7890108B2 (en) 2004-06-10 2011-02-15 Lg Electronics Inc. Handover execution and communication resumption in wireless access system
US7890107B2 (en) 2004-06-10 2011-02-15 Lg Electronics Inc. Handover execution and communication resumption in wireless access system
US7933601B2 (en) 2004-06-10 2011-04-26 Lg Electronics Inc. Handover execution and communication resumption in wireless access system

Also Published As

Publication number Publication date
KR100464019B1 (ko) 2004-12-30

Similar Documents

Publication Publication Date Title
Chen et al. Large-scale characterization of non-native Mandarin Chinese spoken by speakers of European origin: Analysis on iCALL
US8073694B2 (en) System and method for testing a TTS voice
US7996226B2 (en) System and method of developing a TTS voice
EP1096472B1 (en) Audio playback of a multi-source written document
US7277851B1 (en) Automated creation of phonemic variations
US6490563B2 (en) Proofreading with text to speech feedback
US7630898B1 (en) System and method for preparing a pronunciation dictionary for a text-to-speech voice
US7742921B1 (en) System and method for correcting errors when generating a TTS voice
US8914291B2 (en) Method and apparatus for generating synthetic speech with contrastive stress
US7742919B1 (en) System and method for repairing a TTS voice database
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
JP2014240884A (ja) コンテンツ作成支援装置、方法およびプログラム
JP3483230B2 (ja) 発声情報作成装置
KR100464019B1 (ko) 음성 인식기의 발음 사전 편집시 발음열 디스플레이 방법
JP2008009507A (ja) 外国語の発音のカタカナ表記方法
JPH09325787A (ja) 音声合成方法、音声合成装置、文章への音声コマンド組み込み方法、及び装置
Pollák et al. Tool for Czech Pronunciation Generation Combining Fixed Rules with Pronunciation Lexicon and Lexicon Management Tool.
JP2014197117A (ja) 音声合成装置及び言語辞書登録方法
JP6340839B2 (ja) 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム
JP2002123281A (ja) 音声合成装置
JP2003202886A (ja) テキスト入力処理装置及び方法並びにプログラム
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP2004258561A (ja) 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JPS62212870A (ja) 文章読み上げ校正装置

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121115

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20131115

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee