KR101139469B1 - 한국어사전 - Google Patents

한국어사전 Download PDF

Info

Publication number
KR101139469B1
KR101139469B1 KR1020100026730A KR20100026730A KR101139469B1 KR 101139469 B1 KR101139469 B1 KR 101139469B1 KR 1020100026730 A KR1020100026730 A KR 1020100026730A KR 20100026730 A KR20100026730 A KR 20100026730A KR 101139469 B1 KR101139469 B1 KR 101139469B1
Authority
KR
South Korea
Prior art keywords
word
dictionary
words
type
pronunciation
Prior art date
Application number
KR1020100026730A
Other languages
English (en)
Other versions
KR20110107548A (ko
Inventor
최종민
성중모
Original Assignee
성중모
최종민
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성중모, 최종민 filed Critical 성중모
Priority to KR1020100026730A priority Critical patent/KR101139469B1/ko
Publication of KR20110107548A publication Critical patent/KR20110107548A/ko
Application granted granted Critical
Publication of KR101139469B1 publication Critical patent/KR101139469B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/06Foreign languages
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/06Electrically-operated educational appliances with both visual and audible presentation of the material to be studied

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 낱말의 활용형으로 검색하는 한국어사전에 관한 것으로, 보다 상세하게는 한국어사전의 표제어 부분의 구성에서 연음하는 낱말 활용형을 검색어로 더하여 사용하거나 표제어 자체로 삼는 구성 방법과, 사전의 표제어 부분과 뜻풀이 부분 전체에서 동사의 기본형을 배제하고 활용형을 사용하는 구성 방법과, 사전의 표제어 부분에 대표 활용형 표제어와 부속 활용형 표제어 및 기본어간과 실음어간을 설정하여 낱말의 표기형이나 음성언어형의 모든 활용형을 검색하는 구성 방법을 포함하는 것을 특징으로 하는 낱말의 활용형으로 검색하는 한국어 사전에 관한 것이다.
본 발명에 따르면, 발음정보를 제대로 표기하고, 동사 기본형을 동사 활용형으로 대처하는 등 실제 사용되는 낱말 형태로 표기하고, 문자와 음성을 통해 낱말의 모든 활용형으로 사전검색이 가능하도록 함으로써 사전의 실용성을 높이고, 한국어 맞춤법 수준이 낮은 사람이나, 초등학교 수준의 학생들, 특히 한국어를 배우는 외국인들에게 유용한 사전을 제공할 수 있다. 나아가, 문자나 음성언어를 통하여 낱말의 모든 활용형으로 검색가능한 전자사전이나 인터넷사전에 적용할 수 있다.

Description

한국어사전{THE KOREAN DICTIONARY}
본 발명은 낱말의 활용형으로 검색하는 한국어사전에 관한 것으로, 보다 상세하게는 한국어사전의 표제어 부분의 구성에서 연음하는 낱말 활용형을 검색어로 더하여 사용하거나 표제어 자체로 삼는 구성 방법과, 사전의 표제어 부분과 뜻풀이 부분 전체에서 동사의 기본형을 배제하고 활용형을 사용하는 구성 방법과, 사전의 표제어 부분에 대표 활용형 표제어와 부속 활용형 표제어 및 기본어간과 실음어간을 설정하여 낱말의 표기형이나 음성언어형의 모든 활용형을 검색하는 구성 방법을 포함하는 것을 특징으로 하는 낱말의 활용형으로 검색하는 한국어 사전에 관한 것이다.
일반적으로 한국어사전의 구성은 표제어와 뜻풀이 부분으로 구분할 수 있는데, 여기에는 아래와 같은 표제어의 세 가지 연구 문제가 있다. 첫째로 일반적인 한국어사전은 낱말의 기본형을 표제어로 삼고 있는데, 낱말의 기본형은 표기가 발음정보를 제대로 표시해 주지 못하는 문제점이 있고, 둘째로 동사의 기본형은 자연스러운 낱말이 아니라 인위적으로 조직한 인공적 낱말이라는 문제점이 있으며, 셋째로 발음형의 모든 활용형으로 검색하는 사전을 구축하는 데에 필요한 형태론적 이론의 정리가 미흡하므로 맞춤법에 맞춘 표기-문자형 사전의 구성에 편중되어 있다는 문제점이 있다. 이것은 낱말의 활용형을 주로 사용하는 언어 현실과 문자와 함께 음성언어도 중요시되는 정보화시대의 흐름에 기술적으로 대처하지 못하는 단점이다.
좀더 자세히 연구 문제를 말하자면, 첫째 문제로 기존의 사전 표제어로 사용되는 낱말의 기본형은 받침소리가 7가지로만 발음되는 '7종성 발음 제약'을 받으므로, 표기가 발음의 정보를 제대로 표시해 주지 못한 경우가 많다는 문제점이 생기는 것이다. 따라서 기본형의 대안으로 연음하는 낱말 활용형을 검색어로 설정해 보자는 생각을 해 볼 수 있게 된다.
그리고 둘째 문제는, 동사의 기본형은 어간에 종결어미인 {-다}를 붙여서 인위적으로 조직한 형태이므로, 실제로 사용되지 않는 낱말 형태라는 것이다. 예를 들어 {밥을 먹는다}라고 말해야 하는데, 여기서 기본형 동사는 {먹다}로 정했다. 이것은 어간 {먹-}에 종결어미 {-다}를 억지로 붙여서 만든 인공적인 형태인 것이므로 실제로 {밥을 먹다}라는 말을 언어생활에서 사용하지 않고 있는 것이다. 따라서 자연스러운 낱말을 올려 놓아야할 할 사전에서, 실제로 사용하지도 않는 인공적 낱말을 사용하는 모순을 갖는 것으로 볼 수 있다.
또한 셋째 문제는 기존의 전자사전에서는 표기법에 정확하게 맞춘 낱말은 여러 가지 활용형으로 모두 검색이 가능 하지만, 발음형이나 음성언어 형태의 모든 활용형으로는 검색이 불가능하다는 것이다. 이것은 한국어의 문법 연구가 맞춤법 중심의 형태론으로 이루어진 데에도 원인이 있을 것이다. 따라서 음성언어의 활용형을 가지고 언어 현실을 반영하는 발음형 중심의 형태론적 연구가 필요한 것이고, 이에 따라서 문자와 음성을 통하여 낱말의 모든 활용형으로 검색되는 전자사전의 개발이 요청된 것이다.
상기와 같은 한국어사전의 세 가지 연구문제를 본질적으로 파악하면서 본 발명의 배경기술을 설명하고자 한다.
본 발명에 관련된 선행 연구를 찾아 보았으나, 직접적으로 관련된 연구물을 찾아볼 수가 없었다. 용언이나 체언 및 수식언 등의 활용형을 사전에서 사용하면 좋을 것이라는 생각은 누구나 쉽게 할 수 있다. 그러나 한국어의 낱말 활용은 다양하고 섬세하여 그것을 사전의 표제어로 제시한다는 것은 기술적으로 어려운 일이므로, 이에 대한 연구가 본격적으로 이루어지지 않고 있는 것으로 여겨진다. 또한 표기형뿐만 아니라 음성을 포함한 발음형까지 넣어서 모든 낱말의 활용형으로 검색을 하려는 시도도 없는 것으로 여겨진다.
다만, 한국어를 외국어로 배우는 사람들을 위한 자료로서의 사전의 필요성에 따라서, 또는 낱말 활용 학습용 자료 등으로 사용하기 위하여, 단순히 몇 가지 용언의 활용형을 사전의 표제어로 올려서 낱말 학습의 효과를 올리려는 시도는 전부터 있었던 일이다. 이러한 방법은 상식적으로 알려진 방법으로서, 본 발명의 원리와 다른 방법이다.
따라서 본 발명에 직접 관련된 선행 연구는 찾아볼 수가 없고, 다만 용언 활용형의 표제어 선정에 관련된 논문을 볼 수 있었다. 정상근, "한국어 학습사전에서 용언 활용형의 표제어 선정 방안 연구",『한국어 교육』제12권 2호, 국제한국어교육학회, 2002, 207쪽에서 보면(국제한국어교육학회 홈페이지 검색 2008.1.3), 용언의 선정 기준은 '첫째, 초급-중급 단계에서 학습하는 불규칙활용 용언', '둘째, 초급-중급 단계에서 학습하는 규칙활용 용언 중, 기본형 어간의 끝음절에 받침이 없는 것, 단 ㄹ용언은 포함한다.', 셋째, 실제 생활이나 교육현장에서의 출현빈도와 중요도를 비교한 것'으로 제시하였다. 이는 본 발명과 목적이나 방법이 전혀 다른 것이다. 이 연구는 표제어로 올릴 용언의 활용형을 선택하는 문제에 관한 것이다. 특히 둘째 기준에서는 기본형 어간의 끝음절에 받침이 없는 것을 선정한다고 하였으므로, 본 발명에서 오히려 기본형의 받침소리 문제를 연음하는 활용형으로 해결하는 것과 상반되는 것으로 볼 수 있다.
따라서 본 발명의 발상과 언어학적 원리의 정리와 개념의 정립 및 그 적용과 구성 방법 등은 새로운 분야를 개척하는 것으로 볼 수 있다.
다음에는 종래 한국어사전이 갖는 첫째 연구 문제로서, 사전 표제어로 사용하는 낱말 기본형은 표기가 발음의 정보를 제대로 표시해 주지 못한다는 문제부터 살펴보고자 한다. 한국어의 낱말은 다양하고 섬세하게 활용되는 것이 특징이고, 언어생활은 대부분 낱말의 기본형보다 활용형으로 이루어진다. 특히 용언은 어간이 의존 형태소이므로 어미를 첨가하는 활용은 필수적이고, 체언도 대부분 조사가 첨가된 형태로 사용되며, 수식언도 대체로 활용형으로 사용된다.
그런데 종래의 일반적인 한국어사전은 낱말의 기본형을 중심으로 구성하고 있다. 즉 용언의 경우에 표제어도 기본형이고, 용언의 뜻풀이 부분의 문장에서도 낱말의 기본형이 사용된다. 더 나가서는 사전의 모든 예문에서까지 문장의 용언은 대부분 기본형을 사용하고 있는 것이다. 따라서 기본형을 많이 사용하는 사전은 활용형을 많이 사용하는 언어 생활과 거리가 멀어져 있는 셈이다.
그런데다가 낱말의 기본형은 받침소리가 7가지로만 실현되는 이른바 '7종성의 발음 제약'을 받으므로, 표기가 발음 정보를 제대로 표시하지 못한 경우가 많다. 그래서 한국어를 말할 수 있는 사람도 사전을 검색하는 데에 어려움을 겪는 경우가 있게 되고, 특히 한국어 학습 단계가 낮은 사람은 더 어려움을 겪는다. 예를 들면, [막따]라는 발음을 알고 있는 사람도 {맑다}라는 기본형을 모르면 사전을 검색할 수 없다.
또한 한국어는 낱말 활용이 다양하고 복잡하므로, 어떤 낱말의 활용형을 사용할 줄 알면서도 그 낱말의 기본형을 몰라서 사전을 찾을 수 없는 경우도 많이 생긴다. 예를 들면 [날씨가 망는다고 하더라]라는 말을 할 줄 사람이라도 [망는다]의 기본형이 {맑다}라는 것을 모르면 사전을 찾을 수 없다.
도 1에서 보면, 기본형 {밝다}(101)의 발음형태는 [박따]이므로, 표기형태와 발음형태가 다르다. 이것은 어간의 받침소리 [ㄹ,ㄱ]과 종결어미 {-다}가 만나서 생긴 현상이다. 다시 말하면, 종결어미 {-다}의 결합으로 어간 받침 [ㄹ]의 소리가 나지 못하고('탈락'이라고 함), {-다}의 음가도 [-따]로 변형된 것이다. 그러므로 표기형에서 {밝-}(102)이라는 형태가 [박]으로 발음되어 표기와 발음이 다르게 되었다.
이에 비하여 {밝아요}(103)의 발음형은 [발가요]가 되므로, 표기와 발음의 소리 구성이 일치하는 구조를 갖는다. 즉 {밝-}이 [발가-](104)로 될 때, 받침소리 'ㄹㄱ'은 그대로 'ㄹ'과 'ㄱ'으로 이어져 발음된다. 따라서 연음하는 활용형에서는 받침소리인 'ㄹㄱ'이 표기할 때는 한 음절로 모아아서 {밝-}처럼 표기되고, 발음할 때는 두 음절로 풀어서(연음되어서) [발가-]처럼 두 음절로 실현되는 것이다. 이러한 현상을 연음 형태에서 '표기와 발음의 일치'라고 말하고자 한다.
'연음'이란 용언의 어간이나 체언에 모음으로 시작되는 어미나 조사가 결합할 때, 받침소리가 모음의 첫소리(초성)로 이어 내려서 발음되는 현상을 가리킨다. 이것은 구개음화와 같은 특별한 경우를 제외하면 표기법의 '연철'과 같은 결과를 갖는 것이므로, 본 설명에서는 어간이나 체언의 받침소리가 뒤 음절의 첫소리로 되는 것을 '연음' 또는 '연철'이라고 말하고자 한다. 예를 들어, [발가요]로 발음되고 {밝아요}로 표기되는 활용형의 형태를 '연음하는 활용형'(또는 '연음형'이라 함)이라고 말하고자 한다.
도 1에서 체언의 경우에도 기본형 {삶}(105)의 발음은 [삼]이므로, 표기가 발음 정보를 제대로 표시해 주지 못한다. 그러나 연음하는 활용형인 {삶이}와 그의 발음형 [살미](107)를 보면, {삶-}이 [살미](108)와 같이 되어 'ㄹㅁ' 받침소리가 'ㄹ'과 'ㅁ'의 받침소리로 실현된다.
특히 초등학교나 문해 교육, 외국인의 한국어 교육 등 한국어 기초교육을 받는 사람들은 기본형의 맞춤법을 아는 것 자체가 어려워서 사전을 멀리하는 원인이 될 수 있다. 그런데 그들에게 받침소리의 연음 현상만 이해시켜 준다면, 기본형인 '{밝다}[박따]'보다 활용형인 '{밝아요}[발가요]'가 더 쉽고 검색하기 편리한 낱말 형태가 되는 것이다.
'문해 교육'이란 한국어를 모국어로 배워서 말을 잘하는 사람들 중에서 한글을 읽고 쓰는 교육을 제대로 받지 못한 사람들을 교육하는 것을 가리킨다. 현대에도 우리 나라에 문해 교육 대상이 되는 사람은 아직도 수백만 명이나 되는 것으로 추정된다. 이희수(연구책임자)외 5명, "한국 성인의 비문해 실태 조사 연구" (한국교육개발원, 수탁연구 CR 2002-, 35-36쪽. 전국문해성인기초교육협의회 홈페이지 자료실 검색 2008.1.10)에서 참고자료를 볼 수 있다.
초등교 학생이나 문해 교육을 받는 사람들, 외국인 학생들에게는 {깊다}의 [ㅍ]받침소리도 어렵고 {밝다}의 [ㄹㄱ] 받침소리는 더 어렵다. 그러나 연음하는 활용형으로 {깊어요}[기퍼요]라고 말하면 'ㅍ'받침소리가 쉽게 떠오르고, {밝아요}[발가요]라고 말하면 'ㄹㄱ'받침소리가 쉽게 떠오른다. 또한, 체언의 경우에도 이러한 문제점을 갖는 사정은 같다. 도 1에 따르면, {삶}이라는 명사의 발음은 [삼](105)이다. 그런데 기본형 {삶}에 조사 {-이/가}형을 붙인 {삶이}는 연음이나 연철로 [살미](107)가 되므로 표기와 발음이 일치된다.
이와 같이 한국어 낱말의 기본형에서 표기형과 발음형이 일치하지 못하는 이유는 맞춤법과 발음법의 대립에서 찾아볼 수 있다. 맞춤법에서는 받침소리를 27가지를 사용하는 데에 비하여, 표준 발음법에서는 어말과 자음 앞에서는 받침이 7가지로만 발음되는 제약이 있기 때문이다.
한글 맞춤법 제2장 자모, 제4항 붙임1, 2에 따르면(국립국어원 홈페이지, 어문규정, 검색 2007.12.18), 아래 표와 같이 자음의 수가 초성은 19가지이고, 받침소리는 27가지이다. 여기서 음절의 첫소리를 '첫소리' 또는 '초성'이라고 말하고, 음절의 끝소리는 '받침소리' 또는 '끝소리, 종성'이라고 말하며, 음절의 가운뎃소리는 '모음 소리' 또는 '중성'이라고 말고자 한다. 음절을 이루는 첫소리와 받침소리를 표로 정리하면 다음과 같다.
아래 표 1은 한국어 맞춤법의 음절 첫소리와 받침소리에 관한 것이다.
구분 자음형 비고
음절 첫소리
(초성)
ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅇ, ㅈ, ㅊ, ㅋ, ㅌ, ㅍ, ㅎ, ㄲ, ㄸ, ㅃ, ㅆ, ㅉ 19가지
받침소리
(종성)
ㄱ, ㄲ, ㄱㅅ, ㅅ, ㄴ, ㄴㅈ, ㄴㅎ, ㄷ, ㄹ, ㄹㄱ, ㄹㅁ, ㄹㅂ, ㄹㅅ, ㄹㅌ, ㄹㅍ, ㅁ, ㅂ, ㅂㅅ, ㅅ, ㅆ, ㅇ, ㅈ, ㅊ, ㅋ, ㅌ, ㅍ, ㅎ
27가지
상기 표 1에 따르면, 받침소리가 27가지이므로, 첫소리보다 8가지나 더 많다. 이것은 표기법에서 받침소리의 역할이 많다는 것과 첫소리보다 받침소리가 더 어렵게 된다는 것을 말해 주기도 한다.
그런데, 표준 발음법 제4장 받침의 발음-제8항에 따르면(국립국어원 홈페이지, 어문규정, 검색 2007.12.18), "받침소리는 'ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅇ'의 7개 자음만 발음한다"라고 되어 있다. 이것은 표기법의 받침소리 27가지가 그대로 발음되지 못하는 발음 제약을 말한 것이다. 이렇게 받침소리가 발음 제약을 받는 환경(조건)은 '어말과 자음 앞'이다. 표준 발음법 제9항은 "받침 'ㄲ, ㄱ', 'ㅅ, ㅆ, ㅈ, ㅊ, ㅌ', 'ㅍ'은 어말 또는 자음 앞에서 각각 대표음 [ㄱ, ㄷ, ㅂ]으로 발음한다"라고 규정하였다.
따라서 표기법의 받침소리 27가지는 어말과 자음 앞에서 7가지로 중화되는 것이라고 말할 수 있다. 이런 발음법을 가리켜 받침소리의 '7종성 발음법'(이하 '7종성법'이라 함)이라고 말하고자 한다. 이것은 받침소리만 갖고 있는 조음작용의 특성이 있기 때문이다.
받침소리 조음작용의 특성과 관련하여, 최종민의 글 "우리말과 음악의 소리 울림틀(2)-노랫말 받침소리꼴과 소리내기-『한국음악사학보』제17집, 한국음악사학회, 1996, 133쪽에서는 받침소리 [ㄱ, ㄷ, ㅂ]는 '막힘 받침꼴'이고 [ㄴ, ㅁ, ㅇ, ㄹ]은 '울림 받침꼴'로 정리하였다. 그리고 137쪽에서는, 받침소리 [ㄱ, ㄷ, ㅂ]의 조음작용은 모음의 소리울림을 막아서 끝맺는 '소리울림 막음질'이고, [ㄴ, ㅁ, ㅇ, ㄹ]은 모음의 소리울림을 비음인 [ㄴ, ㅁ, ㅇ]이나 유음인 [ㄹ]로 바꾸어 끝맺는 '소리울림 바꿈질'이라고 정리한 바 있다. 이를 간단히 정리하여 제시하면 도 2와 같다.
이에 따르면, 받침소리의 조음작용인 7종성법(201)은 모음의 소리 울림을 막는 조음작용을 하거나(202), 모음의 소리 울림을 비음이나 유음으로 바꾸어 주는 조음작용을 한다(203). 이러한 두 가지 조음작용은 상보적으로 실현되는데, 이를 '받침발음 제약 조건'이라고 말하고자 한다(204).
받침의 발음은 모음의 소리울림 상태를 마무리하는 작업이므로, 자음의 본질적 조음작용인 '파열'이나 '마찰' 등의 작용을 할 수 없다. 따라서 표기법의 받침소리 27가지 중에서 7종성(ㄱ, ㄷ, ㅂ, ㄴ, ㅁ, ㅇ, ㄹ)만 자기 본래 음가를 가질 수 있고, 나머지 20가지는 자기 음가를 잃게 되는 것이다.
영어사전의 모든 표제어는 표기와 발음이 다르므로, 반드시 발음기호를 별도로 표시해 놓아야 한다. 이에 비하여 한국어는 소리대로 적을 수 있는 한글(훈민정음)을 사용하기 때문에, 본질적으로 표기와 발음은 같다. 다만 음성 환경에 따라서 발음의 제약을 받는 낱말의 경우에만 표제어 부분에 발음사항을 별도로 적어 놓고 있는 것이다.
이와 같이 한국어는 낱말마다 발음기호를 별도로 표시할 필요가 없는 데도 불구하고, 사전에서는 7종성법의 발음 제약을 받는 기본형을 표제어로 올려놓음으로써 발음을 별도로 표시해 주는 일을 더 하고 있다. 이것이 문제이다. 그런데 표기와 발음이 연음으로 동일해지는 활용형을 표제어로 삼으면, 사전에서 발음 정보를 별도로 표시해 줄 필요가 없게 된다.
표기와 발음이 다른 기본형을 표제어로 삼은 것은 '말하기와 듣기'라는 음성언어를 배제하고, 주로 '읽기(독해)와 쓰기'를 위한 문자언어를 중심으로 삼은 결과라는 문제점도 생각해 볼 수 있다. 언어는 1차적으로 '말하기와 듣기'의 영역과 직결되는 발음이 중요한 것이다.
표기와 발음이 일치되는 낱말 형태를 사전의 표제어 부분에서 사용함으로써, 사전 표제어의 유용성을 높여야 할 필요성이 있다. 특히 한국어교육의 측면에서 볼 때, 말하기와 듣기와 관련하여 발음과 표기가 일치하는 낱말 활용형으로 표제어를 삼는 교육용 한국어사전을 편찬하는 것이 효과적이라고 볼 수 있다.
21세기 정보화시대는 문자언어와 음성언어가 함께 중요한 시대이다. 특히 음성언어로 검색하는 전자사전을 개발하여 사용하게 될 때, 이때 발음과 표기가 일치하지 못하는 기본형을 표제어로 사용하는 것보다, 연음하는 활용형을 표제어로 삼는 것이 더 알맞다. 이러한 사항을 보더라도 사전 표제어를 기본형으로 삼는 문제는 개선이 필요한 것이다.
지금까지 표제어로 낱말 기본형 사용의 연구문제를 제기하였는데, 이를 표로 정리하면 다음과 같다.
아래 표 2는 사전 표제어에서 표기와 발음이 다른 기본형 사용의 문제에 관한 것이다.
기본형의 표기와 발음이 달라서 생기는 문제들 대안
(1) 발음을 알아도 사전을 검색하는 데에 어려움을 겪는 경우가 많다. 연음하는 낱말 활용형 응용
(2) 한글을 사용하는 한국어는 발음기호가 별도로 필요 없는 데도 불구하고, 표기와 발음이 다른 기본형을 표제어를 삼고, 영어사전처럼 발음정보(발음기호)를 별도로 적어 주고 있다.
(3) 표기법에 맞춘 기본형을 표제어로 사용하는 것은 음성언어보다 문자언어에 중심을 둔 방식이다.
(4) 맞춤법의 표기를 위주로 한 표제어의 기본형은 '말하기나 듣기'와 같은 발음-음성언어의 영역을 소홀하게 여기는 결과가 된다.
(5) 한국어교육의 말하기-듣기의 효율성을 높이기 위하여, 표기가 발음 의 정보를 담아주는 연음 활용형을 검색어로 삼는 교육용 한국어사전이 필요하다.
(6) 21세기 음성언어가 중심으로 떠오르는 때에는 표기와 발음이 다른 기본형을 표제어로 사용하는 것은 적절하지 못한 대응이다.
(7) 문자와 음성으로 검색하는 전자사전에서는 발음과 표기가 다른 기본형보다 연음으로 표기와 발음이 일치되는 방식의 활용형이 더 알맞다.
상기 표 2에 따르면, 사전 표제어에서 표기와 발음이 다른 낱말 기본형을 사용하는 것은 여러 가지 측면에서 문제가 될 수 있다는 것을 알 수 있다. 따라서 사전의 표제어 부분에는 표기와 발음이 일치되는 낱말 활용형을 사용할 필요가 있는 것으로 정리하고자 한다.
다음에는 종래의 한국어사전이 갖는 두 번째 연구 문제로서, 동사의 기본형이 갖는 문제를 살펴보고자 한다. 표제어 부분이나 뜻풀이 부분(예문 포함)에서 사용하는 동사 기본형은 실제로 사용되지 않는 인위적 낱말형태이다. 즉 동사 기본형은 어간에 종결어미 {-다}를 붙여서 인위적으로 조직한 것이므로, 자연스러운 낱말형태가 아니라, 실제로 사용되지 않는 낱말형태를 사전에서 사용하는 문제점이 있다는 것이다.
그런데 형용사의 기본형 구조도 동사의 경우와 같이 어간에 종결어미 {-다}를 붙인 형태이지만, 형용사의 경우에는 {넓다}나 {깊다}처럼 일상생활에서 자연스럽게 사용되는 낱말이다. 따라서 동사의 기본형만 문제가 된다는 것을 알 수 있다.
종래의 한국어사전에서는 표제어만 동사의 기본형을 사용하는 것이 아니라, 사전의 풀이말 부분의 문장에서도 동사의 기본형을 사용하고 있다. 예를 들면 동사 기본형 {먹다}로 만든 예문을 "누구나 밥을 먹다."와 같이 제시하는 경우가 대부분이라는 것이다. 이 문장은 말을 하다가 중간에 멈춘 것과 같기도 하고, 의미가 구체적으로 무엇인지 알기도 힘들다. 문장이 바르고 자연스럽게 되려면 "누구나 밥을 먹는다."라고 해야 하는 것이다.
{먹다}라는 기본형은 {먹-}이라는 어간에 {-다}라는 종결어미를 붙여서 인공적으로 만든 것이므로, 실제로 사용되지 않는 낱말이다. 한국어 학습 정도가 낮은 사람들에게 이러한 모순을 가진 사전은 학습을 돕는 것이 아니라 오히려 학습을 방해하는 요인으로 작용할 수 있다.
여기서 표제어뿐만 아니라 풀이말의 문장에서도 인위적 낱말형인 동사 기본형을 사용하고 있는 예를 제시해 보고자 한다. 그 예를 '표준국어대사전'(국립국어원 홈페이지, 검색일 2007.12.29)과 '연세한국어사전'(연세한국어사전 홈페이지, 검색일 2007.12.29)에서 몇 가지만 옮겨 정리하면, 다음과 같다.
아래 표 3은 한국어사전에서 사용되는 동사 기본형의 양상에 관한 것이다.
구분 표제어 뜻풀이(본문)의 기본형 사용 양상
표준국어 대사전 {먹다} 뜻풀이 :
1. 음식 따위를 입을 통하여 배 속에 들여보내다.
예문 : 밥을 먹다 /술을 먹다 /약을 먹다 /물을 먹다 /음식을 배불리 먹다 /닭이 모이를 먹다 /몸이 약해진 누나는 보약을 몇 차례나 먹어도 늘 골골 거렸다.
연세한국어 사전 {먹다} 뜻풀이 :
1. 음식물을 입을 통하여 넘기다 .
ㄱ. 씹어서 음식을 뱃속에 들여 보내다 .
ㄴ. 액체로 된 것을 마시다 .
ㄷ. 약을 씹거나 마시다 .
ㄱ의 예문 : 아이들이 과자를 잘 먹는다.
ㄴ의 예문 : 아이가 온종일 우유도 먹지 않고 울기만 한다.
ㄷ의 예문 : 그는 약을 한 달이나 먹었다.
상기 표 3에 따르면, 밑줄로 표시한 낱말은 모두 동사 기본형이다. {먹다}라는 동사 기본형에 대하여, 표준국어대사전에서는 뜻풀이 문장에서도 {들여보내다}라는 동사 기본형을 사용하였고, 예문에서도 {먹다}라는 동사 기본형을 많이 사용하였다.
또한 연세한국어사전에서도 뜻풀이 문장에서 {넘기다, 보내다, 마시다}등의 동사 기본형을 사용하였는데, 이것은 인위적 낱말형이다. 자연적 낱말형이 되려면 {넘긴다, 보낸다, 마신다}등과 같아야 하는 것이다. 그런데, 뜻풀이 부분만은 {먹는다, 먹지, 먹었다}등과 같은 동사 활용형을 사용하였다. 따라서, 표준국어대사전에 비하여, 좀더 실용성을 갖는 것으로 볼 수 있다.
그러나 표제어와 뜻풀이에서 동사 기본형을 사용한 점은 두 사전이 똑같다. 뜻풀이는 온전한 문장의 형식으로 제시된 것인데, 자연적 낱말형을 사용하지 않고 인위적 낱말형을 사용하면, 실제로 어법에 맞지 않는다는 것은 자명한 일이다.
표제어가 {값}과 같은 명사인 경우에도, 예문에서 동사 기본형을 사용하는 것도 볼 수 있다. 표준국어대사전의 경우를 보면, '값이 오르다/값이 내리다/값을 매기다/물건값을 깎다'등과 같다. 이보다 적지만, 연세한국어사전에서도 '값을 부르다. 값이 얼마라고 말하다. 내야하는 값을 말하다.' 등과 같은 예문을 볼 수 있다. 따라서 두 사전의 풀이말에서 전체적으로 동사 기본형이 두루 사용되고 있다는 것을 알 수 있다.
실제 언어생활에서는 동사 기본형을 사용하는 예를 보기가 어렵다. 가끔 신문의 기사 제목 같은 데에서 '무엇을 하다'와 같은 말을 볼 수는 있는데, 이것은 특별한 의도를 가지고 사용된 특수 용법일 뿐이다. 이것은 자연스럽고 정상적인 한국어 어법에서 보면 맞지 않는 문장이다.
동사 기본형은 사전의 표제어와 뜻풀이, 예문 등에서 많이 사용되고, 현행 한글 맞춤법에서도 예시한 낱말에서 동사 기본형이 사용되고 있다. 1933년에 제정된 '한글 맞춤법 통일안'(한글학회 홈페이지의 '한글 맞춤법' 검색 2008. 1. 3)에서도 예시한 낱말의 동사 기본형을 많이 볼 수 있다. 물론 한국어 문법 이론 연구에서도 동사 기본형을 많이 사용하고 있다.
그런데 한글 맞춤법이나 표준어 규정 등에는 동사 기본형을 사용해야 한다는 규정은 없고, 다만 예시된 낱말에 동사 기본형이 있을 뿐이다. 이것은 동사 기본형을 사용할 수 있다는 암시적 규정으로 작용하는 것이라고 생각된다. 이에 따르면 사전에서도 동사 기본형을 사용할 수 있다고 할 수 있을 것이다.
그러나 사전은 본질적으로, 실제로 사용되는 말을 싣고 풀이하는 것이라고 볼 수 있다. 그런데, 표제어와 뜻풀이 등에서 한결같이 인위적인 낱말형인 동사 기본형을 사용하는 것은 실제로 사용되지 않는 말을 싣고 풀이해 놓은 것이다. 이것은 본질적으로 모순이고, 사전의 실용성을 보는 관점에서는 문제점이 될 수 있다.
특히 초등학교 학생들이나 한국어를 외국어로 배우는 사람들은 사전을 보면서, 표제어에 있는 동사 기본형이나 뜻풀이의 문장을 실제로 사용하려고 할 것이다. 그러면 실제 사용되지 않는 인위적 낱말형인 동사 기본형으로 문장을 만들게 해 주는 것이니, 학습과정에서 혼란을 더해 준다. 따라서 한국어교육의 측면에서 이것은 개선되는 것이 마땅한 일이다.
또한 한국어 문법으로 보거나 화용론이나 의미론으로 볼 때도 {먹다}라는 기본형을 정상적인 문장의 종결형으로는 사용하기는 어렵다. 영어는 동사 원형을 써야하는 문법이 분명하게 있고, 일본어에도 동사 기본형을 사용해야 하는 문법이 확실하게 있지만, 한국어에는 동사 기본형을 써야 하는 문법이 없기 때문이다. 이것은 한국어학의 문법이다. 영어나 일본어에서 동사의 원형이나 기본형과 같은 형태를 사용한다고 해서, 한국어에서도 실재하지 않는 동사 기본형을 인공적으로 만들어서 사용해야 한다는 것은 한국어의 본질을 벗어나는 생각이라고 볼 수 있다.
특히 실제로 사용되는 자연적인 낱말을 사용해야 할 한국어사전에서, 인위적 낱말형인 동사 기본형으로 종결하는 문장을 예문이나 뜻풀이로 사용한다는 것은 이해하기 어려운 일이다. 이것은 한국어 구조를 다시 만드는 일이라고 볼 수도 있다.
동사 기본형을 바꾸어 설정하는 일은 학술적인 토론이 더 필요한 부분이고, 이것은 국어학계에서 해결해야 할 과제로 남아 있는 것이다. 그러나 언제까지 토론만 하고 있을 수는 없다. 왜냐하면, 이것은 한국어 교육의 문제와 직결되어 있고 특히 사전의 표제어와 그 풀이말로 사용됨으로써, 사용량도 많고 교육이나 연구 등에도 큰 영향력을 갖기 때문이다.
이상에서 살펴본 동사 기본형의 문제점을 표로 정리하면 다음과 같다.
아래 표 4는 사전에서 사용하는 동사 기본형의 문제점에 관한 것이다.
사전에서 사용하는 동사 기본형의 문제점 대안
(1) 동사 기본형은 자연적 낱말 형태가 아니라, 인위적으로 조직한 낱말 형태이다. 동사의 활용형 사용
(2) 동사 기본형은 실제 언어생활에서 사용되지 않는 낱말이다.
(3) 실제로 사용되는 낱말을 사용해야 할 사전에서, 실제 언어 생활에서 사용되지 않는 동사 기본형을 표제어나 풀이말로 사용하는 것은 모순이다.
(4) 문해 교육을 받는 사람이나 초등학교 학생, 또는 한국어를 외국어로 배우는 사람은 사전의 표제어나 그 풀이말로 사용된 동사 기본형을 사용하면서 혼란을 겪게 된다.
상기 표 4에 따르면, 사전의 표제어와 풀이말 등에서 동사 기본형을 사용하는 일은 개선이 필요하다고 할 수 있다.
특히 학생들의 학습에 혼란을 주는 일을 없애야 하기 때문에, 사전의 표제어와 풀이말과 예문에서는 동사 기본형을 사용하지 말아야 한다는 것이다. 21세기에 들어서면서 한국어를 외국어로 학습하는 사람들이 많이 늘어나고 있는 실정을 감안할 때, 동사 기본형을 사전의 표제어와 풀이말에서라도 사용하지 말도록 하는 교육적 조치가 필요한 것이다.
다음에는 종래의 한국어사전이 갖는 셋째 연구 문제를 살펴보고자 한다. 즉 발음이나 음성언어의 모든 낱말 활용형으로 검색할 수 있는 방법을 찾는 데에 필요한 형태론적 이론의 정리가 미흡하여, 발음이나 음성을 통하여 낱말의 모든 활용형으로 검색하는 방법이 제대로 개발되지 못한 문제에 대하여 설명하고자 한다.
기존의 전자사전에서 맞춤법에 맞춘 기본형에 한하여 낱말의 여러 가지 용언의 활용형으로 검색하는 것이 상용화되어 있다. 여기에는 맞춤법에 맞춘 표기형태만 사용하고 용언으로 한정한 조건적 제한이 있다. 그러므로 모든 낱말의 활용형으로 검색하는 데에서 발음형이나 음성형을 검색어로 사용할 수 없고, 또한 체언의 활용형은 대상에서 제외되는 한계를 갖는다.
모든 활용형을 있는 그대로 사전의 표제어로 삼는다는 것은 방대한 낱말 형태를 처리해야 하는 문제 때문에 실현 가능성이 없을 뿐만 아니라, 또한 기본적인 의미가 같은 활용형을 모두 올려놓을 필요도 없다. 다만 모든 낱말의 활용형을 가지고 검색할 수 있는 방법을 찾는 것이 필요할 뿐이다.
기존의 사전은 일반적으로 표기법에 따른 기본형을 표제어로 삼고, 발음사전이라고 하더라도 역시 기본형의 발음만을 대상으로 하고 있다. 발음사전 중에서, 한국방송공사 편저, 『표준 한국어발음대사전』(어문각, 1993)의 경우를 보면, 이 사전은 낱말의 기본형을 표제어로 삼고 그 발음정보만 기술하였고, 부록에는 기본형의 발음을 표기형으로 바꾸어 볼 수 있게 해 주었으며, 뜻풀이는 제공하지 않고 있다.
다만, 일부 전자사전에서는 용언의 경우에 한하여, 표기법에 맞춘 낱말 활용형을 입력하면, 그 활용형의 기본형을 검색하여 뜻풀이를 제공해 주는 방법이 상용화되어 있다. '네이버'나 '다음' 등의 사전 검색에서 확인해 볼 수 있다. 이러한 사전은 반드시 용언을 표기법에 맞춘 활용형태로 입력시켜야 한다는 제한이 있다.
용언을 표기법에 맞춘 활용형은 언제나 어간의 형태가 일정하게 유지되므로, 그 어간의 형태만 이용하면 된다는 것을 알 수 있다. 예를 들면, 기본형 {맑다}의 활용형 {맑고, 맑으니, 맑았는데, 맑지만} 등으로 입력되므로, 어간 {맑-}을 대표형태로 갖고 있으므로, {맑-}을 검색형으로 사용하면 되는 것이다.
이러한 사전의 단점은 모든 용언의 활용형을 맞춤법에 맞춘 문자로만 입력해야 한다는 한계를 갖는 것이다. 따라서 체언이나 수식언 등의 활용형은 검색할 수 없다는 문제를 갖고, 또한 발음형태로는 검색할 수 없다는 문제도 있으며, 더 나가서는 음성으로 입력하면 검색이 되지 않는 문제 등이 있는 것이다.
상기와 같은 종래기술의 문제점을 해결하고자, 본 발명은 사전 표제어에서 받침소리가 연음하는 활용형을 사용함으로써 기존 사전 표제어인 기본형은 7종성법의 발음 제약으로 표기와 발음이 일치하지 못하는 문제를 해결할 수 있는 낱말의 활용형으로 검색하는 한국어사전을 제공하는 것을 목적으로 한다.
또한 본 발명은 기존 사전에서 표제어와 풀이말, 예문 등에서 인위적인 낱말형인 동사 기본형을 사용하는 것을 동사 활용형으로 대치함으로써 실용성이 향상된 낱말의 활용형으로 검색하는 한국어사전을 제공하는 것을 목적으로 한다.
또한 본 발명은 실제 사용되는 문자와 발음 및 음성의 모든 활용형으로 검색이 가능한 낱말의 활용형으로 검색하는 한국어사전을 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위하여, 본 발명은 한국어사전에 있어서,
사전의 표제어 부분의 구성에서 연음하는 낱말 활용형을 검색어로 더하여 사용하거나 표제어 자체로 삼는 구성 방법과,
사전의 표제어 부분과 뜻풀이 부분 전체에서 동사의 기본형을 배제하고 활용형을 사용하는 구성 방법과,
사전의 표제어 부분에 대표 활용형 표제어와 부속 활용형 표제어 및 기본어간과 실음어간을 설정하여 낱말의 표기형이나 음성언어형의 모든 활용형을 검색하는 구성 방법을 포함하는 것을 특징으로 하는 낱말의 활용형으로 검색하는 한국어 사전을 제공한다.
특히, 상기 한국어사전은 사전의 표제어 부분에서 체언이나 용언 등의 활용형을 표제어인 기본형의 앞에 위치시켜서 기본형을 찾아가는 검색어로 사용하거나, 체언이나 용언 등의 활용형을 표제어 자체로 사용하거나, 표기형의 표제어를 주체로 삼고 발음형의 표제어는 표기형 표제어로 찾아가는 역할만 담당하거나, 표제어 부분에서 연음 활용형의 뒤에 기본형을 놓고 각각 발음형을 병기하여 다중적 검색어로 삼거나, 표기형의 기본어간, 활용형의 실음어간 및 음소 공통음형 및 어간 근원음 중 선택된 어느 하나의 개념을 사용할 수 있다.
또한 상기 한국어사전은 종이사전, 전자사전 또는 인터넷사전일 수 있다.
본 발명의 첫째 효과는 사전의 표제어에서 사용되는 기본형이 7종성 발음제한으로 발음과 표기가 일치하지 못하여 생기는 문제를 해결한 것이다. 이 문제는 받침소리가 연음하는 활용형, 즉 모음의 어미나 조사로 활용하는 낱말 활용형을 응용함으로써 해결된다. 이 방법에 따르면, 사전의 표제어에서 27가지 받침소리의 정보가 제대로 표시될 수 있게 된다.
다시 말하면, 용언과 체언의 활용형에서 표기가 발음의 정보를 제대로 표시해 주는 낱말 활용형을 제시함으로써, 사전의 검색에 사용될 수 있게 한 것이다. 즉 용언의 어간에 모음으로 시작되는 어미를 결합하여 연음하는 활용형으로 어간의 받침소리 정보를 정확히 표시해 주게 되고, 체언도 모음으로 시작되는 조사를 붙여서 연음하는 활용형으로 받침 정보를 제대로 표시해 주게 되는 것이다.
둘째 효과는 인위적 낱말형인 동사 기본형이 사전의 표제어와 뜻풀이나 예문 등에서 사용됨으로써, 실제로 사용되지 않는 낱말이나 문장을 사전에서 사용하고 있다는 문제점을 해결한 것이다. 이 문제는 동사의 기본형을 대신하여 동사의 활용형으로 대치함으로써 해결된다.
셋째 효과는 표기형의 기본어간에 더하여, 음성언어의 낱말 활용형에서 실음어간의 개념을 만들고, 실음어간 형태 분석 방법을 창안함으로써, 문자와 음성을 통하여 낱말의 모든 활용형으로 검색하는 전자사전을 만들 수 있게 된 것이다.
이와 같은 효과를 통하여, 한국어 맞춤법 수준이 낮은 사람이나, 초등학교 수준의 학생들, 특히 한국어를 배우는 외국인들 중 기본형을 만들지 못해서 사전을 검색하지 못하던 문제가 해결하여 사전의 실용성을 높일 수 있고, 또한 인위적으로 조직한 동사 기본형을 표제어와 풀이말에서 사용하던 불합리한 문제가 해결되었으며, 문자뿐만 아니라 음성언어를 통하여 낱말의 모든 활용형으로 자유롭게 검색할 수 있어 전자사전이나 인터넷사전에도 적용할 수 있다.
도 1은 낱말 기본형과 연음하는 활용형의 비교 예시도이다.
도 2는 낱말 받침소리의 조음작용 구조 예시도이다.
도 3은 연음하는 활용형의 받침소리 변환 구조 예시도이다.
도 4는 연음법과 7종성법의 관계 및 받침의 표기 근거 정리 예시도이다.
도 5는 본 발명의 일실시예에 따른 연음하는 활용형의 검색어 사용 모형도이다.
도 5은 본 발명의 일실시예에 따른 연음하는 활용형을 표제어를 삼는 모형도이다.
도 7은 본 발명의 일실시예에 따른 문자와 음성으로 검색하는 표제어 부분 모형도이다.
도 8은 본 발명의 일실시예에 따른 모든 활용형으로 찾는 사전의 표제어 부분 모형도이다.
도 9는 본 발명의 일실시예에 따른 모든 활용형으로 찾는 전자사전의 일 실시를 예시한 구성도이다.
도 10은 본 발명의 일실시예에 따른 전자사전의 실음어간 분석기의 구성과 작업 모형도이다.
도 11은 본 발명의 일실시예에 따른 전자사전의 출력어 처리부의 작업 모형도이다.
이하 본 발명을 상세히 설명한다.
이하 본 발명에서 사용하는 용어를 정리하면 다음과 같다. '표제어'란 용어는 사전의 '올림말'로서, 일정한 순서에 따라서 올려놓은 낱말의 항목을 가리킨다. 또한 사전의 낱말의 항목을 크게 두 부분으로 구분할 때, 표제어에 딸린 정보를 주는 부분을 '표제어 부분'이라고 말하고, 뜻풀이나 예문 등의 정보를 주는 부분을 '뜻풀이 부분'이라고 말하고자 한다. 그리고 동사나 형용사 등은 '용언'이라고 말하고, 명사나 대명사 및 수사 등은 '체언', 부사나 관형사 등은 '수식언'이라고 말하고자 한다.
그리고 용언의 어간에 어미가 첨가된 형태나 체언에 조사가 첨가되는 형태를 가리켜 모두 '활용형'이라고 말하고자 한다. 또한 낱말의 형태는 '먹다'와 같이 나타내고, 어미나 조사는 '-다'나 '-이/가'와 같이 나타내며, 어간은 '먹-'과 같이 표시하고, 발음(소리)을 적을 때는 '[먹따]'와 같이 나타내기로 한다.
본 발명자는 문자나 음성을 통하여 낱말의 모든 활용형으로 검색될 수 있는 사전이 가장 이상적인 한국어사전으로 보고, 표제어 부분에 대표 활용형과 부속 활용형을 몇 가지씩 제시하고 이에 따른 기본어간과 실음어간을 설정함으로써 문자나 음성언어를 통하여 낱말의 모든 활용형으로 검색되는 한국어사전을 개발하고자 하였다.
좀더 구체적으로 설명하면, 사전의 표제어 부분에서 7종성의 발음제약을 받는 기본형의 맞춤법 정보 취약점의 보완을 위하여, 모음으로 시작되는 어미나 조사의 활용형인 연음활용형을 사용함으로써, 어간이나 체언의 받침소리 정보가 연음이나 연철 방법을 통하여 맞춤법이 제대로 표시되게 하는 방법, 표제어 부분에서 표기형 표제어를 주체로 삼고 발음형의 표제어는 표기형의 표제어를 찾아가는 역할로 사용하는 방법과 사전의 표제어나 풀이말의 문장 및 예문 등에서 동사의 기본형을 대신하여 동사의 활용형을 사용하는 방법, 용언이나 체언 등에 모든 낱말 활용형의 표기형 기본어간과 활용형 실음어간 및 음소 공통음형, 어간 근원음 등의 개념을 적용하는 방법 등을 복합적이거나 선별적으로 적용하여 종이사전이나 전자사전을 만드는 것을 특징으로 하는 낱말의 활용형으로 검색하는 한국어사전을 만들고자 하는 것이다.
이에 따라 만들어지는 사전이 유형으로 보면, 사전의 표제어 부분에서 체언이나 용언 등의 활용형을 표제어인 기본형의 앞에 위치시켜서 기본형을 찾아가는 검색어로 사용하는 사전, 체언이나 용언 등의 활용형을 표제어 자체로 사용하는 사전과, 표기형의 표제어를 주체로 삼고 발음형의 표제어는 표기형 표제어로 찾아가는 역할만 담당하는 사전, 표제어나 풀이말 및 예문 등에서 동사 기본형을 대신하여 동사 활용형을 사용하는 사전, 표제어 부분에서 연음 활용형의 뒤에 기본형을 놓고 각각 발음형을 병기하여 다중적 검색어로 삼는 사전, 이러한 사전의 구성적 특징을 복합적이거나 부분적으로 적용하여 종이사전이나 전자사전 등이 있게 된다.
문자와 음성을 통하여 모든 활용형으로 검색되는 이상적인 한국어 전자사전을 만들기 위하여, 표제어 부분에 대표 활용형의 표제어와 부속 활용형의 표제어 및 기본어간과 실음어간을 설정하여 낱말의 모든 활용형으로 검색하는 구성 방법을 적용함으로써, 모든 낱말의 표기형과 발음형을 문자로 검색하거나 음성언어의 모든 낱말 활용형을 음성으로 검색하는 전자사전을 구성하는 것을 특징으로 하는 낱말의 활용형으로 검색하는 한국어사전을 만들 수 있다.
한 마디로 정리하면, 사전 표제어에서 낱말 기본형을 사용함으로써, 7종성법의 발음 제한을 받아 표기와 발음이 일치하지 못하는 문제는 받침소리가 연음(연철)하는 활용형으로 해결하고, 인위적 형태인 동사 기본형의 사용 문제는 동사의 활용형으로 대치함으로써 해결하고자 하는 것이 본 발명의 첫째 주안점이라고 말할 수 있고, 그 다음에는 문자와 음성을 통하여 낱말의 모든 활용형으로 검색할 수 있는 이상적인 한국어 전자사전을 창안하는 것이 둘째 주안점이라고 말할 수 있다.
또한 기존의 일반적인 한국어사전은 규범적인 성격을 갖는 것으로 보면, 본 발명의 한국어사전은 실용적인 성격을 갖는 것으로 볼 수 있다. 실용화의 단계로는 다음의 3단계가 알맞다고 여겨진다.
제 1단계는 초등교육이나 문해 교육 등의 교육용 한국어사전을 만드는 단계로 표제어가 3,000개 정도의 소사전이 필요하다. 이 사전은 한국어를 모국어로 배워서 말은 잘할 수 있지만, 한글과 맞춤법에 미숙한 사람들을 위한 것이다.
제 2단계는 한국어를 외국어로 배우는 사람들을 위한 사전으로, 외국인 교육용 한국어사전을 표제어 3,000개 정도 되는 소사전으로 만드는 것이다. 이 사전은 한국어를 배우는 사람들을 위한 사전이라는 조건에 맞도록 쉽고 편리하게 낱말의 활용형으로 검색할 수 있는 사전을 구성하는 것이다. 사전을 찾는 교육은 연음과 연철의 원리에 따라서 받침소리의 정체를 알 수 있게 하면 효과적일 것이다.
제 3단계는 일반적인 한국어사전을 소형과 대형으로 구성하는 것이다. 물론 학술적인 사전도 포함된다. 영어나 일본어는 동사의 기본형을 사용하는 문법이 있으므로, 사전의 표제어도 동사의 기본형이 자연스럽게 올려지지만, 한국어는 동사의 기본형을 사용하는 어법이 없으므로 이 사전에서는 동사 기본형을 표제어로 삼지도 않고, 뜻풀이의 문자이나 예문에서도 동사의 활용형을 사용하게 되는 것이다. 또한 이 사전에서 본격적인 전자사전의 구성도 실현된다.
이러한 3단계에서 초기에는 일단 기본형으로 구성된 기존의 사전 체계를 그대로 사용하면서, 표제어인 기본형 앞에 검색어로 활용형을 더하여 놓음으로써, 검색하는 단계에서만 활용형을 사용하는 방법을 사용한다. 그리고 점차로 표제어 자체를 낱말 활용형으로 삼고, 사전 전체에서 동사 기본형을 배제하고 동사 활용형을 사용하는 사전을 구성하는 것이 무리하지 않는 방법이라고 생각된다.
본 발명의 낱말의 활용형으로 검색되는 한국어사전은, 사전의 표제어 부분의 구성에서 연음하는 낱말 활용형을 검색어로 더하여 사용하거나 표제어 자체로 삼는 구성 방법과, 사전의 표제어 부분과 뜻풀이 부분 전체에서 동사의 기본형을 배제하고 활용형을 사용하는 구성 방법과, 사전의 표제어 부분에 대표 활용형 표제어와 부속 활용형 표제어 및 기본어간과 실음어간을 설정하여 낱말의 표기형이나 음성언어형의 모든 활용형을 검색하는 구성 방법을 포함하는 것을 특징으로 한다.
다음에서 본 발명의 실시를 위한 구체적인 내용은 크게 두 부분으로 나누어 설명하고자 한다. 제1단계에서는 기존의 사전 표제어로 사용되는 기본형의 문제에 대안으로 제시되는 연음 활용형의 구조와 특징을 이론과 예시를 통하여 설명하고, 음성언어 활용형의 형태분석 방법을 이론적으로 정립하며, 제2단계에서는 한국어사전의 구성 문제를 설명하고자 한다.
(제1단계)
1. 연음 활용형의 구조와 특징 및 활용형의 형태 분석 방법
제1단계에서는 사전에서 응용할 낱말 활용형 중에서 연음하는 활용형의 특성을 예시를 중심으로 설명하고, 발음 활용형을 분석하는 방법에 대한 이론에 대하여 설명한다.
그 순서로는 첫째, 연음하는 낱말 활용형의 특성을 설명하고, 둘째, 7종성법과 연음법을 비교하여 설명하며, 셋째, 사전 표제어와 뜻풀이 부분에 적용할 용언의 활용형에 대하여 설명하고, 넷째, 사전의 표제어와 뜻풀이 부분에 적용할 체언의 활용형에 대하여 설명하며, 다섯째, 낱말 활용형에서 음성형을 포함한 발음 활용형의 형태 분석 방법에 대한 개념을 정립하여 제시하고자 한다.
아래의 제목에 붙인 번호 '1.1.'은 제1단계에서 제1항의 설명이라는 의미로 붙인 것이며, 이하 같은 방식을 사용하고자 한다.
1.1. 연음하는 낱말 활용형의 특성
용언의 활용형에서 연음하는 활용형은 표기로 보면 연철과 같다. 도 3에 따르면, 활용형 {맑아요}(301)는 연음으로 [말가요](302)가 되므로 실제에 있어서는 표기와 발음이 일치된다. 즉 {맑아요}의 연음 발음인 [말가요]는 연철 표기로도 {말가요}가 되므로, 연음과 연철은 결과적으로 같은 것이다. 따라서 {-아요/어요}의 활용형인 {맑아요}는 표기와 발음이 일치하는 것이다. 이와 같이 연음하는 활용형에서는 표기가 연철과 연음으로 발음과 일치하는 것을 알 수 있다.
'연철'이란 어간의 받침이 어미의 모음과 결합하는 철자법을 가리킨 것이며, 이와 대조적으로 받침을 내려 적지 않는 것을 '분철'이라고 말하고자 한다. 연음 발음이 연철 표기와 일치하는 것은(302) 연음 발음 형태를 글자로 표기한 것이 연철 표기이기 때문이다.
표기와 발음이 일치되는 현상은 받침이 하나인 경우에서도 마찬가지이다. 예를 들면, 활용형 {먹어요}는 표기하는 연철로 {머거요}이고 발음하는 연음은 [머거요]가 되므로 표기와 발음이 일치한다. {먹어요}에서 맞춤법의 표기로는 어간을 {먹-}으로 밝혀서 적었지만, 연철 표기로 적으면 {머거-}가 되고, 연음으로 발음하면 [머거-]가 된다. 따라서 연철 표기나 연음 발음에서는 표기와 발음이 일치하는 것을 알 수 있다.
용언의 활용형 {맑아요}나 {먹어요} 등에서, 표기와 발음이 일치하는 이유는 {-아요/어요}라는 어미로 활용되었기 때문이다. [아]나 [어]와 같이 후음 [ㅇ]으로 시작되는 어미 활용형에서는 표기형과 발음형이 대부분 일치하는 것이다. 본 설명에서는, [아]나 [어]와 같이 후음 [ㅇ]으로 시작되는 음절을 관행적으로 사용해 온 바에 따라서 '모음으로 시작되는 음절'이라고 말하고 있다.
'모음으로 시작되는 음절'이라는 것은 정확하게 말하면 '후음 [ㅇ]으로 시작되는 음절'이다. 그런데 후음 [ㅇ]은 목구멍에서 거침없이 나오는 소리이므로 음가가 없는 소리라고 하여, [아]와 같은 음절은 모음만 있는 [ㅏ]의 음가로 본다. 그래서 글자로는 [아]나 [어]와 같이 후음 [ㅇ]을 표시하면서도, '모음으로 시작되는 음절'이라고 지칭하는 것이다.
후음 [ㅇ]의 개념은 연음에서 중요한 개념이므로, 좀더 부연하여 설명하고자 한다. 후음 [ㅇ]은 훈민정음(한글) 창제에서 언어학적인 특별한 의미가 있다. 이에 대하여, 최종민의 글 "우리말과 음악의 소리 울림틀(8)-후음 [ㅇ]의 발명과 3?2성틀 오행선율-,『한국어의 역사와 문화』(박이정, 2007), 316-322쪽에서는 '후음 [ㅇ]은 언어학의 0소리(zero sound) 발명'이라고 정리하였다. 즉 수학의 0과 같은 개념으로서, 언어학적인 '0소리'라는 것이다. 그러므로 음가를 0이라고 볼 때, 수에서 '01'이라고 표기해도 수의 값은 1인 것처럼 음절에서 [아]라고 표기해도 소리의 값은 모음인 [ㅏ]와 같은 것으로 볼 수 있다.
이런 의미에서 보면, [아]나 [어]와 같은 음절은 '0소리로 시작되는 음절'이라고 말해야 할 것이다. 그러나 관행적으로 사용되어 온 바에 따라서 '모음으로 시작되는 음절'이라고 말하고자 한다. 따라서 {-아요/어요}와 같은 어미는 '모음으로 시작되는 어미', 또는 줄여서 '모음 어미'라고 말하고, 이를 사용한 {맑아요}와 같은 활용형은 '모음 어미 활용형'이라고 말하고자 한다. 이 용어에는 후음 [ㅇ]으로 시작된다는 의미가 포함되고, 또한 모음이 어간의 받침소리를 내려받는 연음 발음이 생긴다는 의미도 포함된다. 따라서 '모음 어미 활용형'은 '연음 활용형'이라고 말할 수도 있다.
연음 활용형이 갖는 받침소리 내려받기 현상에는 후음 [ㅇ]의 소리성질과 관련된 구조적 시스템의 원리가 작동되고 있다. 도 3에 따르면, 분철 표기형 {맑아요}(301)의 어간 받침 [ㄱ]과 [ㅇ]의 합은 [말가요](302)에서 연음의 [ㄱ]으로 실현된다. 어미 [아]가 어간의 받침을 내려받는 연음에서, '[ㄱ]+[ㅇ]=[ㄱ]'과 같은 소리의 등식이 성립되는 것이다. 이것은 수학의 등식 '1 + 0 = 1'과 같은 맥락을 갖는다(304).
등식은 좌우 두 항이 같음의 의미를 가지므로, 좌우 두 항은 서로 변환되는 관계를 갖다. 그러므로 분철 표기의 [ㄱ,ㅇ]은 연음 발음의 [ㄱ]이 되고, 다시 연음 발음의 [ㄱ]은 분철 표기의 [ㄱ,ㅇ]이 될 수 있는 상호 변환의 구조적 시스템(303)을 갖는 것으로 볼 수 있다. 따라서 모음 어미 활용형에서는 발음과 표기가 상호 변환의 원리를 가지고 일치하는 구조적 시스템이 작용하는 것으로 정리할 수 있다.
이러한 모음 어미 활용형의 구조적 변환 시스템은 한국어의 구조적 특성이다. 이와 같은 특성을 사전의 표제어 부분에서 사용할 수 있게 된다면, 한국어 교육에 효율성을 높여줄 수 있을 것으로 생각된다. 한글 맞춤법이 어렵다고 생각하는 이유 중에 하나는 '표기가 발음을 제대로 표시해 주지 못하는 낱말 기본형'을 외워야 하고, 또한 그 기본형으로 사전을 검색해야 하는 데에 있다.
모음 어미 활용형 {덮어요}를 예를 들어 표로 정리해 보면 다음과 같다.
아래 표 5는 모음 어미 활용형 {덮어요}의 모음 어미 활용형 - 표기와 발음 일치 구조를 나타낸 것이다.
구분 낱말 활용형 표기와 발음의
상호 변환 등식
비고
분철 표기형 {덮어요}
[ㅍ]+[ㅇ]=[ㅍ]
분철 표기의 [ㅍ]과
[ㅇ]의 합이 발음의
[ㅍ]로 실현됨
연철 표기
연음 발음
[더퍼요]
등식 성립 : 후음 [ㅇ]의 0소리(zero sound) 성질에 의한 작용
정리 : 등식의 좌항 [ㅍ]+[ㅇ]과 우항 [ㅍ] 사이는 상호 변환 관계가 있음
상기 표 5에 따르면, 모음 어미 활용의 조건에 맞는 용언은 분철 표기와 연음 발음 사이에 상호 변환되는 구조적 시스템이 작동된다는 것을 알 수 있다. 모음 어미 활용형의 조건은 어간의 받침이 있는 낱말과 모음 어미가 만나는 것이다.
이러한 연음 발음의 상호 변환 구조는 용언에만 있는 것이 아니라 체언에도 있다. 즉 체언에 모음으로 시작되는 조사가 붙어서 활용되는 경우에, 연음 발음의 상호 변환 구조가 실현되는 것이다.
모음으로 시작되는 조사란 {-이/가}나 {-을/를}형 등의 {-이}나 {-을}과 같은 것으로서, 체언의 받침소리를 내려받을 수 있는 형태를 가리킨다. 조사 {-이/가, -을/를, -은/는} 등은 체언 끝음절에 받침이 있으면 {-이, -을, -은}을, 받침이 없으면 {-가, -를, -는}을 붙여서 구별하는데, {-이, -을, -은} 등을 '모음 조사'라고 말하고자 한다. 이를 활용한 형태를 '모음 조사 활용형' 또는 '연음 활용형'이라고 말하고자 한다.
체언에서 모음 조사 활용형의 예를 들면, {삶}이라는 체언이 조사 {-이/가}로 활용되어서 {삶이}(107)가 되는 것을 들 수 있다. 모음 조사 활용형인 {삶이}는 연음으로 [살미](108)가 된다. 받침이 하나인 경우에도 같은 데, 예를 들면 {꽃}이라는 명사는 모음 조사 활용형이 {꽃이}이고 연음으로 [꼬치]가 되므로, 표기와 발음이 일치되는 형태이다.
따라서 용언의 모음 어미 활용형이나 체언의 모음 조사 활용형은 연음으로 받침소리의 정보를 제대로 표시해 주는 것으로 정리할 수 있다.
1.2. 7종성법과 연음법 비교
연음 발음은 받침소리의 음가를 살리기 위한 자연스러운 현상으로 볼 수 있다. 도 3에서 보면, 음절 첫소리(305)는 자음의 일차적인 자리이므로 자음의 본질적 속성을 실현하지만, 받침소리는 버금가는 자리로서 자음의 이차적인 속성을 실현하는 것으로 설명할 수 있다. 따라서 받침의 자음은 연음이 가능한 조건에서는 항상 그 다음 음절의 첫소리로 이동하려는 지향성이 있다고 말할 수 있다(306). 이를 가리켜 '본디 자리(원위치) 지향성-외파화 지향성'이라고 말하였다(306). 다시 말하면, 자음은 음절의 첫소리로 실현되려는 성질이 있다는 것이다. 연음 발음은 이러한 자음의 성질로 설명할 수 있다고 본 것이다.
파열음 [ㅂ]를 예로 들어 보면, [밥]이라는 발음에서 첫소리의 [ㅂ]과 받침소리의 [ㅂ]의 조음작용과 소리 모양은 다르다. 첫소리 [ㅂ]은 온전한 파열을 하는데, 받침소리 [ㅂ]은 모음 소리울림을 입술자리에서 막는 작용을 할 뿐이므로 온전하게 파열하지 못한다. 즉 첫소리는 파열작용의 3단계 '닫음-지님-파열'이 모두 실현되는데, 받침소리는 '닫음'만 실현된 것이다.
이렇게 조음된 소리를 '외파음'과 '외파음'이라고 말하기도 하지만(정영찬, 『한국어 음운론』, 한국문화사, 1997, 34쪽 참조), 본 설명에서는 '미파음'과 '파열음'이라고 말할 수 있다. 미파열 상태인 받침소리 [ㅂ](307)은 모음으로 시작되는 음절의 첫소리로 가서 온전한 파열을 실현하려는 성질이 있는 것으로 볼 수 있기 때문이다. 소리가 실현되는 과정을 나타낸 '{밥} : [ㅂㅏㅂㅇl] : [바비]'(308)에서 보면, 시간적 진행 과정에서 받침소리 [ㅂ]은 모음 어미인 [이]의 [ㅇ]과 합하여 음절의 첫소리로 되는 과정을 볼 수 있다.
본질적으로 자음은 모음 앞(음절 첫소리)에서 자기 정체성을 모두 드러낼 수 있지만, 모음 뒤(받침소리)에서는 조음작용이 제한되는 것이다. 그러므로 받침소리의 위치에 있던 자음들은 모음으로 시작되는 음절을 만나면, 어김없이 모음 음절의 첫소리로 이동하는 연음 작용을 하는 것이다.
한국어의 받침소리 연음에서 또 한 가지 특성을 볼 수 있는데, 그것은 겹받침에 있는 현상이다. 겹받침은 7종성법의 제약을 받을 때는 겹받침 중에 하나만 발음되지만, 연음이 되면 두 가지 자음이 모두 발음된다는 점이다.
겹받침은 [ㄱ]계통으로 [ㄱㅅ], [ㄴ]계통으로 [ㄴㅈ, ㄴㅎ], [ㄹ]계통으로 [ㄹㄱ, ㄹㅁ, ㄹㅂ, ㄹㅅ, ㄹㅌ, ㄹㅍ], [ㅂ]계통으로 [ㅂㅅ]가 있으므로, 모두 10가지가 있다. 이들은 모두 연음 작용을 통하여 각자 자기 소리를 드러낸다.
이것이 연음 방식이 갖는 장점이며, 받침소리가 발음 제약을 받는 7종성법으로부터 자유로워지는 원리이며 문법이다. 이러한 연음 발음법 '연음법'이라고 말하고자 한다. 그리고 연음법으로 발음된 활용형을 '연음형'이라고 말하고자 한다.
한국어 표기법의 받침소리 27가지가 자기 음대로 실현되는 구조는 연음법에 근거를 두고 설명할 수 있다. 도 4에서는 표기법의 기본형이 갖고 있는 27가지 받침의 근거가 연음법에 있다는 것을 보여준다(407). 예를 들면 {꽃}(403)이라는 체언의 받침소리가 {ㅊ}이라는 것은 기본형의 발음형인 [꼬ㄷ](403)에서는 알 수가 없다. 그것은 연음하는 활용형 {꽃이}의 연음 발음 [꼬치](405)를 통해서 받침소리가 [ㅊ]이라는 것을 확인할 수 있는 것이다.
따라서 표기법에 다른 기본형의 받침소리 27가지는 연음하는 활용형에 근거를 두고 있다고 말할 수 있는 것이고(407), 연음하는 활용형은 표기와 발음이 일치하는 특징이 있다고 볼 수 있는 것이다. 바꾸어 말하면, 연음법이 성립되지 않으면, 7종성법의 발음 제약 문제도 설명하기 어렵게 되는 것이다.
따라서 한국어 받침소리는 연음법과 7종성법의 상보적 관계(401)로 운영된다고 볼 수 있다. 7종성법이 적용되는 조건에는 연음법이 적용되지 못하고, 연음법이 적용되는 조건에는 7종성법이 적용되지 못하기 때문이다.
또한 받침의 종류로 보면, 7종성법은 7가지로 한정되지만, 연음법은 변칙활용의 경우를 제외하면 27가지 전체를 실현한다. 따라서 7종성법은 연음법의 한 부분집합이 되는 셈이므로, 7종성법은 연음법에 내포(포함)되는 관계(402)에 있는 것이다.
그렇다면, 어느 법이 더 한국어 낱말 형태를 설명하는 데에 근원적인 법인지, 어느 법을 우선으로 하여 낱말 형태를 설명하는 것이 효과적인지를 생각해 볼 필요가 있다.
기본형은 7종성법의 제약을 받는 표기법으로서, 그 받침소리가 모두 연음법에 근거를 두고 있는 것으로 설명할 수 있다(407). 따라서 7종성법의 제약을 받는 낱말의 기본형보다도 오히려 연음법으로 받침소리가 보존되는 낱말의 연음형이 근원적인 형태라고 생각해 볼 수 있다.
도 4에서 {맑다}[막따](404)의 받침소리가 [ㄹㄱ]이라는 근거는 [막따]라는 발음에서 찾을 수 없고, 다만 연음형의 발음 [말가-](406)에서 찾을 수 있다. 연음법으로 [말가-]라는 발음이 있기 때문에, 발음으로 [막따]인데도 불구하고 [ㄹ]받침을 넣어서 {맑다}라는 기본형의 받침 구조를 밝힐 수 있다. 즉 [말가-]라는 두 음절 소리를 한 음절로 압축(축약)시킨 결과가 {맑-}이라는 어간이라고 설명한다면, 기본형보다 연음형에 원형성이 더 있는 것으로 보인다.
이와 같이, 연음형인 '{맑아)[말가]'가 기본형인 '{맑다}[막따]'보다 더 근원적인 형태로서 한국어 낱말의 형태를 설명하는 데에 적합하다고 본다면, 사전의 표제어로 알맞은 것은 기본형이 아니라 오히려 연음형이 된다고 볼 수 있다. 이것이 본 발명에서 중요하게 본 관점이다.
기본형 '{맑다}[막따]'의 받침소리가 '{맑아}[말가]'라는 연음형에 근원을 두고 있다고 본다면, 연음형 {맑아}는 기본형 {맑다}의 근원이 되는 형태이다. 따라서 어간에 {-다}를 붙인 활용형은 '기본형'이고, 어간에 {-아/어}를 붙인 연음 활용형은 '근원형'이라고 말할 수 있다. 이런 문제는 학술적인 연구 과제로 넘기고, 다만 연음하는 활용형도 기본형만큼 중요한 낱말 형태라는 점을 강조하고자 한다. 따라서 사전의 표제어 부분에서 연음형을 사용하는 것도 의미가 있는 일이라고 보고자 한다.
만약에 기본형보다 연음형이 한국어 낱말의 표기와 발음의 특성을 더 잘 설명할 수 있다면, 현재 용언의 기본형인 '어간+{-다}형'을 대신하여, 연음형인 '어간+{-아/어}형'이나 '어간+{-아요/어요}형'을 기본형으로 다시 설정하던지, 아니면 '대표 활용형'이라는 것을 새로 만들어 사용해야 할 것이다.
이러한 문제는 사전의 표제어 부분에만 해당되는 것이 아니라, 한국어 형태론에서 토론되어야 할 문제이다. 본 발명에서는 다만, 현재 7종성법의 발음제약을 받는 기본형보다 표기법의 모든 받침 27가지를 발음으로 실현할 수 있는 연음법으로 활용되는 연음형을 사전의 표제어로 삼는 것이 더 낫다는 것으로 정리하고자 한다.
1.3. 표제어와 뜻풀이 부분에 적용할 용언과 체언의 활용형 설명
용언의 활용형에서 표기와 발음이 연음(연철)으로 일치하는 양상을 구체적으로 보기 위하여, 기본형과 연음 활용형의 예를 들어 비교해 보고자 한다. 받침소리별로 낱말을 하나씩 예를 들어 비교해 보면 다음과 같다.
아래 표 6은 용언의 기본형과 연음형 비교를 나타낸 것이다.
받침
소리
{-다}형
기본형
{-아요/어요}의
활용형
{-(으)니}의
활용형
비고
[ㄱ] 먹다 [먹따] ^먹어요 [ 머거요 ] ^먹으니 [ 머그니 ]
[ㄲ] 묶다 [묵따] ^묶어요 [ 무꺼요 ] ^묶으니 [ 무끄니 ]
[ㄴ] ^알다 [알다] ^알아요 [ 아라요 ] ^아니 [아니]
[ㄴㅈ] 앉다 [안따] ^앉아요 [ 안자요 ] ^앉으니 [ 안즈니 ]
[ㄴㅎ] 않다 [안타] 않아요 [아나요] 않으니 [아느니] [ㅎ]의 잠재성
[ㄷ] 듣다 [듣따] ^들어요 [ 드러요 ] ^들으니 [ 드르니 ]
[ㄹ] ^불다 [불다] ^불어요 [ 부러요 ] 부니 [부니]
[ㄹㄱ] 맑다 [막따] ^맑아요 [말가요] ^맑으니 [ 말그니 ]
[ㄹㅁ] 닮다 [담따] ^닮아요 [달마요] ^닮으니 [ 달므니]
[ㄹㅂ] 밟다 [밥따] ^밟아요 [ 발바요 ] ^밟으니 [ 발브니 ]
[ㄹㅌ] 핥다 [할따] ^핥아요 [ 할타요 ] ^핥으니 [ 할트니 ]
[ㄹㅍ] 읊다 [읍따] ^읊어요 [ 을퍼요 ] ^읊으니 [ 을프니 ]
[ㄹㅎ] 잃다 [일타] 잃어요 [이러요] 잃으니 [이르니] [ㅎ]의 잠재성
[ㅁ] 담다 [담따] ^담아요 [ 다마요 ] ^담으니 [ 다므니 ]
[ㅂ] 집다 [집따] ^집어요 [ 지버요 ] ^집으니 [ 지브니 ]
[ㅂㅅ] 없다 [업따] ^없어요 [업써요] ^없으니 [업쓰니] [ㅄ]에서 [ㅅ]의 경음화
[ㅅ] 웃다 [우ㄷ따] ^웃어요 [우서요] ^웃으니 [ 우스니 ]
[ㅅㅅ] 있다 [이ㄷ따] ^있어요 [ 이써요 ] ^있으니 [ 이쓰니 ]
[ㅈ] 찾다 [차ㄷ따] ^찾아요 [차자요] ^찾으니 [ 차즈니 ]
[ㅌ] 맡다 [맏따] ^맡아요 [ 마타요 ] ^맡으니 [ 마트니]
[ㅍ] 깊다 [깁따] ^깊어요 [ 기퍼요 ] ^깊으니 [ 기프니 ]
[ㅎ] 놓다 [노타] 놓아요 [노아요] 놓으니 [노으니] [ㅎ]의 잠재성
상기 표 6에서 [ ]표 안은 발음형태이고, ^표는 표기와 발음이 일치하는 형태이다.
상기 표 6에 따르면, 기본형인 {-다}형은 다만 [ㄴ,ㄹ]받침소리에서만 표기와 발음이 일치할 뿐이다. 그런데, 연음형인 {-아요/어요}형이나 {-(으)니}형은 다만 {없어요}의 경우나 {않아요, 잃어요, 놓아요}와 같은 자리에서만 [ㅎ]이 연음하지 않을 뿐, 다른 모든 낱말에서는 표기와 발음이 일치하는 것을 볼 수 있다.
{없어요}의 경우에 [ㅅ]을 [ㅆ]으로 연음하는 것은 [업+서]와 같은 소리 연결에서 생기는 경음화 현상으로서, [ㅂ](폐쇄음)의 다음에 오는 [ㅅ]은 된소리가 되는 이른바 '경음화 규칙'에 의한 것이다. 따라서 이것은 어느 정도 연음의 의미가 있다고 볼 수 있다. 이와 같이 소리가 경음화 환경에 놓여서 경음화 되어 연음하는 것을 가리켜 '경음화 연음' 또는 '된소리 연음'이라고 말하고자 한다.
또한 [ㅎ]받침의 경우에 [ㅎ]받침이 활용된 형태라는 것을 구조를 통하여 보여 준다. 예를 들면 {좋아요}의 [ㅎ]이 연음되지 않는다고 해서 [조요]라고 발음하지 않는다는 것이다. {좋아요}의 발음은 [조요]가 아니라 [조아요]인 것이다. [ㅎ]이 [-아요]의 [ㅇ]과 합쳐진 것과 같다. 따라서 [ㅎ]이 비록 연음하여 소리로 발음은 되지 않아도 [-아]속에 잠재적으로 담겨 있다는 것을 구조적으로 나타내고 있는 것이다. 이것을 본 설명에서는 '[ㅎ]의 잠재적 연음'현상이라고 말하고자 한다.
이와 같은 [ㅅ]의 경음화 연음 현상이나 [ㅎ]의 잠재적 연음 현상이라는 특수한 두 가지 연음현상을 제외하면 모든 낱말 활용형에서 발음 표기 일치 구조를 갖는 것으로 볼 수 있다.
정리하면, 연음형인 모음 어미 활용형은 받침소리 정보를 제대로 표시할 수 있으므로, 사전 검색 방법으로 이 활용형을 사용하면, 기본형에서 얻지 못하던 받침소리 정보를 제대로 받을 수 있게 된다. 이것을 맞춤법의 학습과정에 있는 사람들에게 학습용 사전으로 제공해 준다면, 교육효과를 증대시킬 수 있는 것이다. 한국어에는 지혜로운 구조가 있어서, 7종성법의 발음 제약에만 묶여 있는 것이 아니라는 것을 알 수 있다. 표기법 받침소리 27가지가 모두 자연스럽게 자기 음가를 실현할 수 있는 기제가 마련되어 있는데, 그것이 바로 연음법이다.
모음 어미 활용형은 {-(으)니}형과 같은 비종결형과 {-아/어}나 {-아요/어요}형과 같은 종결형이 있다. 모음 어미 활용형에 사용될 만한 것 몇 가지만 제시해 보면 다음과 같다.
아래 표 7은 모음 어미 활용형의 유형을 나타낸 것이다.
종결형 비종결형
해체
(반말)
하오체
(예사 높임)
해요체
(예사 높임)
{-아/어} {-오} {-아요/어요} {-(으)니}
{-(으)면} 등
{아/어}
{-아서/어서} 등
상기 표 7에 따르면, 종결형으로 세 가지와 비종결형으로 두 가지를 예시하였다. 종결형에는 반말로서 '해체'와 예사 높임으로써 '하오체, 해요체'가 있다.
존대어 등급은 학자에 따라서 다른데, '해체, 하오체, 해요체'로 제시한 것은 남기심?고영근 선생님의 『표준 국어문법론』(탑출판사,1996), 157쪽에 제시된 상대높임법에 따른 것이며, 괄호 안의 '반말, 예사 높임'이라는 용어는 최현배 선생님의 『우리말본』(정음문화사,1929/1991), 266쪽에서는 '아주 낮춤(해라), 예사 낮춤(하게), 예사 높임(하오), 아주 놓임(합쇼), 반말(등외)'로 제시된 바에 따른 것이다. 이에 따르면, 종결형 {-아/어}는 반말로 해체에 들어가고, {-오}와 {-아요/어요}는 하오체와 해요체로서 예사 높임에 해당된다.
연음하는 활용형 중에서 대표적인 활용형을 '대표 활용형'이라고 말하고, 종결형과 비종결형에서 한 가지씩 선정해 보고자 한다. 대표 활용형으로 종결형에서는 {-아/어}형이 알맞아 보이지만, 일상생활에서 존댓말로 {-아요/어요}형이 많이 사용된다. 반말체로 {-아/어}를 꼽는 것이 더 편리할 수 있다. 비종결형으로는 {-(으)니}형이 있다. 연음형으로 사용되는 모음 어미는 종결형의 {-아/어}계통과 연결형의 {-으}계통이 있으므로, 종결형으로는 {-아/어}가 꼽힐 수밖에 없다.
연음하는 활용형에서 잠정적으로 대표 활용형을 선정해 본다면 {-아/어}형을 꼽을 수 있다. 그러나 한국어의 특징 중 하나인 존대법을 대표 활용형에 반영한다면 {-아요/어요}가 알맞은 것으로 보인다. 존댓말이 못마땅하다면, 자연스럽게 {-요}를 제외한 형태인 반말체로 {-아/어}형으로 종결형을 만들면 결과적으로 {-아/어}형이 되는 것이다. 같은 맥락에서 볼 때 비종결형의 대표 활용형은 {-(으)니}가 알맞다.
물론 이와 같은 대표 활용형의 선정은 재론의 여지가 있는 것이고, 필요한 경우 더 많은 논의가 요구되는 부분이므로, 다만 잠정적으로 선정해 놓은 것으로 여기고자 한다.
다음에는 체언의 활용형에 대하여 설명하고자 한다. 체언에 조사가 붙지 않은 상태를 '체언 기본형'(이하 '기본형'이라 함)이라고 말하고, 체언에 조사가 결합한 형태를 '체언 활용형'(이하 '활용형'이라 함)이라고 하며, 사전에 표제어로 올리는 체언을 '체언 표제어'라고 말하고자 한다.
체언 표제어의 문제점도 용언 표제어의 경우와 같이, 표기와 발음이 일치하지 못한 경우가 많다는 것이다. 예를 들면, {부엌}의 발음은 [부억]이고, {삶}의 발음은 [삼]이므로, 기본형은 표기와 발음이 다르다. {삶, 옷, 꽃} 등과 같은 일상적인 말도 표기와 발음이 다른 것이다.
체언에 사용되는 받침소리를 중심으로 체언 기본형과 연음형을 표로 예시해 보면 다음과 같다.
아래 표 8은 체언 기본형과 연음형의 형태 비교를 나타낸 것이다.
받침
소리
기본형
(조사 없음)
{-이/가}형
활용
{-을/를}형
활용
비고
^{복} [복] ^{복이} [보기} ^{복을} [ 보글 ]
{밖} [박] ^{밖이} [ 바끼 ] ^{밖을} [ 바끌 ]
ㄱㅅ {몫} [목] {몫이} [목씨] {몫을} [목쓸] [ㄳ]에서 ㅅ경음화 연음
^{안} [안] ^{안이} [아니] ^{안을} [ 아늘 ]
^{불} [불] ^{불이} [부리] ^{불을} [부를]
ㄹㄱ {닭} [닥] ^{닭이} [달기] ^{닭을} [ 달글 ]
ㄹㅁ {삶} [삼] ^{삶이} [ 살미 ] ^{삶을} [ 살믈 ]
^{담} [담] ^{담이} [ 다미 ] ^{담을} [ 다믈 ]
^{집} [집] ^{집이} [ 지비 ] ^{집을} [ 지블 ]
ㅂㅅ {값} [갑] {값이} [갑씨] {값을} [갑슬] [ㅄ]에서 ㅅ의 경음화 연음
{옷} [오ㄷ] ^{옷이} [오시] ^{옷을} [ 오슬 ]
^{종} [종] ^{종이} [조이] ^{종을} [ 조을 ]
{낮} [낟] ^{낮이} [나지] ^{낮을} [ 나즐 ]
{꽃} [꼬ㄷ] ^{꽃이} [꼬치] ^{꽃을} [ 꼬츨 ]
{부엌} [부억] ^{부엌이} [ 부어키 ] ^{부엌을} [ 부어클 ]
{팥} [파ㄷ] {팥이} [파치] ^{팥을} [ 파틀 ] [ㅌ]구개음화 연음
{숲} [숩] ^{숲이} [수피] ^{숲을} [ 수플 ]
상기 표 8에서 ^표는 표기와 발음이 일치하는 형태이고, []안은 연음형이다.
상기 표 8에 따르면, {옷}과 {꽃}의 발음 형태로 적어 놓은 [오ㄷ]과 [꼬ㄷ]은 'ㄷ'받침이 잘못 적힌 것인데, 이것은 '특허청 전자문서 작성기'의 기능이 좋지 않아서 [오]에 [ㄷ]받침이 붙지 않기 때문에 생긴 것이다. 그리고 {종이}의 발음형태인 [조이]의 [이]는 비음(콧소리)으로서의 이응이다.
또한, 표 8에 나타낸 바와 같이 체언 기본형은 [ㄱ, ㄴ, ㄹ, ㅁ, ㅂ, ㅇ](6개)를 제외한 모든 낱말에서 표기와 발음이 일치되지 못한다. [ㄷ]까지 넣으면, 받침소리의 7종성법만 표기와 발음이 일치할 뿐이다.
이에 비하여, 연음형은 [ㅂㅅ]과 [ㅌ]받침소리를 제외하고 모든 낱말에서 표기와 발음의 일치 구조를 갖는다. [ㅅ]을 [ㅆ]으로 연음하는 경음화 연음이다. 이것은 상기 표 6의 용언의 기본형과 연음형 비교의 설에서 살펴 본 바 있다. 그리고 [ㅌ]받침소리로서 {팥이}가 [파치]로 연음되는 경우는 [이] 앞에서 [ㅌ,ㄷ]이 구개음화된 것이므로 '구개음화 연음'이라고 말하고자 한다.
따라서, 체언의 {-이/-을}에 의한 연음 활용형에서는 경음화 연음과 구개음화 연음을 제외하면 모든 체언의 연음 활용형이 표기와 발음 일치 구조를 갖는다고 볼 수 있는 것이다.
이상과 같이, 표 7과 표 8에서 용언과 체언의 연음 활용형의 예시를 통하여 어미 {-아/어, -(으)니}와 조사 {-이/을} 등의 활용 구조를 살펴본 바에 따라서 연음 활용형의 구조를 간단히 정리하고자 한다.
아래 표 9는 연음 활용형의 구조를 나타낸 것이다.
연음의 종류 연음 활용형의 예 연음 작용 연음 대상
(1) 일반적 연음법 특수 연음 방법 3가지를 제외한 27가지 받침소리 전체
예: {꽃이}[꼬치]
받침소리(종성)가 다음 음절의 첫자음(초성)으로 연음함 받침소리
27가지
전체
(2)특수한
연음법
ㄱ) 경음화
연음
폐쇄음 다음의 [ㅅ]받침:{없어} [업써] [ㅂ]다음에 오는 [ㅅ]을 [ㅆ]으로 연음함
ㄴ) 구개음화
연음
[이]앞의 [ㅌ]받침.
예: {밭이} [바치]
[ㅌ]을 [ㅊ]으로 연음함
ㄷ) 잠재적
연음
[ㅎ]의 [ㅇ]소리 되기: {좋아요}[조아요] [ㅎ]을 [ㅇ]으로 연음함
상기 표 9에 따르면, 맞춤법으로 규정된 받침소리 27가지 전체가 연음하는 활용형의 구조를 갖는다는 것을 알 수 있다. 따라서 한국어 낱말 형태에서 연음 활용형의 구조에 대한 교육이 강화되면 기본형보다 연음 활용형의 실용성을 높일 수 있는 것이다. 일반적인 연음법의 교육은 모음 어미와 모음 조사가 연결될 때 연철과 연음이 되는 방식으로 몇 시간 안에 쉽게 이루어질 수 있는 것이다. 그리고 특수한 연음법은 근본적으로 소리의 성질이 반영된 것이므로, 한국어를 모국어로 배운 사람들은 발음을 해보면 소리의 느낌에서 어느 정도 특수한 연음의 감을 잡을 수 있게 되기도 한다. 또한 소리가 놓인 환경에 따라서 소리 성질을 반영한 것으로 한정된 조건에서만 실현되는 것이므로 이해하기 쉬운 교육으로 해결될 수 있다. 그리고 이것은 문법으로도 연결되어 해결될 수 있다. 사전을 검색하는 데에서는 사전의 안내말에서 특수한 연음법을 제시해 줄 수도 있으므로, 지나치게 신경을 쓸 필요는 없는 것이다.
조사는 연음형을 만드는 기제가 잘 마련되어 있다는 점을 강조하고자 한다. 즉, 조사 {-이/가, -을/를, -은/는}형 등은 체언의 끝음절에 받침이 있으면 {-이, -을, -은}을 붙이고, 받침이 없으면 {-가, -를, -는}을 붙여서 구별한다. 예를 들면, 받침이 있는 {꽃}은 {꽃이, 꽃을, 꽃은}과 같이 활용되고, 받침이 없는 {나무}는 {나무가, 나무를, 나무는}과 같이 활용된다. 조사 {-이, -을, -은} 등은 모음형 조사라고 말하고, {-가, -를, -는} 등은 자음형 조사라고 말하고자 한다. 여기에서 조사의 특별한 구조를 볼 수 있는 것이다. 즉, 체언이 연음하는 데에 편리하도록 모음형 조사가 잘 마련되어 있다는 것이다.
한 가지 고려할 점은 체언에 조사를 붙인 상태를 낱말형으로 보는 관점이다. 학교문법에서는 조사를 자립형태소로 보므로 체언도 자립형태소이고 조사도 자립형태소가 되는 것이다. 그러나 조사는 의존성도 있는 것이므로 학교문법과 달리 학술적으로는 아직도 논란이 있다.
이 설명에서는 {삶이}와 같은 활용형을 낱말의 활용형으로 보고 있다. 이것은 용언의 경우와 맥락을 같이 해보려는 것이다. 즉 어간에 어미가 붙어서 활용형의 낱말이 되는 것처럼, 체언도 조사가 붙은 상태를 활용형의 낱말로 보고자 하는 것이다. 본질적으로 낱말의 개념에 대하여 아직도 학술적인 논란이 있지만, 체언에 조사가 붙은 활용 형태를 '활용형 낱말'로 보는 데에는 무리가 없는 것으로 여겨진다.
특히, 모든 체언도 서술격조사라고 말하는 {-이다}를 붙이면 모두 용언이 되는 특징이 있다. 예를 들어 {꽃}에 {-이다}를 붙인 활용형은 {꽃이다}이므로 이것은 용언처럼 활용된 낱말이 된다. 또한 명사에 따라서 {-하다}나 {-한다}를 붙여서 형용사나 동사로 활용하는 경우가 너무 많다. 예를 들면, {행복}은 {행복하다}라는 형용사가 되고, {공부}는 {공부한다}라는 동사가 된다. 이렇게 체언이 용언으로도 활용되므로 체언에 조사를 붙이는 활용형도 같은 맥락에서 활용형 낱말이라고 보고자 한다.
체언 활용형인 {꽃이다}는 {꽃이-니, 꽃이-고, 꽃이-면} 등과 같이 활용되므로, 여기서는 {꽃이-}라는 형태를 어간의 구성으로 볼 수가 있게 된다. 체언도 활용형에 따라서는 어간의 일부가 될 수도 있는 것이다. 따라서 체언의 활용형은 다양하고 복잡하다는 것을 알 수 있고, 그 안에 조사의 활용형 낱말도 함께 고려되어야 할 것으로 생각된다.
체언 활용형은 모든 활용형으로 검색하는 한국어사전에서는 표제어 부분에서, 대표형 표제어나 부속형으로 올려질 수도 있고, 사용자가 자유롭게 문자나 음성으로 검색하는 질의어로 사용될 수도 있는 낱말 활용형이라고 볼 수 있게 된다.
1.4. 활용형의 실음어간과 어간 근원음의 개념 정립과 응용 방법
연음법의 활용형뿐만 아니라 7종성법의 발음 제한을 받는 활용형까지 포함하여 낱말의 모든 활용형으로 검색될 수 있는 한국어사전이 되면 가장 이상적인 사전이 될 것이다.
다양하고 섬세한 낱말의 활용을 갖는 한국어의 특징을 사전에 반영하려면 모든 낱말의 활용형으로 검색하는 사전의 구성이 필요하다. 그러나, 용언과 체언 등의 모든 낱말의 활용형을 표제어로 올려놓으려면 종이사전은 물론 전자사전이라고 하더라도 그 분량을 감당할 수 없다. 또한 기본적인 의미가 같고 활용의 형태만 많이 달라지는 활용형을 모두 올려놓을 필요도 없다. 그러므로 다만 낱말의 모든 활용형으로 검색을 할 수 있는 방법(기능)만 갖추고 있으면 되는 것이다.
따라서, 본 발명에서는 표기형을 포함하여 발음형과 음성형(음성언어)의 모든 활용형으로 검색할 수 있는 방법을 창안하여 제시하고자 한다.
기존의 사전은 일반적으로 표기법에 따른 기본형을 표제어로 삼고, 발음사전이라고 하더라도 활용형은 배제하고 역시 기본형의 발음만을 대상으로 하고 있다. 발음사전 중에서 예를 들면, 한국방송공사 편저, 『표준 한국어발음대사전』(어문각, 1993)의 경우에 낱말의 기본형을 표제어로 삼아서 발음정보를 제공하고, 부록에서도 역시 기본형의 발음을 표기형으로 바꾸어 볼 수 있게 해 주었으며, 뜻풀이는 제공하지 않고 있다.
그러므로 본 발명에서는 표제어 부분과 뜻풀이 부분을 갖는 일반적 한국어사전에서 표기형과 함께 발음형 및 음성언어로 입력하여 검색하는 방법까지 합하여 모든 낱말의 활용형으로 검색하는 방법을 찾고자 하는 것이다. 이러한 방법을 실현하려면 기존의 표기법에 따른 형태분석의 방법과 다른 발음형의 형태분리 방법이 필요하다.
따라서, 본 발명에서는 기존의 형태소분석 방법과 같이 어미와 조사를 분리하는 형태분석의 방법을 사용하지 않고, 낱말 활용형의 실제 발음 형태로 어간을 분리하는 새로운 형태분리 방법을 창안하였다. 이것은 발음형과 표기형의 모든 낱말 활용형을 몇 가지 유형으로 분류하여 '공통음형'을 설정하고, 이것을 사전의 표제어 부분의 구성에 설정하는 방법이다.
'공통음형'이란 여러 활용형이 공동으로 갖는 음형을 가리킨다. 예를 들면, 발음형에서 [말가요, 말가코, 말가니, 말간데] 등은 [말가-]라는 음형을 공통으로 갖는다. 따라서 [말가-]라는 공통음형을 표제어 부분에 설정해 놓고, [말가요, 말가코, 말가니, 말간데] 등과 같은 낱말 활용형으로 질의어(검색어)가 입력되면 그 표제어 부분을 찾아갈 수 있게 하는 것이다. 즉, 공통음형 [말가-]는 [말가요, 말가코, 말가니, 말간데] 등과 같은 활용형들을 모두 수렴한다는 것이다.
표기형에서는 기존의 '기본형의 어간 형태'(이하 '기본어간'이라 함)가 곧 공통음형이 되는 셈이다. 예를 들면, {맑아, 맑다, 맑고, 맑으니, 맑지만} 등과 같은 표기형의 모든 활용형은 단순하게 {맑-}이라는 기본어간을 한 가지만 갖기 때문이다.
이러한 공통 음형은 실제의 소리로 실현되므로 모든 활용형으로 검색하는 사전에서는 낱말 활용의 발음형과 표기형이 갖는 공통 음형을 설정하고, 이것을 사전의 표제어 부분에서 사용한다는 것이 핵심적 구상이다. 여기서는 낱말 활용 현상에 나타나는 '발음형의 공통음형'이라는 개념으로 정리하여 이론적 근거로 삼고자 한다. '발음형의 공통음형'은 어간과 같은 맥락을 갖는 개념으로서 활용형이 갖는 발음형 어간의 이형태들의 집합이라고 말할 수 있다. 이러한 공통 음형은 실제 소리로 실현되므로 '활용형의 실음어간'(이하 '실음어간'이라 함)이라고 말하고자 한다. 이는 발명에서 활용형에 나타나는 실제의 발음형 어간이라는 개념을 찾게 된 것이다.
그러므로 본 발명에서는 어간을 표기법에 따른 기존의 기본어간과 활용형에 따른 발음형의 실음어간으로 구분하고자 한다. 실음어간이란 낱말의 활용형에서 음형이 불변하는 부분이다. '불변하는 부분'이라는 것은 '어간'의 개념에서 빌려온 의미이다. 어간 개념은 불변하는 형태로서, 어미나 조사처럼 변하는 부분이 제외된 어휘의 중심적 형태를 가리킨 것이기 때문이다.
기존의 기본어간은 7종성법의 발음 제한을 받아 실제 발음의 음형을 표시하지 못한다. 기존의 기본어간 개념은 {먹-}과 같이 불변하는 실질적 형태를 가리키는데, 이것이 발음될 때는 음형이 다르게 실현된다. 예를 들면, 표기형으로 {먹어, 먹었고, 먹는, 먹을, 먹고} 등은 항상 {먹-}이라는 형태를 밝혀서 적기 때문에, {먹-}이 불변하는 공통형태가 되어 어간으로 규정할 수 있다. 그러나 발음형에서는 [머거, 머거요, 머걷꼬, 머거도]등과 같은 활용형에서 불변하는 음형은 [머거-]가 되고, [멍느냐, 멍는다, 멍느라고, 멍는다면] 등과 같은 활용형에서 불변하는 음형은 [멍느-]가 된다.
그러므로 실음어간은 맞춤법에 맞춘 표기형으로 규정한 기존의 기본어간과 다른 것으로서 발음형태로 활용되는 낱말의 발음형 어간이고, 낱말의 활용형이 실제 발음되는 소리형태로서 어휘적 의미를 담당한 실제의 음형어간이다. 전자사전을 비롯한 음성처리 분야에서는 발음형만 가지고 형태를 분석할 필요할 때가 있게 된다. 이때는 이러한 실음어간을 사용하는 것이 합리적이다.
또한, 실음어간은 발음 형태를 학술적으로 연구하는 데에 필요하게 될 것이다. 전통적으로 국어학의 형태론 연구는 표기법의 문자를 중심으로 하여 맞춤법을 주요 대상으로 삼았으므로 기존의 표기형 기본어간으로 언어 현상을 설명해 왔다. 그러나 소리의 저장과 재생이 쉬워지고, 다양한 매체를 통해서 자유롭게 사용할 수 있는 기술 향상으로 음성언어를 중심으로 한 발음의 음형에 대한 형태적 연구가 새롭게 요청되는 것이다. 쉽게 말하면, 기존의 표기형 기본어간 하나만으로 다양하고 섬세하게 변화는 활용형의 실제 음형을 모두 감당하기 어렵다는 것이다.
이에 본 발명에서는 어간의 개념을 표기형의 기본어간과 발음형의 활용형 실음어간으로 구분하여 개념을 정리한 것이다. 이 방법은 표기형의 기본형에서 불변부분을 어간이라고 보는 것처럼 발음형의 활용형에서도 불변부분을 활용형 실음 어간으로 규정한 것이다. 발음형의 활용형에서 불변부분을 찾아내는 것이 좀 복잡하지만, 활용하는 양상을 음절단위로 보면 쉽게 불변부분을 찾아낼 수 있다. 다만, 음절 단위보다 더 작은 자음과 모음을 단위로 하면 다르게 표시할 수 있다. 예를 들어, [멍느-]는 [멍ㄴ-]로 더 넓혀서 규정할 수 있고 [말그-]는 [말ㄱ-]로 규정할 수도 있다.
예를 들어, {먹어, 먹었다, 먹어라}의 발음형 [머거, 머걷따, 머거라]에서는 [머거-]가 불변하는 음형이다. 또한 {먹으니, 먹을, 먹은}의 발음형 [머그니, 머글, 머근]에서는 [머그-]가 불변하는 음형이다. 또한 {먹고, 먹지만, 먹다가}의 발음형 [먹꼬, 먹찌, 먹따가]에서는 [먹-]이 불변하는 음형이다. 그리고 {먹는다, 먹느라고, 먹느냐}의 발음형 [멍는다, 멍느라고, 멍느냐]에서는 [멍느-]가 불변하는 음형이다. 따라서 활용어간은 [머거- / 머그- / 먹- / 멍느-]와 같이 4가지 이형태로 볼 수 있다. 여기에는 기존의 표기형 어간 {먹-}도 포함되어 있다.
체언에 {-이다}가 붙어서 활용되고 조사가 붙어서 활용되므로, 실음어간과 같은 개념을 적용하고자 한다. 예를 들어, {삶이, 삶인데, 삶이라면}의 발음형은 [살미, 살민데, 살미라면]이므로 실음어간은 [살미-]로 설정할 수 있다. {삶은, 삶을, 삶으로}의 발음형은 [살믄, 살믈, 살므로]이므로, 실음어간은 [살므-]라고 볼 수 있다. {삶도, 삶만}의 발음형은 [삼도, 삼만]이므로, 실음어간은 [삼-]으로 볼 수 있다. 따라서 여기에는 3가지 실음어간이 있는 것으로 보고자 한다. 기존의 표기형 어간 {삶}을 포함시켜서 활용어간은 모두 [삶-/ 살미-/ 살므-/ 삼-]과 같이 4가지 형태로 말할 수 있다.
다음에는 또 한 가지 개념을 만들어 낼 수 있다. 예를 들어 실음어간 이형태 [머거- / 머그- / 먹- / 멍느-] 등에는 [머-]라는 공통음형이 있고, [삶- / 살미- / 살므- / 삼-] 등에는 [사-]라는 공통음형이 있다. 이와 같은 공통음형은 실음어간의 근원이 되는 음형이므로 '실음어간 근원음형'(이하 '어간 근원음'이라함)이라고 말하고자 한다. 기존의 표기형 기본어간과 실음어간의 이형태 등 모든 어간은 어간 근원음을 갖다.
어간의 근원이 되는 음형은 불규칙 활용에서도 변하지 않는 음형이라는 특징을 가지므로 중요한 개념으로 사용될 수 있다. 예를 들면, 불규칙 활용형으로 표기형인 {듣는다, 들어요}이나 발음형인 [드르니, 드러라, 든는다] 등에서 어간 근원음은 {드-}라는 형태를 일정하게 갖는 것이다.
따라서, 모든 활용형은 어간 근원음의 음형을 근원으로 성립된다는 특징이 있는 것이다. 즉, 어간 근원음의 범주 안에서만 활용이 성립된다는 것이다. 그러므로 어간 근원음은 모든 활용형의 검색 범위를 한정해 주는 역할도 갖는다. 전자사전의 표제어 검색에서 어간 근원음을 먼저 찾은 다음에 실음어간을 검색한다면 어간 근원음의 범위 안으로 검색의 범위를 좁혀 줄 수 있게 된다.
모든 낱말의 활용형을 분석하고 분류할 수 있는 실음어간과 어간 근원음의 개념을 예시를 통하여 정리하면 다음과 같다.
아래 표 10은 실음어간과 어간 근원음 개념 정립에 대한 예시를 나타낸 것이다.
구분 활용형 예시 실음어간
(변음어간)
공통음형
어간수 어간 근원음
용언 표기형 {맑아요, 맑으니, 맑고, 맑는다,
맑지, 맑다, 맑다가, 맑지만}
{맑-} 1가지 [마]
발음형
(음성언어)
[말가요, 말가, 말가서, 말가타] [말가-]
5가지


[말그니,말그면, 말근데] [말그-]
[말꼬, 말끼도, 말끼만] [말-]
[막따, 막따니, 막찌, 막찌만] [막-]
[망는다, 망는데, 망느라고] [망-]
체언 표기형 {삶이, 삶은, 삶에, 삶도, 삶만,
삶을, 삶에도, 삶일찌라도, 삶}
{삶-} 1가지 [사]
발음형
(음성언어)
[살미, 살미니, 살미요] [살미-]
4가지

[살믄, 살므로, 살믈] [살므-]
[살메, 살메는, 살메도] [살메-]
[삼도, 삼만] [삼-]
상기 표 10에 따르면, 용언과 체언별로 모든 활용형에서 기존의 표기형 기본어간은 {맑-}이나 {삶-}처럼 한 가지이지만, 실음어간은 5가지 정도의 이형태를 갖는 것으로 분석되었다. 그리고 표기형이나 발음형을 포괄하는 어근 근원음은 각각 [마]와 [사]를 갖는 것으로 분석되었다.
이와 같이 실음어간의 형태분리로 모든 활용형을 분류할 수 있게 된다. 예를 들면, 대표 활용형 {맑아}(맑다)의 모든 활용형은 [맑- / 말가- / 말그- / 말- / 막- / 망-] 등 6가지 실음어간 중에서 한 가지 형태를 가지고 활용된다는 것이다. 이것은 대표 활용형 {맑아}를 갖는 낱말 활용형을 6가지로 분류한 것이므로, 이 6가지 실음어간으로 모든 활용형을 수용할 수 있다. 예를 들어, [망는다면]이라는 활용형은 실음어간 [망느-]를 갖는 것으로 분석되는 되는 것이다.
실음어간의 음형은 음절을 단위로 규정하였다. 즉, 자음 하나를 별도로 표시하지 않았다. 예를 들면, [망ㄴ-]이나 [살ㅁ-}의 [ㄴ-]이나 [ㅁ-]처럼 자음을 음절 밖에서 독립적으로 표시하지 않는다. 자음은 홀로 소리(음절)를 이룰 수 없어서 실음어간에는 어울리지 않기 때문이다. 또한 전자장치의 기계적인 음성 처리에서도 이것이 편리할 것이라는 생각을 감안한 것이다. 자음이나 모음은 홀로 음절이 될 수 없다는 이론은 한글 창제를 해설한 문헌인 『훈민정음』원본의 '제자해'의 이론에 있다. 그러나 받아쓰기를 하고 자음과 모음을 단위로 어간을 나열하여 좀 더 포괄적으로 어간형태를 만들어 사용할 수 있다.
실음어간은 한 가지 형태만 갖는 표기법의 기본어간에 비하여 여러 가지 이형태를 가지므로 복잡해 보이지만, 이것이 오히려 특징이 될 수 있다. 한국어 낱말은 불규칙으로 활용되는 낱말이 많은데, 이런 경우에도 실음어간은 모든 낱말이 발음되는 대로 활용되는 실제 발음의 소리를 어간으로 설정하는 것이므로, 오히려 실음어간으로 모든 낱말이 갖는 정확한 활용형을 검색할 수 있는 것이다. 따라서, 사전에서 사용할 경우에는 모든 낱말을 정확하게 검색될 수 있는 특징을 갖는 것이다. 용언과 체언 및 수식언 등 사전에 올린 모든 낱말 활용형을 실음어간으로 모두 분석함으로써 100% 완전하게 분석하는 형태분석기를 사용한 것과 같은 결과를 갖는 것이다.
또한 사소한 문제점으로는 '동음이의어'와 비슷한 맥락의 문제점이 생기는 경우가 있을 수 있다. 실음어간의 음형이 다른 실음어간과 중복되는 일이 있다는 것이다. 예를 들면, {삼}(명사)을 검색할 때, [삼-]('삶도'의 '삼')형이 검색되어 중복되는 점이다. 이것은 사용자가 가려서 볼 수 있을 정도가 되는 것이므로 문제가 되지 않는다. 즉, 낱말에서 '동음이의어'가 많이 있는 것과 같은 맥락에서 보면 큰 문제가 되지 않는다.
실음어간에서 대표형을 정한다면, 용언은 이형태들 중에서 종결형이 될 수 있는 형태로 선정할 수 있다. 또한 체언은 {-이}로 활용되는 음형을 선정하는 것이 알맞은데, 이것은 서술격조사 {-이다}로 활용되는 모든 음형을 내포하게 되기 때문이다. 예를 들면, [삶이], {부엌이} 등과 같다.
실음어간을 이용한 전자사전 구성과 실음어간의 분석기 및 어간 근원음의 분석에 관한 설명은 다음의 제2단계의 뒷부분에서 좀더 자세히 설명하기로 한다.
(제2단계)
2. 활용형으로 검색하는 한국어 사전의 구성
제2단계는 사전을 만드는 실제에 관한 것으로, 낱말 활용형을 사전에서 응용하는 방법을 설명하고자 한다. 따라서 활용형으로 표제어인 기본형을 검색하는 사전과 표제어 자체를 활용형으로 설정하는 사전, 그리고 낱말의 모든 활용형으로 검색하는 사전 등을 설명하고자 한다.
2.1. 연음 활용형으로 기본형 표제어를 검색하는 한국어사전
사전의 표제어 부분에서 연음 활용형을 검색어로 이용하는 방법을 설명하고자 한다. 이것은 연음 활용형을 사전의 표제어 부분에서 응용하는 방법 가운데 가장 간단한 방법이다. 이 방법은 기존의 한국어사전 체계를 그대로 유지한 가운데, 다만 표제어 앞에 연음 활용형을 위치시킴으로써 표제어인 기본형을 찾을 수 있게 하는 것이다. 종이사전과 전자사전에서 모두 사용할 수 있는 방법이다.
이것은 예를 들면, 기본형의 발음형 [막따]나 [말가요]는 아는데, {맑다}와 같은 기본형의 맞춤법 정보를 잘 모르는 사람들을 위한 방법이다. {맑다}의 연음 활용형인 {맑아요}를 검색어로 사용하면, 즉 [말가요]라고 발음을 해 보면 받침소리가 [ㄹ,ㄱ]이라는 정보를 쉽게 알 수 있다. '마-ㄹ-ㄱ'의 구조이다. 따라서 사전을 찾을 때 {마}를 찾은 다음에 'ㄹ'과 'ㄱ'을 차례로 찾아 나가면, {맑}이라는 글자를 찾게 되는 것이므로, {맑아요}라는 낱말을 쉽게 검색할 수 있게 된다는 것이다.
연음 활용형의 표기와 발음의 받침소리 구조는 연철과 분철의 훈련을 조금만 하면 쉽게 알 수 있는 구조이다. 표제어가 용언이면 모음 어미 {-아/어}나 {-아요/어요}형으로, 체언이면 모음 조사 {-이/가}나 {-을/를}형을 사용할 수 있다.
도 5의 예시를 보면서 설명하고자 한다.
도 5는 본 발명의 일실시예에 따른 연음하는 활용형의 검색어 사용 모형도이다. 도 5에 도시된 바와 같이, 연음하는 활용형인 {맑아요}(501)는 검색어로 제일 앞에 올려놓고, 화살표(502)는 검색어로 찾은 표제어 쪽을 안내한 것이며, {맑다}(503)는 기본형으로 올려진 표제어이다. 그 다음은 품사(504)를 적어 놓은 것이고, (1)과 같은 번호(505)는 의미 부분을 가리킨 것이다. 표제어인 {맑다}(503) 이하는 기존의 사전 틀을 그대로 사용한 방법이다.
그 아래 항목인 [말가요](506)는 발음형으로도 검색할 수 있도록 구성한다. 이 검색어 항목은 다만 {맑아요}(501)을 찾아갈 수 있게 화살표 다음에 {맑아요}(507)을 안내해 준 것이다. 이것은 검색어인 {맑아요}의 맞춤법을 잘 몰라서 발음되는 대로 [말가요]로도 검색어를 찾아갈 수 있게 구성한 것이다. 그래서 발음형이라는 표시로 기호를 '[ ]'와 같은 것을 사용하였다. 실제로 사전 구성에서는 검색어 {맑아요}(501)가 발음형 [말가요](506)보다 아래에 놓이게 된다.
검색어 {맑아요}(501)에는 별도로 발음 표시를 해 줄 필요는 없다. 사전 안내에서 연음 발음이나 연철 방식을 안내해 줌으로써, 검색어의 발음을 별도로 표시해 주는 일은 필요 없게 된다. 그러나 표제어 {맑다}(503)에는 [막따]라는 발음 표시를 해 줄 수도 있다.
동사 검색어인 {밟아요}(508)의 경우에 찾아가는 표제어가 {밟는다}(509)로 제시되었다. 기존의 동사 기본형 {밟다}는 실제 사용되지 않는 인위적인 낱말이므로, 이를 대신하여 {밟는다}(509)를 올린 것이다. 따라서 예문에도 "우리는 매일 땅을 밟는다."처럼 되어, 동사가 {밟는다}(510)를 사용하였다. 만약에 기존의 동사 기본형 {밟다}를 표제어로 올린다면, 예문이 "우리는 매일 땅을 밟다."라는 말이 되어야 하므로, 실제로 사용되지 않는 예문을 만들어 놓게 되어 불합리하기 때문이다.
또한 별도로 올리는 검색어 항목인 [발바요](511)는 {밟아요}(508)를 찾아가도록 화살표 다음에 {밟아요}(512)만 적어 놓은 것이다.
도 5의 {빨리}(513)의 경우에, 검색어와 화살표가 없는 것은 이 낱말의 품사가 부사이기 때문이다. 체언과 용언만 연음하는 활용형으로 검색어를 올리게 되므로 부사에는 검색어가 따로 없다. 이러한 뜻에서 표제어인 {빨리}의 뒤에 '/'와 같은 표(514)를 적어 놓은 것이다.
{삶이}(515}는 체언까지 연음하는 활용형으로 검색어를 사용한 예시인데, 그 아래 부분은 용언의 예와 같다. 그런데 용언에만 연음 활용형으로 검색어를 사용하고자 할 때는 체언은 기존의 사전처럼 명사 형태만 표제어로 올리면 된다.
이와 같이 연음 활용형의 검색어 {맑아요}(501)를 사용하는 사전에서도 직접 기본형 {맑다}(503)를 찾아갈 수 있다. 검색어와 표제의 어간이 {맑-}으로 같기 때문에, 거의 같은 곳에서 {맑아요}와 {맑다}를 함께 찾을 수 있게 되는 것이다. 다만 표제어 {맑다}(503)가 검색어 {맑아요}(501)의 뒤에 있다는 점만 감안하면 된다. 이와 같은 방법은 사전 안내말에서 사전을 찾는 방법으로 제시해 놓으면 된다.
2.2. 낱말 활용형을 표제어로 삼는 한국어사전
사전의 표제어로 낱말의 기본형을 사용하는 방법을 버리고, 표제어 자체를 연음 활용형으로 삼는 한국어사전을 만드는 방법을 설명하고자 한다. 이것은 새로운 사전의 틀을 만드는 것으로서, 종이사전과 전자사전에 모두 적용할 수 있다.
도 6을 예시를 보면서 설명하고자 한다.
도 6은 본 발명의 일실시예에 따른 연음하는 활용형을 표제어를 삼는 모형도이다. 도 6에 도시된 바와 같이, 표기형(601)과 함께 발음형(615)으로도 찾을 수 있게 구성한 것이다. 뜻풀이 정보는 표기형에 제시하고, 발음형은 다만 표기형을 안내해 주는 역할만 하도록 구성한 것이다.
도 6에서는 기존의 낱말 기본형을 배제하고, 연음하는 활용형 {맑아요}(601)를 표제어 자체로 사용하였다. 이것은 존댓말 형태이므로 좀 어색하지만, 한국어의 존댓말 특징을 드러내는 장점을 생각한 것이다. 특히, 이 사전 구성은 한국어를 배우는 데에 사용할 교육용 사전으로 사용될 것을 구상한 것이다. 존댓말을 표제어로 삼는 것이 낯설고 마땅하지 않다면 유보할 수도 있다. 그래서 그 아래 동사 활용형 {밟아}(608)에서는 반말로 예시해 놓았다.
표제어 부분에서 ( )안에는 활용형 {맑아}(602)와 기존의 기본형 {맑다}(603)를 참고로 볼 수 있게 예시한 것이다. 품사 안내로 <형용사>(604)와 같이 표시하였고, 뜻풀이 번호(605)로 '(1)'을 사용한 것이다.
표제어가 활용형이므로 뜻풀이 부분(607)의 문장에서도 기본형을 배제하고 '깨끗해요'와 같이 활용형으로 진술하였다. 즉 뜻풀이에서도 표제어와 같은 어형을 사용해야 하는 부담이 있는 것이다. 이것을 어울리게 하는 일이 연구 문제가 되겠지만, 예문에서도 '물이 맑아요'(606)와 같이 제시해 보았다. 이것은 존댓말의 종결형이다.
그런데 표제어의 부속형으로 괄호 안에 올려놓은 '(맑아, 맑다)'(602, 603)에 대한 어형을 맞추기 위하여, 뜻풀이 끝에서 각각 '(깨끗해, 깨끗하다)'(607)와 같이 문장 종결형을 ( )안에 덧붙여 놓았다. 즉 문장의 종결형에서, '{맑아요}에 대하여는 {깨끗해요}로, {맑아}에 대하여는 {깨끗해}로, {맑다}에 대하여 {깨끗하다}로 뜻풀이의 말투를 일치시킨 것이다.
따라서 뜻풀이에서 3중의 종결형을 보여준 것이다. 즉 '{맑아요}(맑아, 맑다)'에 대한 뜻풀이의 맺음말은 '{깨끗해요}(깨끗해, 깨끗하다)'로 대응시킨 것이다. 이것을 읽는 방법을 사전 안내말에서 잘 안내해주면 어려움은 없겠지만, 본문이 다소 복잡해 보이는 단점이 있다. 이 뜻풀이를 세 문장으로 읽을 수 있는데 그 양상은 아래 표와 같다.
아래 표 11은 활용형을 표제어로 삼은 사전에서 용언의 뜻풀이 모형(도 6)을 나타낸 것이다.
구분 뜻풀이의 맺음형
표제어(대표 활용형): 맑아요 "어떤 이물질이나 더러운 것이 섞이지 않아 깨끗해요."
제1부속 활용형: 맑아 "어떤 이물질이나 더러운 것이 섞이지 않아 깨끗해."
제2부속 활용형: 맑다(기본형) "어떤 이물질이나 더러운 것이 섞이지 않아 깨끗하다".
상기 표 11에 따르면, 표제어 {맑아요}에 따른 두 가지 부속 활용형이 있다. 표제어 {맑아요}는 존댓말 종결형이라고 한다면, 제1부속 낱말 {맑아}는 반말의 종결형이고, 제2부속의 기본형 {맑다}는 문어체(격식형)의 종결형이라고 볼 수 있다. 이 표대로 뜻풀이를 적어 주는 것은 많은 정보를 처리할 수 있는 전자사전에서 유리한 점이 있다는 전제 아래서 검토해 볼 만한 것이다. 제1부속 활용형 {맑아}는 {맑아-서}나 {맑아-도}와 같이 활용되는 형태에서 어간의 기능을 담당하면서도 반말의 종결형도 겸하고 있으므로 참고로 제시한 것이고, 제2부속으로 사용된 기본형 {맑다}는 기본형으로서의 중요성과 전통적으로 사용되었던 표제어로서의 중요성도 있고 그 뜻풀이도 알고 싶어할 수 있으므로 부차적으로 제시한 것이다.
한마디로 말해서 활용형 {맑아요}나 {맑아} 중에 하나만 표제어로 올려놓지 않고, 제1과 제2 부속 활용형을 올려놓은 것은 활용형의 정보를 주면서, 기존의 사전 표제어인 기본형에 익숙한 이용자들에게 낯설지 않게 하려는 배려이다. 이와 같이 부속 활용형을 사용하는 방법은 전자사전에서 더 유리할 것이라는 점이 감안된 것이다.
제1, 제2 부속 활용형을 올리지 말고, 다만 표제어로 {맑아요} 하나만 올려놓는 것이 더 낫다고 볼 수도 있다. 또한 활용형을 표제어로 삼은 사전에 어느 정도 익숙해진 다음에, 표제어 부분에 {맑아}나 {맑아요}와 같이 연음의 활용형을 하나만 올려놓아도 될 것이다.
다음에는 동사 표제어 {밟아}(608)의 경우를 보고자 한다. 그 위의 표제어 {맑아요}(601)와 달리 반말의 활용형을 표제어로 삼은 예시를 한 것이다. 그리고 제1 부속 활용형은 존댓말로 {밟아요}를 올리고, 제2 부속 활용형은 현재형 {밟는다}를 올리었다. 기존의 동사 기본형으로는 {밟다}인데, 이것을 제외하고 {밟는다}로 올린 것은 동사 기본형이 인위적으로 조직된 인공적 낱말이기 때문이다. 뜻풀이와 예문을 3중적으로 제시한 것(609, 610)은 형용사의 경우(606, 607)와 같은 방식이므로 설명은 줄인다.
또한 동사의 발음형 [발바](616)에서 화살표로 {밟아}(608)를 가리킨 것은 발음형으로 찾게 된 경우에 표제어 {밟아}(608)로 이동해 보라는 것이다. 그리고 부사형인 {빨리}(513, 514)는 도 5에서 설명한 것을 그대로 사용하는 것이므로 설명을 더할 필요가 없다.
그리고 체언 활용형을 표제어로 올린 {삶이}(611)의 경우도 형용사나 동사의 경우와 구조적인 흐름은 같다. 다만 어미 활용 대신에 조사 활용을 한 것이 다르다. 표제어 {삶이}는 주격조사라고 말하는 {-이/가}의 활용형이다. 제1, 제2부속 활용형 {삶을, 삶}(612)은 목적격 조사 {-을/를}과 조사 활용이 없는 기본형 {삶}을 올린 것이다.
그런데 {삶이}의 뜻풀이 부분(613, 614)이 자연스럽지 못한 측면이 있다. 따라서 조사 활용형은 도 5의 {삶이}(515)처럼 기본형을 찾아가는 검색어 방식으로만 사용하는 것이 더 낫다고 볼 수도 있다. 그렇게 되면 용언은 활용형이 표제어가 되고, 체언은 활용형이 표제어를 찾아가는 검색어가 되므로, 일관성이 없다는 단점이 있지만 체언의 활용형에 익숙하지 못한 사용자들을 위해서는 현실적으로 무난한 방법이 될 수도 있다.
다음에는 활용형을 표제어로 삼으면서, 표기형과 발음형을 함께 검색어로 사용하는 방법을 제시해 보고자 한다. 이것은 전자사전에서 문자와 발음으로 검색하는 사전을 설명하기 위한 것이다. 그 예시를 도 7에 제시하였다.
도 7은 본 발명의 일실시예에 따른 문자와 음성으로 검색하는 표제어 부분 모형도이다. 도 7은 용언 활용형을 표제어로 삼은 것으로서, 표제어 {맑아요}(701)를 제시하였다. 그 다음에 표제어의 발음형 [말가요](702)를 붙여 놓았는데, 이것은 발음으로 검색할 때 찾기 위한 것이다. 종이사전에서는 발음의 정보를 보충해 주는 것으로 사용된다. 그 다음의 기호 '/'(703)은 활용형과 기본형을 구분한 표시이다. 즉 기본형 {맑다}(704)와 그 발음형 [막따](705)는 표제어와 구분하여 그 뒤에 부속형으로 올려놓은 것이다. 여기서 [막따]는 음성으로 검색할 때 사용하기 위한 발음형이지만, 종이사전에서는 발음 정보를 주는 역할을 하는 것이다. 그 다음의 기호 ';'(706)은 표제어 부분의 끝맺음을 표시한 것이며, 이것은 전자사전에서 이 기호의 앞 부분에서만 검색하라는 표시로 사용된다.
여기에서 표제어 부분에 활용형과 기본형을 함께 사용한 것은 전자사전에서는 두 형태가 모두 검색어로 사용될 수 있게 하려는 것이다. 발음형까지 구분하면, 4가지 형태가 되는 셈이다. 기본형의 뜻풀이는 '참고'(708)라는 영역을 만들어 놓고 간단하게 뜻풀이와 예문을 한 가지씩만 적어 놓았다.
또한 동사 기본형은 문제점이 있어서 사용하지 않고, {밟다}를 대신하여 {밟는다}[밤는다](709, 710)를 사용하였다.
그리고 체언은 활용형을 검색어로 삼아 기본형을 찾는 방법으로 제시하였다. 따라서 활용형인 {삶이}[살미](711, 712)로 검색할 수도 있고, 기본형인 {삶}[삼] (713, 714)으로도 직접 검색되도록 한 것이다. 따라서 체언의 뜻풀이 정보는 기본형만 제시하였는데(715), 이것은 도 5에서 활용형으로 기본형을 찾는 모형에 제시되었던 것이다. 이 방식은 결국 기존의 사전에 있는 체언의 체계를 그대로 사용하면서, 다만 활용형으로 표제어를 찾아갈 수 있게 한 것과 같다.
도 7의 용언은 활용형을 표제어로 삼은 것이고, 체언은 활용형을 검색어로만 사용하여 기존 사전 체계를 그대로 사용한 것이다. 따라서 변화를 줄이면서도, 맞춤법이 어려운 체언의 문제를 해결한 것이다. 또한 동사 기본형의 문제점을 개선하고(709, 710), 용언 활용형의 적용이 가능하게 한 것이다.
이상에서 설명한 여러 가지 방법을 전자사전에 적용할 경우에는 문자로만 검색하는 방법과 문자와 음성으로 검색하는 사전을 만들 수 있다.
전자사전의 구성에서는 도 9의 구성을 기본으로 하고, 필요에 따라서 가감하여 구성하면 된다. 예를 들어 말소리(음성) 받아쓰기 같은 것이 필요 없을 경우는 구성에서 제외하면 되는 것이다.
2.3. 문자와 음성의 모든 활용형으로 검색하는 한국어 전자사전
이상적인 한국어사전은 문자와 음성의 모든 활용형으로 검색할 수 있는 사전이라고 볼 수 있다. 즉, 낱말의 기본형으로만 검색되는 것이 아니라 낱말의 모든 활용형으로 말하듯이 음성언어로 검색될 수 있는 한국어사전을 만드는 것이다. 질문은 음성으로 해도 좋고 문자로 해도 좋은 것이므로, 이러한 사전이야말로 가장 사용하기 편리한 한국어사전이다. 여기서는 이러한 사전을 만드는 방법을 창안하여 제시하고자 한다.
한국어의 낱말 활용형은 다양하고 섬세하므로 그 수가 상당히 많고 복잡하기 때문에 그만큼 사전을 만드는 데에도 어려운 점이 많다. 그런데 모든 낱말 활용형을 맞춤법에 맞도록 문자로 입력하면, 낱말의 기본형인 표제어가 검색되는 방법은 이미 상용화되어 있다. 이것은 반드시 발음형이 아니라 표기법에 맞도록 정확하게 문자로 입력해야 한다는 조건에서만 성립되는 것이다.
이러한 사전의 구성은 여러 가지 활용형이 갖는 공통형태를 이용하여 검색하는 방법을 사용하면 가능해진다. 예를 들어, {맑다}의 활용형은 {맑으니, 맑으면, 맑고, 맑지만, 맑은데, 맑았다} 등과 같이 아주 다양하지만, 이들 활용형은 모두 어간이 {맑-}을 공통형태로 갖고 있다. 따라서, {맑으니, 맑으면, 맑고, 맑지만} 등 어떠한 것으로 질의를 하더라도 어간 {맑-}을 가진 기본형 {맑다}를 찾아가기만 하면 되는 것이다.
또한 체언의 활용도 마찬가지이다. {값}이라는 명사로 활용되는 형태가 {값이, 값이면, 값으로, 값이니, 값만, 값도, 값이지만} 등과 같이 많지만, 모두 {값}이라는 공통형태가 있다. 이 공통형태를 기반으로 하여 다양한 활용형이 표제어 {값}을 찾아갈 수 있는 것이다.
이러한 방법은 어간이나 체언의 표기형을 맞춤법에 맞도록 정확하게 문자로 입력해야 한다는 제약이 있다. 즉, 이러한 기존 전자사전의 단점은 '[망는데]'처럼 발음형태의 문자로 입력하거나 음성언어의 소리로 입력하여 검색할 수 없다는 것이다.
이에 본 발명에서는 낱말의 모든 활용형으로 검색이 되면서, 동시에 표기형의 문자는 물론이고 발음형태의 문자나 음성언어로 입력하여도 검색할 수 있는 방법을 제시하고자 한다.
발음형태의 문자로 입력되는 낱말을 '발음형문자', 또는 '발음형'이라고 말하고, 음성언어로 입력되는 낱말은 '음성언어형', 그리고 맞춤법에 맞도록 표기형 문자로 입력되는 낱말을 '표기형문자' 또는 '표기형'이라고 말하고자 한다.
낱말의 발음형문자 표기는 음성언어를 받아서 문자로 쓰는 것이고, 반대로 음성언어의 출력은 발음형문자의 표기를 음성언어로 읽는 것이다. 음성인식 장치에 의하여 음성언어를 발음형문자로 변환시킬 수 있는데, 이것은 음성언어를 소리나는 대로만 받아쓰는 것이므로, 음성언어를 표기형문자로 변환시키는 것보다 쉽다. 음성언어를 표기형문자로 변환시키려면 표기법이라는 까다로운 규칙에 맞추어야 하기 때문에 더 어렵다.
낱말의 모든 활용형으로 검색하는 사전에서는 사용자가 마음대로 정하는 낱말의 활용형(이하 '질의어'라 함)으로 질문을 하게 되는 것이다. 따라서 어떤 활용형이 질의어로 입력될 것인지 전혀 예상되지 않는 상황이다. 특히 문자나 음성언어로 입력되는 조건이 또 전제되어야 한다.
그러므로, 어떤 낱말의 활용형이 문자나 음성의 질의어로 입력될 때 그 낱말 활용형의 형태분석은 어미와 조사를 분리하는 기존의 형태분석 방법을 적용하기 어려운 상황이다. 왜냐하면 맞춤법을 따르는 문자 표기형을 중심으로 분석하는 기존의 형태분석기도 불완전한 면이 있지만, 특히 음성으로 입력되는 낱말 활용형의 발음형태를 가지고 어미와 조사를 분석하는 형태분석기까지 개발하려면 실효성이 더 떨어지기 때문이다.
따라서, 본 발명에서는 기존의 어미나 조사 형태소 분석방법(형태소 분석기)을 사용하지 않고, 실제로 발음되는 낱말의 활용형에서 불변하는 부분을 고정시켜 활용의 어간이나 어기(어근)의 부분을 분석하고 분리하는 방법을 사용하고자 한다. 이것은 앞의 '제1단계'의 '1.4.항'에서 설명한 '실음어간'의 개념을 사용하는 것이다. 즉, 본 발명에서는 어간의 개념을 표기법의 기본어간과 발음법의 실음어간으로 구분하여 개념을 정리한 것이다. 이것은 기존의 기본어간 개념과 달리 발음의 활용형에서도 불변부분을 '실음어간(활용형의 실음어간)'으로 규정하고 이형태로 규정한 것이다. 실음어간의 구체적인 예시와 설명은 상기 표 10의 앞뒤에 제시되어 있다.
여기에서 몇 가지 낱말로 예를 들어 설명하면서 사전의 표제어 모형을 제시하고자 한다. {먹는다}라는 낱말은 표기형의 기본어간으로 {먹-}을 갖고 있고, {먹어, 먹어서, 먹어라} 등으로 활용되는 발음형은 [머거, 머거서, 머거라]로 발음되므로 [머거-]라는 실음어간이 있고, 또한 {먹으니, 먹으면, 먹은}의 발음형은 [머그니, 머그면, 머근]이 되어 [머그-]라는 실음어간이 있다. 또한 {먹고, 먹지, 먹다가}의 발음형 [먹꼬, 먹찌, 먹따가]에서는 [먹-]이 실음어간이고, {먹는다, 먹느냐, 먹느라고}의 발음형 [멍는다, 멍느냐, 멍느라고]에서는 [멍느-]가 실음용어간이다. 따라서 {먹는다}의 실음어간은 [머거- / 머그- / 먹- / 멍느-]와 같이 4가지이다.
따라서, {먹는다}라는 낱말로 활용되는 모든 활용형태는 이 4가지 실음어간 중에 하나를 반드시 갖게 되어 있는 것이다. 예를 들어, [멍느라고]라는 활용형은 [멍느-]라는 실음어간을 갖고 있고, [머거씀니다마는]이라는 활용형은 [머거-]라는 실음어간을 갖고 있는 것이다. 그러므로 4가지 실음어간을 표제어 항목에 설정해 놓으면 어떠한 활용형으로 질의어가 들어와도 표제어 항목으로 찾아갈 수 있게 할 수 있다.
그런데, 이 4가지 활용어간 중에서 [먹-]과 [머거-]와 [머그-]는 [ㅁㅓㄱ]을 순서대로 3개씩 공유하고 있다. 따라서 이들은 음소 공통음형 [ㅁㅓㄱ]을 갖고 있는 것이다. 이를 가리켜 '음소의 공통음형'(이하 '음소 공통음형'이라함)이라고 말하고자 한다. 이것은 공통음소를 중심으로 축약시킨 결과와 같아진 것이다. 나머지 하나인 [멍느-]를 음소 공통음형처럼 나열시켜서 표시하면 [ㅁㅓㅇㄴ]와 같아진다. 그러므로 4가지 실음어간 [먹-, 머거-, 머그-,멍느-]는 2가지 음소 공통음형인 [ㅁㅓㄱ, ㅁㅓㅇㄴ]로 축약된다. 이를 표로 정리해 보면 다음과 같다. 체언의 경우에도 맥락은 같은데, {삶이}라는 낱말의 예를 여기에 함께 예시한다.
아래 표 12는 실음어간과 음소 공통음형을 비교한 것이다.
구분 활용형 예시 실음어간 음소 공통음형 비고
용언 표기형 {먹어요, 먹는다, 먹고} [먹-]

[먹-]

[ㅁㅓㄱ]

발음형
(음성언어)
[먹꼬, 먹찌, 먹따가]
[머거, 머거서, 머거라] [머거-]
[머그니, 머그면, 머근] [머그-]
[멍는다,멍느냐,멍느라고] [멍느-] [ㅁㅓㅇㄴ]
체언 표기형 {삶이, 삶은, 삶도, 삶만} {삶-}

[ㅅㅏㄹㅁ]

발음형
(음성언어)
[살미, 살미니, 살미요] [살미-]
[살믄, 살므로, 살믈] [살므-]
[살메, 살메는, 살메도] [살메-]
[삼도, 삼만] [삼-] [ㅅㅏㅁ]
상기 표 12에 따르면, 실음어간에 비하여 음소 공통음형은 형태가 단순하다. 따라서, 각각 특징이 있으므로 필요에 따라서 다르게 사용될 수 있을 것이다. 입력되는 음성을 인식하고 분석하여 자료를 처리하는 능력과 필요에 따라서 음소 공통음형을 선택적으로 사용할 수 있을 것이다.
그러나, 음소 공통음형은 실음어간에 비하여 자음이나 모음이 하나 이상이 줄어드는 셈이 되는 경우가 생겨서 검색의 정확도가 떨어지는 단점이 생긴다. 예를 들면, 실음어간 [머거-]를 대리한 음소 공통음형 [ ㅁㅓㄱ]에서는 모음 [ㅓ]가 생략된 것이다. 그러므로 검색의 정확도가 낮아진다고 보아야 할 것이다. 따라서 복잡하더라도 정확도를 높이려면 실음어간을 사용하는 것이 필요하다고 볼 수 있다.
다음에는 낱말의 모든 활용형으로 검색하는 사전에서 실음어간이 사용되는 양상을 설명하고자 한다. 이것은 하기 표 13의 표제어 설정 구조의 예시와 도 8의 표제어 부분 모형의 예시를 통하여 설명하고자 한다.
모든 활용형으로 검색하는 한국어사전에서 실음어간의 구체적인 사용은 주로 표제어 부분의 구성에서 이루어지는데, {맑아}와 {값이}와 같은 낱말을 예로 들어 보면, 표제어 부분의 구조는 하기 표 13의 실음어간과 두 가지 표제어 항목과 같다. 여기에서 입력어(질의어)는 사용자가 임의로 정하게 되는 낱말의 활용형이므로, 입력어를 대신하여 간단한 활용형을 예시하였다. 질의어가 어떠한 활용형이더라도 이에 대한 실음어간은 항상 일정하다. 그리고 '부속형의 표제어'와 '대표형의 표제어'는 실음어간 설정의 근거가 될 활용형을 제시해 놓은 것이다.
아래 표 13은 표제어 부분의 실음어간과 표제어 설정 구조를 예시한 것이다.
구분 입력어 예시 (용형의 예) 실음어간 부속 표제어 대표 표제어
용언 {맑아, 맑아요, 맑아서} {맑-}
(표기형 어간)
{맑-아요} {맑아}
{맑으니, 맑은, 맑으면}
{맑다, 맑지, 맑다가}
[말가요, 말간데, 말가면] [말가-] [말가-요]
[말그니, 말근, 말글] [말그-] [말그-니]
[말꼬, 말꼬서, 말꼬는] [말-] [말^꼬]
[막따, 막따가, 막찌] [막-] [막^따]
체언 {값이, 값이요, 값이면} {값-}
(표기형 명사)
{값-이요} {값이}
{값도, 값진}
{값만}
[갑씨, 갑쓸]
[갑쎄, 갑쓴]
[갑씨, 갑쓸]
[갑쎄, 갑쓴]
{값-이}
[갑또] [갑-] [갑^또]
[감만] [감-] [감^만]
상기 표 13에 따르면, { }표는 표기형을 나타내고, [ ]표는 발음형을 나타내는 데에 사용하였다. 그리고 '-'표는 어간이나 체언의 형태가 확실하게 구분될 때 사용한 것이고, '^'표는 발음 현상에서 어간이나 체언의 중심 부분만을 표시해 놓은 것이다. 검색의 작업 과정에서 이 표가 있는 앞의 형태를 찾으라는 작업 명령을 수행할 수 있다.
어떤 질의어가 입력되면, 실음어간을 분리한 다음에, 표제어 부분을 검색하여 찾아가게 되고, 검색된 표제어 부분의 뜻풀이 정보를 출력하게 되는 것이다.
낱말의 활용형에 따라서 실음어간이 8가지가 되기도 하지만, 적은 것은 4가지 정도가 되기도 한다. 용량의 부담 문제보다도 어간형태를 쉽게 잘 분리하여 검색의 정확도를 높일 수 있게 하는 것이 중요한 일이다.
다음에는 도 8에 예시한 표제어 부분 모형을 가지고 좀더 구체적으로 설명하고자 한다. 도 8은 본 발명의 일실시예에 따른 모든 활용형으로 찾는 사전의 표제어 부분 모형도이다. 도 8에 도시한 바와 같이, 표제어 부분은 대표형 표제어(801)와 부속형 표제어(802, 804, 805, 806 등)로 크게 두 부분으로 구성되었다. 또한 표기형(801, 802, 803)과 발음-음성형(804, 805, 806 등)의 구조로 구분되어 있는 것이다. 그리고 그 다음에 실음어간이 << >>표의 안에 '-'표와 함께 설정되어 있다(808). 맑다(809)는 기존의 기본형으로서 뜻풀이(810)에서 사용한 것인데, 관습적으로 기본형에 대한 뜻풀이에 익숙해져 있기 때문에 일단 기본형의 뜻풀이 방식을 사용한 것이다.
체언의 경우에 {값이}(811)는 표기형으로서 대표형 표제어로 제시되었고, [갑시](812)에서부터 발음형이 제시되었다. 그리고 실음어간 부분(813)에는 표기형의 기본형 {값}과 발음형의 활용형들이 설정되어 있다. 따라서, 사용자가 {값}이라는 낱말로 활용되는 어떠한 낱말을 음성언어로 입력하더라도 표제어 부분에 설정된 공통음형을 찾아서 검색이 될 수 있게 되는 것이다.
부사어의 경우에도 활용형으로 검색이 되는 것은 마찬가지이다. {빨리}(814)는 부사어의 표제어 부분을 간단히 예시한 것이다. [빨리 빨리](815)와 같이 반복되는 형태도 많이 있는데, 이런 경우도 [빨리]가 공통음형으로 설정되는 것이다.
이와 같은 표제어 부분의 구성은 검색의 효율성을 높이기 위하여 여러 가지로 바꾸어 사용할 수 있을 것이다.
다음에는 자음과 모음의 공통음형을 사용하여 실음어간보다 공통음형을 좀더 줄이는 방법 중에서 '음소 공통음형'을 사용하는 방법을 간단히 설명하고자 한다. 형태를 분석하고 분리하는 작업 수행에서 자음과 모음을 좀더 분석적으로 분리하여 음소단위로 사용하면, 표제어 부분에 설정하는 부속형의 분량도 줄일 수 있다는 것이다.
이것은 상기 표 12에 나타낸 '음소 공통음형'의 개념을 가지고 상기 표 13의 실음어간 형태 중에서 일부를 공통음소로 묶으면 아래 표 14와 같이 좀더 단순한 '음소 공통음형'을 만들어 사용할 수 있게 된다.
아래 표 14는 표제어 부분의 실음어간과 음소 공통음형 구조를 비교한 것이다.
구분 입력어 예시 (활용형의 예) 실음어간 음소 공통음형 부속형의 표제어 대표형의 표제어
용언 {맑아, 맑아요, 맑아서} {맑-} {맑-} {맑-아요} {맑아}
{맑으니,맑은, 맑으면}
{맑다, 맑지, 맑다가}
[말가요, 말간데,말가면]
[말그니,말근,말글]
[말가-]
[말그-]
[말ㄱ-] [말가-요]
[말그-니]
[말꼬, 말꼬서, 말꼬는] [말-] [말-] {말^꼬}
[막따, 막따가, 막찌] [막-] [막-] [막^따]
체언 {값이, 값이요,값이면} {값-} {값-} {값-이} {값이}
{값도, 값진}
[값만]
[갑시, 갑슬
[갑세 갑슨]
[갑시,갑슬, 갑세, 갑슨] {갑ㅅ} [갑시,갑슬,
갑세,갑슨]
[갑또] [갑-] [갑-] [갑^또]
[감만] [감-] [감-] [감^만]
상기 표 14에 따르면, 용언과 체언의 활용형을 핵심적인 공통형태로 분리하였다. 따라서 공통형태와 부속형 설정 형태가 좀더 단순하게 되었다.
특히, 체언의 경우 조사 {-이/가, -을/를, -은/는, -에} 등이 공통형태 {갑ㅅ}으로 설정되므로 그 수가 많이 줄어들게 되는 것이다. 이것을 다시 표제어 부분에 제시해 보면, <<{값},[갑시,갑슬,갑세,갑슨,갑-,감-]>>(813)과 같이 7개 항이던 실음어간 정보가 <<{값},[갑ㅅ,갑-,갑-]>>(816)과 같이 4개 항으로 축약된 것이다. 이와 같이 음소 공통음형을 사용하면 검색의 공통음형 항목 수를 줄이는 효과를 볼 수 있게 된다. 그러나 검색이 정확도는 다소 낮아질 수도 있는 단점이 있다.
도 8의 표제어 부분 구성은 전자사전이 아닌 종이사전의 표제어 구성에서도 사용할 수 있다. ,즉 종이사전에서도 표제어 부분을 폭넓게 구성함으로써 검색의 효율성을 높일 수 있다는 것이다. 우선 표제어 검색에서 받침소리의 정보를 정확히 주기 위하여 연음되는 활용형으로 대표형 표제어를 설정한다. 그 다음에 실음어간의 근거가 될 수 있는 활용형태를 부속형 표제어로 삼아서 표기형과 발음형으로 설정하고, 이어서 실음어간을 설정하면 되는 것이다.
도8의 표제어 부분 구성을 사용하여 낱말의 모든 활용형으로 검색하는 전자사전에서는 입력어의 실음어간이나 음소 공통음형을 분리하여, 도8과 같이 표제어 부분에 설정된 공통음형을 찾아가는 검색과정을 거치게 되는 것이다. 따라서 입력어의 처리에는 문자언어나 음성언어를 모두 담당하는 장치가 필요하다.
이러한 전자사전의 구성을 도 9 내지 도 11을 참조로 자세히 설명한다.
도 9는 본 발명의 일실시예에 따른 모든 활용형으로 찾는 전자사전의 일 실시를 예시한 구성도이다. 도 10은 본 발명의 일실시예에 따른 전자사전의 실음어간 분석기의 구성과 작업 모형도이다. 도 11은 본 발명의 일실시예에 따른 전자사전의 출력어 처리부의 작업 모형도이다.
도 9에 도시한 바와 같이, 입력어를 마이크나 키보드 등을 통하여 음성이나 문자로 입력하는 입력부(901, 902)와, 음성으로 입력되는 질의어를 받아쓰고 문자로 입력된 질의어는 그대로 받아서 질의어를 정리하는 입력어 처리부(903)와, 실음어간이나 공통음형, 기본어간, 품사 등의 표제어 부분 정보와 뜻풀이 등의 낱말 관련 제반 자료의 데이터가 저장되는 데이터 메모리부(904)와, 입력어 처리부에서 정리된 질의어를 받아서 실음어간 분석을 실행하여 질의어의 실음어간을 확정한 다음에 뜻풀이나 발음 및 표기 등의 제반 목표 정보를 찾아내는 데이터 검색부(905)와, 검색된 정보를 문자나 음성으로 정리하여 출력하는 출력어 처리부(906)와, 각 구성의 동작을 제어하여 검색된 자료를 출력되게 하는 작동 제어부(907)와, 입력 자료의 디스플레이를 위한 디스플레이부(908)와, 자료 정보를 음성이나 문자로 출력하는 출력부(909, 910)와, 자료 정보를 외부 기기와 송수신할 수 있도록 유무선의 송수신 장치를 한 송수신부(911) 등으로 구성된다.
이러한 구성을 갖는 전자사전은 데이터를 외부에서 받아서 사용할 수도 있고, 자체 데이터를 사용할 수도 있다. 따라서 각종 전자기기에서 크고 작은 한국어 전자사전을 실시할 수 있는 것이다. 따라서 낱말의 활용형을 검색어로 응용하는 방법은 전자사전에서도 유용하게 사용될 수 있다.
도 9를 문자로만 검색하는 전자사전에 적용할 경우에는 음성입력(902)과 음성출력(910) 부분을 제외하면 된다. 도 9의 설명에서는 편의상 문자와 음성으로 입력하는 사전의 구성을 제시한 것이다.
문자나 음성을 통하여 낱말의 모든 활용형으로 검색되게 하려면, 입력어 처리부(903)에서는 음성으로 입력된 질의어에 대하여 발음형 문자로 받아쓰기를 해야 한다. 음성처리 기술의 발달로 음성-문자의 변환이나 문자-음성의 변환은 정확도를 높일 수 있다. 음성언어를 맞춤법에 맞추는 표기법으로 받아쓰기를 하는 것은 기술적으로 어려워서 오류가 많이 생기므로 아직은 사용하지 않는 것이 좋다.
입력어 처리부(903)에서는 첫째로 표기형의 문자로 입력된 표기형태의 질의어는 그대로 데이터 검색부(905)에 넘겨주면 되고, 둘째로 음성언어로 입력된 질의어는 발음형의 문자로 받아쓰기를 한 다음에 데이터 검색부(905)에 넘겨주게 된다.
데이터 검색부(905)에서는 표기형의 문자나 음성 언어의 문자로 질의어를 받아서 실음어간을 분석하고 분리하는 작업을 실행하게 되는 것이다. 그 작업 과정은 아래 표 15와 같다.
아래 표 15는 실음어간 형태분석 작업 과정을 예시한 것이다.
실음어간 가설형 설정 구조 질의어 [머그면]의 가설형 예시 표제어 부분 의 실음어간 데이터 검색 결과 작업 과정
가설형-1:질의어 끝음절의 폐음절형(받침있는 형태) [머그면] 없음 가설형-1에서 끝음절의 받침을 삭제하여 가설형-2를 설정함
가설형-2: 질의어 끝음절의 개음절형(받침 없는 형태-받침 삭제 형태) [머그며] 없음 가설형-2에서 끝음절을 삭제하여 가설형-3을 설정함
가설형-3: 질의어의 끝에서 뚤째 음절이 폐음절형일 경우
[ / ] 없는 형태임 없음 가설형-3에서 끝음절의 받침이 삭제된 형태
가설형-4: 질의어 끝음절을 삭제된 형태 [머그] 표제어 {먹어}항에서 실음어간을 찾음 실음어간이 있는 표제어 항목의 의미 정보 처리
(검색 작업종료)
여기 예시된 것처럼 가설형-4에서 실음어간을 찾지 못하였을 경우에는 계속해서 가설형-5이하로 끝음절을 삭제해 내려가면서 실음어간의 형태를 찾아가는 방식임
상기 표 15에 따르면, 실음어간 가설형이 있다. 질의어의 실음어간을 모르는 상태이므로, 질의어의 전체 형태부터 실음어간이라는 가설형태를 세워나가는 것이다. 그래서 가설형-1은 질의어 전체 형태로 설정하였다. 그런데 한국어 음절은 개음절(받음이 없는 음절)과 폐음절(받침이 있는 음절)이 있으므로, 가설형-2는 첫음절에서 폐음절이 있는 경우에만 설정된다는 것이다. 이런 방식으로 음절을 단위로 하여 실음어간을 가설형으로 설정해 나가는 것이다.
편의상 가설형은 폐음절은 1, 3, 5형 등으로 짝수로 개음절은 2, 4, 6형 등 홀수로 고정시켜 놓았다. 예시한 질의어가 [머그면-]으로 3음절이고 폐음절로 되어 있어서, 가설형-1은 폐음절로 [머그면]으로 설정되었다. 질의어의 끝음절에 받침이 없다면 가설형-2부터 시작이 될 것이다.
가설형-4인 [머그]로 데이터 메모리부(903)에 내장된 표제어 부분의 실음어간 형태 정보를 검색한 결과에서 실음어간으로 확인된 것이다. 따라서 질의어 [머그면-]의 실음어간은 [머그-]로 확인되면서, 이 검색형이 찾은 표제어 {먹어} 항의 뜻풀이 정보를 받을 수 있게 되는 것이다.
이와 같이 질의어의 표기형이나 발음형을 실음어간의 가설형으로 만들면서 분석하여 실음어간을 찾아나가는 과정을 갖는 것을 실음어간 형태분석기(이하 '실음어간분석기'라 함)라고 말하고자 한다. 실음어간분석기의 작업과정을 도면으로 예시하면 도 10의 '실음어간 작업모형'과 같다. 도 10은 데이타 검색부(905)의 작업 과정 중에서 실음어간분석기의 작업 모형을 제시한 것이다. 여기에서 실음어간의 가설형-1(1001)은 질의어에서 음절의 형태를 삭제해 나가는 구조로 구성되어 있다. 이것은 쉽게 말하면, 낱말 활용형에서 어미나 조사로 사용된 음절의 형태를 삭제해 나감으로써 실음어간의 형태만 남겨 놓는 방식으로 실음어간을 분석하는 것이라고 말할 수 있다. 질의어로 예를 든 것은 [말그면](1003)이다. 전체형태인 [말그면]을 실음어간의 가설형-1로 설정하고 이것을 데이터 메모리부(904)에서 찾아 확인(1005)해 본 결과, 이러한 실음어간은 없어서 데이터 없음(1006)으로 표시하면서 반환(1007)조치 한다는 것이다. 다음에 가설형-2와 가설형-3도 같은 방식으로 확인하여 반환되고, 가설형-4인 [말그]는 확인해 본 결과 데이터를 찾음으로써 실음어간으로 확정(1008)된 것이다. 질의어의 길이에 따라서 실음어간의 가설형태가 가설형-5(1002) 이상으로 더 늘어날 수도 있다.
질의어 [말그면](1003)의 경우에는 이와 같이 가설형-4인 [말그]가 '데이터 찾음'으로 확인되고 실음어간으로 확정(1008)됨으로써 실음어간의 형태분석이 성립되는 것이다. 이 작업 과정은 데이타 검색부(905)에서 담당한 것인데, 실음어간 확정(1008)의 과정까지만 따로 놓고 보면 이것이 곧 실음어간 분석기가 되는 것이다. 이것이 실음어간 분석기라는 것을 분명하게 보여주려면, 실음어간 확정 단계에서 확정된 실음어간 [말그](1008)를 눈으로 볼 수 있도록 표시해 주는 장치를 해놓으면 되는 것이다. 즉 찾아낸 실음어간을 볼 수 있게 장치를 해 놓으면 그것이 곧 사전을 겸한 실음어간 분석기가 된다는 것이다. 확정된 실음어간을 가시적으로 볼 수 있게 표시해 주지 않더라도, 실음어간의 형태분석기의 작업과정은 실제로 데이터 검색부(905)의 앞 부분에서 담당하는 중요한 기능이라고 할 수 있다.
그 다음에 데이타 검색부(905)에서 하는 일은 확정된 실음어간(1008)이 포함된 표제어 항목 검색을 실행(1010)하여 표제어에 대한 정보를 제공하는 것이다.
출력어 처리부(906)에서는 데이타 검색부(905)에서 실음어간으로 검색한 표제어 항목의 낱말 정보를 받아서 질의어의 입력 당시 상태에 맞춘 출력어로 처리하는 작업을 수행한다. 질의어의 입력 당시 상태라는 것은 질의어가 입력될 때 문자나 음성으로 입력된 상태를 구별하는 것이다. 입력 당시 상태를 문자와 음성으로 구분하여 출력어도 이에 맞추어 주는 것이다. 음성언어로 입력된 것은 다시 음성언어로 읽어 주는 것이고, 문자로 입력된 것은 문자로 정보를 준다. 아니면 사용자가 두 가지 중에서 선택할 수 있게 할 수도 있다.
그런데, 출력어 처리부(906)에서는 사용자에게 제공할 정보의 양적인 문제를 결정해야 한다. 도 11에는 표제어 항목 전체 정보 표시형(1101)과 대표 표제어와 부속 표제어 표시형(1102), 그리고 간단한 형태로서 기본형과 뜻풀이 표시형(1103) 등으로 예시하였다. 이것도 사용자가 선택적으로 볼 수 있게 할 수 있고, 문자와 음성으로도 선택적으로 사용되도록 장치를 하면 좋을 것이다.
한편 음소 공통음형을 분석할 때도 실음어간분석의 방식과 과정을 그대로 적용하면 된다. 다만 이것은 가설형을 만들 때 음절을 중심으로 설정하지 않고 음소 즉 자음과 모음을 계속 삭제해 나가면 되는 것인데, 그러면 가설형의 수가 실음어간의 가설형보다 많아지는데, 이것이 '음소 공통음형 분석기'가 되는 것이다. 실음어간분석기의 구성과 과정은 같으므로 별도 설명은 생략하기로 한다. 그런데, 음소 공통음형은 자음과 모음이 어두에 집결되는 경향이 많아서 실음어간과 대조적으로 질의어의 첫 음절 형태부터 자음과 모음을 하나씩 첨가해 들어가는 방법을 사용하는 것이 더 좋을 수도 있다. 첨가해 들어가면서 가설형을 만들어 나가서 질의어의 음절 끝까지 가설형을 다 만들어서 검색을 한 다음에 찾아진 가설형의 실음어간들 중에서 가장 긴 것을 질의어의 실음어간으로 확정하면 되는 것이다.
이상과 같이, 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.

Claims (6)

  1. 한국어사전에 있어서,
    입력어를 마이크나 키보드 등을 통하여 음성이나 문자로 입력하는 입력부(901, 902)와, 음성으로 입력되는 질의어를 받아쓰고 문자로 입력된 질의어는 그대로 받아서 질의어를 정리하는 입력어 처리부(903)와, 실음어간이나 공통음형, 기본어간, 품사 등의 표제어 부분 정보와 뜻풀이 등의 낱말 관련 제반 자료의 데이터가 저장되는 데이터 메모리부(904)와, 입력어 처리부에서 정리된 질의어를 받아서 실음어간 분석을 실행하여 질의어의 실음어간을 확정한 다음에 뜻풀이나 발음 및 표기 등의 제반 목표 정보를 찾아내는 데이터 검색부(905)와, 검색된 정보를 문자나 음성으로 정리하여 출력하는 출력어 처리부(906)와, 각 구성의 동작을 제어하여 검색된 자료를 출력되게 하는 작동 제어부(907)와, 입력 자료의 디스플레이를 위한 디스플레이부(908)와, 자료 정보를 음성이나 문자로 출력하는 출력부(909, 910)와, 자료 정보를 외부 기기와 송수신할 수 있도록 유무선의 송수신 장치를 한 송수신부(911)로 구성되는 것을 특징으로 하는 낱말 활용형으로 검색하는 한국어사전.
  2. 제 1 항에 있어서,
    상기 데이터 검색부(905)에서 실음어간 분석을 실행하여 질의어의 실음어간을 확정한 다음에 뜻풀이나 발음 및 표기 등의 제반 목표 정보를 찾아내는 작업을 하는데 있어서, 질의어의 실음어간 가설형 구성 구조(1001)와, 실음어간을 검색하는 데이터 처리과정(1004)의 구성과, 실음어간 확정(1008) 구조로 구성되는 실음어간 분석기를 포함하는 것을 특징으로 하는 낱말 활용형으로 검색하는 한국어사전.
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
KR1020100026730A 2010-03-25 2010-03-25 한국어사전 KR101139469B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100026730A KR101139469B1 (ko) 2010-03-25 2010-03-25 한국어사전

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100026730A KR101139469B1 (ko) 2010-03-25 2010-03-25 한국어사전

Publications (2)

Publication Number Publication Date
KR20110107548A KR20110107548A (ko) 2011-10-04
KR101139469B1 true KR101139469B1 (ko) 2012-04-30

Family

ID=45025672

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100026730A KR101139469B1 (ko) 2010-03-25 2010-03-25 한국어사전

Country Status (1)

Country Link
KR (1) KR101139469B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190118306A (ko) 2018-04-10 2019-10-18 정진철 한국어 3000음절 입체학습기 및 이를 이용한 학습방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102078626B1 (ko) * 2019-08-16 2020-02-18 정현욱 한글 학습 방법 및 그 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08235187A (ja) * 1995-02-24 1996-09-13 Fujitsu Ltd 辞書検索システム
KR100401466B1 (ko) 2000-09-22 2003-10-11 이효숙 자연어 검색 시스템을 위한 한글 스태머와 그 스태밍 방법
KR20040051350A (ko) * 2002-12-12 2004-06-18 한국전자통신연구원 다중 발음사전을 이용한 대화체 연속 음성인식 시스템 및방법
KR100486733B1 (ko) 2003-02-24 2005-05-03 삼성전자주식회사 음소 결합정보를 이용한 연속 음성인식방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08235187A (ja) * 1995-02-24 1996-09-13 Fujitsu Ltd 辞書検索システム
KR100401466B1 (ko) 2000-09-22 2003-10-11 이효숙 자연어 검색 시스템을 위한 한글 스태머와 그 스태밍 방법
KR20040051350A (ko) * 2002-12-12 2004-06-18 한국전자통신연구원 다중 발음사전을 이용한 대화체 연속 음성인식 시스템 및방법
KR100486733B1 (ko) 2003-02-24 2005-05-03 삼성전자주식회사 음소 결합정보를 이용한 연속 음성인식방법 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190118306A (ko) 2018-04-10 2019-10-18 정진철 한국어 3000음절 입체학습기 및 이를 이용한 학습방법

Also Published As

Publication number Publication date
KR20110107548A (ko) 2011-10-04

Similar Documents

Publication Publication Date Title
Kortmann English linguistics: essentials
Winder et al. Introduction to Modern Arabic
Gussenhoven et al. Understanding phonology
Bieswanger et al. Introduction to English linguistics
Kuiper et al. An introduction to English language
Mair English linguistics
Lepschy History of linguistics Volume II: Classical and medieval linguistics
Ryding Arabic: A linguistic introduction
Coffin et al. A reference grammar of Modern Hebrew
Romaine et al. The Cambridge history of the English language
Bynon Historical linguistics
Kubozono Handbook of Japanese phonetics and phonology
Nkengasong A grammar of Cameroonian Pidgin
Kijak How stressful is L2 stress? A cross-linguistic study of L2 perception and production of metrical systems
Van Pelt Basics of Biblical Aramaic: complete grammar, lexicon, and annotated text
Kortmann English Linguistics
Kharbe English language and literary criticism
Clivio et al. The sounds, forms, and uses of Italian: An introduction to Italian linguistics
Ashrafova Phonetic and lexical features of words borrowed from French into English
Moore A study of Hindi intonation
Georgiou An Introduction to Issues in General Linguistics
Riddle Complexity in isolating languages: Lexical elaboration versus grammatical economy
Bialek A textbook in Classical Tibetan
KR101139469B1 (ko) 한국어사전
Akindele Duration as a determining factor in educated Edo English rhythm description

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee