KR20230155836A - 난발음 표기 방법 - Google Patents

난발음 표기 방법 Download PDF

Info

Publication number
KR20230155836A
KR20230155836A KR1020220055555A KR20220055555A KR20230155836A KR 20230155836 A KR20230155836 A KR 20230155836A KR 1020220055555 A KR1020220055555 A KR 1020220055555A KR 20220055555 A KR20220055555 A KR 20220055555A KR 20230155836 A KR20230155836 A KR 20230155836A
Authority
KR
South Korea
Prior art keywords
pronunciation
language
alphabet
notation
notating
Prior art date
Application number
KR1020220055555A
Other languages
English (en)
Inventor
정원호
Original Assignee
정원호
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정원호 filed Critical 정원호
Priority to KR1020220055555A priority Critical patent/KR20230155836A/ko
Publication of KR20230155836A publication Critical patent/KR20230155836A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/111Mathematical or scientific formatting; Subscripts; Superscripts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

난발음 표기 방법이 개시된다. 이 방법은 언어를 입력받는 단계, 및 입력 언어를 타 언어의 자모에 기반해 발음 표기하되 입력 언어에 타 언어로 발음 표기가 어려운 난발음이 존재할 경우 해당 난발음에 대해서는 난발음 표기 체계를 이용해 발음 표기하는 단계를 포함한다.

Description

난발음 표기 방법{Phonetic transcription system}
본 발명은 발음 표기에 관한 것으로, 특히 외국어를 한글 기반으로 발음 표기하거나 한국어를 알파벳 기반으로 발음 표기하는 것에 관한 것이다.
외국어의 발음을 모국어를 이용해 표기하거나 세계 공용 문자인 알파벳을 이용해 표기하면 학습자들의 외국어 학습에 도움을 줄 수 있다. 하지만 일부의 경우 기존의 표기 방식으로는 정확한 발음을 표기할 수가 없다는 한계가 있다. 따라서, 기존 방식으로는 그 발음을 정확히 표기하기가 어려웠던 난발음에 대한 새로운 표기 보완 방법이 요구되고 있다.
국내공개특허공보 제10-2009-0055835호 (2009년 6월 3일 공개)
본 발명은 한글로 표현하기 어려운 영어나 중국어 등의 외국어를 원어 발음 그대로 표현이 가능하도록 한글 발음 표기를 보완할 수 있는 방안을 제공함을 목적으로 한다.
또한, 본 발명은 알파벳으로 표현하기 어려운 한국어를 원어 발음 그대로 표현이 가능하도록 알파벳 발음 표기를 보완할 수 있는 방안을 제공함을 목적으로 한다.
일 양상에 따른 난발음 표기 방법은 언어를 입력받는 단계, 및 입력 언어를 타 언어의 자모에 기반해 발음 표기하되 입력 언어에 타 언어로 발음 표기가 어려운 난발음이 존재할 경우 해당 난발음에 대해서는 난발음 표기 체계를 이용해 발음 표기하는 단계를 포함할 수 있다.
발음 표기 단계는 입력 언어가 외국어일 경우 그 입력 언어의 알파벳 표기 발음을 한글 자모에 기반해 발음 표기하되,‘f, r, v, z, θ, ð, sh, zh, ch’중에서 난발음으로 지정된 적어도 일부에 대해서는 난발음 표기 체계에 속한 한글 보완 표시기호 체계를 이용해 발음 표기할 수 있다.
또한, 발음 표기 단계는 입력 언어가 한국어일 경우 알파벳에 기반해 발음 표기하되,‘으, 외, ㄹ, 어, 애’중에서 난발음으로 지정된 적어도 일부에 대해서는 난발음 표기 체계에 속한 알파벳 보완 표시기호 체계를 이용해 발음 표기할 수 있다.
본 발명은 한글로 표현하기 어려운 영어나 중국어 등의 외국어에 대한 한글 발음 표기를 보완함으로써, 그 보완된 한글 발음 표기를 이용하여 외국어를 그 원어 발음 그대로 표현할 수 있게 한다.
또한, 본 발명은 알파벳으로 표현하기 어려운 한국어에 대한 알파벳 발음 표기를 보완함으로써, 그 보완된 알파벳 발음 표기를 이용하여 한국어를 그 원어 발음 그대로 표현할 수 있게 한다.
도 1 및 도 2는 일 실시예에 따른 난발음 표기 방법 흐름도이다.
도 3은 일 실시예에 따른 한글 보완 표시기호 체계를 나타낸다.
도 4는 한글 보완 표시기호 체계를 이용한 발음 표기를 예시한 도면이다.
도 5는 일 실시예에 따른 알파벳 보완 표시기호 체계를 나타낸다.
도 6 및 도 7은 알파벳 보완 표시기호 체계를 이용한 발음 표기를 예시한 도면이다.
도 8은 난발음 표기를 위한 컴퓨팅 디바이스 구성 예시도이다.
전술한, 그리고 추가적인 본 발명의 양상들은 첨부된 도면을 참조하여 설명되는 바람직한 실시예들을 통하여 더욱 명백해질 것이다. 이하에서는 본 발명을 이러한 실시예를 통해 통상의 기술자가 용이하게 이해하고 재현할 수 있도록 상세히 설명하기로 한다.
도 1 및 도 2는 일 실시예에 따른 난발음 표기 방법 흐름도이다. 도 1과 도 2를 설명하기에 앞서, 난발음 표기 방법은 개인용 컴퓨터나 모바일 단말 등에서 프로세서에 의해 실행되어 사용자에게 서비스 제공될 수도 있고 서버 시스템의 프로세서에 의해 실행되어 사용자에게 온라인 서비스로 제공될 수도 있다.
프로세서는 영어나 한국어 등의 언어를 입력받는다(S100). S100을 위해, 사용자는 한글 기반으로 어떻게 발음하는지 발음 표기를 확인하고자 하는 외국어를 입력할 수도 있고, 알파벳 기반으로 어떻게 발음하는지 발음 표기를 확인하고자 하는 한국어를 입력할 수도 있다. 이때, 사용자 입력은 음성 입력이나 텍스트 입력 모두 가능할 수 있으며, 음성 입력일 경우에는 STT(speech to text) 기능을 통해 텍스트로 변환하는 과정이 추가될 수 있다.
다음으로, 프로세서는 입력 언어를 타 언어로 발음 표기하는데, 입력 언어에 타 언어로 발음 표기가 어려운 발음(난발음)이 존재할 경우 그 난발음에 대해서는 난발음 표기 체계를 이용해 발음 표기하여 사용자에게 화면 표시한다(S200). 즉, 새로운 난발음 표기 체계를 통해 발음 표기가 이루어지도록 한 것으로, 학습자들로 하여금 난발음에 대해 좀 더 정확한 발음을 익힐 수 있도록 한 것이다.
한편, 난발음 표기 체계에는 한글 보완 표시기호 체계와 알파벳 보완 표시기호 체계 중에서 적어도 하나가 포함될 수 있다. 한글 보완 표시기호 체계는 외국어 발음을 한글 자모를 이용하여 표기할 때 난발음으로 지정된 발음을 표기할 수 있도록 하기 위한 것이며, 알파벳 보완 표시기호 체계는 한국어 발음을 알파벳을 이용하여 표기할 때 난발음으로 지정된 발음을 표기할 수 있도록 하기 위한 것이다.
S200에서, 프로세서는 입력 언어가 외국어일 경우 그 입력 언어의 알파벳 표기 발음을 한글 자모에 기반해 발음 표기하는데, 미리 지정된 난발음에 대해서는 한글 보완 표시기호 체계를 이용해 발음 표기한다(S210). 여기서, 난발음에는‘f, r, v, z, θ, ð, sh, zh, ch’중에서 적어도 일부가 포함되며, 이 중 sh, zh, ch는 중국어 권설음을 나타낸 것이다. 이들 난발음에 대한 한글 보완 표시기호 체계는 도 3에 예시되어 있는데, f는 , r은 , v는 , z는 , θ는 , ð는 , sh는 , zh는 , ch는 이다. 참고로, 은 순피읖, 은 순리을, 은 순비읍, 은 찐지읒, 은 찐시옷, 은 순디귿이라 명해진다. 그리고 도 3을 이용한 발음 표기는 도 4에 예시되어 있다. 이들을 통해 확인되듯이, 한글로 표기하기 어려운 발음의 경우에는 한글 보완 표시기호 체계를 이용하여 표기할 수 있게 된다.
S200에서, 프로세서는 입력 언어가 한국어나 중국어 등 비알파벳 언어일 경우 그 입력 언어의 표기 발음을 알파벳에 기반해 발음 표기하는데, 미리 지정된 난발음에 대해서는 알파벳 보완 표시기호 체계를 이용해 발음 표기한다(S220). 여기서, 난발음에는‘으, 외, ㄹ, 어, 애’중에서 적어도 일부가 포함되며, 이 중 sh, zh, ch는 중국어 권설음을 나타낸 것이다. 이들 난발음에 대한 알파벳 보완 표시기호 체계는 도 5에 예시되어 있는데, ‘으’는 , ‘외’는 , ‘ㄹ’은 , ‘어’는 , ‘애’는 , ‘sh’는 , ‘zh’는 ,‘ch’는 이다. 그리고 도 5를 이용한 발음 표기는 도 6과 도 7에 예시되어 있다. 이들을 통해 확인되듯이, 알파벳으로 표기하기 어려운 발음의 경우에는 알파벳 보완 표시기호 체계를 이용하여 표기할 수 있게 된다.
특히, 도 4에 따르면, “으”와 “외”발음을 알파벳으로 표기하기가 어려웠던 문제가 해소된다. 즉, 알파벳 자음 및/또는 모음 중 “o”아래에 언더바(under bar)를 표기함으로써 한글 모음 “ㅡ”, 즉 “으”발음을 정확히 표기할 수 있게 되며, “O”문자에 슬래시(/)를 중첩시켜 정의된 기호로 “외”발음을 정확히 표기할 수 있게 된다.
도 8은 난발음 표기를 위한 컴퓨팅 디바이스 구성 예시도이다. 도 8에 도시된 바와 같이, 컴퓨팅 디바이스는 제어부(100), 저장부(200), 사용자 입출력부(300), 및 통신부(400)를 포함할 수 있다. 제어부(100)는 CPU(central processing unit), GPU(graphical processing unit), 또는 이와 유사한 하나 이상의 프로세싱 코어를 구비한 마이크로 프로세서를 포함할 수 있다. 저장부(200)는 하나 이상의 휘발성 및 비휘발성 메모리를 포함할 수 있으며, 하드 디스크 드라이브, 플래시 메모리, 광디스크, 자기-광학 디스크, 범용 직렬 버스(USB) 드라이브 등 중에서 적어도 일부도 포함할 수 있다. 이 같은 저장부(200)에는 난발음 표기를 위한 프로그램 및 데이터가 저장될 수 있다.
사용자 입출력부(300)는 사용자가 입력을 제공하고 출력을 수신하며, 다른 컴퓨팅 디바이스들과 데이터를 주고받을 수 있게 하는 하나 이상의 입력 및/또는 출력 디바이스를 포함할 수 있다. 사용자 입출력부(300)는 마우스, 키패드 또는 키보드, 카메라, 광학식 스캐너, 네트워크 인터페이스, 모뎀, 기타 알려진 I/O 장치일 수 있으며, 이들의 조합을 포함할 수 있다. 사용자 입출력부(300)는 그래픽 엔진, 디스플레이, 하나 이상의 출력 드라이버(예를 들어, 디스플레이 드라이버), 하나 이상의 오디오 스피커 및 하나 이상의 오디오 드라이버 중에서 적어도 일부를 포함할 수 있다. 통신부(400)는 하나 이상의 다른 컴퓨팅 디바이스와의 네트워크 통신(예를 들어, 패킷 기반 통신)을 위한 하나 이상의 인터페이스를 제공할 수 있다. 예를 들어, 통신부(400)는 이더넷이나 다른 유선 기반 네트워크로 통신하기 위한 네트워크 인터페이스 제어기(NIC)나 네트워크 어댑터 또는 와이파이와 같이 무선 네트워크로 통신하기 위한 Wireless NIC나 무선 어댑터를 포함할 수 있다.
한편, 버스(Bus)는 컴퓨팅 디바이스의 구성들을 서로 연결하는 하드웨어, 소프트웨어 또는 이들 모두를 포함할 수 있다. 예를 들어, 버스는 AGP(Accelerated Graphics Port)나 다른 그래픽 버스, EISA(Enhanced Industry Standard Architecture) 버스, FSB(front-side bus), HT(hypertransport) 인터커넥트, ISA(Industry Standard Architecture) 버스, INFINIBAND 인터커넥트, LPC(low-pin-count) 버스, 메모리 버스, MAC(Micro Channel Architecture) 버스, PCI(Peripheral Component Interconnect) 버스, PCIe(PCI-Express) 버스, SATA(serial technology attachment) 버스, VL(VESA Local, VESA: Video Electronics Standard Association Local) 버스, 다른 적절한 버스 또는 그 조합을 포함할 수 있다. 이상의 도 8의 구성들은 예시적인 것으로, 컴퓨팅 디바이스는 도 8에 도시되어 있지 않은 다른 구성들도 포함할 수 있음은 물론이다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.

Claims (5)

  1. 발음 표기를 위한 언어를 입력받는 단계; 및
    입력 언어를 타 언어로 발음 표기하되, 타 언어로 발음 표기가 어려운 난발음이 존재할 경우 해당 난발음에 대해서는 난발음 표기 체계를 이용해 발음 표기하는 단계;
    를 포함하는 난발음 표기 방법.
  2. 제 1 항에 있어서,
    발음 표기 단계는 입력 언어가 외국어일 경우 그 입력 언어의 알파벳 표기 발음을 한글 자모에 기반해 발음 표기하되,‘f, r, v, z, θ, ð, sh, zh, ch’중에서 난발음으로 지정된 적어도 일부에 대해서는 난발음 표기 체계에 속한 한글 보완 표시기호 체계를 이용해 발음 표기하는 난발음 표기 방법.
  3. 제 2 항에 있어서,
    한글 보완 표시기호 체계에 따른 난발음 f는 , r은 , v는 , z는 , θ는 , ð는 , sh는 , zh는 , ch는 로 표기되는 난발음 표기 방법.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    발음 표기 단계는 입력 언어가 한국어일 경우 알파벳에 기반해 발음 표기하되,‘으, 외, ㄹ, 어, 애’중에서 난발음으로 지정된 적어도 일부에 대해서는 난발음 표기 체계에 속한 알파벳 보완 표시기호 체계를 이용해 발음 표기하는 난발음 표기 방법.
  5. 제 4 항에 있어서,
    알파벳 보완 표시기호 체계에 따른 난발음인 한글 모음‘ㅡ’는 알파벳 자음 및/또는 모음 중 “o” 하측에 언더바(under bar)로 표기되는 난발음 표기 방법.
KR1020220055555A 2022-05-04 2022-05-04 난발음 표기 방법 KR20230155836A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220055555A KR20230155836A (ko) 2022-05-04 2022-05-04 난발음 표기 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220055555A KR20230155836A (ko) 2022-05-04 2022-05-04 난발음 표기 방법

Publications (1)

Publication Number Publication Date
KR20230155836A true KR20230155836A (ko) 2023-11-13

Family

ID=88746826

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220055555A KR20230155836A (ko) 2022-05-04 2022-05-04 난발음 표기 방법

Country Status (1)

Country Link
KR (1) KR20230155836A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090055835A (ko) 2007-11-29 2009-06-03 정수현 한글로 표기하기 어려운 외국어 발음을 한글로 표기하는 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090055835A (ko) 2007-11-29 2009-06-03 정수현 한글로 표기하기 어려운 외국어 발음을 한글로 표기하는 방법

Similar Documents

Publication Publication Date Title
EP1251490A1 (en) Compact phonetic model for arabic languages recognition
RU2441287C2 (ru) Универсальные орфографические мнемосхемы
US10043519B2 (en) Generation of text from an audio speech signal
US11043213B2 (en) System and method for detection and correction of incorrectly pronounced words
JP2001296880A (ja) 固有名の複数のもっともらしい発音を生成する方法および装置
US10930274B2 (en) Personalized pronunciation hints based on user speech
US11694028B2 (en) Data generation apparatus and data generation method that generate recognition text from speech data
Abbas et al. Punjabi to ISO 15919 and Roman transliteration with phonetic rectification
KR20230155836A (ko) 난발음 표기 방법
US20220350973A1 (en) Apparatus and method for preprocessing text
US8438005B1 (en) Generating modified phonetic representations of indic words
Odinye Phonology of mandarin chinese: a comparison of Pinyin and IPA
KR20220030664A (ko) 리듬과 운율을 가진 언어에 대한 한글입력장치 및 그 입력방법
JP7165439B2 (ja) ソース言語の音声によって拡張言語の音声認識モデルをトレーニングする方法
KR20200062910A (ko) 개선된 프랑스어 발음 학습 제공 시스템
US11809831B2 (en) Symbol sequence converting apparatus and symbol sequence conversion method
Ganjavi et al. A transcription scheme for languages employing the arabic script motivated by speech processing applications
KR20220065483A (ko) 단일음성기호집합을 활용한 인공신경망 기반 다국어 발화 텍스트 음성합성 방법 및 장치
KR20220030662A (ko) 한국·중국·일본·베트남 등 한자문화권 언어들에 대한 한글입력장치 및 그 입력방법
Vochala The Specific Features of Chinese Characters and Some of the Problems Involved in Their Reform
KR20110031718A (ko) 발음 기호에 기초한 음차 표기 데이터 생성 시스템 및 방법