KR101604553B1 - 비교사 분할 및 병합에 의한 의사형태소 음성 인식 단위 생성 장치 및 방법 - Google Patents
비교사 분할 및 병합에 의한 의사형태소 음성 인식 단위 생성 장치 및 방법 Download PDFInfo
- Publication number
- KR101604553B1 KR101604553B1 KR1020140153857A KR20140153857A KR101604553B1 KR 101604553 B1 KR101604553 B1 KR 101604553B1 KR 1020140153857 A KR1020140153857 A KR 1020140153857A KR 20140153857 A KR20140153857 A KR 20140153857A KR 101604553 B1 KR101604553 B1 KR 101604553B1
- Authority
- KR
- South Korea
- Prior art keywords
- morpheme
- unit
- sub
- pseudo
- cost function
- Prior art date
Links
- 230000011218 segmentation Effects 0.000 title claims description 39
- 238000000034 method Methods 0.000 title claims description 35
- 238000004364 calculation method Methods 0.000 claims description 19
- 238000005315 distribution function Methods 0.000 claims 2
- 230000002708 enhancing effect Effects 0.000 claims 1
- 230000000052 comparative effect Effects 0.000 abstract description 7
- 150000001875 compounds Chemical class 0.000 abstract description 5
- 230000000694 effects Effects 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 48
- 230000008569 process Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000005192 partition Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
Abstract
본 발명에 의하면 비교사 분할 및 병합으로 구한 의사형태소 단위를 생성하며, 기존의 형태소 분석기로 해결하기 어려운 고유명사나 신조어, 외래어, 복합어와 같은 미등록어를 비교사 방법으로 분할함으로써, 어휘 외 단어율을 줄이고, 빈도가 높은 단어를 병합함으로써, 인식 성능을 향상시키는 효과가 있다.
Description
도 2는 일반적인 어절 단위 문장의 예제이다.
도 3은 본 발명의 일 실시예에 따른 위치정보가 추가된 어절 단위 문장의 예제이다.
도 4는 본 발명의 일 실시예에 따른 위치정보가 추가된 의사형태소 단위 문장의 예제이다.
도 5는 본 발명의 일 실시예에 따른 부형태소 분할 모델 예제이다.
도 6은 본 발명의 일 실시예에 따른 부형태소 단위 문장의 예제이다.
도 7은 본 발명의 일 실시예에 따른 부형태소 간 병합 모델의 예제이다.
도 8은 본 발명의 일 실시예에 따른 병합된 의사형태소 단위 문장의 예제이다.
도 9는 본 발명의 일 실시예에 따른 의사형태소 음성 인식 단위 생성 방법을 보여주는 흐름도이다.
도 10은 본 발명의 일 실시예에 따른 부형태소 분할 과정을 보여주는 흐름도이다.
120 형태소 분석기 101 위치정보 추가부
102 사후확률 계산부 103 분할 경계 탐색부
Claims (12)
- 의사형태소 음성 인식 단위를 생성하는 장치에 있어서,
입력된 어절 단위 말뭉치로부터 더 작은 부형태소 단위를 추출하기 위한 부형태소 분할부; 및
상기 부형태소 단위로부터 최대 빈도를 갖는 부형태소 쌍을 연결하여 병합된 의사형태소 단위를 생성하는 부형태소 병합부를 포함하되,
상기 부형태소 분할부는,
입력된 어절 단위 말뭉치에 의사형태소 단위의 어절 내 형태소의 위치를 고려한 위치정보를 추가하기 위한 위치정보 추가부;
의사형태소를 분석하는 장치인 의사형태소 분석기를 이용하여 상기 위치정보가 추가된 말뭉치를 분할한 후, 의사형태소 단위의 분할 모델을 생성하기 위한 사후확률 계산부; 및
생성된 분할 모델을 참조하여 어절 단위 말뭉치에서 최적의 분할 경계를 찾는 분할 경계 탐색부를 포함하는 것을 특징으로 하는 의사형태소 음성 인식 단위 생성 장치.
- 삭제
- 청구항 1에 있어서,
상기 사후확률 계산부는,
상기 위치정보가 추가된 의사형태소 단위 말뭉치로부터 단어의 빈도 비용함수, 단어 빈도의 빈도 비용함수, 문자의 빈도 비용함수, 문자열의 길이 분포 비용함수를 이용하여 사후확률(posterior probability)을 계산하며, 더 분할된 결과를 얻기 위해 길이 분포 비용함수에 가중치를 적용하여 기여도를 높인 것을 특징으로 하는 의사형태소 음성 인식 단위 생성 장치.
- 청구항 3에 있어서,
상기 분할 경계 탐색부는,
비터비(Viterbi) 알고리듬을 사용하여, 상기 사후확률 계산부에서 구한 분할 모델을 참조하여 위치정보가 고려된 어절단위 말뭉치를 최적의 경계로 분할하여 부형태소 단위를 생성하는 것을 특징으로 하는 의사형태소 음성 인식 단위 생성 장치.
- 청구항 1에 있어서,
상기 부형태소 병합부는,
상기 분할 경계 탐색부에서 구한 부형태소 단위 말뭉치에서 최대빈도를 가지는 부형태소 쌍을 찾아 연결하여 병합된 의사형태소 음성 인식 단위를 생성하는 것을 특징으로 하는 의사형태소 음성 인식 단위 생성 장치.
- 청구항 4에 있어서,
상기 사후확률 계산부는,
위치정보가 고려된 어절단위 말뭉치에서 형태소 분석기를 이용하여 분할하고, 생성된 형태소 단위 말뭉치를 로마자로 변경한 다음, 말뭉치 비용함수, 어휘(lexicon) 비용함수, 단어의 빈도 분포 비용함수, 분자 빈도 분포 비용함수, 문자열의 길이분포 비용함수를 계산하고, 사후확률에 음의 로그 함수를 취하여 최종적인 전체 비용함수를 계산하며, 비용이 최소화되는 곳을 최적의 분할 위치로 표시하여 분할 모델을 생성하는 것을 특징으로 하는 의사형태소 음성 인식 단위 생성 장치.
- 의사형태소 음성 인식 단위를 생성하는 장치에서의 의사형태소 음성 인식 단위를 생성하는 방법에 있어서,
입력된 어절 단위 말뭉치로부터 더 작은 부형태소 단위를 추출하기 위한 부형태소 분할 단계; 및
상기 부형태소 단위로부터 최대 빈도를 갖는 부형태소 쌍을 연결하여 병합된 의사형태소 단위를 생성하는 부형태소 병합 단계를 포함하되,
상기 부형태소 분할 단계는,
입력된 어절 단위 말뭉치에 의사형태소 단위의 어절 내 형태소의 위치를 고려한 위치정보를 추가하기 위한 위치정보 추가 단계;
의사형태소를 분석하는 장치인 의사형태소 분석기를 이용하여 상기 위치정보가 추가된 말뭉치를 분할한 후, 의사형태소 단위의 분할 모델을 생성하기 위한 사후확률 계산 단계; 및
생성된 분할 모델을 참조하여 어절 단위 말뭉치에서 최적의 분할 경계를 찾는 분할 경계 탐색 단계를 포함하는 것을 특징으로 하는 의사형태소 음성 인식 단위 생성 방법.
- 삭제
- 청구항 7에 있어서,
상기 사후확률 계산 단계는,
상기 위치정보가 추가된 의사형태소 단위 말뭉치로부터 단어의 빈도 비용함수, 단어 빈도의 빈도 비용함수, 문자의 빈도 비용함수, 문자열의 길이 분포 비용함수를 이용하여 사후확률(posterior probability)을 계산하며, 더 분할된 결과를 얻기 위해 길이 분포 비용함수에 가중치를 적용하여 기여도를 높인 것을 특징으로 하는 의사형태소 음성 인식 단위 생성 방법.
- 청구항 9에 있어서,
상기 분할 경계 탐색 단계는,
비터비(Viterbi) 알고리듬을 사용하여, 상기 사후확률 계산 단계에서 구한 분할 모델을 참조하여 위치정보가 고려된 어절단위 말뭉치를 최적의 경계로 분할하여 부형태소 단위를 생성하는 것을 특징으로 하는 의사형태소 음성 인식 단위 생성 방법.
- 청구항 7에 있어서,
상기 부형태소 병합 단계는,
상기 분할 경계 탐색 단계에서 구한 부형태소 단위 말뭉치에서 최대빈도를 가지는 부형태소 쌍을 찾아 연결하여 병합된 의사형태소 음성 인식 단위를 생성하는 것을 특징으로 하는 의사형태소 음성 인식 단위 생성 방법.
- 청구항 10에 있어서,
상기 사후확률 계산 단계는,
위치정보가 고려된 어절단위 말뭉치에서 형태소 분석기를 이용하여 분할하고, 생성된 형태소 단위 말뭉치를 로마자로 변경한 다음, 말뭉치 비용함수, 어휘(lexicon) 비용함수, 단어의 빈도 분포 비용함수, 분자 빈도 분포 비용함수, 문자열의 길이분포 비용함수를 계산하고, 사후확률에 음의 로그 함수를 취하여 최종적인 전체 비용함수를 계산하며, 비용이 최소화되는 곳을 최적의 분할 위치로 표시하여 분할 모델을 생성하는 것을 특징으로 하는 의사형태소 음성 인식 단위 생성 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140153857A KR101604553B1 (ko) | 2014-11-06 | 2014-11-06 | 비교사 분할 및 병합에 의한 의사형태소 음성 인식 단위 생성 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140153857A KR101604553B1 (ko) | 2014-11-06 | 2014-11-06 | 비교사 분할 및 병합에 의한 의사형태소 음성 인식 단위 생성 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101604553B1 true KR101604553B1 (ko) | 2016-03-18 |
Family
ID=55651809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020140153857A KR101604553B1 (ko) | 2014-11-06 | 2014-11-06 | 비교사 분할 및 병합에 의한 의사형태소 음성 인식 단위 생성 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101604553B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200106644A (ko) * | 2019-03-05 | 2020-09-15 | 충북대학교 산학협력단 | 형태소 발음변이를 고려한 음성인식 단위 생성 장치 및 방법 |
-
2014
- 2014-11-06 KR KR1020140153857A patent/KR101604553B1/ko active IP Right Grant
Non-Patent Citations (2)
Title |
---|
Mathias Creutz et al., ‘Morfessor in the Morpho Challenge’, Proc. PASCAL Challenge Workshop on Unsupervised Segmentation of Words into Morphemes, 2006.* |
Mike Schuster et al., ‘Japanese and Korean voice search’, ICASSP 2012, pp.5149~5152, 2012.* |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200106644A (ko) * | 2019-03-05 | 2020-09-15 | 충북대학교 산학협력단 | 형태소 발음변이를 고려한 음성인식 단위 생성 장치 및 방법 |
KR102182408B1 (ko) | 2019-03-05 | 2020-11-24 | 충북대학교 산학협력단 | 형태소 발음변이를 고려한 음성인식 단위 생성 장치 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Schuster et al. | Japanese and korean voice search | |
KR101083540B1 (ko) | 통계적인 방법을 이용한 한자에 대한 자국어 발음열 변환 시스템 및 방법 | |
JP5014785B2 (ja) | 表音ベース音声認識システム及び方法 | |
Karpov et al. | Large vocabulary Russian speech recognition using syntactico-statistical language modeling | |
US8126714B2 (en) | Voice search device | |
CN105404621B (zh) | 一种用于盲人读取汉字的方法及系统 | |
JP6245846B2 (ja) | 音声認識における読み精度を改善するシステム、方法、およびプログラム | |
EP2950306A1 (en) | A method and system for building a language model | |
Illina et al. | Grapheme-to-phoneme conversion using conditional random fields | |
Tennage et al. | Transliteration and byte pair encoding to improve tamil to sinhala neural machine translation | |
Demberg et al. | Phonological constraints and morphological preprocessing for grapheme-to-phoneme conversion | |
Ablimit et al. | A multilingual language processing tool for Uyghur, Kazak and Kirghiz | |
US20150073796A1 (en) | Apparatus and method of generating language model for speech recognition | |
Alghamdi et al. | Automatic restoration of arabic diacritics: a simple, purely statistical approach | |
KR20230011220A (ko) | 언어 이해 및 생성이 가능한 딥러닝 언어모델을 위한 사전학습 장치 및 이를 이용한 방법 | |
Chennoufi et al. | Impact of morphological analysis and a large training corpus on the performances of Arabic diacritization | |
CN112863484B (zh) | 韵律短语边界预测模型训练方法和韵律短语边界预测方法 | |
CN106294310B (zh) | 一种藏语声调预测方法及系统 | |
KR101604553B1 (ko) | 비교사 분할 및 병합에 의한 의사형태소 음성 인식 단위 생성 장치 및 방법 | |
KR20040018008A (ko) | 품사 태깅 장치 및 태깅 방법 | |
Wang et al. | Mongolian named entity recognition using suffixes segmentation | |
Asahiah | Development of a Standard Yorùbá digital text automatic diacritic restoration system | |
KR100511247B1 (ko) | 음성 인식 시스템의 언어 모델링 방법 | |
Kumar et al. | Learning agglutinative morphology of Indian languages with linguistically motivated adaptor grammars | |
Saychum et al. | Efficient Thai Grapheme-to-Phoneme Conversion Using CRF-Based Joint Sequence Modeling. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20141106 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20150916 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20160226 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20160311 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20160311 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20200206 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20200206 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20210119 Start annual number: 6 End annual number: 6 |
|
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20221222 |