KR102182408B1 - 형태소 발음변이를 고려한 음성인식 단위 생성 장치 및 방법 - Google Patents
형태소 발음변이를 고려한 음성인식 단위 생성 장치 및 방법 Download PDFInfo
- Publication number
- KR102182408B1 KR102182408B1 KR1020190025114A KR20190025114A KR102182408B1 KR 102182408 B1 KR102182408 B1 KR 102182408B1 KR 1020190025114 A KR1020190025114 A KR 1020190025114A KR 20190025114 A KR20190025114 A KR 20190025114A KR 102182408 B1 KR102182408 B1 KR 102182408B1
- Authority
- KR
- South Korea
- Prior art keywords
- unit
- pronunciation
- word
- sequence
- phonetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/086—Recognition of spelled words
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
본 발명에 의하면 형태소 발음변이가 고려된 음성인식 단위를 생성함으로써, 음성인식을 위한 탐색 네트워크의 혼잡도를 증가시키지 않으면서, 다양하게 변이되는 의사형태소의 발음들을 발음사전과 언어모델에 반영하여 전체적인 한국어 음성인식 성능을 향상시킬 수 있는 효과가 있다.
Description
도 2 내지 도 7은 본 발명의 일 실시예에 따른 예시 문장이다.
도 8은 본 발명의 일 실시예에 따른 형태소 발음변이를 고려한 음성인식 단위 생성 방법을 보여주는 흐름도이다.
103 발음열 부착부
Claims (10)
- 한국어에 대한 음성인식 단위 생성 장치에서,
어절 단위 말뭉치로부터 어절 단위의 발음열을 추출하고, 의사형태소 단위 말뭉치로부터 의사형태소 단위의 발음열을 추출하는 발음열 추출부;
상기 어절 단위의 발음열과 상기 의사형태소 단위의 발음열을 정렬하는 발음열 정렬부; 및
상기 의사형태소 단위의 발음열에 상기 어절 단위의 발음열을 부착하여 음성인식 단위의 말뭉치를 생성하는 발음열 부착부를 포함하며,
상기 발음열 추출부는 상기 어절 단위 말뭉치와 상기 의사형태소 단위 말뭉치로부터 어절 범위 내에서 변이된 의사형태소 발음열을 탐색하기 위하여, 단어의 경계에 별도의 단어경계 기호를 삽입하고,
상기 발음열 추출부에서 추출한 어절 단위 발음열과 의사형태소 단위 발음열을 어절 단위 말뭉치의 발음열을 기준으로 정렬하고,
상기 발음열 정렬부는 상기 발음열 추출부에서 추출한 어절 단위 발음열과 의사형태소 단위 발음열을 어절 단위 말뭉치의 발음열을 기준으로 정렬하되, 단어 경계에서 발음열의 정렬이 발생하지 않도록 단어 경계 사이의 거리 값을 높인 것이고,
상기 발음열 정렬부는 상기 어절 단위의 발음열로부터 발음변이가 고려된 의사형태소의 발음열을 얻고,
상기 발음열 부착부는, 상기 발음열 정렬부에서 얻은 발음변이가 고려된 의사형태소의 발음열을 상기 의사형태소 단위의 발음열에 부착하는 방식으로, 발음이 다른 의사형태소 단위를 서로 다른 단위로 구분하며,
상기 발음열 정렬부는 문자열 정렬 알고리즘을 이용하여 어절 단위에서 생성된 발음열과 의사형태소 단위에서 생성된 발음열을 어절 단위를 기준으로 정렬하되, 두 발음열 사이의 거리 값이 최소가 되는 정렬 결과를 탐색하기 위해서 누적 거리값이 기록된 탐색 테이블을 생성하고, 생성된 탐색 테이블을 이용하여 거리 값이 최소가 되는 정렬 결과를 탐색하는 정렬 알고리즘을 이용하여 정렬하며,
이때, 은 어절 단위의 발음열 와 형태소 단위의 발음열 에서 각 i번째, j번째 발음 기호 , 사이의 거리 값을 나타내며,
(수학식 1)
을 사용하여 발음 간의 거리를 계산하고,
는 두 발음열로 생성된 탐색 테이블에서 i번째와 j번째 발음 기호까지의 누적거리 값을 나타내며,
(수학식 2)
를 사용하여 탐색 테이블의 대각, 위쪽, 왼쪽의 누적거리 값에 두 발음 사이의 거리 값을 더하거나, 삽입 페널티 또는 삭제 페널티를 더한 값 중에서 가장 작은 값을 선택하여 재귀적으로 누적 거리 값을 기록하는 방식으로 탐색 테이블을 생성하고,
단어 경계 기호를 WB라고 할 때,
을 이용하여 단어 경계 기호가 발견될 때 상대적으로 높은 거리 값을 갖도록 하는 것을 특징으로 하는 음성인식 단위 생성 장치.
- 삭제
- 삭제
- 삭제
- 삭제
- 형태소 발음변위를 고려한 음성인식 단위 생성 장치에서의 음성인식 단위 생성 방법에서,
어절 단위 말뭉치로부터 어절 단위의 발음열을 추출하고, 의사형태소 단위 말뭉치로부터 의사형태소 단위의 발음열을 추출하는 발음열 추출 단계;
상기 어절 단위의 발음열과 상기 의사형태소 단위의 발음열을 정렬하는 발음열 정렬 단계; 및
상기 의사형태소 단위의 발음열에 상기 어절 단위의 발음열을 부착하여 음성인식 단위의 말뭉치를 생성하는 발음열 부착 단계를 포함하며,
상기 발음열 추출 단계에서 상기 어절 단위 말뭉치와 상기 의사형태소 단위 말뭉치로부터 어절 범위 내에서 변이된 의사형태소 발음열을 탐색하기 위하여, 단어의 경계에 별도의 단어경계 기호를 삽입하고,
상기 발음열 정렬 단계에서 어절 단위 발음열과 의사형태소 단위 발음열을 어절 단위 말뭉치의 발음열을 기준으로 정렬하고,
상기 발음열 정렬 단계에서 어절 단위 발음열과 의사형태소 단위 발음열을 어절 단위 말뭉치의 발음열을 기준으로 정렬하되, 단어 경계에서 발음열의 정렬이 발생하지 않도록 단어 경계 사이의 거리 값을 높인 것이고,
상기 발음열 정렬 단계에서 상기 어절 단위의 발음열로부터 발음변이가 고려된 의사형태소의 발음열을 얻고,
상기 발음열 부착 단계에서, 상기 발음열 정렬 단계에서 얻은 발음변이가 고려된 의사형태소의 발음열을 상기 의사형태소 단위의 발음열에 부착하는 방식으로, 발음이 다른 의사형태소 단위를 서로 다른 단위로 구분하며,
상기 발음열 정렬 단계에서, 문자열 정렬 알고리즘을 이용하여 어절 단위에서 생성된 발음열과 의사형태소 단위에서 생성된 발음열을 어절 단위를 기준으로 정렬하되, 두 발음열 사이의 거리 값이 최소가 되는 정렬 결과를 탐색하기 위해서 누적 거리값이 기록된 탐색 테이블을 생성하고, 생성된 탐색 테이블을 이용하여 거리 값이 최소가 되는 정렬 결과를 탐색하는 정렬 알고리즘을 이용하여 정렬하며,
이때, 은 어절 단위의 발음열 와 형태소 단위의 발음열 에서 각 i번째, j번째 발음 기호 , 사이의 거리 값을 나타내며,
(수학식 1)
을 사용하여 발음 간의 거리를 계산하고,
는 두 발음열로 생성된 탐색 테이블에서 i번째와 j번째 발음 기호까지의 누적거리 값을 나타내며,
(수학식 2)
를 사용하여 탐색 테이블의 대각, 위쪽, 왼쪽의 누적거리 값에 두 발음 사이의 거리 값을 더하거나, 삽입 페널티 또는 삭제 페널티를 더한 값 중에서 가장 작은 값을 선택하여 재귀적으로 누적 거리 값을 기록하는 방식으로 탐색 테이블을 생성하고,
단어 경계 기호를 WB라고 할 때,
을 이용하여 단어 경계 기호가 발견될 때 상대적으로 높은 거리 값을 갖도록 하는 것을 특징으로 하는 음성인식 단위 생성 방법. - 삭제
- 삭제
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190025114A KR102182408B1 (ko) | 2019-03-05 | 2019-03-05 | 형태소 발음변이를 고려한 음성인식 단위 생성 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190025114A KR102182408B1 (ko) | 2019-03-05 | 2019-03-05 | 형태소 발음변이를 고려한 음성인식 단위 생성 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200106644A KR20200106644A (ko) | 2020-09-15 |
KR102182408B1 true KR102182408B1 (ko) | 2020-11-24 |
Family
ID=72450511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190025114A Active KR102182408B1 (ko) | 2019-03-05 | 2019-03-05 | 형태소 발음변이를 고려한 음성인식 단위 생성 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102182408B1 (ko) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100848148B1 (ko) | 2007-02-20 | 2008-07-28 | 고려대학교 산학협력단 | 음절 단위의 음성 인식 장치, 음절 단위의 음성 인식을이용한 문자 입력 장치, 그 방법 및 기록 매체 |
JP2009246813A (ja) * | 2008-03-31 | 2009-10-22 | Kddi Corp | 字幕ずれ推定装置、字幕ずれ補正装置、再生装置および放送装置 |
KR101604553B1 (ko) | 2014-11-06 | 2016-03-18 | 충북대학교 산학협력단 | 비교사 분할 및 병합에 의한 의사형태소 음성 인식 단위 생성 장치 및 방법 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102117082B1 (ko) * | 2014-12-29 | 2020-05-29 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
KR102413067B1 (ko) * | 2015-07-28 | 2022-06-24 | 삼성전자주식회사 | 문법 모델을 갱신하고, 문법 모델에 기초하여 음성 인식을 수행하는 방법 및 디바이스 |
KR102094935B1 (ko) | 2016-09-09 | 2020-03-30 | 한국전자통신연구원 | 음성 인식 시스템 및 방법 |
-
2019
- 2019-03-05 KR KR1020190025114A patent/KR102182408B1/ko active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100848148B1 (ko) | 2007-02-20 | 2008-07-28 | 고려대학교 산학협력단 | 음절 단위의 음성 인식 장치, 음절 단위의 음성 인식을이용한 문자 입력 장치, 그 방법 및 기록 매체 |
JP2009246813A (ja) * | 2008-03-31 | 2009-10-22 | Kddi Corp | 字幕ずれ推定装置、字幕ずれ補正装置、再生装置および放送装置 |
KR101604553B1 (ko) | 2014-11-06 | 2016-03-18 | 충북대학교 산학협력단 | 비교사 분할 및 병합에 의한 의사형태소 음성 인식 단위 생성 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20200106644A (ko) | 2020-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107741928B (zh) | 一种基于领域识别的对语音识别后文本纠错的方法 | |
US5949961A (en) | Word syllabification in speech synthesis system | |
US6684187B1 (en) | Method and system for preselection of suitable units for concatenative speech | |
US8126714B2 (en) | Voice search device | |
Abushariah et al. | Arabic speaker-independent continuous automatic speech recognition based on a phonetically rich and balanced speech corpus. | |
JPH06505349A (ja) | 言語学的に動機づけした隠れマルコフモデルを用いる音声の認識方法 | |
EP2595144B1 (en) | Voice data retrieval system and program product therefor | |
JP2012043000A (ja) | 検索装置、検索方法、及び、プログラム | |
CN100354929C (zh) | 语音处理设备、语言处理方法 | |
KR101424193B1 (ko) | 타 언어권 화자음성에 대한 음성인식 시스템의 성능 향상을위한 비직접적 데이터 기반 발음변이 모델링 시스템 및방법 | |
US7328157B1 (en) | Domain adaptation for TTS systems | |
Adda-Decker et al. | The use of lexica in automatic speech recognition | |
Masmoudi et al. | Phonetic tool for the Tunisian Arabic. | |
KR100573870B1 (ko) | 대화체 연속음성인식을 위한 의사형태소 기반다중발음사전 구축 방법 및 그 시스템과 이를 이용한대화체 음성인식 방법 | |
JP4764203B2 (ja) | 音声認識装置及び音声認識プログラム | |
Chu et al. | A concatenative Mandarin TTS system without prosody model and prosody modification. | |
KR102182408B1 (ko) | 형태소 발음변이를 고려한 음성인식 단위 생성 장치 및 방법 | |
KR20050032759A (ko) | 음운변이 규칙을 이용한 외래어 음차표기 자동 확장 방법및 그 장치 | |
Stefan-Adrian et al. | Rule-based automatic phonetic transcription for the Romanian language | |
Llitjós et al. | Improving pronunciation accuracy of proper names with language origin classes | |
KR100704508B1 (ko) | N-gram 네트워크를 이용하는 한국어 연속음성인식의언어모델 적응장치 및 그 방법 | |
JP5124012B2 (ja) | 音声認識装置及び音声認識プログラム | |
Yeh et al. | Speech recognition with word fragment detection using prosody features for spontaneous speech | |
Saychum et al. | Efficient Thai Grapheme-to-Phoneme Conversion Using CRF-Based Joint Sequence Modeling. | |
KR101068120B1 (ko) | 다중 탐색 기반의 음성 인식 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20190305 |
|
PA0201 | Request for examination | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20200518 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20201109 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20201118 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20201118 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230920 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20240930 Start annual number: 5 End annual number: 5 |