KR102376552B1 - 음성 합성 장치 및 음성 합성 방법 - Google Patents
음성 합성 장치 및 음성 합성 방법 Download PDFInfo
- Publication number
- KR102376552B1 KR102376552B1 KR1020170029966A KR20170029966A KR102376552B1 KR 102376552 B1 KR102376552 B1 KR 102376552B1 KR 1020170029966 A KR1020170029966 A KR 1020170029966A KR 20170029966 A KR20170029966 A KR 20170029966A KR 102376552 B1 KR102376552 B1 KR 102376552B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- unit
- service domain
- speech
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
Description
도 3은 본 발명의 실시 예에 따른 음성 합성 장치의 주요 구성을 도시한 블록도이다.
도 4는 본 발명의 실시 예에 따른 음성 합성 방법을 설명하기 위한 흐름도이다.
도 5는 본 발명의 다른 실시 예에 따른 음성 합성 방법을 설명하기 위한 흐름도이다.
| <skml domain="music"> <sk_artist> 소녀시대</sk_artist> 의 <sk_songtitle> 소원을 말해봐</sk_songtitle> 들려드릴께요. </skml> |
| 주문하신 / 상품을 / 학여울역으로 / 전달하였습니다 |
| <skml domain="weather"> 지금 <sk_addr>서울</sk_addr> 하늘에는 구름이 많고 기온은 영상 1도 입니다. </skml> |
| <skml domain="weather"> 지금 <sk_addr>서울</sk_addr> 하늘에는 / 구름이 많고 / 기온은 / 영상 1도 / 입니다 </skml> |
210: 인터페이스 장치 220: 음성 인식 장치
230: 자연어 처리 장치 240: 음성 합성 장치
241: 텍스트 분석부 242: 유닛 추출부
243: 합성음 생성부 244: 합성음 출력부
245: 음성 데이터베이스
245a: 서비스 도메인 음성 데이터베이스
245b: 범용 음성 데이터베이스
300: 통신망
Claims (11)
- 서비스 도메인에 대응하여 운율이 설정된 음성 유닛을 저장하는 복수 개의 서비스 도메인 음성 데이터베이스 및 운율이 설정되지 않은 음소열의 집합인 음성 유닛을 저장하는 범용 음성 데이터베이스를 포함하는 음성 합성 장치에 있어서,
상기 음성 합성 장치는
복수 개의 문자 유닛 및 태그로 구성되는 텍스트가 입력되면, 입력된 텍스트에서 상기 태그를 이용하여 서비스 도메인을 확인하는 텍스트 분석부;
상기 텍스트 분석부를 통해 확인된 서비스 도메인에 대응하는 서비스 도메인 음성 데이터베이스에서 상기 문자 유닛에 대응하는 음성 유닛을 추출하는 유닛 추출부; 및
상기 추출된 음성 유닛의 운율을 고려하여 합성음을 생성하는 합성음 생성부;를 포함하고,
상기 합성음 생성부는
복수의 서비스 도메인 음성 데이터베이스에서 추출된 음성 유닛이 존재하는 경우, 상기 복수의 서비스 도메인 음성 데이터베이스 중 도메인 태그로 지정된 서비스 도메인에 해당하는 서비스 도메인 음성 데이터베이스에서 추출된 음성 유닛의 운율에 맞춰 데이터 태그로 지정된 서비스 도메인에서 추출된 다른 음성 유닛의 운율을 조정하여 합성음을 생성하고,
서비스 도메인 음성 데이터베이스에서 추출된 제1 음성 유닛과 범용 음성 데이터베이스에서 추출된 제2 음성 유닛을 결합하는 경우, 상기 제1 음성 유닛의 운율에 맞춰 제2 음성 유닛의 운율을 조정하여 합성음을 생성하되, 복수의 서비스 도메인 음성 데이터베이스에서 상기 제1 음성 유닛이 추출되면 상기 제2 음성 유닛의 운율을 상기 제2 음성 유닛의 앞뒤에 위치하는 제1 음성 유닛의 운율을 고려하여 설정하는 것을 특징으로 하는 음성 합성 장치. - 제1항에 있어서,
상기 텍스트 분석부는
상기 태그 중 도메인 태그를 이용하여 서비스 도메인을 확인하는 것을 특징으로 하는 음성 합성 장치. - 제1항에 있어서,
상기 유닛 추출부는
상기 텍스트에서 특정 문자 유닛에 대응하여 서비스 도메인으로 지정된 데이터 태그가 존재하는 경우, 상기 데이터 태그에 대응하는 서비스 도메인 음성 데이터베이스에서, 상기 특정 문자 유닛에 대응하는 음성 유닛을 추출하는 것을 특징으로 하는 음성 합성 장치. - 제1항에 있어서,
상기 유닛 추출부는
상기 서비스 도메인 음성 데이터베이스에서 추출되지 못한 문자 유닛이 존재할 경우, 상기 범용 음성 데이터베이스에서 해당 문자 유닛에 대응하는 음소 유닛을 추출하는 것을 특징으로 하는 음성 합성 장치. - 삭제
- 삭제
- 삭제
- 서비스 도메인에 대응하여 운율이 설정된 음성 유닛을 저장하는 복수 개의 서비스 도메인 음성 데이터베이스 및 운율이 설정되지 않은 음소열의 집합인 음성 유닛을 저장하는 범용 음성 데이터베이스를 포함하는 음성 합성 장치에서의 음성 합성 방법에 있어서,
상기 음성 합성 장치가
복수 개의 문자 유닛 및 태그로 구성되는 텍스트가 입력되면, 입력된 텍스트에서 상기 태그를 이용하여 서비스 도메인을 확인하는 단계;
확인된 서비스 도메인에 대응하는 서비스 도메인 음성 데이터베이스에서 상기 문자 유닛에 대응하는 음성 유닛을 추출하는 단계; 및
상기 추출된 음성 유닛의 운율을 고려하여 합성음을 생성하는 단계;를 포함하고,
상기 합성음을 생성하는 단계는
복수의 서비스 도메인 음성 데이터베이스에서 추출된 음성 유닛이 존재하는 경우, 상기 복수의 서비스 도메인 음성 데이터베이스 중 도메인 태그로 지정된 서비스 도메인에 해당하는 서비스 도메인 음성 데이터베이스에서 추출된 음성 유닛의 운율에 맞춰 데이터 태그로 지정된 서비스 도메인에서 추출된 다른 음성 유닛의 운율을 조정하여 합성음을 생성하고,
서비스 도메인 음성 데이터베이스에서 추출된 제1 음성 유닛과 범용 음성 데이터베이스에서 추출된 제2 음성 유닛을 결합하는 경우, 상기 제1 음성 유닛의 운율에 맞춰 제2 음성 유닛의 운율을 조정하여 합성음을 생성하되, 복수의 서비스 도메인 음성 데이터베이스에서 상기 제1 음성 유닛이 추출되면 상기 제2 음성 유닛의 운율을 상기 제2 음성 유닛의 앞뒤에 위치하는 제1 음성 유닛의 운율을 고려하여 설정하는 것을 특징으로 하는 음성 합성 방법. - 제8항에 있어서,
상기 음성 유닛을 추출하는 단계 이후에,
상기 서비스 도메인 음성 데이터베이스에서 추출되지 못한 문자 유닛이 존재하는 지 여부를 판단하는 단계; 및
추출되지 못한 문자 유닛이 존재할 경우, 운율이 설정되지 않은 음소열의 집합인 음성 유닛을 저장하는 범용 음성 데이터베이스에서 상기 문자 유닛에 대응하는 음소 유닛을 추출하는 단계;
를 더 포함하는 것을 특징으로 하는 음성 합성 방법. - 삭제
- 제8항 내지 제9항 중 어느 하나의 항에 기재된 음성 합성 방법을 실행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록매체.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020170029966A KR102376552B1 (ko) | 2017-03-09 | 2017-03-09 | 음성 합성 장치 및 음성 합성 방법 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020170029966A KR102376552B1 (ko) | 2017-03-09 | 2017-03-09 | 음성 합성 장치 및 음성 합성 방법 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20180103273A KR20180103273A (ko) | 2018-09-19 |
| KR102376552B1 true KR102376552B1 (ko) | 2022-03-17 |
Family
ID=63719085
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020170029966A Active KR102376552B1 (ko) | 2017-03-09 | 2017-03-09 | 음성 합성 장치 및 음성 합성 방법 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR102376552B1 (ko) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102685417B1 (ko) * | 2019-02-19 | 2024-07-17 | 삼성전자주식회사 | 사용자 입력을 처리하는 전자 장치 및 방법 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080065383A1 (en) * | 2006-09-08 | 2008-03-13 | At&T Corp. | Method and system for training a text-to-speech synthesis system using a domain-specific speech database |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100669241B1 (ko) * | 2004-12-15 | 2007-01-15 | 한국전자통신연구원 | 화행 정보를 이용한 대화체 음성합성 시스템 및 방법 |
| US8600753B1 (en) * | 2005-12-30 | 2013-12-03 | At&T Intellectual Property Ii, L.P. | Method and apparatus for combining text to speech and recorded prompts |
| KR20100003574A (ko) * | 2008-07-01 | 2010-01-11 | 엘지전자 주식회사 | 음성음원정보 생성 장치 및 시스템, 그리고 이를 이용한음성음원정보 생성 방법 |
| KR101097186B1 (ko) | 2010-03-03 | 2011-12-22 | 미디어젠(주) | 대화체 앞뒤 문장정보를 이용한 다국어 음성합성 시스템 및 방법 |
-
2017
- 2017-03-09 KR KR1020170029966A patent/KR102376552B1/ko active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080065383A1 (en) * | 2006-09-08 | 2008-03-13 | At&T Corp. | Method and system for training a text-to-speech synthesis system using a domain-specific speech database |
Also Published As
| Publication number | Publication date |
|---|---|
| KR20180103273A (ko) | 2018-09-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP3994683B1 (en) | Multilingual neural text-to-speech synthesis | |
| CN111667814B (zh) | 一种多语种的语音合成方法及装置 | |
| KR102582291B1 (ko) | 감정 정보 기반의 음성 합성 방법 및 장치 | |
| CN110473546B (zh) | 一种媒体文件推荐方法及装置 | |
| CN102549653B (zh) | 语音翻译系统、第一终端装置、语音识别服务器装置、翻译服务器装置以及语音合成服务器装置 | |
| CN101030368B (zh) | 在保持情感的同时跨通道进行通信的方法和系统 | |
| US10991373B1 (en) | Voice command processing for locked devices | |
| US8594995B2 (en) | Multilingual asynchronous communications of speech messages recorded in digital media files | |
| KR102097710B1 (ko) | 대화 분리 장치 및 이에서의 대화 분리 방법 | |
| US11093110B1 (en) | Messaging feedback mechanism | |
| KR102848501B1 (ko) | 이중 웨이크업을 이용한 음성 인식 서비스 제공 방법 및 이를 위한 장치 | |
| CN117597728A (zh) | 使用未完全训练的文本到语音模型的个性化和动态的文本到语音声音克隆 | |
| CN115148212B (zh) | 一种语音交互方法、智能设备及系统 | |
| KR102312993B1 (ko) | 인공신경망을 이용한 대화형 메시지 구현 방법 및 그 장치 | |
| CN117059076A (zh) | 方言语音识别方法、装置、设备及存储介质 | |
| CN112133285B (zh) | 语音识别方法、装置、存储介质和电子设备 | |
| KR20190048371A (ko) | 음성 합성 장치 및 상기 음성 합성 장치에서의 음성 합성 방법 | |
| KR102376552B1 (ko) | 음성 합성 장치 및 음성 합성 방법 | |
| CN111489742A (zh) | 声学模型训练方法、语音识别方法、装置及电子设备 | |
| JP2004347732A (ja) | 言語自動識別方法及び装置 | |
| US20080162559A1 (en) | Asynchronous communications regarding the subject matter of a media file stored on a handheld recording device | |
| CN112927677A (zh) | 语音合成方法和装置 | |
| Motyka et al. | Information technology of transcribing Ukrainian-language content based on deep learning | |
| CN113763947A (zh) | 一种语音意图识别方法、装置、电子设备及存储介质 | |
| KR102574311B1 (ko) | 음성 합성 서비스를 제공하는 장치, 단말기 및 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20170309 |
|
| PG1501 | Laying open of application | ||
| A201 | Request for examination | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20200225 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20170309 Comment text: Patent Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210428 Patent event code: PE09021S01D |
|
| AMND | Amendment | ||
| E601 | Decision to refuse application | ||
| PE0601 | Decision on rejection of patent |
Patent event date: 20211027 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20210428 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
| X091 | Application refused [patent] | ||
| AMND | Amendment | ||
| PX0901 | Re-examination |
Patent event code: PX09011S01I Patent event date: 20211027 Comment text: Decision to Refuse Application Patent event code: PX09012R01I Patent event date: 20210628 Comment text: Amendment to Specification, etc. |
|
| PX0701 | Decision of registration after re-examination |
Patent event date: 20211222 Comment text: Decision to Grant Registration Patent event code: PX07013S01D Patent event date: 20211129 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20211027 Comment text: Decision to Refuse Application Patent event code: PX07011S01I Patent event date: 20210628 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I |
|
| X701 | Decision to grant (after re-examination) | ||
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220315 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20220315 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration | ||
| PR1001 | Payment of annual fee |
Payment date: 20241219 Start annual number: 4 End annual number: 4 |