CN113096664A - 一种语音学习系统 - Google Patents
一种语音学习系统 Download PDFInfo
- Publication number
- CN113096664A CN113096664A CN201911331107.3A CN201911331107A CN113096664A CN 113096664 A CN113096664 A CN 113096664A CN 201911331107 A CN201911331107 A CN 201911331107A CN 113096664 A CN113096664 A CN 113096664A
- Authority
- CN
- China
- Prior art keywords
- voice
- text
- library
- module
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种语音学习系统,包括:文本录入模块,用以录入文字文本库;语音录入模块,用于录入所述文字文本库对应的语音库;分析提取模块,与所述文本录入模块及所述语音录入模块电性连接,用以提取所述文字文本库内每个文本字段的对应的语音字段;语音输出模块,与所述分析提取模块电性连接,用以根据文本阈值输出对应的对应语音字段。上述实施方式能够获取被模仿者的语音库,并对该语音库对应的文字文本库提取对应的语音字段,以能够输出高仿真的语音。本实施方式中输出语音仿真度高,声音不生硬。
Description
技术领域
本发明涉及语音处理领域,特别是涉及一种语音学习系统。
背景技术
语音是人们日常交流活动的最基本、也是最有效的一种方式。随着人工智能技术的日渐成熟,人们也希望能够通过直接对话的方式与计算机进行交流和传递信息,因此语音识别、语音合成也随之成为自然语言处理领域中的一大主题。语音转文字以及根据文字合成语音等各种形式的需求日渐扩大,比如:语音输入法的使用量呈现飞速的增长。
目前,声音模拟已在各大软件使用,但是目前声音模拟软件所模拟出的声音大多比较生硬,仿真度不高。
发明内容
基于此,有必要针对模拟声音生硬、仿真度不高的问题,提供语音学习系统。
一种语音学习系统,包括:
文本录入模块,用以录入文字文本库;
语音录入模块,用于录入所述文字文本库对应的语音库;
分析提取模块,与所述文本录入模块及所述语音录入模块电性连接,用以提取所述文字文本库内每个文本字段的对应的语音字段;
语音输出模块,与所述分析提取模块电性连接,用以根据文本阈值输出对应的对应语音字段。
在其中一个实施方式中,包括:
储存器,用于储存所述文字文本库及语音库。
在其中一个实施方式中,包括:
所述语音库至少包括一种语言。
上述实施方式能够获取被模仿者的语音库,并对该语音库对应的文字文本库提取对应的语音字段,以能够输出高仿真的语音。本实施方式中输出语音仿真度高,声音不生硬。
附图说明
图1为本发明一优选实施方式的语音学习系统的模块结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
需要说明的是,当元件被称为“设置于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
如图1所示,本实施方式中的一优选实施方式公开了一种语音学习系统100,包括:
文本录入模块110,用以录入文字文本库;
语音录入模块120,用于录入所述文字文本库对应的语音库;
分析提取模块130,与所述文本录入模块及所述语音录入模块电性连接,用以提取所述文字文本库内每个文本字段的对应的语音字段;
语音输出模块140,与所述分析提取模块电性连接,用以根据文本阈值输出对应的对应语音字段。
在其中一个实施方式中,语音学习系统100包括:储存器,用于储存所述文字文本库及语音库。
在其中一个实施方式中,语音学习系统100包括:所述语音库至少包括一种语言。
上述实施方式能够获取被模仿者的语音库,并对该语音库对应的文字文本库提取对应的语音字段,以能够输出高仿真的语音。本实施方式中输出语音仿真度高,声音不生硬。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (3)
1.一种语音学习系统,其特征在于,包括:
文本录入模块,用以录入文字文本库;
语音录入模块,用于录入所述文字文本库对应的语音库;
分析提取模块,与所述文本录入模块及所述语音录入模块电性连接,用以提取所述文字文本库内每个文本字段的对应的语音字段;
语音输出模块,与所述分析提取模块电性连接,用以根据文本阈值输出对应的对应语音字段。
2.根据权利要求1所述的语音学习系统,其特征在于,包括:
储存器,用于储存所述文字文本库及语音库。
3.根据权利要求1所述的语音学习系统,其特征在于,包括:
所述语音库至少包括一种语言。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911331107.3A CN113096664A (zh) | 2019-12-20 | 2019-12-20 | 一种语音学习系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911331107.3A CN113096664A (zh) | 2019-12-20 | 2019-12-20 | 一种语音学习系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113096664A true CN113096664A (zh) | 2021-07-09 |
Family
ID=76662784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911331107.3A Pending CN113096664A (zh) | 2019-12-20 | 2019-12-20 | 一种语音学习系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113096664A (zh) |
-
2019
- 2019-12-20 CN CN201911331107.3A patent/CN113096664A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106575500B (zh) | 基于面部结构合成话音的方法和装置 | |
CN106688034B (zh) | 具有情感内容的文字至语音转换 | |
US9390711B2 (en) | Information recognition method and apparatus | |
US9047868B1 (en) | Language model data collection | |
CN112233698B (zh) | 人物情绪识别方法、装置、终端设备及存储介质 | |
CN110473566A (zh) | 音频分离方法、装置、电子设备及计算机可读存储介质 | |
CN112562634B (zh) | 多风格音频合成方法、装置、设备及存储介质 | |
CN108447471A (zh) | 语音识别方法及语音识别装置 | |
CN101551998B (zh) | 一种语音互动系统以及其和人的语音互动方法 | |
CN106847279A (zh) | 基于机器人操作系统ros的人机交互方法 | |
CN113851136A (zh) | 基于聚类的说话人识别方法、装置、设备及存储介质 | |
KR20220090171A (ko) | 음성 인식 장치, 프로그램 및 그것의 학습 제어 방법 | |
CN110544482A (zh) | 一种单通道语音分离系统 | |
CN116797695A (zh) | 一种数字人与虚拟白板的交互方法、系统及存储介质 | |
CN116386594A (zh) | 语音合成方法、语音合成装置、电子设备及存储介质 | |
KR102167157B1 (ko) | 발음 변이를 적용시킨 음성 인식 방법 | |
CN113256262A (zh) | 会议纪要的自动生成方法、系统、存储介质及电子设备 | |
CN113436609A (zh) | 语音转换模型及其训练方法、语音转换方法及系统 | |
DE102018111896A1 (de) | Bereitstellen einer Ausgabe, die mit einem Dialekt verknüpft ist | |
CN113555003B (zh) | 语音合成方法、装置、电子设备及存储介质 | |
CN109308896B (zh) | 语音处理方法及装置、存储介质及处理器 | |
KR102318150B1 (ko) | 생성적 적대 신경망 기반 수어 영상 생성 시스템 | |
CN113096664A (zh) | 一种语音学习系统 | |
CN111210812A (zh) | 一种人工智能语音中转系统 | |
CN116935851A (zh) | 用于语音转换的方法及装置、语音转换系统、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210709 |
|
WD01 | Invention patent application deemed withdrawn after publication |