CN113096664A - 一种语音学习系统 - Google Patents

一种语音学习系统 Download PDF

Info

Publication number
CN113096664A
CN113096664A CN201911331107.3A CN201911331107A CN113096664A CN 113096664 A CN113096664 A CN 113096664A CN 201911331107 A CN201911331107 A CN 201911331107A CN 113096664 A CN113096664 A CN 113096664A
Authority
CN
China
Prior art keywords
voice
text
library
module
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911331107.3A
Other languages
English (en)
Inventor
徐旺荣
宋游
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yancheng Qingyu Information Technology Co ltd
Original Assignee
Yancheng Qingyu Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yancheng Qingyu Information Technology Co ltd filed Critical Yancheng Qingyu Information Technology Co ltd
Priority to CN201911331107.3A priority Critical patent/CN113096664A/zh
Publication of CN113096664A publication Critical patent/CN113096664A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种语音学习系统,包括:文本录入模块,用以录入文字文本库;语音录入模块,用于录入所述文字文本库对应的语音库;分析提取模块,与所述文本录入模块及所述语音录入模块电性连接,用以提取所述文字文本库内每个文本字段的对应的语音字段;语音输出模块,与所述分析提取模块电性连接,用以根据文本阈值输出对应的对应语音字段。上述实施方式能够获取被模仿者的语音库,并对该语音库对应的文字文本库提取对应的语音字段,以能够输出高仿真的语音。本实施方式中输出语音仿真度高,声音不生硬。

Description

一种语音学习系统
技术领域
本发明涉及语音处理领域,特别是涉及一种语音学习系统。
背景技术
语音是人们日常交流活动的最基本、也是最有效的一种方式。随着人工智能技术的日渐成熟,人们也希望能够通过直接对话的方式与计算机进行交流和传递信息,因此语音识别、语音合成也随之成为自然语言处理领域中的一大主题。语音转文字以及根据文字合成语音等各种形式的需求日渐扩大,比如:语音输入法的使用量呈现飞速的增长。
目前,声音模拟已在各大软件使用,但是目前声音模拟软件所模拟出的声音大多比较生硬,仿真度不高。
发明内容
基于此,有必要针对模拟声音生硬、仿真度不高的问题,提供语音学习系统。
一种语音学习系统,包括:
文本录入模块,用以录入文字文本库;
语音录入模块,用于录入所述文字文本库对应的语音库;
分析提取模块,与所述文本录入模块及所述语音录入模块电性连接,用以提取所述文字文本库内每个文本字段的对应的语音字段;
语音输出模块,与所述分析提取模块电性连接,用以根据文本阈值输出对应的对应语音字段。
在其中一个实施方式中,包括:
储存器,用于储存所述文字文本库及语音库。
在其中一个实施方式中,包括:
所述语音库至少包括一种语言。
上述实施方式能够获取被模仿者的语音库,并对该语音库对应的文字文本库提取对应的语音字段,以能够输出高仿真的语音。本实施方式中输出语音仿真度高,声音不生硬。
附图说明
图1为本发明一优选实施方式的语音学习系统的模块结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
需要说明的是,当元件被称为“设置于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的,并不表示是唯一的实施方式。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
如图1所示,本实施方式中的一优选实施方式公开了一种语音学习系统100,包括:
文本录入模块110,用以录入文字文本库;
语音录入模块120,用于录入所述文字文本库对应的语音库;
分析提取模块130,与所述文本录入模块及所述语音录入模块电性连接,用以提取所述文字文本库内每个文本字段的对应的语音字段;
语音输出模块140,与所述分析提取模块电性连接,用以根据文本阈值输出对应的对应语音字段。
在其中一个实施方式中,语音学习系统100包括:储存器,用于储存所述文字文本库及语音库。
在其中一个实施方式中,语音学习系统100包括:所述语音库至少包括一种语言。
上述实施方式能够获取被模仿者的语音库,并对该语音库对应的文字文本库提取对应的语音字段,以能够输出高仿真的语音。本实施方式中输出语音仿真度高,声音不生硬。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (3)

1.一种语音学习系统,其特征在于,包括:
文本录入模块,用以录入文字文本库;
语音录入模块,用于录入所述文字文本库对应的语音库;
分析提取模块,与所述文本录入模块及所述语音录入模块电性连接,用以提取所述文字文本库内每个文本字段的对应的语音字段;
语音输出模块,与所述分析提取模块电性连接,用以根据文本阈值输出对应的对应语音字段。
2.根据权利要求1所述的语音学习系统,其特征在于,包括:
储存器,用于储存所述文字文本库及语音库。
3.根据权利要求1所述的语音学习系统,其特征在于,包括:
所述语音库至少包括一种语言。
CN201911331107.3A 2019-12-20 2019-12-20 一种语音学习系统 Pending CN113096664A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911331107.3A CN113096664A (zh) 2019-12-20 2019-12-20 一种语音学习系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911331107.3A CN113096664A (zh) 2019-12-20 2019-12-20 一种语音学习系统

Publications (1)

Publication Number Publication Date
CN113096664A true CN113096664A (zh) 2021-07-09

Family

ID=76662784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911331107.3A Pending CN113096664A (zh) 2019-12-20 2019-12-20 一种语音学习系统

Country Status (1)

Country Link
CN (1) CN113096664A (zh)

Similar Documents

Publication Publication Date Title
CN106575500B (zh) 基于面部结构合成话音的方法和装置
CN106688034B (zh) 具有情感内容的文字至语音转换
US9390711B2 (en) Information recognition method and apparatus
US9047868B1 (en) Language model data collection
CN112233698B (zh) 人物情绪识别方法、装置、终端设备及存储介质
CN110473566A (zh) 音频分离方法、装置、电子设备及计算机可读存储介质
CN112562634B (zh) 多风格音频合成方法、装置、设备及存储介质
CN108447471A (zh) 语音识别方法及语音识别装置
CN101551998B (zh) 一种语音互动系统以及其和人的语音互动方法
CN106847279A (zh) 基于机器人操作系统ros的人机交互方法
CN113851136A (zh) 基于聚类的说话人识别方法、装置、设备及存储介质
KR20220090171A (ko) 음성 인식 장치, 프로그램 및 그것의 학습 제어 방법
CN110544482A (zh) 一种单通道语音分离系统
CN116797695A (zh) 一种数字人与虚拟白板的交互方法、系统及存储介质
CN116386594A (zh) 语音合成方法、语音合成装置、电子设备及存储介质
KR102167157B1 (ko) 발음 변이를 적용시킨 음성 인식 방법
CN113256262A (zh) 会议纪要的自动生成方法、系统、存储介质及电子设备
CN113436609A (zh) 语音转换模型及其训练方法、语音转换方法及系统
DE102018111896A1 (de) Bereitstellen einer Ausgabe, die mit einem Dialekt verknüpft ist
CN113555003B (zh) 语音合成方法、装置、电子设备及存储介质
CN109308896B (zh) 语音处理方法及装置、存储介质及处理器
KR102318150B1 (ko) 생성적 적대 신경망 기반 수어 영상 생성 시스템
CN113096664A (zh) 一种语音学习系统
CN111210812A (zh) 一种人工智能语音中转系统
CN116935851A (zh) 用于语音转换的方法及装置、语音转换系统、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210709

WD01 Invention patent application deemed withdrawn after publication