CN110444192A - 一种基于语音技术的智能语音机器人 - Google Patents

一种基于语音技术的智能语音机器人 Download PDF

Info

Publication number
CN110444192A
CN110444192A CN201910755243.9A CN201910755243A CN110444192A CN 110444192 A CN110444192 A CN 110444192A CN 201910755243 A CN201910755243 A CN 201910755243A CN 110444192 A CN110444192 A CN 110444192A
Authority
CN
China
Prior art keywords
conducting wire
voice
lpc
module
processing module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910755243.9A
Other languages
English (en)
Inventor
亚琼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Guangdong And Guangdong Mdt Infotech Ltd
Original Assignee
Guangzhou Guangdong And Guangdong Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Guangdong And Guangdong Mdt Infotech Ltd filed Critical Guangzhou Guangdong And Guangdong Mdt Infotech Ltd
Priority to CN201910755243.9A priority Critical patent/CN110444192A/zh
Publication of CN110444192A publication Critical patent/CN110444192A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种基于语音技术的智能语音机器人,涉及机器人交互技术领域领域,针对现有的语音合成效率低的问题,现提出如下方案,其包括处理模块,所述处理模块的引脚通过导线连接有LPC滤波器,所述LPC滤波器通过导线连接有LPC预测编码模块,所述LPC预测编码模块通过导线连接有语音接收模块,所述处理模块的引脚通过导线连接有LPC合成器,所述LPC合成器通过导线连接有语音输出模块,所述处理模块的引脚通过导线连接有射频器和语音库,本发明结构简单,实用方便,通过各个模块之间的相互配合,可以实现有效的语音合成,降低时间域信号的传输速率,合成出符合要求的语音,提高语音信息的有效性,同时提高语音合成效率。

Description

一种基于语音技术的智能语音机器人
技术领域
本发明涉及机器人交互技术领域领域,尤其涉及一种基于语音技术的智能语音机器人。
背景技术
机器人(Robot)是自动执行工作的机器装置,它既可以接受人类指挥,又可以运行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动。它的任务是协助或取代人类工作的工作,例如生产业、建筑业,或是危险的工作,机器人的发展速度越来越快,在生产生活中起到恨到的作用,但是现有结构的机器人在语音交互上虽然能进行相互交流,但是语音合成效率较低,对处理器要求过高,降低交互的体验感。
发明内容
本发明提出的一种基于语音技术的智能语音机器人,解决了语音合成效率低的问题。
为了实现上述目的,本发明采用了如下技术方案:
一种基于语音技术的智能语音机器人,包括处理模块,所述处理模块的引脚通过导线连接有LPC滤波器,所述LPC滤波器通过导线连接有LPC预测编码模块,所述LPC预测编码模块通过导线连接有语音接收模块,所述处理模块的引脚通过导线连接有LPC合成器,所述LPC合成器通过导线连接有语音输出模块,所述处理模块的引脚通过导线连接有射频器和语音库,所述语音库通过导线连接有语音合成模块,且语音合成模块通过导线与语音输出模块电连接。
优选的,所述语音库内存储有语音基元,所述语音基元采用二进制数制。
优选的,所述射频器通过无线协议与外界网络数据库无线连接,所述射频器采用ISO15693标准。
本发明的有益效果:
1、利用LPC(线性预测合成)技术,将语音信号产生的物理模型进行抽象,得到语音信号的数学模型,保存了语音的全部信息,同时降低编码语音信号时的数码率,实现有效的语音合成,降低时间域信号的传输速率。
2、利用MICROSOFT的TTS引擎编制演示程序,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音,提高语音信息的有效性。
附图说明
图1为本发明的系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
参见附图1,一种基于语音技术的智能语音机器人,包括处理模块,处理模块的引脚通过导线连接有LPC滤波器,LPC滤波器通过导线连接有LPC预测编码模块,LPC预测编码模块通过导线连接有语音接收模块,处理模块的引脚通过导线连接有LPC合成器,LPC合成器通过导线连接有语音输出模块,处理模块的引脚通过导线连接有射频器和语音库,语音库通过导线连接有语音合成模块,且语音合成模块通过导线与语音输出模块电连接,语音库内存储有语音基元,语音基元采用二进制数制,射频器通过无线协议与外界网络数据库无线连接,射频器采用ISO15693标准。
工作原理:使用时,语音接收模块接收外界的语音信号,然后LPC预测编码模块将语音信号分帧得到LPC系数,并将分析参数经过LPC滤波器,得到声道模型的系统函数,提供了一组简洁的语音信号模型参数,这一组参数较精确地表征了语音信号的频谱幅度,传递到处理模块内,进行分析处理,而分析它们的运算量并不大,然后,对语音信号中的浊音进行基音周期检测从而获得激励信号,用激励信号激励LPC合成器形成新的信号,在由语音输出模块得到再生语音,进行输出保存了语音的全部信息,因而对于单个合成基元来说能够获得较高的自然度,同时降低编码语音信号时的数码率,实现有效的语音合成,降低时间域信号的传输速率。
根据语音输出的信号,经过处理模块的处理,从原始语音库中取出相应的语音基元,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音,同时利用射频器连接入网,可以将数据通信和语音通信在终端一级实现交融,人们将有望在获取Internet信息时,使短消息服务、电子邮件等多数以文本方式提供的信息也用语音的方式输出。在大规模真实录音语音库的基础上,增加了音库压缩算法和音色变换算法形成核心技术,音库大小可缩扩,小音库为1MB,适合基于嵌入式操作系统的应用。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (3)

1.一种基于语音技术的智能语音机器人,包括处理模块和,其特征在于,所述处理模块的引脚通过导线连接有LPC滤波器,所述LPC滤波器通过导线连接有LPC预测编码模块,所述LPC预测编码模块通过导线连接有语音接收模块,所述处理模块的引脚通过导线连接有LPC合成器,所述LPC合成器通过导线连接有语音输出模块,所述处理模块的引脚通过导线连接有射频器和语音库,所述语音库通过导线连接有语音合成模块,且语音合成模块通过导线与语音输出模块电连接。
2.根据权利要求所述的一种基于语音技术的智能语音机器人,其特征在于,所述语音库内存储有语音基元,所述语音基元采用二进制数制。
3.根据权利要求所述的一种基于语音技术的智能语音机器人,其特征在于,所述射频器通过无线协议与外界网络数据库无线连接,所述射频器采用ISO15693标准。
CN201910755243.9A 2019-08-15 2019-08-15 一种基于语音技术的智能语音机器人 Pending CN110444192A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910755243.9A CN110444192A (zh) 2019-08-15 2019-08-15 一种基于语音技术的智能语音机器人

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910755243.9A CN110444192A (zh) 2019-08-15 2019-08-15 一种基于语音技术的智能语音机器人

Publications (1)

Publication Number Publication Date
CN110444192A true CN110444192A (zh) 2019-11-12

Family

ID=68435837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910755243.9A Pending CN110444192A (zh) 2019-08-15 2019-08-15 一种基于语音技术的智能语音机器人

Country Status (1)

Country Link
CN (1) CN110444192A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1652207A (zh) * 1995-06-16 2005-08-10 诺基亚流动电话有限公司 语音编码器
CN101359978A (zh) * 2007-07-30 2009-02-04 向为 一种控制变速率多模式宽带编码速率的方法
CN101577605A (zh) * 2008-05-08 2009-11-11 吴志军 基于滤波器相似度的语音lpc隐藏和提取算法
CN102184731A (zh) * 2011-05-12 2011-09-14 北京航空航天大学 一种韵律类和音质类参数相结合的情感语音转换方法
CN102664003A (zh) * 2012-04-24 2012-09-12 南京邮电大学 基于谐波加噪声模型的残差激励信号合成及语音转换方法
CN103489443A (zh) * 2013-09-17 2014-01-01 湖南大学 一种声音模仿方法及装置
CN104937662A (zh) * 2013-01-29 2015-09-23 高通股份有限公司 用于线性预测译码中的自适应共振峰锐化的系统、方法、设备和计算机可读媒体

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1652207A (zh) * 1995-06-16 2005-08-10 诺基亚流动电话有限公司 语音编码器
CN101359978A (zh) * 2007-07-30 2009-02-04 向为 一种控制变速率多模式宽带编码速率的方法
CN101577605A (zh) * 2008-05-08 2009-11-11 吴志军 基于滤波器相似度的语音lpc隐藏和提取算法
CN102184731A (zh) * 2011-05-12 2011-09-14 北京航空航天大学 一种韵律类和音质类参数相结合的情感语音转换方法
CN102664003A (zh) * 2012-04-24 2012-09-12 南京邮电大学 基于谐波加噪声模型的残差激励信号合成及语音转换方法
CN104937662A (zh) * 2013-01-29 2015-09-23 高通股份有限公司 用于线性预测译码中的自适应共振峰锐化的系统、方法、设备和计算机可读媒体
CN103489443A (zh) * 2013-09-17 2014-01-01 湖南大学 一种声音模仿方法及装置

Similar Documents

Publication Publication Date Title
CN110491382B (zh) 基于人工智能的语音识别方法、装置及语音交互设备
US10978047B2 (en) Method and apparatus for recognizing speech
CN106611597B (zh) 基于人工智能的语音唤醒方法和装置
CN112599122B (zh) 基于自注意力机制和记忆网络的语音识别方法及装置
CN1125432C (zh) 基于声码器的语音识别器、识别方法及数字蜂窝电话
CN103971685B (zh) 语音命令识别方法和系统
CN108806720B (zh) 话筒、数据处理器、监测系统及监测方法
CN108573693A (zh) 使用自动编码器的文本到语音合成
CN102648493B (zh) 音频信号处理方法和设备
CN105206271A (zh) 智能设备的语音唤醒方法及实现所述方法的系统
CN112365882A (zh) 语音合成方法及模型训练方法、装置、设备及存储介质
CN112466288A (zh) 语音识别方法、装置、电子设备及存储介质
CN106653056A (zh) 基于lstm循环神经网络的基频提取模型及训练方法
CN114360557B (zh) 语音音色转换方法、模型训练方法、装置、设备和介质
CN113129927B (zh) 语音情绪识别方法、装置、设备及存储介质
CN107943834A (zh) 人机对话的实现方法、装置、设备及存储介质
CN110364170A (zh) 语音传输方法、装置、计算机装置及存储介质
CN104143342B (zh) 一种清浊音判定方法、装置和语音合成系统
CN106356054A (zh) 一种基于语音识别的农产品信息采集方法和系统
CN111862938A (zh) 一种智能应答方法与终端、计算机可读存储介质
CN114360485A (zh) 语音处理方法、系统、装置及介质
CN113012681B (zh) 基于唤醒语音模型的唤醒语音合成方法及应用唤醒方法
CN112489628B (zh) 语音数据选择方法、装置、电子设备及存储介质
CN110444192A (zh) 一种基于语音技术的智能语音机器人
CN109243458A (zh) 一种用于智能机器人的语音识别系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191112