CN102890931A - 提高语音识别率的方法 - Google Patents

提高语音识别率的方法 Download PDF

Info

Publication number
CN102890931A
CN102890931A CN2012103607727A CN201210360772A CN102890931A CN 102890931 A CN102890931 A CN 102890931A CN 2012103607727 A CN2012103607727 A CN 2012103607727A CN 201210360772 A CN201210360772 A CN 201210360772A CN 102890931 A CN102890931 A CN 102890931A
Authority
CN
China
Prior art keywords
voice
module
recognization rate
raising
phonetic recognization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012103607727A
Other languages
English (en)
Inventor
李红建
贾汇东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN2012103607727A priority Critical patent/CN102890931A/zh
Publication of CN102890931A publication Critical patent/CN102890931A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明涉及一种提高语音识别率的方法。本发明所述的方法的主要步骤为:首先使用信号采集设备采集语音振源产生的振源数据,然后将采集到的振源数据处理为语音信息后传输到语音识别系统,最后通过语音识别系统对语音信息进行识别。本发明的有益效果为,能够减少语音识别系统因为环境嘈杂、发音不清晰等因素导致的语音获取数据不完整的问题,能够有效的提升语音识别的准确性,提高语音识别率。本发明尤其适用于语音识别系统。

Description

提高语音识别率的方法
技术领域
本发明涉及一种提高语音识别率的方法。
背景技术
语音表达是人类可以自然表达的最直接的一种方式,因此语音输入技术被认为是人机交互发展的主要方向,目前越来越多的设备采用语音识别系统进行文字输入、语音控制以及语音交互。目前的语音设备系统主要通过语音输入设备捕捉语音在空气中的传播信号,这种语音接收方式的主要缺点是比如在嘈杂环境、不清晰的发音以及多人同时语音的情况下,会出现语音输入效果差、识别率低下甚至不能工作的问题,产生这些问题的主要原因在于现有的语音输入设备在接收语音信号时外界的其他声源干扰会影响语音输入设备采集到的语音数据。在目前的智能设备如智能电视中,语音控制功能已经成为主流配置,因此目前的语音系统语音识别率不准确的问题已经不能满足当前智能设备的需求。
发明内容
本发明所解决的问题,就是针对目前语音系统语音识别率低下的问题,提出了一种提高语音识别率的方法。
本发明解决上述技术问题所采用的技术方案是:提高语音识别率的方法,其特征在于,包括以下步骤:
a.使用信号采集设备采集语音振源产生的振源数据;
b.将采集到的振源数据处理为语音信息后传输到语音识别系统;
c.语音识别系统对语音信息进行识别。
具体的,所述信号采集设备为接触式振动感应器。
具体的,所述信号采集设备为内嵌有接触式振动感应器的手持设备。
具体的,所述手持设备为话筒、手机、平板电脑和遥控器中的一种或者多种。
具体的,所述语音识别系统包括语音采集编码模块、语音传输模块、语音识别模块和识别内容反馈模块,
所述语音采集编码模块用于接收振源数据信息,将其处理为计算机设备易于读取存储的信息,
所述语音传输模块用于将经过语音采集编码模块处理后的语音信息传输到计算机设备,传输的方式包括有线传输和无限传输,
所述语音识别模块用于识别语音信息,
所述识别内容反馈模块用于将识别出的语音信息反馈给用户。
具体的,所述识别反馈模块是以文字方式反馈识别的语音内容。
具体的,所述识别反馈模块是以声音方式反馈识别的语音内容。
具体的,所述语音识别模块识别语音信息包括以下步骤:
c1.提取语音信息中的语音特征信息;
c2.将提取出的语音特征信息与语音模板库中的语音特征信息进行对比并输出比较结果。
具体的,所述语音模板库设置在存储模块中。
具体的,所述语音模板库设置在与互联网连接的计算机存储模块中。
本发明的有益效果为,能够减少语音识别系统因为环境嘈杂、发音不清晰等因素导致的语音获取数据不完整的问题,能够有效的提升语音识别的准确性,提高语音识别率。
具体实施方式
下面详细描述本发明的技术方案:
本发明所述的提高语音识别率的方法,主要步骤为:首先使用信号采集设备采集语音振源产生的振源数据,通过采集振源数据,可以实现避免外界嘈杂环境的干扰;然后将采集到的振源数据处理为语音信息后传输到语音识别系统,采集到的振源数据通常为模拟信号,通过模数转换将其转换为计算机处理器可以直接处理的数字信号后传递到语音识别系统供使用;最后通过语音识别系统对语音信息进行识别。
一种具体的方案是,所述信号采集设备为接触式振动感应器。采用接触式振动感应器的优点在于,可将传感器置于如喉结等直接发声的部位,可通过喉结部位的振动获取振动源的内容,然后将其转化为语音识别系统可直接处理的信号作为语音输入源,从而实现减少外部环境的影响,提高语音识别率的目的。
一种优选的方案是,所述信号采集设备为内嵌有接触式振动感应器的手持设备。内嵌有接触式振动感应器的手持设备使用起来更为方便,可以更容易的采集各种发声源的信号,从而有效的提高了使用方便性。
一种具体的方案是,所述手持设备为话筒、手机、平板电脑和遥控器中的一种或者多种。话筒、手机、平板电脑和遥控器是目前较常使用的手持设备,也是目前经常用于语音控制的设备载体,因此将接触式振动感应器内置于这些设备中更便于使用。
一种具体的实现语音识别系统的方案是:所述语音识别系统包括语音采集编码模块、语音传输模块、语音识别模块和识别内容反馈模块。其中,语音采集编码模块用于接收振源数据信息,将其处理为计算机设备易于读取存储的信息;语音传输模块用于将经过语音采集编码模块处理后的语音信息传输到计算机设备,传输的方式包括有线传输和无限传输,接收语音信息的设备通常为接收语音控制的设备,如电脑、机顶盒和电视等;语音识别模块用于识别语音信息;识别内容反馈模块用于将识别出的语音信息反馈给用户。
一种具体的方案是,所述识别反馈模块是以文字方式反馈识别的语音内容。本方案的目的是提供一种通过语音输入字符的方法,输出的字符可以通过显示设备显示出来,同时也能够存储在计算机的存储设备中。
另一种具体的方案是,所述识别反馈模块是以声音方式反馈识别的语音内容。本方案的目的是提供一种语音传输的方法,将输入的语音传输到另外的设备输出,能够实现语音的传输与存储等。
一种具体的语音识别模块识别语音信息的主要步骤为:首先提取语音信息中的语音特征信息,这里所说的语音特征信息包括音调等语音所特有的能够区别出具体的语音信息的信息,从而能够实现语音的辨别;然后将提取出的语音特征信息与语音模板库中的语音特征信息进行对比并输出比较结果,这里的语音模板库中预先存储了大量的能够区别出具体语音信息的信息,能够更方便的识别出具体的语音来源,如预先存入公司所有员工的语音音色信息,从而能够准确的辨认出语音来自于某一个具体的员工。本方案的目的在于提供一种可行的能够辨别出语音来源的方法,从而使语音识别系统能够适用于各种具有不同需求的场合,极大的提高语音识别系统的适用范围。
一种具体的方案是,所述语音模板库设置在存储模块中。这里的存储模块主要是指接收语音信息的具备一定存储功能的智能设备。
一种更优选的方案是,所述语音模板库设置在与互联网连接的计算机存储模块中。本方案的目的在于提供更多的更方便获取的语音模板库,并且使存储有语音模板库的计算机设备能够适用于更大的范围。

Claims (10)

1.提高语音识别率的方法,其特征在于,包括以下步骤:
a.使用信号采集设备采集语音振源产生的振源数据;
b.将采集到的振源数据处理为语音信息后传输到语音识别系统;
c.语音识别系统对语音信息进行识别。
2.根据权利要求1所述的提高语音识别率的方法,其特征在于,所述信号采集设备为接触式振动感应器。
3.根据权利要求2所述的提高语音识别率的方法,其特征在于,所述信号采集设备为内嵌有接触式振动感应器的手持设备。
4.根据权利要求3所述的提高语音识别率的方法,其特征在于,所述手持设备为话筒、手机、平板电脑和遥控器中的一种或者多种。
5.根据权利要求1~4任意一项所述的提高语音识别率的方法,其特征在于,所述语音识别系统包括语音采集编码模块、语音传输模块、语音识别模块和识别内容反馈模块,
所述语音采集编码模块用于接收振源数据信息,将其处理为计算机设备易于读取存储的信息,
所述语音传输模块用于将经过语音采集编码模块处理后的语音信息传输到计算机设备,传输的方式包括有线传输和无限传输,
所述语音识别模块用于识别语音信息,
所述识别内容反馈模块用于将识别出的语音信息反馈给用户。
6.根据权利要求5所述的提高语音识别率的方法,其特征在于,所述识别反馈模块是以文字方式反馈识别的语音内容。
7.根据权利要求5所述的提高语音识别率的方法,其特征在于,所述识别反馈模块是以声音方式反馈识别的语音内容。
8.根据权利要求6或7所述的提高语音识别率的方法,其特征在于,所述语音识别模块识别语音信息包括以下步骤:
c1.提取语音信息中的语音特征信息;
c2.将提取出的语音特征信息与语音模板库中的语音特征信息进行对比并输出比较结果。
9.根据权利要求8所述的提高语音识别率的方法,其特征在于,所述语音模板库设置在存储模块中。
10.根据权利要求9所述的提高语音识别率的方法,其特征在于,所述语音模板库设置在与互联网连接的计算机存储模块中。
CN2012103607727A 2012-09-25 2012-09-25 提高语音识别率的方法 Pending CN102890931A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012103607727A CN102890931A (zh) 2012-09-25 2012-09-25 提高语音识别率的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012103607727A CN102890931A (zh) 2012-09-25 2012-09-25 提高语音识别率的方法

Publications (1)

Publication Number Publication Date
CN102890931A true CN102890931A (zh) 2013-01-23

Family

ID=47534418

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012103607727A Pending CN102890931A (zh) 2012-09-25 2012-09-25 提高语音识别率的方法

Country Status (1)

Country Link
CN (1) CN102890931A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105105898A (zh) * 2015-07-28 2015-12-02 安徽机电职业技术学院 基于三维压力检测的喉头送话器装置及其使用方法
CN105147429A (zh) * 2015-07-28 2015-12-16 安徽工程大学 喉头送话器装置及其使用方法
CN108182941A (zh) * 2017-12-28 2018-06-19 重庆柚瓣家科技有限公司 用于嘈杂环境下的人机交互模块
CN108536875A (zh) * 2018-06-12 2018-09-14 重庆靖帛天域科技发展有限公司 基于大数据语音交互的语言自主学习系统
CN108922519A (zh) * 2018-09-04 2018-11-30 江苏清投视讯科技有限公司 具有语音控制功能的图像处理系统
CN109686373A (zh) * 2019-02-27 2019-04-26 北京声智科技有限公司 一种语音识别方法及系统
CN110648676A (zh) * 2019-10-11 2020-01-03 东南大学 嘈杂环境下语音输出接收设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002039294A1 (fr) * 2000-11-10 2002-05-16 Ntt Docomo, Inc. Systeme d'authentification, appareil agent d'authentification, et terminal
JP2004037721A (ja) * 2002-07-02 2004-02-05 Pioneer Electronic Corp 音声応答システム、音声応答プログラム及びそのための記憶媒体
CN201532762U (zh) * 2009-06-04 2010-07-21 成都信息工程学院 个人专用同声传译装置
CN201622839U (zh) * 2009-12-16 2010-11-03 比亚迪股份有限公司 一种无线语音汽车远程控制系统
CN102404330A (zh) * 2011-11-30 2012-04-04 上海博泰悦臻电子设备制造有限公司 多用户同时在线管理方法和系统
CN102582576A (zh) * 2012-03-15 2012-07-18 福州海景科技开发有限公司 基于声音识别技术的车辆防盗和人身安全保护系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002039294A1 (fr) * 2000-11-10 2002-05-16 Ntt Docomo, Inc. Systeme d'authentification, appareil agent d'authentification, et terminal
JP2004037721A (ja) * 2002-07-02 2004-02-05 Pioneer Electronic Corp 音声応答システム、音声応答プログラム及びそのための記憶媒体
CN201532762U (zh) * 2009-06-04 2010-07-21 成都信息工程学院 个人专用同声传译装置
CN201622839U (zh) * 2009-12-16 2010-11-03 比亚迪股份有限公司 一种无线语音汽车远程控制系统
CN102404330A (zh) * 2011-11-30 2012-04-04 上海博泰悦臻电子设备制造有限公司 多用户同时在线管理方法和系统
CN102582576A (zh) * 2012-03-15 2012-07-18 福州海景科技开发有限公司 基于声音识别技术的车辆防盗和人身安全保护系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105105898A (zh) * 2015-07-28 2015-12-02 安徽机电职业技术学院 基于三维压力检测的喉头送话器装置及其使用方法
CN105147429A (zh) * 2015-07-28 2015-12-16 安徽工程大学 喉头送话器装置及其使用方法
CN108182941A (zh) * 2017-12-28 2018-06-19 重庆柚瓣家科技有限公司 用于嘈杂环境下的人机交互模块
CN108536875A (zh) * 2018-06-12 2018-09-14 重庆靖帛天域科技发展有限公司 基于大数据语音交互的语言自主学习系统
CN108922519A (zh) * 2018-09-04 2018-11-30 江苏清投视讯科技有限公司 具有语音控制功能的图像处理系统
CN109686373A (zh) * 2019-02-27 2019-04-26 北京声智科技有限公司 一种语音识别方法及系统
CN110648676A (zh) * 2019-10-11 2020-01-03 东南大学 嘈杂环境下语音输出接收设备

Similar Documents

Publication Publication Date Title
CN102890931A (zh) 提高语音识别率的方法
CN108227903B (zh) 一种虚拟现实语言交互系统与方法
CN103730116B (zh) 在智能手表上实现智能家居设备控制的系统及其方法
WO2020119448A1 (zh) 语音信息验证
CN101893993B (zh) 电子白板系统及其语音处理方法
CN105957514A (zh) 一种便携式聋哑人交流设备
CN104796584A (zh) 具有语音识别功能的提词装置
CN110992932B (zh) 一种自学习的语音控制方法、系统及存储介质
CN202796043U (zh) 一种语音识别系统
CN105556594A (zh) 声音识别处理装置、声音识别处理方法以及显示装置
CN105261356A (zh) 一种语音识别系统及方法
CN203164971U (zh) 便携式中英交流装置
CN104217718A (zh) 依据环境参数及群体趋向数据的语音识别方法和系统
CN104301522A (zh) 通讯中的信息输入方法及通讯终端
CN201213041Y (zh) 光学点读机
CN101593057A (zh) 一种点读机及其坐标定位方法
CN105975220B (zh) 一种语音打印辅助设备及语音打印系统
CN202979200U (zh) 一种输入装置及电视系统
CN209571226U (zh) 一种语音识别装置及系统
CN102262524A (zh) 基于无线输入设备的声音识别输入方法及实现装置
CN201796356U (zh) 一种能识别语音命令的计算机
CN208834732U (zh) 语音识别系统及其营销机
CN104166724A (zh) 一种捕捉关键词的中文语音应用于浏览器的方法
CN102750126B (zh) 语音输入方法及终端
CN204559707U (zh) 具有语音识别功能的提词装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130123