CN105913840A - 一种语音识别装置及移动终端 - Google Patents

一种语音识别装置及移动终端 Download PDF

Info

Publication number
CN105913840A
CN105913840A CN201610459193.6A CN201610459193A CN105913840A CN 105913840 A CN105913840 A CN 105913840A CN 201610459193 A CN201610459193 A CN 201610459193A CN 105913840 A CN105913840 A CN 105913840A
Authority
CN
China
Prior art keywords
module
mobile terminal
preprocessor
shell
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610459193.6A
Other languages
English (en)
Inventor
何宁宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CK TELECOM TECHNOLOGY EQUIPMENT (HEYUAN) Co Ltd
Original Assignee
CK TELECOM TECHNOLOGY EQUIPMENT (HEYUAN) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CK TELECOM TECHNOLOGY EQUIPMENT (HEYUAN) Co Ltd filed Critical CK TELECOM TECHNOLOGY EQUIPMENT (HEYUAN) Co Ltd
Priority to CN201610459193.6A priority Critical patent/CN105913840A/zh
Publication of CN105913840A publication Critical patent/CN105913840A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种语音识别装置及移动终端,包括外壳与硬件系统,所述外壳上设有若干个采集孔、重置按钮、确认按钮,所述硬件系统安装在外壳内,所述硬件系统包括语音采集模块、预处理器、语音提取模块、模式识别模块与数据库,所述语音采集模块与预处理器相连接,所述预处理器与模块识别模块相连接,所述模块识别模块与数据库相连接,所述数据库连接有字词提取模块,所述字词提取模块连接有后处理器,本发明具有很高的识别能力,与传统的语音识别理念相比,通过非线性处理,大大的提高了识别效率与精度,具有较为广阔的市场前景。

Description

一种语音识别装置及移动终端
技术领域
本发明涉及语音处理设备领域,具体为一种语音识别装置及移动终端。
背景技术
语音识别由于其重要的理论价值与广阔的应用前景,受到人们的广泛重视。到目前为止,语音识别研究大部分以线性系统理论为基础,主要应用隐马尔可夫模型与动态时间规整等技术。随着研究的逐步深入,人们发现语音是一个复杂的非线性过程,基于线性系统理论的语音识别方法的局限性越来越凸显。语音识别若要取得突破,必须引入非线性理论的方法。近年来,人工神经网络、混沌、分形等非线性理论研究和应用的逐渐深入,将这些理论应用于语音识别成为可能。因此,针对以上问题设计一种语音识别装置及移动终端是十分必要的。
发明内容
针对以上问题,本发明提供了一种语音识别装置及移动终端,本发明具有很高的识别能力,与传统的语音识别理念相比,通过非线性处理,大大的提高了识别效率与精度,具有较为广阔的市场前景,可以有效解决背景技术中的问题。
为实现上述目的,本发明提供如下技术方案:一种语音识别装置及移动终端,包括外壳与硬件系统,所述外壳上设有若干个采集孔、重置按钮、确认按钮,所述硬件系统安装在外壳内,所述硬件系统包括语音采集模块、预处理器、语音提取模块、模式识别模块与数据库,所述语音采集模块与预处理器相连接,所述预处理器与模块识别模块相连接,所述模块识别模块与数据库相连接,所述数据库连接有字词提取模块,所述字词提取模块连接有后处理器。
作为本发明一种优选的技术方案,所述语音采集模块采用的是扬声器。
作为本发明一种优选的技术方案,所述语音提取模块包括短时参数提取单元与超音段特征提取单元。
作为本发明一种优选的技术方案,所述采集孔的直径为1-1.5mm。
作为本发明一种优选的技术方案,所述预处理模块包括杂波过滤单元与音节阻断单元。
与现有技术相比,本发明的有益效果是:本发明设计的语音识别硬件系统的基本原理首先增加语音信号的预处理过程,包括预加重、加窗分帧处理与端点检测等环节,这样就大大的提高了语音的非线性处理,使原本复杂,混乱的语音变的有章可循,方便了以后的处理,提高了语音的识别程度,通过数据库的比对,使识别精度大大的提高了,另外采用统计的训练方法将底层的声学模型和上层的语音模型融入统一的语音识别搜索算法中,可以获得较好的识别效果,因此本发明具有很高的识别能力,与传统的语音识别理念相比,通过非线性处理,大大的提高了识别效率与精度,具有较为广阔的市场前景。
附图说明
图1为本发明整体结构示意图;
图2为本发明硬件系统结构框图;
图中:1-外壳;2-硬件系统;3-采集孔;4-重置按钮;5-确认按钮;6-语音采集模块;7-预处理器;8-语音提取模块;9-模式识别模块;10-数据库;11-字词提取模块;12-后处理器;13-短时参数提取单元;14-超音段特征提取单元;15-杂波过滤单元;16-音节阻断单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:
请参阅图1与图2,本发明提供一种技术方案:一种语音识别装置及移动终端,包括外壳1与硬件系统2,所述外壳1上设有若干个采集孔3、重置按钮4、确认按钮5,所述硬件系统2安装在外壳1内,所述硬件系统2包括语音采集模块6、预处理器7、语音提取模块8、模式识别模块9与数据库10,所述语音采集模块6与预处理器7相连接,所述预处理器7与模块识别模块9相连接,所述模块识别模块9与数据库10相连接,所述数据库10连接有字词提取模块11,所述字词提取模块11连接有后处理器12。
在上述实施例中优选的,所述语音采集模块6采用的是扬声器。
在上述实施例中优选的,所述语音提取模块8包括短时参数提取单元13与超音段特征提取单元14。
在上述实施例中优选的,所述采集孔3的直径为1-1.5mm。
在上述实施例中优选的,所述预处理器7包括杂波过滤单元15与音节阻断单元16。
基于上述,本发明具有的优点在于:本发明设计的语音识别硬件系统的基本原理首先增加语音信号的预处理过程,包括预加重、加窗分帧处理与端点检测等环节,这样就大大的提高了语音的非线性处理,使原本复杂,混乱的语音变的有章可循,方便了以后的处理,提高了语音的识别程度,通过数据库的比对,使识别精度大大的提高了,另外采用统计的训练方法将底层的声学模型和上层的语音模型融入统一的语音识别搜索算法中,可以获得较好的识别效果,因此本发明具有很高的识别能力,与传统的语音识别理念相比,通过非线性处理,大大的提高了识别效率与精度,具有较为广阔的市场前景。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种语音识别装置及移动终端,其特征在于:包括外壳(1)与硬件系统(2),所述外壳(1)上设有若干个采集孔(3)、重置按钮(4)、确认按钮(5),所述硬件系统(2)安装在外壳(1)内,所述硬件系统(2)包括语音采集模块(6)、预处理器(7)、语音提取模块(8)、模式识别模块(9)与数据库(10),所述语音采集模块(6)与预处理器(7)相连接,所述预处理器(7)与模块识别模块(9)相连接,所述模块识别模块(9)与数据库(10)相连接,所述数据库(10)连接有字词提取模块(11),所述字词提取模块(11)连接有后处理器(12)。
2.根据权利要求1所述的一种信息输入装置及移动终端,其特征在于:所述语音采集模块(6)采用的是扬声器。
3.根据权利要求1所述的一种信息输入装置及移动终端,其特征在于:所述语音提取模块(8)包括短时参数提取单元(13)与超音段特征提取单元(14)。
4.根据权利要求1所述的一种信息输入装置及移动终端,其特征在于:所述采集孔(3)的直径为1-1.5mm。
5.根据权利要求1所述的一种信息输入装置及移动终端,其特征在于:所述预处理器(7)包括杂波过滤单元(15)与音节阻断单元(16)。
CN201610459193.6A 2016-06-20 2016-06-20 一种语音识别装置及移动终端 Pending CN105913840A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610459193.6A CN105913840A (zh) 2016-06-20 2016-06-20 一种语音识别装置及移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610459193.6A CN105913840A (zh) 2016-06-20 2016-06-20 一种语音识别装置及移动终端

Publications (1)

Publication Number Publication Date
CN105913840A true CN105913840A (zh) 2016-08-31

Family

ID=56759330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610459193.6A Pending CN105913840A (zh) 2016-06-20 2016-06-20 一种语音识别装置及移动终端

Country Status (1)

Country Link
CN (1) CN105913840A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1538383A (zh) * 2003-03-24 2004-10-20 用于移动计算设备的分布式语音识别
CN101286317A (zh) * 2008-05-30 2008-10-15 同济大学 语音识别装置、模型训练方法、及交通信息服务平台
CN202058443U (zh) * 2011-05-09 2011-11-30 杨捷 一种鸟类语音识别系统
CN102789779A (zh) * 2012-07-12 2012-11-21 广东外语外贸大学 一种语音识别系统及其识别方法
CN103065629A (zh) * 2012-11-20 2013-04-24 广东工业大学 一种仿人机器人的语音识别系统
CN103236260A (zh) * 2013-03-29 2013-08-07 京东方科技集团股份有限公司 语音识别系统
CN103915092A (zh) * 2014-04-01 2014-07-09 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN104038864A (zh) * 2013-03-08 2014-09-10 亚德诺半导体股份有限公司 带有语音识别的麦克风电路总成和系统
CN105261356A (zh) * 2015-10-30 2016-01-20 桂林信通科技有限公司 一种语音识别系统及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1538383A (zh) * 2003-03-24 2004-10-20 用于移动计算设备的分布式语音识别
CN101286317A (zh) * 2008-05-30 2008-10-15 同济大学 语音识别装置、模型训练方法、及交通信息服务平台
CN202058443U (zh) * 2011-05-09 2011-11-30 杨捷 一种鸟类语音识别系统
CN102789779A (zh) * 2012-07-12 2012-11-21 广东外语外贸大学 一种语音识别系统及其识别方法
CN103065629A (zh) * 2012-11-20 2013-04-24 广东工业大学 一种仿人机器人的语音识别系统
CN104038864A (zh) * 2013-03-08 2014-09-10 亚德诺半导体股份有限公司 带有语音识别的麦克风电路总成和系统
CN103236260A (zh) * 2013-03-29 2013-08-07 京东方科技集团股份有限公司 语音识别系统
CN103915092A (zh) * 2014-04-01 2014-07-09 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN105261356A (zh) * 2015-10-30 2016-01-20 桂林信通科技有限公司 一种语音识别系统及方法

Similar Documents

Publication Publication Date Title
CN107767861A (zh) 语音唤醒方法、系统及智能终端
CN100349206C (zh) 文字语音互转装置
CN109754790B (zh) 一种基于混合声学模型的语音识别系统及方法
US9542938B2 (en) Scene recognition method, device and mobile terminal based on ambient sound
CN103514883B (zh) 一种自适应实现男女声切换方法
CN105702252B (zh) 一种语音识别方法及装置
CN102855872A (zh) 基于终端及互联网语音交互的家电控制方法及系统
CN103093755A (zh) 基于终端及互联网语音交互的网络家电控制方法及系统
CN105261356A (zh) 一种语音识别系统及方法
CN102855875B (zh) 基于外部开启控制语音输入的网络语音转换控制系统和方法
CN104269169B (zh) 一种混叠音频事件分类方法
CN102831195B (zh) 个性化语音采集与语义确定系统及其方法
CN103236258B (zh) 基于巴氏距离最优小波包分解的语音情感特征提取方法
CN105895082A (zh) 声学模型训练方法、语音识别方法及装置
CN106898355A (zh) 一种基于二次建模的说话人识别方法
Wang et al. Research on speech emotion recognition technology based on deep and shallow neural network
CN106782502A (zh) 一种儿童机器人用的语音识别装置
CN107134277A (zh) 一种基于gmm模型的语音激活检测方法
CN104952446A (zh) 基于语音交互的数字楼盘展示系统
CN105575387A (zh) 基于听觉仿生中耳蜗基底膜的声源定位方法
CN203386472U (zh) 一种个性语音变声装置
CN113077798B (zh) 一种居家老人呼救设备
CN109377982B (zh) 一种有效语音获取方法
CN204463573U (zh) 一种新型普通话训练装置
CN105913840A (zh) 一种语音识别装置及移动终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160831

RJ01 Rejection of invention patent application after publication