CN108022584A - 办公室语音识别优化方法 - Google Patents

办公室语音识别优化方法 Download PDF

Info

Publication number
CN108022584A
CN108022584A CN201711222908.7A CN201711222908A CN108022584A CN 108022584 A CN108022584 A CN 108022584A CN 201711222908 A CN201711222908 A CN 201711222908A CN 108022584 A CN108022584 A CN 108022584A
Authority
CN
China
Prior art keywords
office
voice
feature
optimization method
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711222908.7A
Other languages
English (en)
Inventor
徐健华
范传奇
梅志
易昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhu Xingtu Robot Technology Co Ltd
Original Assignee
Wuhu Xingtu Robot Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhu Xingtu Robot Technology Co Ltd filed Critical Wuhu Xingtu Robot Technology Co Ltd
Priority to CN201711222908.7A priority Critical patent/CN108022584A/zh
Publication of CN108022584A publication Critical patent/CN108022584A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及语音识别领域,公开办公室语音识别优化方法,该办公室语音识别优化方法包括:步骤1,对办公室的语音信号进行预处理,得到离散数字信号;步骤2,根据所述离散数字信号判定为噪声的情况下,进行去除,否则执行步骤3;步骤3,对离散数字信号进行特征提取,并将所提取的特征与预生成的模板进行比对,判断语音信号的来源。该办公室语音识别优化方法克服了现有技术中的办公室语音无法优化的问题,实现了办公室语音的优化。

Description

办公室语音识别优化方法
技术领域
本发明涉及语音识别领域,具体地,涉及办公室语音识别优化方法。
背景技术
语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
现阶段对于办公室语音识别方式比较单一,语音识别的效果不好,无法实现噪声的去除。
发明内容
本发明的目的是提供一种办公室语音识别优化方法,该办公室语音识别优化方法克服了现有技术中的办公室语音无法优化的问题,实现了办公室语音的优化。
为了实现上述目的,本发明提供一种办公室语音识别优化方法,该办公室语音识别优化方法包括:
步骤1,对办公室的语音信号进行预处理,得到离散数字信号;
步骤2,根据所述离散数字信号判定为噪声的情况下,进行去除,否则执行步骤3;
步骤3,对离散数字信号进行特征提取,并将所提取的特征与预生成的模板进行比对,判断语音信号的来源。
优选地,在步骤1中,对办公室的语音信号进行预处理的方法包括:
步骤11,获取语音信号;
步骤12,对所获取的语音信号进行调理;
步骤13,对调理后的语音信号进行AD转换,得到离散数字信号。
优选地,在步骤3中,该办公室语音识别优化方法还包括:
对离散数字信号进行特征提取,并将所提取的特征进行存储生成训练模板。
优选地,将所提取的特征通过数据存储器进行存储。
优选地,在步骤3中,将所提取的特征与预生成的模板进行比对,判断语音信号的来源的方法包括:
预设语音转换系统,在所提取的特征与预生成的模板比对成功的情况下,将该所提取的特征所对应的人员输出。
优选地,将该所提取的特征所对应的人员输出的方法包括:
将该所提取的特征所对应的人员信息在滤波放大后,通过喇叭进行播放。
通过上述技术方案,对办公室的语音识别方式进行了优化,首先对语音信号进行了预处理,先进行了调理,再进行去噪,保证了语音信号的真实和有效性,利用特征提取方法,将其语音信号与预生成的模板进行比对,以最终判断出其来源,从而实现语音的优化识别和传输。
本发明的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:
图1是说明本发明的一种办公室语音识别优化方法的流程图。
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
本发明提供一种办公室语音识别优化方法,该办公室语音识别优化方法包括:
步骤1,对办公室的语音信号进行预处理,得到离散数字信号;
步骤2,根据所述离散数字信号判定为噪声的情况下,进行去除,否则执行步骤3;
步骤3,对离散数字信号进行特征提取,并将所提取的特征与预生成的模板进行比对,判断语音信号的来源。
通过上述技术方案,对办公室的语音识别方式进行了优化,首先对语音信号进行了预处理,先进行了调理,再进行去噪,保证了语音信号的真实和有效性,利用特征提取方法,将其语音信号与预生成的模板进行比对,以最终判断出其来源,从而实现语音的优化识别和传输。
在本发明的一种具体实施方式中,在步骤1中,对办公室的语音信号进行预处理的方法可以包括:
步骤11,获取语音信号;
步骤12,对所获取的语音信号进行调理;
步骤13,对调理后的语音信号进行AD转换,得到离散数字信号。
通过上述的实施方式,可以实现语音信号的预处理,并对信号依次进行调理和AD转换,最终得到了离散的数字信号方便进行进一步的处理。
在本发明的一种具体实施方式中,为了预先得到模板,可以得到比对的数据库,在步骤3中,该办公室语音识别优化方法还可以包括:
对离散数字信号进行特征提取,并将所提取的特征进行存储生成训练模板。
在该种实施方式中,将所提取的特征通过数据存储器进行存储。从而方便了数据的调用和保存,实现了数据的整体化。
在本发明的一种具体实施方式中,在步骤3中,将所提取的特征与预生成的模板进行比对,判断语音信号的来源的方法可以包括:
预设语音转换系统,在所提取的特征与预生成的模板比对成功的情况下,将该所提取的特征所对应的人员输出。
通过上述的实施方式,可以得出对应的人员,并重复覆盖人员的信息,从而实现了人员的语音识别。
在该种实施方式中,为了让信号可以放大输出,并且可以广播播放,将该所提取的特征所对应的人员输出的方法可以包括:
将该所提取的特征所对应的人员信息在滤波放大后,通过喇叭进行播放。
通过上述的实施方式,可以实现滤波信号后的广播播放。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

Claims (6)

1.一种办公室语音识别优化方法,其特征在于,该办公室语音识别优化方法包括:
步骤1,对办公室的语音信号进行预处理,得到离散数字信号;
步骤2,根据所述离散数字信号判定为噪声的情况下,进行去除,否则执行步骤3;
步骤3,对离散数字信号进行特征提取,并将所提取的特征与预生成的模板进行比对,判断语音信号的来源。
2.根据权利要求1所述的办公室语音识别优化方法,其特征在于,在步骤1中,对办公室的语音信号进行预处理的方法包括:
步骤11,获取语音信号;
步骤12,对所获取的语音信号进行调理;
步骤13,对调理后的语音信号进行AD转换,得到离散数字信号。
3.根据权利要求1所述的办公室语音识别优化方法,其特征在于,在步骤3中,该办公室语音识别优化方法还包括:
对离散数字信号进行特征提取,并将所提取的特征进行存储生成训练模板。
4.根据权利要求3所述的办公室语音识别优化方法,其特征在于,将所提取的特征通过数据存储器进行存储。
5.根据权利要求1所述的办公室语音识别优化方法,其特征在于,在步骤3中,将所提取的特征与预生成的模板进行比对,判断语音信号的来源的方法包括:
预设语音转换系统,在所提取的特征与预生成的模板比对成功的情况下,将该所提取的特征所对应的人员输出。
6.根据权利要求5所述的办公室语音识别优化方法,其特征在于,将该所提取的特征所对应的人员输出的方法包括:
将该所提取的特征所对应的人员信息在滤波放大后,通过喇叭进行播放。
CN201711222908.7A 2017-11-29 2017-11-29 办公室语音识别优化方法 Pending CN108022584A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711222908.7A CN108022584A (zh) 2017-11-29 2017-11-29 办公室语音识别优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711222908.7A CN108022584A (zh) 2017-11-29 2017-11-29 办公室语音识别优化方法

Publications (1)

Publication Number Publication Date
CN108022584A true CN108022584A (zh) 2018-05-11

Family

ID=62077311

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711222908.7A Pending CN108022584A (zh) 2017-11-29 2017-11-29 办公室语音识别优化方法

Country Status (1)

Country Link
CN (1) CN108022584A (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020013702A1 (en) * 2000-06-26 2002-01-31 Lee Soo Young Efficient voice recognition system based on auditory model
CN1567431A (zh) * 2003-07-10 2005-01-19 上海优浪信息科技有限公司 一种说话者身份识别方法和系统
CN101404160A (zh) * 2008-11-21 2009-04-08 北京科技大学 一种基于音频识别的语音降噪方法
CN102074230A (zh) * 2009-11-20 2011-05-25 索尼公司 语音识别装置、语音识别方法和程序
CN102509547A (zh) * 2011-12-29 2012-06-20 辽宁工业大学 基于矢量量化的声纹识别方法及系统
CN103236260A (zh) * 2013-03-29 2013-08-07 京东方科技集团股份有限公司 语音识别系统
CN105118501A (zh) * 2015-09-07 2015-12-02 徐洋 语音识别的方法及系统
CN106657865A (zh) * 2016-12-16 2017-05-10 联想(北京)有限公司 会议纪要的生成方法、装置及视频会议系统
CN107172018A (zh) * 2017-04-27 2017-09-15 华南理工大学 公共背景噪声下激活式的声纹密码安全控制方法及系统
CN107210040A (zh) * 2015-02-11 2017-09-26 三星电子株式会社 语音功能的操作方法和支持该方法的电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020013702A1 (en) * 2000-06-26 2002-01-31 Lee Soo Young Efficient voice recognition system based on auditory model
CN1567431A (zh) * 2003-07-10 2005-01-19 上海优浪信息科技有限公司 一种说话者身份识别方法和系统
CN101404160A (zh) * 2008-11-21 2009-04-08 北京科技大学 一种基于音频识别的语音降噪方法
CN102074230A (zh) * 2009-11-20 2011-05-25 索尼公司 语音识别装置、语音识别方法和程序
CN102509547A (zh) * 2011-12-29 2012-06-20 辽宁工业大学 基于矢量量化的声纹识别方法及系统
CN103236260A (zh) * 2013-03-29 2013-08-07 京东方科技集团股份有限公司 语音识别系统
CN107210040A (zh) * 2015-02-11 2017-09-26 三星电子株式会社 语音功能的操作方法和支持该方法的电子设备
CN105118501A (zh) * 2015-09-07 2015-12-02 徐洋 语音识别的方法及系统
CN106657865A (zh) * 2016-12-16 2017-05-10 联想(北京)有限公司 会议纪要的生成方法、装置及视频会议系统
CN107172018A (zh) * 2017-04-27 2017-09-15 华南理工大学 公共背景噪声下激活式的声纹密码安全控制方法及系统

Similar Documents

Publication Publication Date Title
CN102483926B (zh) 在处理语音信号中通过把语音作为目标和忽略噪声以降噪的系统及方法
US10811030B2 (en) System and apparatus for real-time speech enhancement in noisy environments
CN110197670B (zh) 音频降噪方法、装置及电子设备
CN107578769A (zh) 语音数据标注方法和装置
CN103686571B (zh) 助听设备的音调语言的双耳增强方法及助听系统
CN110473547B (zh) 一种语音识别方法
CN105448303A (zh) 语音信号的处理方法和装置
CN101996630A (zh) 基于二进时频单元的自动声音识别
CN112786064B (zh) 一种端到端的骨气导语音联合增强方法
TW201225688A (en) Method and hearing aid of enhancing sound accuracy heard by a hearing-impaired listener
CN110808030B (zh) 语音唤醒方法、系统、存储介质及电子设备
CN108494952A (zh) 语音通话处理方法及相关设备
TWI543634B (zh) 處理聲音段之方法及其電腦程式產品及助聽器
CN108022584A (zh) 办公室语音识别优化方法
CN107274895A (zh) 一种语音识别设备及方法
CN103730117A (zh) 一种自适应智能语音装置及方法
CN110136741B (zh) 一种基于多尺度上下文的单通道语音增强方法
CN110534110B (zh) 一种机器人及提高其语音交互识别率的方法、装置和电路
CN110459206A (zh) 一种基于双机器识别的语音识别系统及方法
CN110992966B (zh) 一种人声分离方法及系统
CN108594989A (zh) 脑电波采集方法及相关设备
CN112687275A (zh) 一种语音过滤方法和过滤系统
CN110070874B (zh) 一种针对声纹识别的语音降噪方法及装置
CN108899010A (zh) 适用于多种口音的交互系统
Zhao Design of continuous recognition algorithm for online interactive english speech segment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180511