CN101950564A - 一种远程数字化语音采集分析识别系统 - Google Patents

一种远程数字化语音采集分析识别系统 Download PDF

Info

Publication number
CN101950564A
CN101950564A CN2010105055500A CN201010505550A CN101950564A CN 101950564 A CN101950564 A CN 101950564A CN 2010105055500 A CN2010105055500 A CN 2010105055500A CN 201010505550 A CN201010505550 A CN 201010505550A CN 101950564 A CN101950564 A CN 101950564A
Authority
CN
China
Prior art keywords
voice
noise
remote digital
recognition system
characteristic parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010105055500A
Other languages
English (en)
Inventor
杨际荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZHENJIANG HUAYANG INFORMATION TECHNOLOGY CO LTD
Original Assignee
ZHENJIANG HUAYANG INFORMATION TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZHENJIANG HUAYANG INFORMATION TECHNOLOGY CO LTD filed Critical ZHENJIANG HUAYANG INFORMATION TECHNOLOGY CO LTD
Priority to CN2010105055500A priority Critical patent/CN101950564A/zh
Publication of CN101950564A publication Critical patent/CN101950564A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开一种远程数字化语音采集分析识别系统,包括语音采集装置、传输装置、语音分析识别装置和控制中心,语音信号通过语音采集装置、传输装置传输到语音分析识别装置;其特征在于:所述语音分析识别装置包括语音分析模块、语音存储模块、语音输出模块;系统自动把采集到的语音通过语音分析模块进行编码操作,经抗噪方法处理后,得到纯净的语音信号,并把有效的声音和语音库进行对比,识别出语音的身份,然后利用计算机局域网网络电路,传送至远程的控制中心。这种系统实时性强、信号准确、功能强大灵敏性高、方便、经济长期有效性,语音监控系统可以长期有效工作,提供信息准确,且极少失误;保真性高。

Description

一种远程数字化语音采集分析识别系统
技术领域
本发明涉及高噪声环境下的语音控制领域,特别涉及一种远程数字化语音采集分析识别系统。
背景技术
语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统。20世纪80年代末,随着实验室语音识别研究的巨大突破,计算机技术、软件技术和存储技术的发展突飞猛进,语音技术的商业应用开始掀起浪潮。
语音识别技术研究和应用的重要发展趋势是,让人在任何地方,任何时间,对任何事都能够通过语音交互的方式,更加方便地享受到更多的社会信息资源和现代化服务。人类将越来越多地体验到语音识别技术可能的便捷优点。
近十年来,语音识别的产品也逐渐多起来,例如Motorola的语音拨号电话、IBM的语音听写机等。但是,现有的语音识别系统都存在一个共同的问题,即性能不稳定,不同的用户、不同的信道、不同的背景噪音环境、不同的口音和发音方式都对识别性能有很大的影响。在实验室环境下,很多计算机语音识别系统有很好的性能,但是当环境噪音很大,即信噪比很低时,系统的识别性能将急剧变坏,有的甚至会使识别系统的误识率增加好几倍。
发明内容
发明目的:本发明的目的在于针对现有技术的不足,提供一种能够提高语音信号的质量,降低识别系统的误差的远程数字化语音采集分析识别系统。
技术方案:一种远程数字化语音采集分析识别系统,包括语音采集装置、传输装置、语音分析识别装置和控制中心,语音信号通过语音采集装置、传输装置传输到语音分析识别装置;其特征在于:所述语音分析识别装置包括语音分析模块、语音存储模块、语音输出模块;系统自动把采集到的语音通过语音分析模块进行编码操作,经抗噪方法处理后,得到纯净的语音信号,并把有效的声音和语音库进行对比,识别出语音的身份,然后利用计算机局域网网络电路,传送至远程的控制中心。
较佳的,所述抗噪方法包括以下三种具体方法:
1)信号级抗噪处理:这种处理是从带噪语音信号中提取尽可能纯净的原始语音,在语音信号处理中称为语音增强。
2)特征参数级抗噪处理:该法又分为三类:第一类在特征参数的计算过程中去除噪音的影响;第二类是特征参数变换法;第三类是提取新的抗噪特征参数。
3)模型级抗噪处理:该法主要有两类,一类是用与测试集有相同环境的少数数据对模型进行快速适应,这是一种对噪音模型的自适应方法。另一类是直接在识别模型中增加对环境噪音的处理。
将信号级抗噪法得到的端点信息与特征参数标准化方法结合使用,能够明显地提高识别器的性能。三种抗噪方法的综合,识别效果更好。
较佳的,系统自动把采集到的语音通过语音分析模块进行编码操作进行分析识别,筛选出无效的声音,并把有效的声音和语音库进行对比,从而识别出语音的身份;如果发现其没有相对应的信息资料,通过语音存储模块系统会自动建立语音信息资料,并要求相关工作人员补充完整语音信息。
较佳的,所述语音采集装置包括控制主机的十六路数字语音硬盘和安装在现场的十六路监听设备,所述十六路数字语音硬盘控制管理前端的十六路监听信息。
较佳的,所述传输装置包括线缆、光纤、微波、双绞线的一种或几种,以及调制与解调设备;传输装置把现场传来的电信号传送到控制中心,终端系统部分的主要设备是显示和记录采集到的语音信息,并进行语音分析。
有益效果:本发明与现有技术相比的有益效果:(1)实时性强,可实时监听现场语音,并通过有线载体实时传输到监控中心;(2)信号准确,误识率低,可进行高噪声环境下的语音控制;(3)功能强大,可同时实现数字录音、录音检索、通话监听、网络监听、语音分析和网络查询等操作;(4)高灵敏性,可以监听很微小的声响,并分析清楚不同的声音;(5)方便、经济,录取的语音资料存储在计算机的硬盘上,并通过附加设施刻录在光盘上进行长期保存;(6)长期有效性,语音监控系统可以长期有效工作,提供信息准确,且极少失误;(7)高保真性,数码系统所提取及记录的声音资料在各方面都十分真实、清晰,毫不失真。
附图说明
图1为本发明的数字语音采集分析识别系统工作原理示意图;
图2为本发明的语音抗噪方法的总体流程图;
具体实施方式
下面结合附图,通过实施例,对本发明技术方案进行详细说明,但是本发明的保护范围不局限于所述实施例。
实施例1:如图1和图2所示,一种远程数字化语音采集分析识别系统,包括语音采集装置、传输装置、语音分析识别装置和控制中心,语音信号通过语音采集装置、传输装置传输到语音分析识别装置;其特征在于:所述语音分析识别装置包括语音分析模块、语音存储模块、语音输出模块;系统自动把采集到的语音通过语音分析模块进行编码操作,经抗噪方法处理后,得到纯净的语音信号,并把有效的声音和语音库进行对比,识别出语音的身份,然后利用计算机局域网网络电路,传送至远程的控制中心。
抗噪方法包括以下三种具体方法:
1)信号级抗噪处理:这种处理是从带噪语音信号中提取尽可能纯净的原始语音,在语音信号处理中称为语音增强。
2)特征参数级抗噪处理:该法又分为三类:第一类在特征参数的计算过程中去除噪音的影响;第二类是特征参数变换法;第三类是提取新的抗噪特征参数。
3)模型级抗噪处理:该法主要有两类,一类是用与测试集有相同环境的少数数据对模型进行快速适应,这是一种对噪音模型的自适应方法。另一类是直接在识别模型中增加对环境噪音的处理。
将信号级抗噪法得到的端点信息与特征参数标准化方法结合使用,能够明显地提高识别器的性能。三种抗噪方法的综合,识别效果更好。
系统自动把采集到的语音通过语音分析模块进行编码操作进行分析识别,筛选出无效的声音,并把有效的声音和语音库进行对比,从而识别出语音的身份;如果发现其没有相对应的信息资料,通过语音存储模块系统会自动建立语音信息资料,并要求相关工作人员补充完整语音信息。
所述语音采集装置包括控制主机的十六路数字语音硬盘和安装在现场的监听设备,所述十六路数字语音硬盘控制管理前端的十六路监听信息,能够完成多路电话线路互不干扰录音、实时监听、查询、回放录音等功能,并实现对录音文件的有效管理,能自动备份、自动删除文件;现场的监听设备任务是对所有的语音进行监听采集并将其转换成电信号。
所述传输装置包括线缆、光纤、微波、双绞线的一种或几种,以及调制与解调设备;传输装置把现场传来的电信号传送到控制中心,终端系统部分的主要设备是显示和记录采集到的语音信息,并进行语音分析。
本发明工作时,通过十六路监听设备采集语音,对采集的语音进行初步的分析,即对采集到的语音与语音数据库和噪声数据库进行比对,将比对的结果通过数据准备模块进行格式、信噪比转换等,然后将语音数据通过抗噪方法处理后,识别出语音身份,最后将识别结果通过传输装置传送到控制中心,通过性能分析模块进行后处理。如果发现其没有相对应的信息资料而不能识别语音身份,通过语音存储模块系统会自动建立语音信息资料,并要求相关工作人员补充完整语音信息。
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上作出各种变化。

Claims (10)

1.一种远程数字化语音采集分析识别系统,包括语音采集装置、传输装置、语音分析识别装置和控制中心,语音信号通过语音采集装置、传输装置传输到语音分析识别装置;其特征在于:所述语音分析识别装置包括语音分析模块、语音存储模块、语音输出模块;系统自动把采集到的语音通过语音分析模块进行编码操作,经抗噪方法处理后,得到纯净的语音信号,并把有效的声音和语音库进行对比,识别出语音的身份,然后利用计算机局域网网络电路,传送至远程的控制中心。
2.如权利要求1所述的远程数字化语音采集分析识别系统,其特征在于:所述抗噪方法,包括以下至少一种方法:
1)信号级抗噪处理方法:从带噪语音信号中提取尽可能纯净的原始语音;
2)特征参数级抗噪处理方法;
3)模型级抗噪处理方法。
3.如权利要求2所述的远程数字化语音采集分析识别系统,其特征在于:所述特征参数级抗噪处理方法为在特征参数的计算过程中去除噪音的影响。
4.如权利要求2所述的远程数字化语音采集分析识别系统,其特征在于:所述特征参数级抗噪处理方法为特征参数变换法。
5.如权利要求2所述的远程数字化语音采集分析识别系统,其特征在于:所述特征参数级抗噪处理方法为提取新的抗噪特征参数。
6.如权利要求2所述的远程数字化语音采集分析识别系统,其特征在于:所述模型级抗噪处理方法为用与测试集有相同环境的少数数据对模型进行快速适应。
7.如权利要求2所述的远程数字化语音采集分析识别系统,其特征在于:所述模型级抗噪处理方法为直接在识别模型中增加对环境噪音的处理。
8.如权利要求1至7任一所述的远程数字化语音采集分析识别系统,其特征在于:系统自动把采集到的语音通过语音分析模块进行编码操作进行分析识别,筛选出无效的声音,并把有效的声音和语音库进行对比,从而识别出语音的身份;如果发现其没有相对应的信息资料,通过语音存储模块系统会自动建立语音信息资料,并要求相关工作人员补充完整语音信息。
9.如权利要求1至7任一所述的远程数字化语音采集分析识别系统,其特征在于:所述语音采集装置包括控制主机的十六路数字语音硬盘和安装在现场的十六路监听设备,所述十六路数字语音硬盘控制管理前端的十六路监听信息。
10.如权利要求1至7任一所述的远程数字化语音采集分析识别系统,其特征在于:所述传输装置包括线缆、光纤、微波、双绞线的一种或几种,以及调制与解调设备;传输装置把现场传来的电信号传送到控制中心,终端系统部分的主要设备是显示和记录采集到的语音信息,并进行语音分析。
CN2010105055500A 2010-10-13 2010-10-13 一种远程数字化语音采集分析识别系统 Pending CN101950564A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105055500A CN101950564A (zh) 2010-10-13 2010-10-13 一种远程数字化语音采集分析识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105055500A CN101950564A (zh) 2010-10-13 2010-10-13 一种远程数字化语音采集分析识别系统

Publications (1)

Publication Number Publication Date
CN101950564A true CN101950564A (zh) 2011-01-19

Family

ID=43454034

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105055500A Pending CN101950564A (zh) 2010-10-13 2010-10-13 一种远程数字化语音采集分析识别系统

Country Status (1)

Country Link
CN (1) CN101950564A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102723081A (zh) * 2012-05-30 2012-10-10 林其灿 语音信号处理方法、语音和声纹识别方法及其装置
CN104332159A (zh) * 2014-10-30 2015-02-04 上海修源网络科技有限公司 一种车载语音操作系统人机互动方法及装置
CN109119071A (zh) * 2018-09-26 2019-01-01 珠海格力电器股份有限公司 一种语音识别模型的训练方法及装置
CN110516265A (zh) * 2019-08-31 2019-11-29 青岛谷力互联科技有限公司 一种基于智能语音的单一识别实时翻译系统
CN112581967A (zh) * 2020-11-06 2021-03-30 厦门快商通科技股份有限公司 一种声纹检索方法及前端后端服务器、后端服务器

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1746972A (zh) * 2004-09-09 2006-03-15 上海优浪信息科技有限公司 一种语音锁
CN1867966A (zh) * 2003-10-03 2006-11-22 旭化成株式会社 数据处理单元和数据处理单元控制程序
CN101211615A (zh) * 2006-12-31 2008-07-02 于柏泉 一种对特定人的语音进行自动录制的方法、系统及设备
CN101241699A (zh) * 2008-03-14 2008-08-13 北京交通大学 一种远程汉语教学中的说话人确认系统
US20090210223A1 (en) * 2008-02-19 2009-08-20 Samsung Electronics Co., Ltd. Apparatus and method for sound recognition in portable device
US20090216529A1 (en) * 2008-02-27 2009-08-27 Sony Ericsson Mobile Communications Ab Electronic devices and methods that adapt filtering of a microphone signal responsive to recognition of a targeted speaker's voice
CN101740031A (zh) * 2010-01-21 2010-06-16 安徽科大讯飞信息科技股份有限公司 一种基于网络动态负载均衡的声纹识别系统及其识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1867966A (zh) * 2003-10-03 2006-11-22 旭化成株式会社 数据处理单元和数据处理单元控制程序
CN1746972A (zh) * 2004-09-09 2006-03-15 上海优浪信息科技有限公司 一种语音锁
CN101211615A (zh) * 2006-12-31 2008-07-02 于柏泉 一种对特定人的语音进行自动录制的方法、系统及设备
US20090210223A1 (en) * 2008-02-19 2009-08-20 Samsung Electronics Co., Ltd. Apparatus and method for sound recognition in portable device
US20090216529A1 (en) * 2008-02-27 2009-08-27 Sony Ericsson Mobile Communications Ab Electronic devices and methods that adapt filtering of a microphone signal responsive to recognition of a targeted speaker's voice
CN101241699A (zh) * 2008-03-14 2008-08-13 北京交通大学 一种远程汉语教学中的说话人确认系统
CN101740031A (zh) * 2010-01-21 2010-06-16 安徽科大讯飞信息科技股份有限公司 一种基于网络动态负载均衡的声纹识别系统及其识别方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102723081A (zh) * 2012-05-30 2012-10-10 林其灿 语音信号处理方法、语音和声纹识别方法及其装置
CN102723081B (zh) * 2012-05-30 2014-05-21 无锡百互科技有限公司 语音信号处理方法、语音和声纹识别方法及其装置
CN104332159A (zh) * 2014-10-30 2015-02-04 上海修源网络科技有限公司 一种车载语音操作系统人机互动方法及装置
CN109119071A (zh) * 2018-09-26 2019-01-01 珠海格力电器股份有限公司 一种语音识别模型的训练方法及装置
CN110516265A (zh) * 2019-08-31 2019-11-29 青岛谷力互联科技有限公司 一种基于智能语音的单一识别实时翻译系统
CN112581967A (zh) * 2020-11-06 2021-03-30 厦门快商通科技股份有限公司 一种声纹检索方法及前端后端服务器、后端服务器
CN112581967B (zh) * 2020-11-06 2023-06-23 厦门快商通科技股份有限公司 一种声纹检索方法及前端后端服务器、后端服务器

Similar Documents

Publication Publication Date Title
WO2020238209A1 (zh) 音频处理的方法、系统及相关设备
US9424743B2 (en) Real-time traffic detection
CN101950564A (zh) 一种远程数字化语音采集分析识别系统
CN110956965A (zh) 一种基于声纹识别的个性化智能家居安全控制系统及方法
CN104410973A (zh) 一种播放录音的诈骗电话识别方法和系统
CN110858476A (zh) 一种基于麦克风阵列的声音采集方法及装置
CN111508527B (zh) 一种电话应答状态检测方法、装置及服务器
CN107358958B (zh) 对讲方法、装置及系统
CN103778917A (zh) 一种在电话满意度调查中检测身份冒充的系统与方法
CN116318457B (zh) 一种无线电信号监测方法及系统
CN112151038B (zh) 语音重放攻击检测方法、装置、可读存储介质及电子设备
CN112581975B (zh) 基于信号混叠和双声道相关性的超声波语音指令防御方法
KR101382356B1 (ko) 오디오파일의 위변조 검출장치
CN116129909A (zh) 一种基于聚类的声纹数据自动采集方法
CN114155845A (zh) 服务确定方法、装置、电子设备及存储介质
CN111292748B (zh) 一种可适应多种频率的语音录入系统
CN113689855A (zh) 一种会议记录生成系统、方法、装置、存储介质
CN113889081A (zh) 语音识别方法、介质、装置和计算设备
CN116192815B (zh) 一种工会会员在线直播与语音互动职代会管理方法
CN116127366B (zh) 一种基于tws耳机的情绪识别方法、系统及介质
CN113066507B (zh) 端到端说话人分离方法、系统及设备
US20230106550A1 (en) Method of processing speech, electronic device, and storage medium
CN114822549A (zh) 流调信息处理方法及装置、存储介质、电子设备
CN205609213U (zh) 语音数据结构化转换装置
CN111341295A (zh) 一种离线实时多语种广播敏感词监听方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110119