CN102682770A - 基于云计算的语音识别系统 - Google Patents

基于云计算的语音识别系统 Download PDF

Info

Publication number
CN102682770A
CN102682770A CN2012100425835A CN201210042583A CN102682770A CN 102682770 A CN102682770 A CN 102682770A CN 2012100425835 A CN2012100425835 A CN 2012100425835A CN 201210042583 A CN201210042583 A CN 201210042583A CN 102682770 A CN102682770 A CN 102682770A
Authority
CN
China
Prior art keywords
speech recognition
decision
voice recognition
terminal
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012100425835A
Other languages
English (en)
Inventor
石广海
石辉
裴文斌
曹玉清
陈俊平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XI'AN RADIOCOM SYSTEMS CO Ltd
Original Assignee
XI'AN RADIOCOM SYSTEMS CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XI'AN RADIOCOM SYSTEMS CO Ltd filed Critical XI'AN RADIOCOM SYSTEMS CO Ltd
Priority to CN2012100425835A priority Critical patent/CN102682770A/zh
Publication of CN102682770A publication Critical patent/CN102682770A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明的目的在于,提供了一种基于云计算的语音识别系统,由语音识别终端、决策器、通信网络、云计算端和本地语音识别器组成,其特征在于:语音识别终端把采集到的语音片段进行模数转换后,传送到决策器进行决策,若决策值小于规定的阈值,决策器就通过通信网络将语音数据上传至云计算端进行语音识别,反馈结果至语音识别终端,即可进行应用;若决策值大于规定的阈值,决策器就将语音数据传送给本地语音识别器进行语音识别,反馈结果至语音识别终端,即可进行应用。本发明,低成本,高性能,易扩展,广泛应用于基于云计算的语音识别系统领域。

Description

基于云计算的语音识别系统
技术领域
本发明涉及终端语音采集装置,具体涉及一种基于云计算的语音识别系统。
背景技术
语音识别技术近年来逐渐被普遍使用于各个领域。语音识别技术使得人们可以仅仅通过语音来操控电子设备。例如,可以通过语音来进行电话呼叫和计算机操作。
然而,传统的语音识别技术都是采用本地语音识别软件进行语音识别,因此要求终端必须具有较强的CPU和足够大的存储空间来存储尽可能大的词汇表。并且由于语音采集终端厂家技术的不断更新,新的语音识别软件迫使语音识别终端必须不停地升级自己的软硬件,严重限制了语音识别应用的发展。
发明内容
为了克服上述现有技术的不足,本发明的目的在于提供一种利用通信网络采用云计算方式进行语音识别或采用本地语音识别器进行语音识别的语音识别系统,使低性能的语音识别终端可以在不进行任何软硬件升级的条件下具备高质量的语音识别能力。
为实现上述目的,本发明采用的技术方案为:
基于云计算的语音识别系统,由语音识别终端、决策器、通信网络、云计算端和本地语音识别器组成,其特征在于:语音识别终端把采集到的语音片段进行模数转换后,传送到决策器进行决策,若决策值小于规定的阈值,决策器就通过通信网络将语音数据上传至云计算端进行语音识别,反馈结果至语音识别终端,若决策值大于规定的阈值,决策器就将语音数据传送给本地语音识别器进行语音识别,反馈结果至语音识别终端。
本发明相对于现有技术,具有以下优点和效果:
1)当本地语音识别器识别质量不能满足要求时,可以通过云计算端的语音识别器进行高质量的语音识别;
2)由于语音识别并不完全依赖于本地语音识别器,就降低语音识别终端的性能要求,甚至使不具有本地语音识别功能的低端终端也能通过云计算端实现高质量的语音识别功能;
3)用户只需在云计算端进行升级即可提高语音识别质量和增加新的语音识别应用,而不必进行其他任何升级,具有极大的灵活性。
附图说明
图1为本发明的系统结构流程示意图。
具体实施方式
以下结合具体实施例对本方案做进一步描述:
结合附图,本方案所述的基于云计算的语音识别系统,由语音识别终端、决策器、通信网络、云计算端和本地语音识别器组成,语音识别终端把采集到的语音片段进行模数转换后,传送到决策器进行决策,若决策值小于规定的阈值,决策器就通过通信网络将语音数据上传至云计算端进行语音识别,反馈结果至语音识别终端;若决策值大于规定的阈值,决策器就将语音数据传送给本地语音识别器进行语音识别,反馈结果至语音识别终端。
本发明的工作流程是:
第一步,语音识别终端通过录音功能对语音片段进行采集并模数转化成语音数据;
第二步,语音识别终端将语音数据传送到决策器进行决策;
第三步,决策器对语音数据进行决策,若决策值小于规定的阈值,则进行第四、五、六步;若决策值大于规定的阈值,则进行第七、八、九步;
第四步,决策器通过通信网络将语音数据上传至云计算端服务器,服务器接收;
第五步,云计算端服务器上的语音识别器对语音信号进行识别;
第六步,反馈识别结果给语音识别终端应用;
第七步,决策器直接将语音数据传送给本地语音识别器;
第八步,本地语音识别器对语音信号进行识别;
第九步,反馈识别结果给语音识别终端应用。
本发明,低成本,高性能,易扩展,广泛应用于基于云计算的语音识别系统领域。

Claims (1)

1.基于云计算的语音识别系统,由语音识别终端、决策器、通信网络、云计算端和本地语音识别器组成,其特征在于:语音识别终端把采集到的语音片段进行模数转换后,传送到决策器进行决策,若决策值小于规定的阈值,决策器就通过通信网络将语音数据上传至云计算端进行语音识别,反馈结果至语音识别终端,若决策值大于规定的阈值,决策器就将语音数据传送给本地语音识别器进行语音识别,反馈结果至语音识别终端。
CN2012100425835A 2012-02-23 2012-02-23 基于云计算的语音识别系统 Pending CN102682770A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012100425835A CN102682770A (zh) 2012-02-23 2012-02-23 基于云计算的语音识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012100425835A CN102682770A (zh) 2012-02-23 2012-02-23 基于云计算的语音识别系统

Publications (1)

Publication Number Publication Date
CN102682770A true CN102682770A (zh) 2012-09-19

Family

ID=46814585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012100425835A Pending CN102682770A (zh) 2012-02-23 2012-02-23 基于云计算的语音识别系统

Country Status (1)

Country Link
CN (1) CN102682770A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014048348A1 (zh) * 2012-09-29 2014-04-03 深圳市国华识别科技开发有限公司 一种多媒体设备语音控制系统及方法、计算机存储介质
CN103730119A (zh) * 2013-12-18 2014-04-16 惠州市车仆电子科技有限公司 车载人机语音交互系统
CN104916283A (zh) * 2015-06-11 2015-09-16 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN106446787A (zh) * 2016-08-30 2017-02-22 孟玲 一种基于云计算的生物识别系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1351745A (zh) * 1999-03-26 2002-05-29 皇家菲利浦电子有限公司 客户一服务器语音识别
US20100226288A1 (en) * 2009-03-04 2010-09-09 At&T Intellectual Property I, Lp. Method and apparatus for group media consumption
CN102196207A (zh) * 2011-05-12 2011-09-21 深圳市子栋科技有限公司 语音控制电视机的方法、装置和系统
CN202677827U (zh) * 2012-02-23 2013-01-16 西安雷迪维护系统设备有限公司 基于云计算的语音识别系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1351745A (zh) * 1999-03-26 2002-05-29 皇家菲利浦电子有限公司 客户一服务器语音识别
US20100226288A1 (en) * 2009-03-04 2010-09-09 At&T Intellectual Property I, Lp. Method and apparatus for group media consumption
CN102196207A (zh) * 2011-05-12 2011-09-21 深圳市子栋科技有限公司 语音控制电视机的方法、装置和系统
CN202677827U (zh) * 2012-02-23 2013-01-16 西安雷迪维护系统设备有限公司 基于云计算的语音识别系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014048348A1 (zh) * 2012-09-29 2014-04-03 深圳市国华识别科技开发有限公司 一种多媒体设备语音控制系统及方法、计算机存储介质
US9955210B2 (en) 2012-09-29 2018-04-24 Shenzhen Prtek Co. Ltd. Multimedia device voice control system and method, and computer storage medium
CN103730119A (zh) * 2013-12-18 2014-04-16 惠州市车仆电子科技有限公司 车载人机语音交互系统
CN104916283A (zh) * 2015-06-11 2015-09-16 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN106446787A (zh) * 2016-08-30 2017-02-22 孟玲 一种基于云计算的生物识别系统

Similar Documents

Publication Publication Date Title
CN103137129B (zh) 语音识别方法及电子装置
CN102708865A (zh) 语音识别方法、装置及系统
WO2010023192A3 (en) Conversion management system, method and computer program
EP2624122A3 (en) Information processing system, information processing apparatus, and data conversion method
EP2663064A3 (en) Method and system for operating communication service
WO2009087619A3 (en) Stateless attestation system
CN102496364A (zh) 基于云端网络的交互式语音识别方法
CN110473540B (zh) 语音交互方法及系统、终端设备、计算机设备及介质
CN105513590A (zh) 语音识别的方法和装置
CN104378710A (zh) 一种无线音箱
CN102682770A (zh) 基于云计算的语音识别系统
EP3462447A3 (en) Apparatus and method for residential speaker recognition
CN104125206A (zh) 一种客户端的硬件环境适配方法、装置、服务器及系统
EP2343647A3 (en) Processing system and method for connecting a remote USB device automatically
EP2509295A3 (en) Connecting to a telephone extension using a telephone directory and an audio token
CN112634902A (zh) 语音转写方法、装置、录音笔和存储介质
CN108538290A (zh) 一种基于音频信号检测的智能家居控制方法
CN202677827U (zh) 基于云计算的语音识别系统
US20120046952A1 (en) Remote control system and method
CN102572406B (zh) 在服务器端快速浏览车载终端视频文件的方法及装置
CN202711445U (zh) 一种数字多媒体遥控器
CN204859420U (zh) 一种智能楼宇视频监控系统
CN107357859A (zh) 一种通过语音采集实现知识库自动显示的智能终端
CN208094741U (zh) 一种基于语音识别技术的智能麦克风
CN204145546U (zh) 一种交互式智能问询服务终端平台

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB03 Change of inventor or designer information

Inventor after: Ma Jun

Inventor after: Shi Hui

Inventor after: Pei Wenbin

Inventor after: Cao Yuqing

Inventor before: Shi Guanghai

Inventor before: Shi Hui

Inventor before: Pei Wenbin

Inventor before: Cao Yuqing

Inventor before: Chen Junping

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: SHI GUANGHAI SHI HUI PEI WENBIN CAO YUQING CHEN JUNPING TO: MA JUN SHI HUIPEI WENBIN CAO YUQING

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120919