CN102299934A - 一种基于云模式和语音识别的语音输入方法 - Google Patents

一种基于云模式和语音识别的语音输入方法 Download PDF

Info

Publication number
CN102299934A
CN102299934A CN2010102078430A CN201010207843A CN102299934A CN 102299934 A CN102299934 A CN 102299934A CN 2010102078430 A CN2010102078430 A CN 2010102078430A CN 201010207843 A CN201010207843 A CN 201010207843A CN 102299934 A CN102299934 A CN 102299934A
Authority
CN
China
Prior art keywords
service
user
speech
voice
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102078430A
Other languages
English (en)
Inventor
施丽艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Bolu Information Technology Co Ltd
Original Assignee
Shanghai Bolu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Bolu Information Technology Co Ltd filed Critical Shanghai Bolu Information Technology Co Ltd
Priority to CN2010102078430A priority Critical patent/CN102299934A/zh
Publication of CN102299934A publication Critical patent/CN102299934A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于云模式和语音识别的语音输入方法,包含语音获取模块,语音识别模块,业务逻辑处理模块,服务接口模块,语音样本库,数据通讯模块。本发明将通过将本地语音录取后发送到远端的网络侧的语音识别模块识别,识别后将识别的文本信息发送到终端侧,由输入控制模块显示在用户的输入选择框,用户简单的口述即可获得和输入对应的文本信息。

Description

一种基于云模式和语音识别的语音输入方法
技术领域
本发明涉及互联网络和语音平台技术领域,特别是指一种基于云模式和语音识别的语音输入方法。
背景技术
随着互联网业务的发展,特别是基于宽带互联网和移动互联网技术的发展,用户上网的速度越来越快。高速带宽促使了云模式业务的发展,各种基于互联网络云模式的业务不断涌现,结合传统软件平台和网络成为新的一个业务的发展方向。
近年来语音识别技术发展很快,识别率和识别速度不断提高,逐步走向成熟的应用,结合互联网和云计算的模式的互联网和移动互联网业务和语音识别业务成为一种新的趋势。
有鉴于此,本发明的目的在于提出一种云模式的远端语音识别的语音输入方法。
发明内容
从上面所述可以看出,本发明提供的基于云模式和语音识别模式的语音输入方法,通过简单用户在网络客户端,包含互联网客户端和手机客户端等,简单地说出输入的文本,网络端进行识别并返回到客户端进行输入,客户端无需安装复杂的语音识别程序和庞大的语音数据库,对手机和瘦客户端的用户来讲具有很大的潜在价值。
具体来说具有以下优点:
使用简单:
用户只需简单地口述想要输入的文本信息,通过远端的语音识别服务即可将其语音识别后返回到客户端进行输入;
对终端要求低:
语音识别对客户端的设备资源要求较高,需要较多的计算资源和数据存储资源,而通过云模式,客户端被大大地简化,对终端的要求大为降低;业务升级便捷:
通过云模式的业务部署,使得业务的升级和扩展非常便捷,在网络端进行功能升级和数据扩充,对客户端没有任何的影响。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明系统模块结构的示意图。
图2为业务使用流程说明示意图。
具体实施方式
下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。
为实现上述目的,提出了一种基于云模式和语音识别的语音输入方法。
以下通过结合附图,对本发明的实施方式进行描述。
实现移动通信领域的信息业务的关键点如下:
语音获取:客户端获取用户语音并按照自然语言进行断句并打包成音频编码格式压缩后发送到网络端;
语音识别:语音识别模块识别音频文件的内容并转换成文本信息:
服务调用:通过各种远程服务调用的方式和协议,请求远端的服务端的服务,如通过SOAP协议请求远端的识别服务,远端的服务开放成应用接口以供客户端进行调用;
主要功能模块
如图1所示,基于云模式和语音识别模式的语音输入方法的系统结构主要包括:
客户端101:
负责提供输入界面,获取用户语音和编码打包,请求远端的服务调用,显示识别后的文本信息;
数据网络102:
提供业务的网络数据通道,传输业务请求数据和业务结果信息;
服务接口103:
提供远端的服务全球的接口,用户通过该服务接口请求网络端的语音识别服务和返回到客户端识别后的结果信息;
业务逻辑模块104:
根据业务配置的各种参数执行业务逻辑,配置业务执行的流程和参数,如为首次的语音注册、语音界面的配置等;
语音库105:
负责存储用户的语音样本库和为语音识别模块提供比对语音数据;
语音识别模块106:
执行与语音库的样本语音的匹配和识别;
管理模块107:对整个系统进行管理,包含参数管理、语音样本数据管理、用户管理,日志记录和管理等管理功能。
下面举一个例子来说明本发明系统的工作流程,该实施例中,业务包括以下步骤:
步骤1:用户激活客户端,口述输入的文字,客户端获取用户的语音的片段后编码成音频格式的数据;
步骤2:客户端请求接口模块的语音识别服务;
步骤3:系统平台接口模块接收到客户端的服务请求,接收到客户端的语音数据;
步骤4.接口模块接收到服务请求和语音数据后请求业务逻辑模块执行业务逻辑;
步骤5.业务逻辑模块请求语音识别模块对语音数据进行识别;
步骤6.语音识别模块对客户端提交的语音数据进行识别后将识别后的结果返回到业务逻辑模块和接口模块;
步骤7.接口模块将返回的结果信息封装和格式化返回到客户端的输入选择框;
本发明的描述是为了示例和说明起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。

Claims (6)

1.一种基于云模式的语音识别方式的语音输入方法,其特征在于,包含:通过云模式的请求服务的方式识别用户语音描述的语音并转换为文本。
2.远端服务通过服务接口提供了语音识别的服务,客户端侧调用该服务识别本地的语音信息,并获取到识别后的文本结果。
3.如权利要求2所述,本地端按照用户的自然语句方式截取语音片段,获取周期性的音频片段,并以此作为参数发起远端的语音识别的调用。
4.本地端在收到网络端的服务调用结果后,将其结果显示在输入框内供用户进行选择。
5.如权利要求1所述的云模式的语音输入方法,其特征在于:
按照用户自然语句节奏获取语音片段:
按照用户自然语言断句的节奏获取到语音片段,用户说完一句话后获得该句的完整片段后将其作为参数发起远端的服务的识别请求;
远端语音识别:
本地端获取到用户的语音片段后,将其压缩和编码成音频格式发送给云端服务,作为参数请求远端的语音识别服务进行识别;
本地输入控制:
本地端获得云端服务计算的结果后,将结果信息显示在输入选择框供用户进行选择,如有多个可能选项则显示多行。
云模式服务:
将语音识别的功能包装成服务开放在网络端,本地端无论在何处只要联网即可使用远端的云服务。
6.如权利要求2所述的云模式的语音识别方法,语音识别模块部署在远端服务端,功能和性能的扩展不受限制,有效地利用了庞大的语音数据库数据。
整个业务降低了对终端的要求,终端无需安装大量的语音数据和进行复杂的计算,为终端用户在移动网络上提供了一个新型业务,通过简单地说话即可将语音转换成文本进行输入,为用户提供了一个新的输入的选择。
CN2010102078430A 2010-06-23 2010-06-23 一种基于云模式和语音识别的语音输入方法 Pending CN102299934A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102078430A CN102299934A (zh) 2010-06-23 2010-06-23 一种基于云模式和语音识别的语音输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102078430A CN102299934A (zh) 2010-06-23 2010-06-23 一种基于云模式和语音识别的语音输入方法

Publications (1)

Publication Number Publication Date
CN102299934A true CN102299934A (zh) 2011-12-28

Family

ID=45360109

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102078430A Pending CN102299934A (zh) 2010-06-23 2010-06-23 一种基于云模式和语音识别的语音输入方法

Country Status (1)

Country Link
CN (1) CN102299934A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682771A (zh) * 2012-04-27 2012-09-19 厦门思德电子科技有限公司 一种适用于云平台的多语音控制方法
CN103246648A (zh) * 2012-02-01 2013-08-14 腾讯科技(深圳)有限公司 语音输入控制方法及装置
CN103294440A (zh) * 2012-03-05 2013-09-11 上海酷宇通讯技术有限公司 一种基于云计算的语音输入数据处理方法及系统
CN103366742A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音输入方法及系统
WO2013182129A2 (zh) * 2013-03-22 2013-12-12 中兴通讯股份有限公司 一种云笔记实现方法及装置
CN103581158A (zh) * 2012-08-10 2014-02-12 百度在线网络技术(北京)有限公司 一种语音数据的处理方法及系统
WO2014101687A1 (zh) * 2012-12-31 2014-07-03 百度在线网络技术(北京)有限公司 一种用于实现语音输入的方法与设备
CN104700836A (zh) * 2013-12-10 2015-06-10 阿里巴巴集团控股有限公司 一种语音识别方法和系统
CN104717536A (zh) * 2013-12-11 2015-06-17 中国电信股份有限公司 一种语音控制的方法和系统
CN106126157A (zh) * 2016-06-13 2016-11-16 北京云知声信息技术有限公司 基于医院信息系统的语音输入方法及装置
CN108346429A (zh) * 2017-01-22 2018-07-31 腾讯科技(深圳)有限公司 基于语音识别的数据传输方法和装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103246648B (zh) * 2012-02-01 2016-04-20 腾讯科技(深圳)有限公司 语音输入控制方法及装置
CN103246648A (zh) * 2012-02-01 2013-08-14 腾讯科技(深圳)有限公司 语音输入控制方法及装置
CN103294440A (zh) * 2012-03-05 2013-09-11 上海酷宇通讯技术有限公司 一种基于云计算的语音输入数据处理方法及系统
CN103366742A (zh) * 2012-03-31 2013-10-23 盛乐信息技术(上海)有限公司 语音输入方法及系统
CN103366742B (zh) * 2012-03-31 2018-07-31 上海果壳电子有限公司 语音输入方法及系统
CN102682771B (zh) * 2012-04-27 2013-11-20 厦门思德电子科技有限公司 一种适用于云平台的多语音控制方法
CN102682771A (zh) * 2012-04-27 2012-09-19 厦门思德电子科技有限公司 一种适用于云平台的多语音控制方法
CN103581158A (zh) * 2012-08-10 2014-02-12 百度在线网络技术(北京)有限公司 一种语音数据的处理方法及系统
US10199036B2 (en) 2012-12-31 2019-02-05 Baidu Online Network Technology (Beijing) Co., Ltd. Method and device for implementing voice input
WO2014101687A1 (zh) * 2012-12-31 2014-07-03 百度在线网络技术(北京)有限公司 一种用于实现语音输入的方法与设备
WO2013182129A2 (zh) * 2013-03-22 2013-12-12 中兴通讯股份有限公司 一种云笔记实现方法及装置
CN104064188A (zh) * 2013-03-22 2014-09-24 中兴通讯股份有限公司 一种语音文字化的云笔记实现方法及装置
WO2013182129A3 (zh) * 2013-03-22 2014-02-20 中兴通讯股份有限公司 一种云笔记实现方法及装置
CN104700836A (zh) * 2013-12-10 2015-06-10 阿里巴巴集团控股有限公司 一种语音识别方法和系统
US10140989B2 (en) 2013-12-10 2018-11-27 Alibaba Group Holding Limited Method and system for speech recognition processing
CN104700836B (zh) * 2013-12-10 2019-01-29 阿里巴巴集团控股有限公司 一种语音识别方法和系统
US10249301B2 (en) 2013-12-10 2019-04-02 Alibaba Group Holding Limited Method and system for speech recognition processing
CN104717536A (zh) * 2013-12-11 2015-06-17 中国电信股份有限公司 一种语音控制的方法和系统
CN106126157A (zh) * 2016-06-13 2016-11-16 北京云知声信息技术有限公司 基于医院信息系统的语音输入方法及装置
CN106126157B (zh) * 2016-06-13 2019-04-05 北京云知声信息技术有限公司 基于医院信息系统的语音输入方法及装置
CN108346429A (zh) * 2017-01-22 2018-07-31 腾讯科技(深圳)有限公司 基于语音识别的数据传输方法和装置
CN108346429B (zh) * 2017-01-22 2022-07-08 腾讯科技(深圳)有限公司 基于语音识别的数据传输方法和装置

Similar Documents

Publication Publication Date Title
CN102299934A (zh) 一种基于云模式和语音识别的语音输入方法
US9177551B2 (en) System and method of providing speech processing in user interface
CN103137129B (zh) 语音识别方法及电子装置
JP6373985B2 (ja) 音声動作式機能にキーワードモデルを割り当てるための方法および装置
US9043208B2 (en) System, method and program product for providing automatic speech recognition (ASR) in a shared resource environment
US9542956B1 (en) Systems and methods for responding to human spoken audio
KR101649771B1 (ko) 발성 처리를 위한 인식기들의 마크업 언어 기반 선택 및 이용
CN108986826A (zh) 自动生成会议记录的方法、电子装置及可读存储介质
CN107004407A (zh) 增强型语音端点确定
CN102510426A (zh) 个人助理应用访问方法及系统
US20120317492A1 (en) Providing Interactive and Personalized Multimedia Content from Remote Servers
JP2016095383A (ja) 音声認識クライアント装置及びサーバ型音声認識装置
WO2015109971A1 (zh) 智能电视的语音处理方法、处理系统及智能电视
US9196250B2 (en) Application services interface to ASR
CN104766608A (zh) 一种语音控制方法及装置
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
CN111261151A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN104461446B (zh) 基于语音交互的软件运行方法及系统
CN110517686A (zh) 智能音箱端语音开通应用的方法及系统
CN109670109A (zh) 信息获取方法、装置、服务器、终端和介质
CN104010097A (zh) 基于传统pstn电话的多媒体通讯系统及方法
CN110019848A (zh) 对话交互方法、装置及机器人
WO2021103741A1 (zh) 内容处理方法、装置、计算机设备及存储介质
CN113903338A (zh) 面签方法、装置、电子设备和存储介质
US10529324B1 (en) Geographical based voice transcription

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20111228