CN102496364A - 基于云端网络的交互式语音识别方法 - Google Patents

基于云端网络的交互式语音识别方法 Download PDF

Info

Publication number
CN102496364A
CN102496364A CN2011103888961A CN201110388896A CN102496364A CN 102496364 A CN102496364 A CN 102496364A CN 2011103888961 A CN2011103888961 A CN 2011103888961A CN 201110388896 A CN201110388896 A CN 201110388896A CN 102496364 A CN102496364 A CN 102496364A
Authority
CN
China
Prior art keywords
speech recognition
client
service end
recognition engine
feature information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011103888961A
Other languages
English (en)
Inventor
葛长伟
冯春瑾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUZHOU GCX INFORMATION TECHNOLOGY Co Ltd
Original Assignee
SUZHOU GCX INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUZHOU GCX INFORMATION TECHNOLOGY Co Ltd filed Critical SUZHOU GCX INFORMATION TECHNOLOGY Co Ltd
Priority to CN2011103888961A priority Critical patent/CN102496364A/zh
Publication of CN102496364A publication Critical patent/CN102496364A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明公开了一种基于云端网络的交互式语音识别方法,其实施步骤如下:1)在客户端建立本地语音识别引擎,在服务端建立远程语音识别引擎,采集客户端语音,提取语音特征信息;2)客户端识别语音特征信息,如果本地语音识别引擎识别成功,则返回识别信息给用户;如果本地语音识别引擎识别失败,则将语音特征信息发送给服务端;3)服务端使用远程语音识别引擎识别语音特征信息,并返回最优的识别结果信息发送给客户端,客户端针对识别结果进行打分并发送给服务端;4)服务端根据客户端的打分对远程语音识别引擎的语音识别数据库进行整理并同步至各个客户端。本发明具有语音识别效果好、具备自学习功能、使用简单方便的优点。

Description

基于云端网络的交互式语音识别方法
技术领域
本发明涉及交互式语音识别领域,具体涉及一种基于云端网络的交互式语音识别方法。
背景技术
语音识别技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。 语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音特征信息是语音识别中的一个最重要基本问题,语音识别系统常用的语音特征信息有线性预测系数、倒频谱系数、平均过零率、能量、短时频谱、共振峰频率及带宽等。目前采用的语音特征信息是14维倒谱、14维差分倒谱、能量、一阶差分能量、二阶差分能量,共31维。计算参数时,分析帧长为200,窗移100。目前语音识别方法也开始渐渐得到了商业应用。但是目前的语音识别方法一般采用单机实现,语音识别引擎的语音识别数据库不能更新,导致语音识别方法无法实现自学习,识别效果不佳,而且缺乏有效的交互手段,不能实现用户参与语音识别的学习和验证,使得语音识别方法受到限制。
 
发明内容
本发明要解决的技术问题是提供一种语音识别效果好、具备自学习功能、使用简单方便的基于云端网络的交互式语音识别方法。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于云端网络的交互式语音识别方法,其实施步骤如下:
1)在客户端建立包含语音识别数据库的本地语音识别引擎,在服务端建立语音识别数据库的远程语音识别引擎,采集客户端用户输入的语音,提取语音中的语音特征信息;
2)客户端使用本地语音识别引擎识别语音特征信息,如果本地语音识别引擎识别成功,则返回识别信息给用户;如果本地语音识别引擎识别失败,则将语音特征信息发送给服务端;
3)服务端使用远程语音识别引擎识别语音特征信息,并返回最优的识别结果信息发送给客户端,客户端针对识别结果进行打分并发送给服务端;
4)服务端根据客户端的打分对远程语音识别引擎的语音识别数据库进行整理,并将语音识别数据库中分数超过预设阈值的项目同步至各个客户端。
作为上述技术方案的进一步改进:
所述步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端前还包括将语音特征信息采用Speex编码器进行压缩的步骤。
所述服务端包括多个镜像服务器和用于实现反向代理的中央服务器,所述中央服务器和多个镜像服务器组成CDN网络架构。
所述步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端的详细步骤包括:客户端首先将语音特征信息发送给中央服务器,所述中央服务器将语音特征信息通过HTTP协议发送给服务端。
本发明具有下述优点:
1、本发明通过在客户端建立包含语音识别数据库的本地语音识别引擎,在服务端建立语音识别数据库的远程语音识别引擎,客户端采集的语音在用本地语音识别引擎优先、辅以远程语音识别引擎来实现语音识别,而且通过服务端与客户端的语音识别数据库中分数超过预设阈值的项目同步,能够有效提高本发明的语音识别正确率。
2、本发明通过服务端根据客户端的打分对远程语音识别引擎的语音识别数据库进行整理,并将语音识别数据库中分数超过预设阈值的项目同步至各个客户端,能够充分利用用户评价实现对语音识别效果的评估,使得本发明具有自学习功能,能够逐步提高语音识别的识别效果。
3、本发明的服务端进一步包括多个镜像服务器和用于实现反向代理的中央服务器,中央服务器和多个镜像服务器组成CDN网络架构,能够有效降低服务端的平均负担,提高服务器的数据处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的主要流程示意图。
具体实施方式
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
如图1所示,本实施例基于云端网络的交互式语音识别方法的实施步骤如下:
1)在客户端建立包含语音识别数据库的本地语音识别引擎,在服务端建立语音识别数据库的远程语音识别引擎,采集客户端用户输入的语音,提取语音中的语音特征信息;
2)客户端使用本地语音识别引擎识别语音特征信息,如果本地语音识别引擎识别成功,则返回识别信息给用户;如果本地语音识别引擎识别失败,则将语音特征信息发送给服务端;
3)服务端使用远程语音识别引擎识别语音特征信息,并返回最优的识别结果信息发送给客户端,客户端针对识别结果进行打分并发送给服务端;
4)服务端根据客户端的打分对远程语音识别引擎的语音识别数据库进行整理,并将语音识别数据库中分数超过预设阈值的项目同步至各个客户端。
本实施例步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端前还包括将语音特征信息采用Speex编码器进行压缩的步骤。Speex编码器是一个开源、免费而且无软件专利的自由音频压缩编码器,尤其适用于语音编码。Speex编码器旨在降低语音入门门槛,能够替代昂贵的专用语音编解码器。
本实施例服务端包括多个镜像服务器和用于实现反向代理的中央服务器,中央服务器和多个镜像服务器组成CDN网络架构。
本实施例步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端的详细步骤包括:客户端首先将语音特征信息发送给中央服务器,中央服务器将语音特征信息通过HTTP协议发送给服务端。
 
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种基于云端网络的交互式语音识别方法,其特征在于其实施步骤如下:
1)在客户端建立包含语音识别数据库的本地语音识别引擎,在服务端建立语音识别数据库的远程语音识别引擎,采集客户端用户输入的语音,提取语音中的语音特征信息;
2)客户端使用本地语音识别引擎识别语音特征信息,如果本地语音识别引擎识别成功,则返回识别信息给用户;如果本地语音识别引擎识别失败,则将语音特征信息发送给服务端;
3)服务端使用远程语音识别引擎识别语音特征信息,并返回最优的识别结果信息发送给客户端,客户端针对识别结果进行打分并发送给服务端;
4)服务端根据客户端的打分对远程语音识别引擎的语音识别数据库进行整理,并将语音识别数据库中分数超过预设阈值的项目同步至各个客户端。
2.根据权利要求1所述的基于云端网络的交互式语音识别方法,其特征在于:所述步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端前还包括将语音特征信息采用Speex编码器进行压缩的步骤。
3.根据权利要求1或2所述的基于云端网络的交互式语音识别方法,其特征在于,所述服务端包括多个镜像服务器和用于实现反向代理的中央服务器,所述中央服务器和多个镜像服务器组成CDN网络架构。
4.根据权利要求1或2或3所述的基于云端网络的交互式语音识别方法,其特征在于,所述步骤2)中客户端在本地语音识别引擎识别失败时将语音特征信息发送给服务端的详细步骤包括:客户端首先将语音特征信息发送给中央服务器,所述中央服务器将语音特征信息通过HTTP协议发送给服务端。
CN2011103888961A 2011-11-30 2011-11-30 基于云端网络的交互式语音识别方法 Pending CN102496364A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011103888961A CN102496364A (zh) 2011-11-30 2011-11-30 基于云端网络的交互式语音识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011103888961A CN102496364A (zh) 2011-11-30 2011-11-30 基于云端网络的交互式语音识别方法

Publications (1)

Publication Number Publication Date
CN102496364A true CN102496364A (zh) 2012-06-13

Family

ID=46188181

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011103888961A Pending CN102496364A (zh) 2011-11-30 2011-11-30 基于云端网络的交互式语音识别方法

Country Status (1)

Country Link
CN (1) CN102496364A (zh)

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831892A (zh) * 2012-09-07 2012-12-19 深圳市信利康电子有限公司 基于互联网语音交互的玩具控制方法及系统
CN102855874A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于互联网语音交互的家电控制方法及系统
CN102855875A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于外部开启控制语音输入的网络语音转换控制系统和方法
CN102855872A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于终端及互联网语音交互的家电控制方法及系统
CN102868740A (zh) * 2012-09-07 2013-01-09 深圳市信利康电子有限公司 基于移动通讯终端及互联网语音交互的玩具控制方法及系统
CN103000175A (zh) * 2012-12-03 2013-03-27 深圳市金立通信设备有限公司 一种语音识别的方法及移动终端
CN103079258A (zh) * 2013-01-09 2013-05-01 广东欧珀移动通信有限公司 一种提高语音识别准确性的方法及移动智能终端
CN103092181A (zh) * 2012-12-28 2013-05-08 吴玉胜 基于智能电视设备的家电控制方法及系统
CN103093755A (zh) * 2012-09-07 2013-05-08 深圳市信利康电子有限公司 基于终端及互联网语音交互的网络家电控制方法及系统
CN103208285A (zh) * 2012-09-07 2013-07-17 深圳市信利康电子有限公司 基于移动通讯终端语音交互的家电控制方法及系统
CN103247291A (zh) * 2013-05-07 2013-08-14 华为终端有限公司 一种语音识别设备的更新方法、装置及系统
CN103295572A (zh) * 2012-08-13 2013-09-11 深圳市路畅科技股份有限公司 一种语音识别方法及具有语音识别的车载多媒体导航仪系统
CN103440867A (zh) * 2013-08-02 2013-12-11 安徽科大讯飞信息科技股份有限公司 语音识别方法及系统
CN103533154A (zh) * 2012-06-28 2014-01-22 Lg电子株式会社 移动终端及其识别语音的方法
CN104134442A (zh) * 2014-08-15 2014-11-05 广东欧珀移动通信有限公司 一种启动语音服务的方法及装置
CN104681026A (zh) * 2013-11-27 2015-06-03 夏普株式会社 语音识别终端及系统、服务器及其控制方法、非易失性存储介质
CN104715752A (zh) * 2015-04-09 2015-06-17 刘文军 语音识别方法、装置及系统
CN104717536A (zh) * 2013-12-11 2015-06-17 中国电信股份有限公司 一种语音控制的方法和系统
CN105118508A (zh) * 2015-09-14 2015-12-02 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN105261366A (zh) * 2015-08-31 2016-01-20 努比亚技术有限公司 语音识别方法、语音引擎及终端
CN106098062A (zh) * 2016-06-16 2016-11-09 杭州古北电子科技有限公司 本地处理与无线网络结合的智能语音识别控制系统及方法
CN106164869A (zh) * 2014-04-01 2016-11-23 微软技术许可有限责任公司 用于并行处理的混合客户端/服务器架构
TWI574255B (zh) * 2016-02-22 2017-03-11 華碩電腦股份有限公司 語音辨識方法、電子裝置及語音辨識系統
CN106847291A (zh) * 2017-02-20 2017-06-13 成都启英泰伦科技有限公司 一种本地和云端相结合的语音识别系统及方法
CN107146623A (zh) * 2017-04-07 2017-09-08 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法、装置和系统
CN107430853A (zh) * 2015-05-27 2017-12-01 谷歌公司 将用于具有选择性离线能力的话音动作的数据本地保存在支持话音的电子装置中
CN108074571A (zh) * 2017-12-27 2018-05-25 深圳市亿道信息股份有限公司 增强现实设备的语音控制方法、系统及存储介质
CN109102804A (zh) * 2018-08-17 2018-12-28 飞救医疗科技(赣州)有限公司 一种语音病历终端输入的方法及其系统
CN109119071A (zh) * 2018-09-26 2019-01-01 珠海格力电器股份有限公司 一种语音识别模型的训练方法及装置
US10311878B2 (en) 2014-01-17 2019-06-04 Microsoft Technology Licensing, Llc Incorporating an exogenous large-vocabulary model into rule-based speech recognition
CN110517674A (zh) * 2019-07-26 2019-11-29 视联动力信息技术股份有限公司 一种语音处理方法、装置及存储介质
WO2020119438A1 (zh) * 2018-12-11 2020-06-18 青岛海尔洗衣机有限公司 语音控制方法、云端服务器及终端设备
WO2020119437A1 (zh) * 2018-12-11 2020-06-18 青岛海尔洗衣机有限公司 语音控制方法、云端服务器及终端设备
US10885918B2 (en) 2013-09-19 2021-01-05 Microsoft Technology Licensing, Llc Speech recognition using phoneme matching
CN112259098A (zh) * 2020-10-28 2021-01-22 湖南天琛信息科技有限公司 一种基于指纹识别的语音遥控系统
CN112927721A (zh) * 2019-12-06 2021-06-08 观致汽车有限公司 人车互动方法、系统以及车辆和计算机可读存储介质
US11087762B2 (en) 2015-05-27 2021-08-10 Google Llc Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device
CN114078476A (zh) * 2020-08-21 2022-02-22 观致汽车有限公司 车载人物情绪展示方法以及车载人物情绪展示装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000058942A2 (en) * 1999-03-26 2000-10-05 Koninklijke Philips Electronics N.V. Client-server speech recognition
US6532446B1 (en) * 1999-11-24 2003-03-11 Openwave Systems Inc. Server based speech recognition user interface for wireless devices
CN1877697A (zh) * 2006-07-25 2006-12-13 北京理工大学 一种基于分布式结构的说话人确认方法
CN102122506A (zh) * 2011-03-08 2011-07-13 天脉聚源(北京)传媒科技有限公司 一种语音识别的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000058942A2 (en) * 1999-03-26 2000-10-05 Koninklijke Philips Electronics N.V. Client-server speech recognition
US6532446B1 (en) * 1999-11-24 2003-03-11 Openwave Systems Inc. Server based speech recognition user interface for wireless devices
CN1877697A (zh) * 2006-07-25 2006-12-13 北京理工大学 一种基于分布式结构的说话人确认方法
CN102122506A (zh) * 2011-03-08 2011-07-13 天脉聚源(北京)传媒科技有限公司 一种语音识别的方法

Cited By (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9147395B2 (en) 2012-06-28 2015-09-29 Lg Electronics Inc. Mobile terminal and method for recognizing voice thereof
CN103533154B (zh) * 2012-06-28 2015-09-02 Lg电子株式会社 移动终端及其识别语音的方法
CN103533154A (zh) * 2012-06-28 2014-01-22 Lg电子株式会社 移动终端及其识别语音的方法
CN103295572B (zh) * 2012-08-13 2016-02-03 深圳市路畅科技股份有限公司 一种语音识别方法及具有语音识别的车载多媒体导航仪系统
CN103295572A (zh) * 2012-08-13 2013-09-11 深圳市路畅科技股份有限公司 一种语音识别方法及具有语音识别的车载多媒体导航仪系统
CN103093755A (zh) * 2012-09-07 2013-05-08 深圳市信利康电子有限公司 基于终端及互联网语音交互的网络家电控制方法及系统
CN103208285A (zh) * 2012-09-07 2013-07-17 深圳市信利康电子有限公司 基于移动通讯终端语音交互的家电控制方法及系统
CN102855872B (zh) * 2012-09-07 2015-08-05 深圳市信利康电子有限公司 基于终端及互联网语音交互的家电控制方法及系统
CN102868740A (zh) * 2012-09-07 2013-01-09 深圳市信利康电子有限公司 基于移动通讯终端及互联网语音交互的玩具控制方法及系统
CN103093755B (zh) * 2012-09-07 2016-05-11 深圳市信利康电子有限公司 基于终端及互联网语音交互的网络家电控制方法及系统
CN102855872A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于终端及互联网语音交互的家电控制方法及系统
CN102855875A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于外部开启控制语音输入的网络语音转换控制系统和方法
CN102855874A (zh) * 2012-09-07 2013-01-02 深圳市信利康电子有限公司 基于互联网语音交互的家电控制方法及系统
CN102855875B (zh) * 2012-09-07 2015-05-06 深圳市信利康电子有限公司 基于外部开启控制语音输入的网络语音转换控制系统和方法
CN102831892A (zh) * 2012-09-07 2012-12-19 深圳市信利康电子有限公司 基于互联网语音交互的玩具控制方法及系统
CN103000175A (zh) * 2012-12-03 2013-03-27 深圳市金立通信设备有限公司 一种语音识别的方法及移动终端
CN103092181A (zh) * 2012-12-28 2013-05-08 吴玉胜 基于智能电视设备的家电控制方法及系统
CN103079258A (zh) * 2013-01-09 2013-05-01 广东欧珀移动通信有限公司 一种提高语音识别准确性的方法及移动智能终端
CN103247291A (zh) * 2013-05-07 2013-08-14 华为终端有限公司 一种语音识别设备的更新方法、装置及系统
WO2014180218A1 (zh) * 2013-05-07 2014-11-13 华为终端有限公司 一种语音识别设备的更新方法、装置及系统
CN103440867A (zh) * 2013-08-02 2013-12-11 安徽科大讯飞信息科技股份有限公司 语音识别方法及系统
CN103440867B (zh) * 2013-08-02 2016-08-10 科大讯飞股份有限公司 语音识别方法及系统
US10885918B2 (en) 2013-09-19 2021-01-05 Microsoft Technology Licensing, Llc Speech recognition using phoneme matching
CN104681026A (zh) * 2013-11-27 2015-06-03 夏普株式会社 语音识别终端及系统、服务器及其控制方法、非易失性存储介质
CN104717536A (zh) * 2013-12-11 2015-06-17 中国电信股份有限公司 一种语音控制的方法和系统
US10311878B2 (en) 2014-01-17 2019-06-04 Microsoft Technology Licensing, Llc Incorporating an exogenous large-vocabulary model into rule-based speech recognition
CN106164869A (zh) * 2014-04-01 2016-11-23 微软技术许可有限责任公司 用于并行处理的混合客户端/服务器架构
US10749989B2 (en) 2014-04-01 2020-08-18 Microsoft Technology Licensing Llc Hybrid client/server architecture for parallel processing
CN106164869B (zh) * 2014-04-01 2020-12-11 微软技术许可有限责任公司 用于并行处理的混合客户端/服务器架构
CN104134442A (zh) * 2014-08-15 2014-11-05 广东欧珀移动通信有限公司 一种启动语音服务的方法及装置
CN104715752B (zh) * 2015-04-09 2019-01-08 刘文军 语音识别方法、装置及系统
CN104715752A (zh) * 2015-04-09 2015-06-17 刘文军 语音识别方法、装置及系统
CN107430853B (zh) * 2015-05-27 2020-11-03 谷歌有限责任公司 将用于具有选择性离线能力的话音动作的数据本地保存在支持话音的电子装置中
US10986214B2 (en) 2015-05-27 2021-04-20 Google Llc Local persisting of data for selectively offline capable voice action in a voice-enabled electronic device
CN107430853A (zh) * 2015-05-27 2017-12-01 谷歌公司 将用于具有选择性离线能力的话音动作的数据本地保存在支持话音的电子装置中
US11676606B2 (en) 2015-05-27 2023-06-13 Google Llc Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device
US11087762B2 (en) 2015-05-27 2021-08-10 Google Llc Context-sensitive dynamic update of voice to text model in a voice-enabled electronic device
CN105261366A (zh) * 2015-08-31 2016-01-20 努比亚技术有限公司 语音识别方法、语音引擎及终端
CN105118508B (zh) * 2015-09-14 2018-10-23 百度在线网络技术(北京)有限公司 语音识别方法和装置
CN105118508A (zh) * 2015-09-14 2015-12-02 百度在线网络技术(北京)有限公司 语音识别方法和装置
TWI574255B (zh) * 2016-02-22 2017-03-11 華碩電腦股份有限公司 語音辨識方法、電子裝置及語音辨識系統
CN106098062A (zh) * 2016-06-16 2016-11-09 杭州古北电子科技有限公司 本地处理与无线网络结合的智能语音识别控制系统及方法
CN106847291A (zh) * 2017-02-20 2017-06-13 成都启英泰伦科技有限公司 一种本地和云端相结合的语音识别系统及方法
CN107146623A (zh) * 2017-04-07 2017-09-08 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法、装置和系统
CN107146623B (zh) * 2017-04-07 2021-03-16 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法、装置和系统
CN108074571A (zh) * 2017-12-27 2018-05-25 深圳市亿道信息股份有限公司 增强现实设备的语音控制方法、系统及存储介质
CN109102804A (zh) * 2018-08-17 2018-12-28 飞救医疗科技(赣州)有限公司 一种语音病历终端输入的方法及其系统
CN109119071A (zh) * 2018-09-26 2019-01-01 珠海格力电器股份有限公司 一种语音识别模型的训练方法及装置
WO2020119437A1 (zh) * 2018-12-11 2020-06-18 青岛海尔洗衣机有限公司 语音控制方法、云端服务器及终端设备
WO2020119438A1 (zh) * 2018-12-11 2020-06-18 青岛海尔洗衣机有限公司 语音控制方法、云端服务器及终端设备
US11705129B2 (en) 2018-12-11 2023-07-18 Qingdao Haier Washing Machine Co., Ltd. Voice control method, cloud server and terminal device
US11967320B2 (en) 2018-12-11 2024-04-23 Qingdao Haier Washing Machine Co., Ltd. Processing voice information with a terminal device and a cloud server to control an operation
CN110517674A (zh) * 2019-07-26 2019-11-29 视联动力信息技术股份有限公司 一种语音处理方法、装置及存储介质
CN112927721A (zh) * 2019-12-06 2021-06-08 观致汽车有限公司 人车互动方法、系统以及车辆和计算机可读存储介质
CN114078476A (zh) * 2020-08-21 2022-02-22 观致汽车有限公司 车载人物情绪展示方法以及车载人物情绪展示装置
CN114078476B (zh) * 2020-08-21 2023-12-19 观致汽车有限公司 车载人物情绪展示方法以及车载人物情绪展示装置
CN112259098A (zh) * 2020-10-28 2021-01-22 湖南天琛信息科技有限公司 一种基于指纹识别的语音遥控系统

Similar Documents

Publication Publication Date Title
CN102496364A (zh) 基于云端网络的交互式语音识别方法
CN111508498B (zh) 对话式语音识别方法、系统、电子设备和存储介质
CN103035238B (zh) 音频数据的编码方法及解码方法
WO2019227579A1 (zh) 会议信息记录方法、装置、计算机设备及存储介质
CN109256150B (zh) 基于机器学习的语音情感识别系统及方法
US8386265B2 (en) Language translation with emotion metadata
US8731936B2 (en) Energy-efficient unobtrusive identification of a speaker
US8447608B1 (en) Custom language models for audio content
CN105679310A (zh) 一种用于语音识别方法及系统
CN103164403B (zh) 视频索引数据的生成方法和系统
WO2016119604A1 (zh) 一种语音信息搜索方法、装置及服务器
CN108074570A (zh) 自动切割、传输、保存的语音识别方法
CN110070855A (zh) 一种基于迁移神经网络声学模型的语音识别系统及方法
CN109785832A (zh) 一种适用于重口音的老人机顶盒智能语音识别方法
CN113724718B (zh) 目标音频的输出方法及装置、系统
CN103794211A (zh) 一种语音识别方法及系统
CN111489754A (zh) 一种基于智能语音技术的话务数据分析方法
CN103474075B (zh) 语音信号发送方法及系统、接收方法及系统
CN113239903B (zh) 一种跨模态唇读的对抗性双重对比自监督学习方法
WO2022083039A1 (zh) 语音处理方法、计算机存储介质及电子设备
CN103474067A (zh) 语音信号传输方法及系统
US20230059882A1 (en) Speech synthesis method and apparatus, device and computer storage medium
CN102314878A (zh) 一种音素自动切分方法
CN114783428A (zh) 语音翻译、模型训练方法、装置、设备及存储介质
CN102314873A (zh) 一种语音基元的编码与合成系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120613