CN106373565A - 一种自动切换语音识别引擎的方法 - Google Patents
一种自动切换语音识别引擎的方法 Download PDFInfo
- Publication number
- CN106373565A CN106373565A CN201610712552.4A CN201610712552A CN106373565A CN 106373565 A CN106373565 A CN 106373565A CN 201610712552 A CN201610712552 A CN 201610712552A CN 106373565 A CN106373565 A CN 106373565A
- Authority
- CN
- China
- Prior art keywords
- engine
- online
- dictation
- communication quality
- network communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 13
- 238000004891 communication Methods 0.000 claims abstract description 30
- 238000005516 engineering process Methods 0.000 description 5
- 238000007689 inspection Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明提供一种自动切换语音识别引擎的方法,在使用在线听写引擎和在线识别引擎前检测网络通信质量,判断聚焦情况,在网络通信质量好、聚焦到编辑框时切换到在线听写引擎,在网络通信质量差是直接切换离线识别引擎,在网络通信质量好、聚焦不到编辑框时切换在线识别引擎,并根据在线识别引擎的识别结果判断命令词是否为可编辑命令,在网络通信质量好、命令词为可编辑命令时切换到在线听写引擎,在网络通信质量差、命令词为可编辑命令时自动跳出,在命令词为不可编辑命令时继续使用在线识别引擎,实现在线听写引擎、在线识别引擎和离线识别引擎间的自动切换,大大降低了在线引擎与服务器建立联系时耗费的网络资源和系统资源。
Description
技术领域
本发明属于语音识别技术领域,涉及一种语音识别引擎切换方法,具体是一种自动切换语音识别引擎的方法。
背景技术
与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。中国物联网校企联盟形象得把语音识别比做为“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用,例如在翼卡车联网中,只需按一键通客服人员口述即可设置目的地直接导航,安全、便捷。
现有的语音识别软件基本都建立在在线识别引擎和在线听写引擎的技术基础上,由于在线识别引擎和在线听写引擎工作时均需要与服务器建立联系,如果无法在具体应用时进行切换,会极大的耗费网络资源和系统资源。
发明内容
本发明的目的在于提供一种操作简单、的自动切换语音识别引擎的方法。
本发明的目的可以通过以下技术方案实现:
一种自动切换语音识别引擎的方法,包括以下步骤:
步骤S1,会话开始时,首先检测网络通信质量,如果网络通信质量较差,则在线听写引擎和在线识别引擎初始化失败,离线识别引擎初始化成功,执行步骤S6;如果网络通信质量较好,则在线听写引擎、在线识别引擎和离线识别引擎均初始化成功,执行步骤S2;
步骤S2,判断聚焦情况,如果聚焦到编辑框,执行步骤S5;如果聚焦不到编辑框,执行步骤S3;
步骤S3,再次检测网络通信质量,判断在线识别引擎是否可用,如果在线识别引擎可用,执行步骤S4;如果在线识别引擎不可用,执行步骤S6;
步骤S4,通过在线识别引擎进行在线语音识别,根据识别结果进行命令词类型检查,判断命令词是否为可编辑命令,如果命令词为可编辑命令,执行步骤S5,如果命令词为不可编辑命令,继续执行步骤S4;
步骤S5,再次检测网络通信质量,判断在线听写引擎是否可用,如果在线听写引擎可用,执行步骤S7,如果在线听写引擎不可用,执行步骤S8;
步骤S6,通过离线识别引擎进行离线语音识别,会话结束;
步骤S7,利用在线听写引擎进行在线听写任务;
步骤S8,跳出,会话结束。
本发明的有益效果:本发明提供一种自动切换语音识别引擎的方法,在使用在线听写引擎和在线识别引擎前检测网络通信质量,判断聚焦情况,在网络通信质量好、聚焦到编辑框时切换到在线听写引擎,在网络通信质量差是直接切换离线识别引擎,在网络通信质量好、聚焦不到编辑框时切换在线识别引擎,并根据在线识别引擎的识别结果判断命令词是否为可编辑命令,在网络通信质量好、命令词为可编辑命令时切换到在线听写引擎,在网络通信质量差、命令词为可编辑命令时自动跳出,在命令词为不可编辑命令时继续使用在线识别引擎,实现在线听写引擎、在线识别引擎和离线识别引擎间的自动切换,大大降低了在线引擎与服务器建立联系时耗费的网络资源和系统资源。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种自动切换语音识别引擎的方法,包括以下步骤:
步骤S1,会话开始时,首先检测网络通信质量,如果网络通信质量较差,则在线听写引擎和在线识别引擎初始化失败,离线识别引擎初始化成功,执行步骤S6;如果网络通信质量较好,则在线听写引擎、在线识别引擎和离线识别引擎均初始化成功,执行步骤S2。
步骤S2,判断聚焦情况,如果聚焦到编辑框,执行步骤S5;如果聚焦不到编辑框,执行步骤S3。
步骤S3,再次检测网络通信质量,判断在线识别引擎是否可用,如果在线识别引擎可用,执行步骤S4;如果在线识别引擎不可用,执行步骤S6。
步骤S4,通过在线识别引擎进行在线语音识别,根据识别结果进行命令词类型检查,判断命令词是否为可编辑命令,如果命令词为可编辑命令,执行步骤S5,如果命令词为不可编辑命令,继续执行步骤S4。
步骤S5,再次检测网络通信质量,判断在线听写引擎是否可用,如果在线听写引擎可用,执行步骤S7,如果在线听写引擎不可用,执行步骤S8。
步骤S6,通过离线识别引擎进行离线语音识别,会话结束。
步骤S7,利用在线听写引擎进行在线听写任务。
步骤S8,跳出,会话结束。
本发明提供一种自动切换语音识别引擎的方法,在使用在线听写引擎和在线识别引擎前检测网络通信质量,判断聚焦情况,在网络通信质量好、聚焦到编辑框时切换到在线听写引擎,在网络通信质量差是直接切换离线识别引擎,在网络通信质量好、聚焦不到编辑框时切换在线识别引擎,并根据在线识别引擎的识别结果判断命令词是否为可编辑命令,在网络通信质量好、命令词为可编辑命令时切换到在线听写引擎,在网络通信质量差、命令词为可编辑命令时自动跳出,在命令词为不可编辑命令时继续使用在线识别引擎,实现在线听写引擎、在线识别引擎和离线识别引擎间的自动切换,大大降低了在线引擎与服务器建立联系时耗费的网络资源和系统资源。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (1)
1.一种自动切换语音识别引擎的方法,其特征在于,包括以下步骤:
步骤S1,会话开始时,首先检测网络通信质量,如果网络通信质量较差,则在线听写引擎和在线识别引擎初始化失败,离线识别引擎初始化成功,执行步骤S6;如果网络通信质量较好,则在线听写引擎、在线识别引擎和离线识别引擎均初始化成功,执行步骤S2;
步骤S2,判断聚焦情况,如果聚焦到编辑框,执行步骤S5;如果聚焦不到编辑框,执行步骤S3;
步骤S3,再次检测网络通信质量,判断在线识别引擎是否可用,如果在线识别引擎可用,执行步骤S4;如果在线识别引擎不可用,执行步骤S6;
步骤S4,通过在线识别引擎进行在线语音识别,根据识别结果进行命令词类型检查,判断命令词是否为可编辑命令,如果命令词为可编辑命令,执行步骤S5,如果命令词为不可编辑命令,继续执行步骤S4;
步骤S5,再次检测网络通信质量,判断在线听写引擎是否可用,如果在线听写引擎可用,执行步骤S7,如果在线听写引擎不可用,执行步骤S8;
步骤S6,通过离线识别引擎进行离线语音识别,会话结束;
步骤S7,利用在线听写引擎进行在线听写任务;
步骤S8,跳出,会话结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610712552.4A CN106373565A (zh) | 2016-08-24 | 2016-08-24 | 一种自动切换语音识别引擎的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610712552.4A CN106373565A (zh) | 2016-08-24 | 2016-08-24 | 一种自动切换语音识别引擎的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106373565A true CN106373565A (zh) | 2017-02-01 |
Family
ID=57879519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610712552.4A Pending CN106373565A (zh) | 2016-08-24 | 2016-08-24 | 一种自动切换语音识别引擎的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106373565A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106847291A (zh) * | 2017-02-20 | 2017-06-13 | 成都启英泰伦科技有限公司 | 一种本地和云端相结合的语音识别系统及方法 |
CN107170450A (zh) * | 2017-06-14 | 2017-09-15 | 上海木爷机器人技术有限公司 | 语音识别方法及装置 |
CN107171874A (zh) * | 2017-07-21 | 2017-09-15 | 维沃移动通信有限公司 | 一种语音引擎切换方法、移动终端及服务器 |
CN107424607A (zh) * | 2017-07-04 | 2017-12-01 | 珠海格力电器股份有限公司 | 语音控制模式切换方法、装置及具有该装置的设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1735059A (zh) * | 2003-10-24 | 2006-02-15 | 微软公司 | 能经由多个网络通信媒体建立连接的计算设备上的网络和接口选择 |
CN101034390A (zh) * | 2006-03-10 | 2007-09-12 | 日电(中国)有限公司 | 用于语言模型切换和自适应的装置和方法 |
CN104575503A (zh) * | 2015-01-16 | 2015-04-29 | 广东美的制冷设备有限公司 | 语音识别方法和装置 |
CN104731549A (zh) * | 2015-04-09 | 2015-06-24 | 徐敏 | 一种基于鼠标的语音识别人机交互装置及其方法 |
CN104965596A (zh) * | 2015-07-24 | 2015-10-07 | 上海宝宏软件有限公司 | 语音操控系统 |
CN105118508A (zh) * | 2015-09-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
CN105261366A (zh) * | 2015-08-31 | 2016-01-20 | 努比亚技术有限公司 | 语音识别方法、语音引擎及终端 |
CN105869633A (zh) * | 2011-04-25 | 2016-08-17 | 谷歌公司 | 语言模型的跨语种初始化 |
-
2016
- 2016-08-24 CN CN201610712552.4A patent/CN106373565A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1735059A (zh) * | 2003-10-24 | 2006-02-15 | 微软公司 | 能经由多个网络通信媒体建立连接的计算设备上的网络和接口选择 |
CN101034390A (zh) * | 2006-03-10 | 2007-09-12 | 日电(中国)有限公司 | 用于语言模型切换和自适应的装置和方法 |
CN105869633A (zh) * | 2011-04-25 | 2016-08-17 | 谷歌公司 | 语言模型的跨语种初始化 |
CN104575503A (zh) * | 2015-01-16 | 2015-04-29 | 广东美的制冷设备有限公司 | 语音识别方法和装置 |
CN104731549A (zh) * | 2015-04-09 | 2015-06-24 | 徐敏 | 一种基于鼠标的语音识别人机交互装置及其方法 |
CN104965596A (zh) * | 2015-07-24 | 2015-10-07 | 上海宝宏软件有限公司 | 语音操控系统 |
CN105261366A (zh) * | 2015-08-31 | 2016-01-20 | 努比亚技术有限公司 | 语音识别方法、语音引擎及终端 |
CN105118508A (zh) * | 2015-09-14 | 2015-12-02 | 百度在线网络技术(北京)有限公司 | 语音识别方法和装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106847291A (zh) * | 2017-02-20 | 2017-06-13 | 成都启英泰伦科技有限公司 | 一种本地和云端相结合的语音识别系统及方法 |
CN107170450A (zh) * | 2017-06-14 | 2017-09-15 | 上海木爷机器人技术有限公司 | 语音识别方法及装置 |
CN107424607A (zh) * | 2017-07-04 | 2017-12-01 | 珠海格力电器股份有限公司 | 语音控制模式切换方法、装置及具有该装置的设备 |
CN107424607B (zh) * | 2017-07-04 | 2023-06-06 | 珠海格力电器股份有限公司 | 语音控制模式切换方法、装置及具有该装置的设备 |
CN107171874A (zh) * | 2017-07-21 | 2017-09-15 | 维沃移动通信有限公司 | 一种语音引擎切换方法、移动终端及服务器 |
CN107171874B (zh) * | 2017-07-21 | 2020-02-18 | 维沃移动通信有限公司 | 一种语音引擎切换方法、移动终端及服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106373565A (zh) | 一种自动切换语音识别引擎的方法 | |
CN109446307A (zh) | 一种实现智能对话中对话管理的方法 | |
CN110557451B (zh) | 对话交互处理方法、装置、电子设备和存储介质 | |
CN107277272A (zh) | 一种基于软件app的蓝牙设备语音交互方法及系统 | |
CN109348051A (zh) | 自动接听手机通话的方法、装置、设备及介质 | |
WO2007082132A3 (en) | Method and apparatus for effecting a handoff in a mobile internet protocol communication system | |
CN105137937B (zh) | 一种智能物联家电的控制方法、装置及智能物联家电 | |
CN102572134A (zh) | 工单处理方法、工单建立系统以及工单处理系统 | |
WO2005101886A3 (en) | Frequency layer convergence method for mbms | |
CN105100360A (zh) | 用于语音通话的通话辅助方法和装置 | |
CN104809758A (zh) | 基于三维实景漫游技术的现场隧道巡检及设备控制方法 | |
CN103152244A (zh) | 一种控制即时通信平台通信的方法、装置和通信系统 | |
CN107993657A (zh) | 一种基于多个语音助手平台的切换方法 | |
CN107545887A (zh) | 语音指令处理方法及装置 | |
CN109344411A (zh) | 一种自动侦听式同声传译的翻译方法 | |
CN109509468A (zh) | 一种设备执行语音播报任务的方法及装置 | |
CN109981360A (zh) | 物联网设备站点开通方法、装置、系统及存储介质 | |
CN107046598A (zh) | 一种基于移动终端的控制volte功能的方法及移动终端 | |
CN106506230A (zh) | 基于无线网络远程维护现场设备的方法及系统 | |
CN112866053A (zh) | 一种物联网测试方法、系统、装置及存储介质 | |
CN104064184B (zh) | 异构解码网络的构建方法及系统、语音识别方法及系统 | |
CN103269521B (zh) | 智能终端数据快速分享方法 | |
CN108965614A (zh) | 一种通话翻译方法以及系统 | |
CN104796867A (zh) | 一种主动登录的方法及终端 | |
CN100484175C (zh) | 一种会场当前说话者上报的实现方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170201 |
|
RJ01 | Rejection of invention patent application after publication |