CN111261166B - 一种语音识别方法及装置 - Google Patents
一种语音识别方法及装置 Download PDFInfo
- Publication number
- CN111261166B CN111261166B CN202010043239.2A CN202010043239A CN111261166B CN 111261166 B CN111261166 B CN 111261166B CN 202010043239 A CN202010043239 A CN 202010043239A CN 111261166 B CN111261166 B CN 111261166B
- Authority
- CN
- China
- Prior art keywords
- recognition result
- engine
- result
- recognition
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000009286 beneficial effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- WPPDXAHGCGPUPK-UHFFFAOYSA-N red 2 Chemical compound C1=CC=CC=C1C(C1=CC=CC=C11)=C(C=2C=3C4=CC=C5C6=CC=C7C8=C(C=9C=CC=CC=9)C9=CC=CC=C9C(C=9C=CC=CC=9)=C8C8=CC=C(C6=C87)C(C=35)=CC=2)C4=C1C1=CC=CC=C1 WPPDXAHGCGPUPK-UHFFFAOYSA-N 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种语音识别方法及装置,包括:语音模板接收到语音信号输入时,同时打开离线引擎和在线引擎;利用离线引擎和在线引擎对语音信号同时进行识别,获取两份识别结果;根据两份识别结果确定最终识别结果;输出最终识别结果。通过同时利用在线引擎和离线引擎对语音信号进行识别,使得识别的结果更加准确,由于离线引擎具有比在线引擎更高的识别率,故而识别的结果也可以根据两个引擎各自的识别结果进行调整,保证了识别的准确性。解决了现有技术中由于在线引擎的优化识别率较低使得语音模板填充的语音发生错误从而导致识别的结果出现大的偏差,提高了用户的体验感。
Description
技术领域
本发明涉及信号处理技术领域,尤其涉及一种语音识别方法及装置。
背景技术
目前,语音识别技术越来越广泛的应用在人们的生活中,比如用户发出一句语音即可将该语音转化为对应的文字,这样避免了用户去手动打字输入的繁琐操作,现有的语音识别技术是利用语音模块结合在线引擎对语音信号进行识别并且转换为文字,但是这种方法存在着以下缺点:在线引擎的优化识别率较低使得语音模板填充的语音发生错误从而导致识别的结果出现大的偏差,严重影响了用户的体验感。
发明内容
针对上述所显示出来的问题,本方法基于利用在线引擎和离线引擎同时对语音模板中的语音信号进行识别,从两种识别结果中确定最终的识别结果来对语音进行识别输出。
一种语音识别方法,包括以下步骤:
当语音模板接收到语音信号输入时,同时打开离线引擎和在线引擎;
利用所述离线引擎和所述在线引擎对所述语音信号同时进行识别,获取两份识别结果;
根据所述两份识别结果确定最终识别结果;
输出所述最终识别结果。
优选的,所述利用所述离线引擎和所述在线引擎对所述语音信号同时进行识别,获取两份识别结果,包括:
将所述语音信号复制为两份,获得两份相同的所述语音信号;
将所述两份相同的语音信号分别输入到所述离线引擎和所述在线引擎中;
获取所述在线引擎的第一识别结果和所述离线引擎识别的第二识别结果。
优选的,所述根据所述两份识别结果确定最终识别结果,包括:
判断所述第一识别结果的输出结果类型是否为第一预设类型;
若是,将所述第一识别结果确定为所述最终识别结果;
否则,判断所述第一识别结果的输出结果类型是否为第二预设类型;
若所述第一识别结果的输出结果类型为所述第二预设类型,判断所述第二识别结果的置信度是否大于等于预设阈值;
若所述置信度大于等于所述预设阈值,获取所述第二识别结果中的第二元素值,以及获取所述第一识别结果的第一元素填充位置信息;
根据所述第一元素填充位置信息确定所述第一识别结果中的第一元素值;
将所述第一识别结果中的所述第一元素值替换为所述第二元素值;
将所述替换后的第一识别结果确定为所述最终识别结果;
若所述置信度小于所述预设阈值,确定所述第二识别结果为错误识别结果,将所述第一识别结果确定为所述最终识别结果。
优选的,所述输出所述最终识别结果,包括:
获取预设设备的请求指令;
根据所述请求指令将所述最终识别结果输入到所述预设设备上;
将所述最终识别结果显示在所述预设设备上。
优选的,所述方法还包括:当所述语音模板接收到所述语音信号输入时,对所述语音信号进行降噪和提帧预处理。
一种语音识别装置,该装置包括:
开启模块,用于当语音模板接收到语音信号输入时,同时打开离线引擎和在线引擎;
识别模块,用于利用所述离线引擎和所述在线引擎对所述语音信号同时进行识别,获取两份识别结果;
确定模块,用于根据所述两份识别结果确定最终识别结果;
输出模块,用于输出所述最终识别结果。
优选的,所述识别模块,包括:
复制子模块,用于将所述语音信号复制为两份,获得两份相同的所述语音信号;
输入子模块,用于将所述两份相同的语音信号分别输入到所述离线引擎和所述在线引擎中;
第一获取子模块,用于获取所述在线引擎的第一识别结果和所述离线引擎识别的第二识别结果。
优选的,所述确定模块,包括:
第一判断子模块,用于判断所述第一识别结果的输出结果类型是否为第一预设类型;
第一确定子模块,用于若所述第一判断子模块确定为所述第一预设类型时,将所述第一识别结果确定为所述最终识别结果;
第二判断子模块,用于当所述第一判断子模块确定不是所述第一预设类型时,判断所述第一识别结果的输出结果类型是否为第二预设类型;
第三判断子模块,用于若所述第二判断子模块确定所述第一识别结果的输出结果类型为所述第二预设类型时,判断所述第二识别结果的置信度是否大于等于预设阈值;
第二获取子模块,用于若所述第三判断子模块确定所述置信度大于等于所述预设阈值时,获取所述第二识别结果中的第二元素值,以及获取所述第一识别结果的第一元素填充位置信息;
第二确定子模块,用于根据所述第一元素填充位置信息确定所述第一识别结果中的第一元素值;
替换子模块,用于将所述第一识别结果中的所述第一元素值替换为所述第二元素值;
输出子模块,用于输出替换后的第一识别结果;
第三确定子模块,用于将所述替换后的第一识别结果确定为所述最终识别结果;
第四确定子模块,用于若所述第三判断子模块确定所述置信度小于所述第三预设阈值,确定所述第二识别结果为错误识别结果,将所述第一识别结果确定为所述最终识别结果。
优选的,所述输出模块,包括:
第三获取子模块,用于获取预设设备的请求指令;
输入子模块,用于根据所述请求指令将所述最终识别结果输入到所述预设设备上;
显示子模块,用于将所述最终识别结果显示在所述预设设备上。
优选的,所述装置还包括:
预处理模块,用于当所述语音模板接收到所述语音信号输入时,对所述语音信号进行降噪和提帧预处理。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制,在附图中:
图1为本发明所提供的一种语音识别方法的工作流程图;
图2为本发明所提供的一种语音识别方法的另一工作流程图;
图3为本发明所提供的一种语音识别方法的工作流程截图;
图4为本发明所提供的一种语音识别装置的结构图;
图5为本发明所提供的一种语音识别装置的另一结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
目前,语音识别技术越来越广泛的应用在人们的生活中,比如用户发出一句语音即可将该语音转化为对应的文字,这样避免了用户去手动打字输入的繁琐操作,现有的语音识别技术是利用语音模块结合在线引擎对语音信号进行识别并且转换为文字,但是这种方法存在着以下缺点:在线引擎的优化识别率较低使得语音模板填充的语音发生错误从而导致识别的结果出现大的偏差,严重影响了用户的体验感。为了解决上述问题,本实施例公开了一种基于利用在线引擎和离线引擎同时对语音模板中的语音信号进行识别,从两种识别结果中确定最终的识别结果来对语音进行识别输出的方法。
一种语音识别方法,如图1所示,包括以下步骤:
步骤S101、当语音模板接收到语音信号输入时,同时打开离线引擎和在线引擎;
步骤S102、利用离线引擎和在线引擎对语音信号同时进行识别,获取两份识别结果;
步骤S103、根据两份识别结果确定最终识别结果;
步骤S104、输出最终识别结果;
在本实施例中,上述离线引擎指的是在没有网络接入的引擎,在线引擎指的是有网络接入的引擎。
上述技术方案的工作原理为:当语音模板接收到语音信号输入时,同时打开离线引擎和在线引擎同时对语音信号进行识别,得到两份识别结果,根据两份识别结果确定最终识别结果,将最终识别结果输出给用户观看。
上述技术方案的有益效果为:通过同时利用在线引擎和离线引擎对语音信号进行识别,使得识别的结果更加准确,由于离线引擎具有比在线引擎更高的识别率,故而识别的结果也可以根据两个引擎各自的识别结果进行调整,保证了识别的准确性。解决了现有技术中由于在线引擎的优化识别率较低使得语音模板填充的语音发生错误从而导致识别的结果出现大的偏差,提高了用户的体验感。
在一个实施例中,如图2所示,利用离线引擎和在线引擎对语音信号同时进行识别,获取两份识别结果,包括:
步骤S201、将语音信号复制为两份,获得两份相同的语音信号;
步骤S202、将两份相同的语音信号分别输入到离线引擎和在线引擎中;
步骤S203、获取在线引擎的第一识别结果和离线引擎识别的第二识别结果。
上述技术方案的有益效果为:通过获取第一识别结果和第二识别结果可以将二者进行对比,由第二识别结果去检查第一识别结果是否准确,降低了识别错误的风险。
在一个实施例中,根据两份识别结果确定最终识别结果,包括:
判断第一识别结果的输出结果类型是否为第一预设类型;
若是,将第一识别结果确定为最终识别结果;
否则,判断第一识别结果的输出结果类型是否为第二预设类型;
若第一识别结果的输出结果类型为第二预设类型,判断第二识别结果的置信度是否大于等于预设阈值;
若置信度大于等于预设阈值,获取第二识别结果中的第二元素值,以及获取第一识别结果的第一元素填充位置信息;
根据第一元素填充位置信息确定第一识别结果中的第一元素值;
将第一识别结果中的第一元素值替换为第二元素值;
输出替换后的第一识别结果;
将替换后的第一识别结果确定为最终识别结果;
若置信度小于预设阈值,确定第二识别结果为错误识别结果,将第一识别结果确定为最终识别结果;
在本实施例中,上述第一预设模型和第二预设模型都是体现在识别的文字里,它们表示为一个预设数字,第一预设模型可以为0,第二预设模型可以为1,上述预设阈值可以为1。
上述技术方案的有益效果为:将离线引擎的第二识别结果中的第二元素值替换为第一识别结果中的第一元素值,保证了元素值的准确性,获取第一元素填充位置信息可以快速的将第二元素值替换为第一元素值,有效的减少了识别的时间,提高了识别效率。
在一个实施例中,输出最终识别结果,包括:
获取预设设备的请求指令;
根据请求指令将最终识别结果输入到预设设备上;
将最终识别结果显示在预设设备上;
在本实施例中,上述预设设备可以为手机、平板、电脑等智能设备。
上述技术方案的有益效果为:可以更直观的向用户显示识别结果,使用户有良好的视觉感受。
在一个实施例中,上述方法还包括:当语音模板接收到语音信号输入时,对语音信号进行降噪和提帧预处理。
上述技术方案的有益效果为:将语音信号中的噪音剔除并且进行提帧处理使得语音信号中的人声更加清晰,使得在线引擎和离线引擎的识别率更高,避免了误识别几率的同时提高了识别效率。
在一个实时例中,如图3所示,包括:
第一步:打开模板之后,离线引擎和在线引擎共同识别开启,将语音复制两份,分别送入离线引擎和在线引擎;
第二步:在线引擎经过后处理获取到识别结果,如图中红色1序号所示,resultType为1表示是命令(resultType为0表示是文本),得到的识别结果中包含了元素所在的位置索引(index)信息,但是识别结果中元素的值识别错误既elementValue应该为10,但是识别结果为4,所以填充结果是错误的(红色1序号中红色字部分经常出错,同样错误的还存在识别结果出现毫无根据的大数问题);
第三步:和第二步同步进行,离线引擎获取识别结果,如图中红色2序号所示;
第四步:1)当红色1标号中resultType为0时,表示的识别结果为文本,将在线识别结果最为最终结果;
2)当红色1标号中resultType为1时,表示的识别结果为命令,查看离线识别结果中的阈值(红色2序号中confidence),如果阈值大于指定值,则认为离线引擎识别了正确结果,那么将离线识别结果(红色2序号)中的Value,替换到在线识别结果(红色1序号)elementValue中作为最终结果;
如果阈值小于指定值,则认为离线引擎识别了错误结果,那么将在线引擎的识别结果作为最终结果;
第五步:拿到的最终提供给客户端使用,并更新界面显示。
上述技术方案的有益效果为:首先利用了在线引擎的后处理模块提供元素填充位置和在线引擎的文本识别功能,针对在线引擎的句式识别率低的问题,由识别率高的离线引擎替代。提高在固定位置准确填充识别结果。
本实施例还公开了一种语音识别装置,如图4所示,该装置包括:
开启模块401,用于当语音模板接收到语音信号输入时,同时打开离线引擎和在线引擎;
识别模块402,用于利用离线引擎和在线引擎对语音信号同时进行识别,获取两份识别结果;
确定模块403,用于根据两份识别结果确定最终识别结果;
输出模块404,用于输出最终识别结果。
在一个实施例中,识别模块,包括:
复制子模块4021,用于将语音信号复制为两份,获得两份相同的语音信号;
输入子模块4022,用于将两份相同的语音信号分别输入到所述离线引擎和在线引擎中;
第一获取子模块4023,用于获取在线引擎的第一识别结果和离线引擎识别的第二识别结果。
在一个实施例中,确定模块,包括:
第一判断子模块,用于判断第一识别结果的输出结果类型是否为第一预设类型;
第一确定子模块,用于若第一判断子模块确定为第一预设类型时,将第一识别结果确定为最终识别结果;
第二判断子模块,用于当第一判断子模块确定不是第一预设类型时,判断第一识别结果的输出结果类型是否为第二预设类型;
第三判断子模块,用于若第二判断子模块确定第一识别结果的输出结果类型为第二预设类型时,判断第二识别结果的置信度是否大于等于预设阈值;
第二获取子模块,用于若第三判断子模块确定置信度大于等于预设阈值时,获取第二识别结果中的第二元素值,以及获取第一识别结果的第一元素填充位置信息;
第二确定子模块,用于根据第一元素填充位置信息确定第一识别结果中的第一元素值;
替换子模块,用于将第一识别结果中的第一元素值替换为第二元素值;输出子模块,用于输出替换后的第一识别结果;
第三确定子模块,用于将替换后的第一识别结果确定为最终识别结果;
第四确定子模块,用于若第三判断子模块确定置信度小于第三预设阈值,确定第二识别结果为错误识别结果,将第一识别结果确定为最终识别结果。
在一个实施例中,输出模块,包括:
第三获取子模块,用于获取预设设备的请求指令;
输入子模块,用于根据请求指令将最终识别结果输入到预设设备上;
显示子模块,用于将最终识别结果显示在预设设备上。
在一个实施例中,上述装置还包括:
预处理模块,用于当语音模板接收到语音信号输入时,对语音信号进行降噪和提帧预处理。
本领域技术人员应当理解的是,本发明中的第一、第二指的是不同应用阶段而已。
本领域技术用户员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (6)
1.一种语音识别方法,其特征在于,包括以下步骤:
当语音模板接收到语音信号输入时,同时打开离线引擎和在线引擎;
利用所述离线引擎和所述在线引擎对所述语音信号同时进行识别,获取两份识别结果;
根据所述两份识别结果确定最终识别结果;
输出所述最终识别结果;
所述利用所述离线引擎和所述在线引擎对所述语音信号同时进行识别,获取两份识别结果,包括:
将所述语音信号复制为两份,获得两份相同的所述语音信号;
将所述两份相同的语音信号分别输入到所述离线引擎和所述在线引擎中;
获取所述在线引擎的第一识别结果和所述离线引擎识别的第二识别结果;
所述根据所述两份识别结果确定最终识别结果,包括:
判断所述第一识别结果的输出结果类型是否为第一预设类型;
若是,将所述第一识别结果确定为所述最终识别结果;
否则,判断所述第一识别结果的输出结果类型是否为第二预设类型;
若所述第一识别结果的输出结果类型为所述第二预设类型,判断所述第二识别结果的置信度是否大于等于预设阈值;
若所述置信度大于等于所述预设阈值,获取所述第二识别结果中的第二元素值,以及获取所述第一识别结果的第一元素填充位置信息;
根据所述第一元素填充位置信息确定所述第一识别结果中的第一元素值;
将所述第一识别结果中的所述第一元素值替换为所述第二元素值;
输出替换后的第一识别结果;
将所述替换后的第一识别结果确定为所述最终识别结果;
若所述置信度小于所述预设阈值,确定所述第二识别结果为错误识别结果,将所述第一识别结果确定为所述最终识别结果。
2.根据权利要求1所述语音识别方法,其特征在于,所述输出所述最终识别结果,包括:
获取预设设备的请求指令;
根据所述请求指令将所述最终识别结果输入到所述预设设备上;
将所述最终识别结果显示在所述预设设备上。
3.根据权利要求1所述语音识别方法,其特征在于,所述方法还包括:当所述语音模板接收到所述语音信号输入时,对所述语音信号进行降噪和提帧预处理。
4.一种语音识别装置,其特征在于,该装置包括:
开启模块,用于当语音模板接收到语音信号输入时,同时打开离线引擎和在线引擎;
识别模块,用于利用所述离线引擎和所述在线引擎对所述语音信号同时进行识别,获取两份识别结果;
确定模块,用于根据所述两份识别结果确定最终识别结果;
输出模块,用于输出所述最终识别结果;
所述识别模块,包括:
复制子模块,用于将所述语音信号复制为两份,获得两份相同的所述语音信号;
输入子模块,用于将所述两份相同的语音信号分别输入到所述离线引擎和所述在线引擎中;
第一获取子模块,用于获取所述在线引擎的第一识别结果和所述离线引擎识别的第二识别结果;
所述确定模块,包括:
第一判断子模块,用于判断所述第一识别结果的输出结果类型是否为第一预设类型;
第一确定子模块,用于若所述第一判断子模块确定为所述第一预设类型时,将所述第一识别结果确定为所述最终识别结果;
第二判断子模块,用于当所述第一判断子模块确定不是所述第一预设类型时,判断所述第一识别结果的输出结果类型是否为第二预设类型;
第三判断子模块,用于若所述第二判断子模块确定所述第一识别结果的输出结果类型为所述第二预设类型时,判断所述第二识别结果的置信度是否大于等于预设阈值;
第二获取子模块,用于若所述第三判断子模块确定所述置信度大于等于所述预设阈值时,获取所述第二识别结果中的第二元素值,以及获取所述第一识别结果的第一元素填充位置信息;
第二确定子模块,用于根据所述第一元素填充位置信息确定所述第一识别结果中的第一元素值;
替换子模块,用于将所述第一识别结果中的所述第一元素值替换为所述第二元素值;
输出子模块,用于输出替换后的第一识别结果;
第三确定子模块,用于将所述替换后的第一识别结果确定为所述最终识别结果;
第四确定子模块,用于若所述第三判断子模块确定所述置信度小于所述预设阈值,确定所述第二识别结果为错误识别结果,将所述第一识别结果确定为所述最终识别结果。
5.根据权利要求4所述语音识别装置,其特征在于,所述输出模块,包括:
第三获取子模块,用于获取预设设备的请求指令;
输入子模块,用于根据所述请求指令将所述最终识别结果输入到所述预设设备上;
显示子模块,用于将所述最终识别结果显示在所述预设设备上。
6.根据权利要求4所述语音识别装置,其特征在于,所述装置还包括:预处理模块,用于当所述语音模板接收到所述语音信号输入时,对所述语音信号进行降噪和提帧预处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010043239.2A CN111261166B (zh) | 2020-01-15 | 2020-01-15 | 一种语音识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010043239.2A CN111261166B (zh) | 2020-01-15 | 2020-01-15 | 一种语音识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111261166A CN111261166A (zh) | 2020-06-09 |
CN111261166B true CN111261166B (zh) | 2022-09-27 |
Family
ID=70948926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010043239.2A Active CN111261166B (zh) | 2020-01-15 | 2020-01-15 | 一种语音识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111261166B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114446280A (zh) * | 2020-10-16 | 2022-05-06 | 阿里巴巴集团控股有限公司 | 语音交互及语音识别方法、装置、设备和存储介质 |
CN112435670A (zh) * | 2020-11-11 | 2021-03-02 | 青岛歌尔智能传感器有限公司 | 语音识别方法、语音识别设备和计算机可读存储介质 |
CN112382292A (zh) * | 2020-12-11 | 2021-02-19 | 北京百度网讯科技有限公司 | 基于语音的控制方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109920432A (zh) * | 2019-03-05 | 2019-06-21 | 百度在线网络技术(北京)有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN110120221A (zh) * | 2019-06-06 | 2019-08-13 | 上海蔚来汽车有限公司 | 用于车机系统的用户个性化离线语音识别方法及其系统 |
CN110277089A (zh) * | 2019-07-09 | 2019-09-24 | 广东美的制冷设备有限公司 | 离线语音识别模型的更新方法、家用电器和服务器 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE417346T1 (de) * | 2003-03-26 | 2008-12-15 | Koninkl Philips Electronics Nv | Spracherkennungs- und korrektursystem, korrekturvorrichtung und verfahren zur erstellung eines lexikons von alternativen |
JP4604178B2 (ja) * | 2004-11-22 | 2010-12-22 | 独立行政法人産業技術総合研究所 | 音声認識装置及び方法ならびにプログラム |
CN103440867B (zh) * | 2013-08-02 | 2016-08-10 | 科大讯飞股份有限公司 | 语音识别方法及系统 |
CN104899002A (zh) * | 2015-05-29 | 2015-09-09 | 深圳市锐曼智能装备有限公司 | 机器人基于对话预测的在线与离线的识别切换方法及系统 |
CN106531151B (zh) * | 2016-11-16 | 2019-10-11 | 北京云知声信息技术有限公司 | 语音识别方法及装置 |
CN106558313A (zh) * | 2016-11-16 | 2017-04-05 | 北京云知声信息技术有限公司 | 语音识别方法及装置 |
CN107464567A (zh) * | 2017-07-24 | 2017-12-12 | 深圳云知声信息技术有限公司 | 语音识别方法及装置 |
US10388272B1 (en) * | 2018-12-04 | 2019-08-20 | Sorenson Ip Holdings, Llc | Training speech recognition systems using word sequences |
-
2020
- 2020-01-15 CN CN202010043239.2A patent/CN111261166B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109920432A (zh) * | 2019-03-05 | 2019-06-21 | 百度在线网络技术(北京)有限公司 | 一种语音识别方法、装置、设备及存储介质 |
CN110120221A (zh) * | 2019-06-06 | 2019-08-13 | 上海蔚来汽车有限公司 | 用于车机系统的用户个性化离线语音识别方法及其系统 |
CN110277089A (zh) * | 2019-07-09 | 2019-09-24 | 广东美的制冷设备有限公司 | 离线语音识别模型的更新方法、家用电器和服务器 |
Also Published As
Publication number | Publication date |
---|---|
CN111261166A (zh) | 2020-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111261166B (zh) | 一种语音识别方法及装置 | |
CN109584882B (zh) | 一种针对特定场景的语音转文字的优化方法及系统 | |
US8504350B2 (en) | User-interactive automatic translation device and method for mobile device | |
CN111523306A (zh) | 文本的纠错方法、装置和系统 | |
CN111144191A (zh) | 字体识别方法、装置、电子设备及存储介质 | |
CN101326533B (zh) | 基于语音的文档的历史跟踪方法和系统 | |
CN109616101B (zh) | 声学模型训练方法、装置、计算机设备和可读存储介质 | |
CN114549993B (zh) | 实验中线段图像的评分方法、系统、设备及可读存储介质 | |
CN110555096A (zh) | 用户意图识别方法、系统、终端及介质 | |
CN113642316A (zh) | 中文文本纠错方法、装置、电子设备及存储介质 | |
CN111144118B (zh) | 口语化文本中命名实体的识别方法、系统、设备和介质 | |
CN110765342A (zh) | 信息查询方法及装置、存储介质、智能终端 | |
CN115661836A (zh) | 一种自动批改方法、装置、系统及可读存储介质 | |
CN116013307A (zh) | 一种标点预测方法、装置、设备以及计算机存储介质 | |
CN112669814B (zh) | 一种数据处理方法、装置、设备及介质 | |
CN110929514B (zh) | 文本校对方法、装置、计算机可读存储介质及电子设备 | |
CN114742522B (zh) | 一种勘察设计图自动对比方法、系统、装置及存储介质 | |
CN112367494A (zh) | 基于ai的在线会议通讯方法、装置及计算机设备 | |
US11694675B2 (en) | Information processing apparatus, information processing system, and information processing method | |
CN113850235B (zh) | 一种文本处理方法、装置、设备及介质 | |
CN115601778A (zh) | 基于图像识别的作业批改方法、装置、设备及存储介质 | |
CN111767214B (zh) | 软件ui的自动化测试方法及装置 | |
CN114297409A (zh) | 模型训练方法、信息抽取方法及装置、电子设备、介质 | |
CN112287738A (zh) | 图形控件的文本匹配方法及装置、介质、电子设备 | |
CN112257420B (zh) | 文本处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |