CN104240698A - 一种语音识别的方法 - Google Patents

一种语音识别的方法 Download PDF

Info

Publication number
CN104240698A
CN104240698A CN201410492475.7A CN201410492475A CN104240698A CN 104240698 A CN104240698 A CN 104240698A CN 201410492475 A CN201410492475 A CN 201410492475A CN 104240698 A CN104240698 A CN 104240698A
Authority
CN
China
Prior art keywords
model
user
information
recognition method
scene information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410492475.7A
Other languages
English (en)
Inventor
朱龙腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI BOSHI INFORMATION SCIENCE & TECHNOLOGY Co Ltd
Original Assignee
SHANGHAI BOSHI INFORMATION SCIENCE & TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI BOSHI INFORMATION SCIENCE & TECHNOLOGY Co Ltd filed Critical SHANGHAI BOSHI INFORMATION SCIENCE & TECHNOLOGY Co Ltd
Priority to CN201410492475.7A priority Critical patent/CN104240698A/zh
Publication of CN104240698A publication Critical patent/CN104240698A/zh
Pending legal-status Critical Current

Links

Abstract

一种语音识别方法,包括以下步骤:第一步,录入声音;第二步,分析录入信息的特性;获取用户的场景信息,根据所述场景信息匹配语法模型或语言模型;根据所述匹配的语法模型或语言模型进行模式匹配算法,得到语音识别结果。第三步,获取录音者的声音数据,判别语法模型和语言模型;第四步,所述根据所述匹配的语法模型或语言模型进行模式匹配算法。上述语音识别的方法,根据用户的场景信息匹配语法模型或语言模型,能在进行模式匹配算法时根据用户的场景信息改变语法模型或语言模型的参数,使得模式匹配算法所采用的语法模型或语言模型适应用户的交互场景,因此能提高语音识别的准确度。

Description

一种语音识别的方法
技术领域
本发明涉及软件技术,尤其涉及一种语音识别的方法。
背景技术
语音识别是将人的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或字符序列等。传统的语音识别方法是采集语音,再对采集到的语音进行特征提取,特征提取是指将语音波形经过线性或非线性运算后得到一组矢量,然后通过模式匹配算法,将矢量转换为和模型最接近的发音单元序列,进而转换为语音识别结果。然而,传统的这种语音识别方法仅根据采集到的语音和固定的声学模型和语言模型( 或者语法模型) 进行模式匹配,识别准确度不高,为此,我们提出一种语音识别的方法。
发明内容
一种语音识别方法,包括以下步骤:
第一步,录入声音;
第二步,分析录入信息的特性;
获取用户的场景信息,根据所述场景信息匹配语法模型或语言模型;根据所述匹配的语法模型或语言模型进行模式匹配算法,得到语音识别结果;
第三步,获取录音者的声音数据,判别语法模型和语言模型;
第四步,所述根据所述匹配的语法模型或语言模型进行模式匹配算法,得到语音识别结果的步骤为:根据所述匹配的语法模型、语言模型和发音字典进行模式匹配算法,得到语音识别结果。
优选的,所述方法还包括根据所述位置信息和场景信息匹配发音字典的步骤。
优选的,所述录音者的声音数据为当时所处环境的所有的声音信息。
优选的,所述位置信息为用户的终端设备自动检测提供的地理位置或GPS 定位信息,所述场景信息为用户交互过程中的场景变化数据。
优选的,所述位置信息为用户主动提供或修改的地理位置或GPS 定位信息,所述场景信息为用户主动设定或更改的场景变化数据。
优选的,所述方法还包括获取用户的位置信息,根据所述位置信息匹配语法模型或语言模型的步骤。
上述语音识别的方法,根据用户的场景信息匹配语法模型或语言模型,能在进行模式匹配算法时根据用户的场景信息改变语法模型或语言模型的参数,使得模式匹配算法所采用的语法模型或语言模型适应用户的交互场景,因此能提高语音识别的准确度。
附图说明
图1为发明的流程框图。
具体实施方式
一种语音识别方法,包括以下步骤:
第一步,录入声音。
第二步,分析录入信息的特性,获取用户的场景信息,根据所述场景信息匹配语法模型或语言模型;根据所述匹配的语法模型或语言模型进行模式匹配算法,得到语音识别结果。优选的,所述方法还包括获取用户的位置信息,根据所述位置信息匹配语法模型或语言模型的步骤。优选的,所述方法还包括根据所述位置信息和场景信息匹配发音字典的步骤。
第三步,获取录音者的声音数据,判别语法模型和语言模型;优选的,录音者的声音数据为当时所处环境的所有的声音信息。
第四步,所述根据所述匹配的语法模型或语言模型进行模式匹配算法,得到语音识别结果的步骤为:根据所述匹配的语法模型、语言模型和发音字典进行模式匹配算法,得到语音识别结果。优选的,所述位置信息为用户的终端设备自动检测提供的地理位置或GPS 定位信息,所述场景信息为用户交互过程中的场景变化数据。优选的,所述位置信息为用户主动提供或修改的地理位置或GPS 定位信息,所述场景信息为用户主动设定或更改的场景变化数据。

Claims (6)

1.一种语音识别方法,包括以下步骤:
第一步,录入声音;
第二步,分析录入信息的特性;
获取用户的场景信息,根据所述场景信息匹配语法模型或语言模型;根据所述匹配的语法模型或语言模型进行模式匹配算法,得到语音识别结果;
第三步,获取录音者的声音数据,判别语法模型和语言模型;
第四步,所述根据所述匹配的语法模型或语言模型进行模式匹配算法,得到语音识别结果的步骤为:根据所述匹配的语法模型、语言模型和发音字典进行模式匹配算法,得到语音识别结果。
2.根据权利要求1所述的一种语音识别方法,其特征在于:所述方法还包括根据所述位置信息和场景信息匹配发音字典的步骤。
3.根据权利要求1所述的一种语音识别方法,其特征在于:所述录音者的声音数据为当时所处环境的所有的声音信息。
4.根据权利要求1所述的一种语音识别方法,其特征在于:所述位置信息为用户的终端设备自动检测提供的地理位置或GPS 定位信息,所述场景信息为用户交互过程中的场景变化数据。
5.根据权利要求1所述的一种语音识别方法,其特征在于:所述位置信息为用户主动提供或修改的地理位置或GPS 定位信息,所述场景信息为用户主动设定或更改的场景变化数据。
6.根据权利要求1所述的一种语音识别方法,其特征在于:所述方法还包括获取用户的位置信息,根据所述位置信息匹配语法模型或语言模型的步骤。
CN201410492475.7A 2014-09-24 2014-09-24 一种语音识别的方法 Pending CN104240698A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410492475.7A CN104240698A (zh) 2014-09-24 2014-09-24 一种语音识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410492475.7A CN104240698A (zh) 2014-09-24 2014-09-24 一种语音识别的方法

Publications (1)

Publication Number Publication Date
CN104240698A true CN104240698A (zh) 2014-12-24

Family

ID=52228655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410492475.7A Pending CN104240698A (zh) 2014-09-24 2014-09-24 一种语音识别的方法

Country Status (1)

Country Link
CN (1) CN104240698A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105225665A (zh) * 2015-10-15 2016-01-06 桂林电子科技大学 一种语音识别方法及语音识别装置
CN105719649A (zh) * 2016-01-19 2016-06-29 百度在线网络技术(北京)有限公司 语音识别方法及装置
CN107316635A (zh) * 2017-05-19 2017-11-03 科大讯飞股份有限公司 语音识别方法及装置、存储介质、电子设备
CN110349575A (zh) * 2019-05-22 2019-10-18 深圳壹账通智能科技有限公司 语音识别的方法、装置、电子设备和存储介质
CN111312235A (zh) * 2018-12-11 2020-06-19 阿里巴巴集团控股有限公司 一种语音交互方法、装置及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105225665A (zh) * 2015-10-15 2016-01-06 桂林电子科技大学 一种语音识别方法及语音识别装置
CN105719649A (zh) * 2016-01-19 2016-06-29 百度在线网络技术(北京)有限公司 语音识别方法及装置
CN105719649B (zh) * 2016-01-19 2019-07-05 百度在线网络技术(北京)有限公司 语音识别方法及装置
CN107316635A (zh) * 2017-05-19 2017-11-03 科大讯飞股份有限公司 语音识别方法及装置、存储介质、电子设备
CN111312235A (zh) * 2018-12-11 2020-06-19 阿里巴巴集团控股有限公司 一种语音交互方法、装置及系统
CN110349575A (zh) * 2019-05-22 2019-10-18 深圳壹账通智能科技有限公司 语音识别的方法、装置、电子设备和存储介质
WO2020233363A1 (zh) * 2019-05-22 2020-11-26 深圳壹账通智能科技有限公司 语音识别的方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
JP6465077B2 (ja) 音声対話装置および音声対話方法
KR102413692B1 (ko) 음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치
US10074363B2 (en) Method and apparatus for keyword speech recognition
US10629186B1 (en) Domain and intent name feature identification and processing
WO2017054122A1 (zh) 语音识别系统及方法、客户端设备及云端服务器
CN110047481B (zh) 用于语音识别的方法和装置
CN104240698A (zh) 一种语音识别的方法
CN106710593B (zh) 一种添加账号的方法、终端、服务器
JPWO2016120904A1 (ja) 意図推定装置及び意図推定方法
WO2011074771A3 (ko) 외국어 학습 장치 및 그 제공 방법.
CN105810205A (zh) 一种语音处理方法及装置
KR102607373B1 (ko) 음성감성 인식 장치 및 방법
US9240181B2 (en) Automatic collection of speaker name pronunciations
CN103778915A (zh) 语音识别方法和移动终端
CN111986675A (zh) 语音对话方法、设备及计算机可读存储介质
WO2014173325A1 (zh) 喉音识别方法及装置
JP2018159788A5 (ja) 情報処理装置、感情認識方法、及び、プログラム
CN108091340B (zh) 声纹识别方法、声纹识别系统和计算机可读存储介质
JP5849761B2 (ja) 音声認識システム、音声認識方法および音声認識プログラム
CN103426429B (zh) 语音控制方法和装置
CN104200807B (zh) 一种erp语音控制方法
CN107886940B (zh) 语音翻译处理方法及装置
CN109074809B (zh) 信息处理设备、信息处理方法和计算机可读存储介质
CN115104151A (zh) 一种离线语音识别方法和装置、电子设备和可读存储介质
US9953638B2 (en) Meta-data inputs to front end processing for automatic speech recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141224