CN106328124A - 一种基于用户行为特征的语音识别方法 - Google Patents

一种基于用户行为特征的语音识别方法 Download PDF

Info

Publication number
CN106328124A
CN106328124A CN201610712533.1A CN201610712533A CN106328124A CN 106328124 A CN106328124 A CN 106328124A CN 201610712533 A CN201610712533 A CN 201610712533A CN 106328124 A CN106328124 A CN 106328124A
Authority
CN
China
Prior art keywords
user
voice
audio
voice data
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610712533.1A
Other languages
English (en)
Inventor
冯海洪
毛德平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Mic Technology Co Ltd
Original Assignee
Anhui Mic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Mic Technology Co Ltd filed Critical Anhui Mic Technology Co Ltd
Priority to CN201610712533.1A priority Critical patent/CN106328124A/zh
Publication of CN106328124A publication Critical patent/CN106328124A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/065Adaptation
    • G10L15/07Adaptation to the speaker
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于用户行为特征的语音识别方法,先通过语音识别终端采集到的用户语音数据并发送到服务器进行处理分析,结合该用户的信息,分析得到用户的行为习惯和声音特征,根据每个用户不同的行为习惯生成更加符合该用户行为习惯的语法规则和命令词库,根据每个用户的声音特征生成声音特征模型,对语音识别终端的语法规则、命令词库以及声音特征模型进行调整更新,进一步优化语音模型,实现自学习功能,使得每个用户都有更加个性化的、符合自己行为习惯的体验,保证语音识别的准确率,提高语音识别的可靠性。

Description

一种基于用户行为特征的语音识别方法
技术领域
本发明属于语音识别技术领域,涉及一种语音识别方法,具体是一种基于用户行为特征的语音识别方法。
背景技术
随着通信技术的发展,终端集成了越来越多的功能,从而使得终端的系统功能列表中包含了越来越多相应的应用程序,例如,电脑中安装的应用程序,第三方智能手机中安装的应用程序(App l i cat i on,APP)等。有些应用程序中会涉及一些语音识别服务,例如,QQ、微信等即时通信软件中的语音输入、百度地图中的语音输入等。现有技术中,语音处理引擎可以利用所接收到的语音数据作为输入,运行语音模型,以获得识别结果。
然而,由于每个用户表达同一件事情的方式和用词都不一样,同时不同用户的声音也存在一定的差异性,因此,采用已有的语音模型进行语音识别,会导致某些用户的语音识别准确率降低,从而导致了语音识别的可靠性的降低。
发明内容
本发明的目的在于提供一种对用户行为进行数据采集和分析,进一步优化语音模型,实现自学习功能的基于用户行为特征的语音识别方法。
本发明的目的可以通过以下技术方案实现:
一种基于用户行为特征的语音识别方法,包括以下步骤:
步骤S1,首先,语音识别终端使用语音采集设备采集用户音频数据,上传至在线语音识别服务器;
步骤S2,在线语音识别服务器对用户的音频数据进行处理,结合该用户的信息,进一步分析得到用户的行为习惯和声音特征;
其中,所述的用户行为习惯包括用户说话的语法习惯和用词习惯;
步骤S3,在线语音识别服务器根据每个用户不同的行为习惯生成更加符合该用户行为习惯的语法规则和命令词库,推送给语音识别终端;
步骤S4,语音识别终端根据接收到新的语法规则和命令词库对现有的语法规则和命令词库进行调整,用户再次使用时采用新的语法规则和命令词库;
步骤S5,在线语音识别服务器将用户声音特征进一步转换为用户的声音特征模型,推送到语音识别终端;
步骤S6,语音识别终端根据接收到的用户声音特征模型对本地声音特征模型进行更新。
进一步地,所述的在线语音识别服务器对用户音频数据的处理包括对音频数据的识别处理和对音频数据的信号处理。
进一步地,所述的对音频数据的识别处理包括以下步骤:
步骤S211,将音频数据通过语音识别转换为文本信息;
步骤S212,识别出文本信息中的关键字;
步骤S213,根据识别出的关键字,采用预定策略的方法、神经网络的方法、模糊查询的方法或关联分析的方法分析出用户的行为习惯信息。
进一步地,所述的对音频数据的信号处理包括以下步骤:
步骤S221,将音频数据转换成与该音频对应的数据模型;
步骤S222,对该音频数据模型进行分析,抽取形成用户声音特征。
本发明的有益效果:本发明提供了一种基于用户行为特征的语音识别方法,先通过语音识别终端采集到的用户语音数据并发送到服务器进行处理分析,结合该用户的信息,分析得到用户的行为习惯和声音特征,根据每个用户不同的行为习惯生成更加符合该用户行为习惯的语法规则和命令词库,根据每个用户的声音特征生成声音特征模型,对语音识别终端的语法规则、命令词库以及声音特征模型进行调整更新,进一步优化语音模型,实现自学习功能,使得每个用户都有更加个性化的、符合自己行为习惯的体验,保证语音识别的准确率,提高语音识别的可靠性。
附图说明
下面结合附图和具体实施例对本发明作进一步详细描述。
图1是本发明的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
如图1所示,本发明提供了一种基于用户行为特征的语音识别方法,通过对用户行为进行数据采集和分析,进一步优化语音模型,实现自学习功能,包括以下步骤:
步骤S1,首先,语音识别终端使用语音采集设备采集用户音频数据,上传至在线语音识别服务器;其中,语音采集设备可使用麦克风、语音鼠标等,在线语音识别服务器使用讯飞在线语音识别服务器。
步骤S2,在线语音识别服务器对用户的音频数据进行处理,结合该用户的信息,进一步分析得到用户的行为习惯和声音特征;其中,用户行为习惯包括用户说话的语法习惯和用词习惯。
在线语音识别服务器对用户音频数据的处理包括对音频数据的识别处理和对音频数据的信号处理。
其中,对音频数据的识别处理包括:
步骤S211,将音频数据通过语音识别转换为文本信息。
步骤S212,识别出文本信息中的关键字。
步骤S213,根据识别出的关键字,采用预定策略的方法、神经网络的方法、模糊查询的方法或关联分析的方法分析出用户的行为习惯信息。
其中,对音频数据的信号处理包括:
步骤S221,将音频数据转换成与该音频对应的数据模型。
步骤S222,对该音频数据模型进行分析,抽取形成用户声音特征。
步骤S3,在线语音识别服务器根据每个用户不同的行为习惯生成更加符合该用户行为习惯的语法规则和命令词库,推送给语音识别终端;其中,语法规则使用BNF或ABNF进行描述。
步骤S4,语音识别终端根据接收到新的语法规则和命令词库对现有的语法规则和命令词库进行调整,用户再次使用时采用新的语法规则和命令词库,得到更加符合该用户行为习惯的结果。
步骤S5,在线语音识别服务器将用户声音特征进一步转换为用户的声音特征模型,推送到语音识别终端。
步骤S6,语音识别终端根据接收到的用户声音特征模型对本地声音特征模型进行更新,语音识别终端就可以结合每个用户所属的声音特征参数进行不同的语音识别以到达更加人性化的功能。
步骤S7,返回步骤1,形成良性的循环,使得每个用户都有更加个性化的、符合自己行为习惯的体验,提高语音识别的可靠性。
本发明提供了一种基于用户行为特征的语音识别方法,先通过语音识别终端采集到的用户语音数据并发送到服务器进行处理分析,结合该用户的信息,分析得到用户的行为习惯和声音特征,根据每个用户不同的行为习惯生成更加符合该用户行为习惯的语法规则和命令词库,根据每个用户的声音特征生成声音特征模型,对语音识别终端的语法规则、命令词库以及声音特征模型进行调整更新,进一步优化语音模型,实现自学习功能,使得每个用户都有更加个性化的、符合自己行为习惯的体验,保证语音识别的准确率,提高语音识别的可靠性。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (4)

1.一种基于用户行为特征的语音识别方法,其特征在于,包括以下步骤:
步骤S1,首先,语音识别终端使用语音采集设备采集用户音频数据,上传至在线语音识别服务器;
步骤S2,在线语音识别服务器对用户的音频数据进行处理,结合该用户的信息,进一步分析得到用户的行为习惯和声音特征;
其中,所述的用户行为习惯包括用户说话的语法习惯和用词习惯;
步骤S3,在线语音识别服务器根据每个用户不同的行为习惯生成更加符合该用户行为习惯的语法规则和命令词库,推送给语音识别终端;
步骤S4,语音识别终端根据接收到新的语法规则和命令词库对现有的语法规则和命令词库进行调整,用户再次使用时采用新的语法规则和命令词库;
步骤S5,在线语音识别服务器将用户声音特征进一步转换为用户的声音特征模型,推送到语音识别终端;
步骤S6,语音识别终端根据接收到的用户声音特征模型对本地声音特征模型进行更新。
2.根据权利要求1所述的一种基于用户行为特征的语音识别方法,其特征在于:所述的在线语音识别服务器对用户音频数据的处理包括对音频数据的识别处理和对音频数据的信号处理。
3.根据权利要求2所述的一种基于用户行为特征的语音识别方法,其特征在于:所述的对音频数据的识别处理包括以下步骤:
步骤S211,将音频数据通过语音识别转换为文本信息;
步骤S212,识别出文本信息中的关键字;
步骤S213,根据识别出的关键字,采用预定策略的方法、神经网络的方法、模糊查询的方法或关联分析的方法分析出用户的行为习惯。
4.根据权利要求2所述的一种基于用户行为特征的语音识别方法,其特征在于:所述的对音频数据的信号处理包括以下步骤:
步骤S221,将音频数据转换成与该音频对应的数据模型;
步骤S222,对该音频数据模型进行分析,抽取形成用户声音特征。
CN201610712533.1A 2016-08-24 2016-08-24 一种基于用户行为特征的语音识别方法 Pending CN106328124A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610712533.1A CN106328124A (zh) 2016-08-24 2016-08-24 一种基于用户行为特征的语音识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610712533.1A CN106328124A (zh) 2016-08-24 2016-08-24 一种基于用户行为特征的语音识别方法

Publications (1)

Publication Number Publication Date
CN106328124A true CN106328124A (zh) 2017-01-11

Family

ID=57742462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610712533.1A Pending CN106328124A (zh) 2016-08-24 2016-08-24 一种基于用户行为特征的语音识别方法

Country Status (1)

Country Link
CN (1) CN106328124A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107464558A (zh) * 2017-08-23 2017-12-12 绵阳美菱软件技术有限公司 一种语音识别方法、终端以及服务端
CN108170034A (zh) * 2017-12-29 2018-06-15 上海器魂智能科技有限公司 智能设备控制方法、装置、计算机设备和储存介质
CN108428446A (zh) * 2018-03-06 2018-08-21 北京百度网讯科技有限公司 语音识别方法和装置
CN108520751A (zh) * 2018-03-30 2018-09-11 四川斐讯信息技术有限公司 一种语音智能识别设备及语音智能识别方法
CN108597500A (zh) * 2018-03-30 2018-09-28 四川斐讯信息技术有限公司 一种智能穿戴设备及基于智能穿戴设备的语音识别方法
WO2018214663A1 (zh) * 2017-05-26 2018-11-29 北京搜狗科技发展有限公司 一种基于语音的数据处理方法、装置和电子设备
CN108922540A (zh) * 2018-07-27 2018-11-30 重庆柚瓣家科技有限公司 与老人用户进行连续ai对话的方法及系统
CN109509473A (zh) * 2019-01-28 2019-03-22 维沃移动通信有限公司 语音控制方法及终端设备
CN109587019A (zh) * 2018-12-12 2019-04-05 珠海格力电器股份有限公司 一种家电设备的语音控制方法、装置、存储介质及系统
CN109634404A (zh) * 2018-11-01 2019-04-16 济南奥维信息科技有限公司济宁分公司 一种基于吹气的可控交互界面的系统和方法
CN110246498A (zh) * 2019-07-15 2019-09-17 广东美的制冷设备有限公司 语音处理方法、装置和家电设备
CN111599350A (zh) * 2020-04-07 2020-08-28 云知声智能科技股份有限公司 一种命令词定制识别方法及系统
CN112309399A (zh) * 2020-10-30 2021-02-02 上海淇玥信息技术有限公司 一种基于语音执行任务的方法、装置和电子设备
CN112437956A (zh) * 2018-07-25 2021-03-02 Lg 电子株式会社 语音识别系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1852354A (zh) * 2005-10-17 2006-10-25 华为技术有限公司 收集用户行为特征的方法和装置
CN101256448A (zh) * 2008-03-24 2008-09-03 腾讯科技(深圳)有限公司 输入法实现方法及装置、客户端
CN102456344A (zh) * 2010-10-22 2012-05-16 中国电信股份有限公司 基于语音识别技术分析客户行为特征的系统及方法
CN102543082A (zh) * 2012-01-19 2012-07-04 北京赛德斯汽车信息技术有限公司 使用自然语言的车载信息服务系统语音操作方法及系统
CN102779509A (zh) * 2011-05-11 2012-11-14 联想(北京)有限公司 语音处理设备和语音处理方法
CN103095784A (zh) * 2011-11-08 2013-05-08 北京捷通华声语音技术有限公司 一种云端用户映射系统和方法
CN103247291A (zh) * 2013-05-07 2013-08-14 华为终端有限公司 一种语音识别设备的更新方法、装置及系统
CN103400576A (zh) * 2013-07-18 2013-11-20 百度在线网络技术(北京)有限公司 基于用户行为日志的语音模型更新方法及装置
CN104112445A (zh) * 2014-07-30 2014-10-22 宇龙计算机通信科技(深圳)有限公司 一种终端及语音识别方法
CN105068515A (zh) * 2015-07-16 2015-11-18 华南理工大学 一种基于自学习算法的智能家居设备语音控制方法
CN105318499A (zh) * 2015-09-30 2016-02-10 广东美的制冷设备有限公司 用户行为自学习空调系统及其控制方法
CN105727572A (zh) * 2016-03-14 2016-07-06 深圳市艾塔文化科技有限公司 一种玩具的基于语音识别的自学习方法和自学习装置
CN105787496A (zh) * 2014-12-23 2016-07-20 联想(北京)有限公司 一种数据的归集方法和电子设备

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1852354A (zh) * 2005-10-17 2006-10-25 华为技术有限公司 收集用户行为特征的方法和装置
CN101256448A (zh) * 2008-03-24 2008-09-03 腾讯科技(深圳)有限公司 输入法实现方法及装置、客户端
CN102456344A (zh) * 2010-10-22 2012-05-16 中国电信股份有限公司 基于语音识别技术分析客户行为特征的系统及方法
CN102779509A (zh) * 2011-05-11 2012-11-14 联想(北京)有限公司 语音处理设备和语音处理方法
CN103095784A (zh) * 2011-11-08 2013-05-08 北京捷通华声语音技术有限公司 一种云端用户映射系统和方法
CN102543082A (zh) * 2012-01-19 2012-07-04 北京赛德斯汽车信息技术有限公司 使用自然语言的车载信息服务系统语音操作方法及系统
CN103247291A (zh) * 2013-05-07 2013-08-14 华为终端有限公司 一种语音识别设备的更新方法、装置及系统
CN103400576A (zh) * 2013-07-18 2013-11-20 百度在线网络技术(北京)有限公司 基于用户行为日志的语音模型更新方法及装置
CN104112445A (zh) * 2014-07-30 2014-10-22 宇龙计算机通信科技(深圳)有限公司 一种终端及语音识别方法
CN105787496A (zh) * 2014-12-23 2016-07-20 联想(北京)有限公司 一种数据的归集方法和电子设备
CN105068515A (zh) * 2015-07-16 2015-11-18 华南理工大学 一种基于自学习算法的智能家居设备语音控制方法
CN105318499A (zh) * 2015-09-30 2016-02-10 广东美的制冷设备有限公司 用户行为自学习空调系统及其控制方法
CN105727572A (zh) * 2016-03-14 2016-07-06 深圳市艾塔文化科技有限公司 一种玩具的基于语音识别的自学习方法和自学习装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018214663A1 (zh) * 2017-05-26 2018-11-29 北京搜狗科技发展有限公司 一种基于语音的数据处理方法、装置和电子设备
CN107464558A (zh) * 2017-08-23 2017-12-12 绵阳美菱软件技术有限公司 一种语音识别方法、终端以及服务端
CN108170034A (zh) * 2017-12-29 2018-06-15 上海器魂智能科技有限公司 智能设备控制方法、装置、计算机设备和储存介质
US10978047B2 (en) 2018-03-06 2021-04-13 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for recognizing speech
CN108428446B (zh) * 2018-03-06 2020-12-25 北京百度网讯科技有限公司 语音识别方法和装置
CN108428446A (zh) * 2018-03-06 2018-08-21 北京百度网讯科技有限公司 语音识别方法和装置
CN108520751A (zh) * 2018-03-30 2018-09-11 四川斐讯信息技术有限公司 一种语音智能识别设备及语音智能识别方法
CN108597500A (zh) * 2018-03-30 2018-09-28 四川斐讯信息技术有限公司 一种智能穿戴设备及基于智能穿戴设备的语音识别方法
CN112437956B (zh) * 2018-07-25 2024-03-26 Lg 电子株式会社 语音识别系统
CN112437956A (zh) * 2018-07-25 2021-03-02 Lg 电子株式会社 语音识别系统
CN108922540A (zh) * 2018-07-27 2018-11-30 重庆柚瓣家科技有限公司 与老人用户进行连续ai对话的方法及系统
CN109634404A (zh) * 2018-11-01 2019-04-16 济南奥维信息科技有限公司济宁分公司 一种基于吹气的可控交互界面的系统和方法
CN109587019A (zh) * 2018-12-12 2019-04-05 珠海格力电器股份有限公司 一种家电设备的语音控制方法、装置、存储介质及系统
CN109509473B (zh) * 2019-01-28 2022-10-04 维沃移动通信有限公司 语音控制方法及终端设备
CN109509473A (zh) * 2019-01-28 2019-03-22 维沃移动通信有限公司 语音控制方法及终端设备
CN110246498A (zh) * 2019-07-15 2019-09-17 广东美的制冷设备有限公司 语音处理方法、装置和家电设备
CN110246498B (zh) * 2019-07-15 2021-04-20 广东美的制冷设备有限公司 语音处理方法、装置和家电设备
CN111599350A (zh) * 2020-04-07 2020-08-28 云知声智能科技股份有限公司 一种命令词定制识别方法及系统
CN111599350B (zh) * 2020-04-07 2023-02-28 云知声智能科技股份有限公司 一种命令词定制识别方法及系统
CN112309399A (zh) * 2020-10-30 2021-02-02 上海淇玥信息技术有限公司 一种基于语音执行任务的方法、装置和电子设备
CN112309399B (zh) * 2020-10-30 2023-02-24 上海淇玥信息技术有限公司 一种基于语音执行任务的方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN106328124A (zh) 一种基于用户行为特征的语音识别方法
US10217463B2 (en) Hybridized client-server speech recognition
CN109817213B (zh) 用于自适应语种进行语音识别的方法、装置及设备
CN103137129B (zh) 语音识别方法及电子装置
CN109256136B (zh) 一种语音识别方法和装置
CN106446045B (zh) 基于对话交互的用户画像的构建方法及系统
US20190221208A1 (en) Method, user interface, and device for audio-based emoji input
CN108364650B (zh) 语音识别结果的调整装置及方法
CN105334743A (zh) 一种基于情感识别的智能家居控制方法及其系统
CN103700370A (zh) 一种广播电视语音识别系统方法及系统
CN108447471A (zh) 语音识别方法及语音识别装置
US20150199340A1 (en) System for translating a language based on user's reaction and method thereof
CN107403619A (zh) 一种应用于自行车环境的语音控制方法及系统
CN105469789A (zh) 一种语音信息的处理方法及终端
CN110765759A (zh) 意图识别方法及装置
CN107316635B (zh) 语音识别方法及装置、存储介质、电子设备
CN107808007A (zh) 信息处理方法和装置
CN111462741B (zh) 语音数据处理方法、装置及存储介质
CN109190124A (zh) 用于分词的方法和装置
CN112634892B (zh) 一种语音处理方法、装置、可读存储介质和电子设备
CN105654955A (zh) 语音识别方法及装置
CN112562681A (zh) 语音识别方法和装置、存储介质
CN110428835A (zh) 一种语音设备的调节方法、装置、存储介质及语音设备
CN114186108A (zh) 一种面向电力物资业务场景的多模态人机交互系统
CN111178081A (zh) 语义识别的方法、服务器、电子设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170111