CN106057194A - 一种语音交互系统 - Google Patents
一种语音交互系统 Download PDFInfo
- Publication number
- CN106057194A CN106057194A CN201610468878.7A CN201610468878A CN106057194A CN 106057194 A CN106057194 A CN 106057194A CN 201610468878 A CN201610468878 A CN 201610468878A CN 106057194 A CN106057194 A CN 106057194A
- Authority
- CN
- China
- Prior art keywords
- voice
- unit
- data
- speech
- vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 21
- 238000013500 data storage Methods 0.000 claims abstract description 6
- 230000002452 interceptive effect Effects 0.000 claims description 57
- 230000004913 activation Effects 0.000 claims description 20
- 238000000034 method Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 210000000352 storage cell Anatomy 0.000 claims description 5
- 230000003213 activating effect Effects 0.000 claims description 4
- 238000004148 unit process Methods 0.000 claims description 2
- 238000001994 activation Methods 0.000 description 15
- 238000000605 extraction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明涉及人机交互领域、语音识别领域,尤其涉及一种语音交互系统。包括语音交互装置以及云处理装置,其特征在于:所述语音交互装置包括设置在汽车中的:语音输入单元、语音处理单元、车载交互终端和语音输出单元;所述云处理装置包括:云服务器、数据存储单元、语音解析单元、语音反馈单元;所述车载交互终端和所述云服务器之间通过网络进行数据交互;其特征在于:所述云处理装置还包括语音学习单元;所述语音学习单元,在所述语音解析单元匹配失败时进行跟读学习。
Description
技术领域
本发明本发明涉及人机交互领域、语音识别领域,尤其涉及一种语音交互系统。
背景技术
随着互联网与人工智能技术的不断发展,语音交互系统近些年可以说是快速的发展。而车载的人机交互系统的历史尽管只有三、四年的历史,但是发展却是突飞猛进。作为驾驶者最安全、最便捷的信息交互方式,语音交互已经成为车载系统发展的必然趋势。但是目前的车载系统语音识别不能根据不同人的口音特性、发音习惯、语种的不同而自适应其口音,使语音识别的成功率特别低,与人交互的体验感不强。而且基本上是基于本地的语音系统,其处理能力非常有限。
发明内容
本发明提出一种基于云端处理带自学习功能的车载语音交互系统方式,可以解决语音交互时不能根据不同人口音的差别识别语音的问题,同时具有自学习功能,能不断地补充完善云语音库。
一种语音交互系统,包括语音交互装置以及云处理装置,其特征在于:所述语音交互装置包括设置在汽车中的:语音输入单元、语音处理单元、车载交互终端和语音输出单元;所述云处理装置包括:云服务器、数据存储单元、语音解析单元、语音反馈单元;所述车载交互终端和所述云服务器之间通过网络进行数据交互;其特征在于:所述云处理装置还包括语音学习单元;所述语音学习单元,在所述语音解析单元匹配失败时进行跟读学习。
作为优选,在跟读学习模式下:所述语音学习单元,通过所述云服务器发送标准语音数据至所述语音交互装置;所述语音输出单元,通过所述车载交互终端接收所述云处理装置发送的标准语音数据,并根据所述标准语音数据输出标准语音;所述语音输入单元,接收所述用户输入的跟读语音并发送至所述语音处理单元;所述语音处理单元,对来自所述语音输入单元的跟读语音进行语音处理,生成跟读语音数据,并通过车载交互终端发送至所述云处理装置;所述语音学习单元,根据所述跟读语音数据和所述标准语音数据生成新的个性语音类别添加至存储在所述数据存储单元中的语音数据库,所述个性语音类别包括语音特征数据。
作为优选,所述语音学习单元包括语音特征提取模块,所述语音特征提取模块用于比较所述标准语音数据与所述跟读语音数据,生成语音特征数据。
作为优选,所述语音特征提取模块用于比较所述标准语音数据和所述跟读语音数据的语速信息,所述语音特征数据包括用户语速特征的语速信息。
作为优选,所述语音特征提取模块用于比较所述标注语音数据和所述跟读语音数据的语调信息,所述语音特征包括用于语调特征的语调信息。
作为优选,所述语音数据库包括语种数据库。
作为优选,所述语音数据库包括方言数据库。
作为优选,所述车载交互终端包括参数设置单元,所述参数设置模块接收用户输入的反馈参数并发送至所述语音反馈单元;所述反馈参数包括反馈语种信息,所述语音反馈单元根据所述反馈参数生成与所述反馈语种对应的语音反馈数据。
作为优选,所述语音交互装置包括激活单元,所述激活单元包含存储有激活指令的存储模块;所述激活单元与所述语音处理单元连接,所述激活单元与所述车载交互终端连接;所述激活单元在所述语音指令包含激活指令时,激活所述车载交互终端。
作为优选,所述激活指令可通过所述语音输入单元输入,并经过所述语音处理单元处理后存储至所述存储模块。
附图说明
图1 语音交互系统框图。
图2 车载交互终端激活流程图。
图3一般语音交互流程图。
图4跟读学习流程图。
具体实施方式
下面将结合附图对本发明的实施方式进行详细描述。一种语音交互系统,包括语音交互装置以及设置在云端的云处理装置。
语音交互装置包括设置在汽车中的:语音输入单元、语音处理单元、车载交互终端、激活单元和语音输出单元,语音输入单元的信号输出至语音处理单元,语音处理单元的信号分别输出至车载交互终端和激活单元,激活单元的信号输出至车载交互终端用于唤醒车载交互终端。云处理装置包括:云服务器、数据存储单元、语音解析单元、语音反馈单元、语音学习单元,云服务器的信号输出至语音解析单元,用于对经语音交互终端输入的语音数据进行语音匹配,云服务器的信号输出至语音学习单元,语音学习单元包括特征提取单元,用于对经语音交互终端输入的语音数据进行语音特征提取。语音解析单元的信号分别输出至语音反馈单元和语音学习单元,以分别启动语音反馈单元和语音学习单元的进行工作。语音学习单元的信号输出至云服务器。车载交互终端和云服务器之间通过网络进行数据交互。
基于本语音交互系统的语音交互操作包括以下功能阶段:
一.车载交互终端的激活
语音输入单元,接收用户输入的包含有激活指令的语音指令并发送至语音处理单元;
语音处理单元,对来自语音输入单元的语音指令进行语音处理,生成语音指令数据,并发送至激活单元;
激活单元,比较来自语音处理单元的语音指令数据与存储在其存储模块中的激活指令数据,在判断用户的输入的语音指令中包含有激活指令时,激活车载交互终端。
其中,激活指令数据可以通过预语音输入单元输入,并经过语音处理单元处理后存储至存储模块。
用户上车后,可以通过包含激活指令例如“你好”、“小丽”等的特殊指令唤醒车载交互终端。
二.一般语音交互
语音输入单元,接收用户输入的语音指令并发送至语音处理单元。
语音处理单元,对来自语音输入单元的语音指令进行语音处理,生成语音指令数据,并通过车载交互终端发送至云处理装置。
语音解析单元,通过云服务器接收语音指令数据与语音数据库进行匹配。该匹配是指通过在数据存储模块中检索、对比,查找与用于输入的语音指令的语种相同的语种信息库,使得用户输入的语音指令能够被解读。
语音反馈单元,在语音解析单元匹配成功时,根据语音指令数据,结合与用户输入的语音指令对应的语种信息库,生成语音反馈数据,并通过后台服务器发送至语音交互装置。
语音输出单元,通过车载交互终端接收云处理装置的语音反馈数据,并根据语音反馈数据输出反馈语音。
语音数据库还包括方言数据库和语种数据库。车载交互终端包括参数设置单元,参数设置模块接收用户输入的反馈参数并发送至语音反馈单元;反馈参数包括反馈语种信息,语音反馈单元根据语音解析单元的解析结果以及该反馈参数生成与反馈语种对应的语音反馈数据。语音交互系统可以根据用户的设置,选择合适的语种以及方言来与其交流。如果用户说的是四川方言,我们语音数据库里面存有四川方言的语系,便可直接匹配四川语音进行回复沟通。
三.跟读学习
语音学习单元,在语音解析单元匹配失败时通过云服务器发送标准语音数据。
语音输出单元,通过车载交互终端接收云处理装置的标准语音数据,并根据标准语音数据输出标准语音。
语音输入单元,接收用户输入的跟读语音并发送至语音处理单元。
语音处理单元,对来自语音输入单元的跟读语音进行语音处理,生成跟读语音数据,并通过车载交互终端发送至云处理装置。
语音学习单元,根据跟读语音数据和标准语音数据生成新的个性语音类别添加至存储在数据存储单元中的语音数据库,个性语音类别包括语音特征数据。语音特征提取模块用于比较标准语音数据与跟读语音数据的语速信息以及语调信息,生成包括语速特征和语调特征的语音特征数据。跟读模式下对用于的语音进行学习,通过语速特征以及语调特征对无法识别的新用户的语音数据进行标记,建立用户的个性语音类别。
同时,语音数据库还包括方言数据库和语种数据库。当系统再次接收到该用户输入的语音指令时,语音分析单元能够将新添加的该用户的个性语音类别与该语音指令数据进行匹配,结合方言数据数据库和语种数据库结合,可以对用户语音指令数据进行解析。车载交互终端包括参数设置单元,参数设置模块接收用户输入的反馈参数并发送至语音反馈单元;反馈参数包括反馈语种信息,语音反馈单元根据语音解析单元的解析结果以及该反馈参数生成与反馈语种对应的语音反馈数据。
虽然结合附图描述了本发明的实施方式,但是本领域普通技术人员可以在所附权利要求的范围内做出各种变形或修改。
Claims (10)
1.一种语音交互系统,包括语音交互装置以及云处理装置,其特征在于:
所述语音交互装置包括设置在汽车中的:语音输入单元、语音处理单元、车载交互终端和语音输出单元;所述云处理装置包括:云服务器、数据存储单元、语音解析单元、语音反馈单元;所述车载交互终端和所述云服务器之间通过网络进行数据交互;其特征在于:所述云处理装置还包括语音学习单元;所述语音学习单元,在所述语音解析单元匹配失败时进行跟读学习。
2.根据权利要求1所述的一种语音交互系统,其特征在于:在跟读学习模式下,
所述语音学习单元,通过所述云服务器发送标准语音数据至所述语音交互装置;
所述语音输出单元,通过所述车载交互终端接收所述云处理装置发送的标准语音数据,并根据所述标准语音数据输出标准语音;
所述语音输入单元,接收所述用户输入的跟读语音并发送至所述语音处理单元;
所述语音处理单元,对来自所述语音输入单元的跟读语音进行语音处理,生成跟读语音数据,并通过车载交互终端发送至所述云处理装置;
所述语音学习单元,根据所述跟读语音数据和所述标准语音数据生成新的个性语音类别添加至存储在所述数据存储单元中的语音数据库,所述个性语音类别包括语音特征数据。
3.根据权利要求2所述的一种语音交互系统,其特征在于:所述语音学习单元包括语音特征提取模块,所述语音特征提取模块用于比较所述标准语音数据与所述跟读语音数据,生成语音特征数据。
4.根据权利要求3所述的一种语音交互系统,其特征在与:所述语音特征提取模块用于比较所述标准语音数据和所述跟读语音数据的语速信息,所述语音特征数据包括用户语速特征的语速信息。
5.根据权利要求3所述的一种语音交互系统,其特征在于:所述语音特征提取模块用于比较所述标注语音数据和所述跟读语音数据的语调信息,所述语音特征包括用于语调特征的语调信息。
6.根据权利要求4或5所述的一种语音交互系统,其特征在于:所述语音数据库包括语种数据库。
7.根据权利要求6所述的一种语音交互系统,其特征在于:所述语音数据库包括方言数据库。
8.根据权利要求6所述的一种语音交互系统,其特征在于:所述车载交互终端包括参数设置单元,所述参数设置模块接收用户输入的反馈参数并发送至所述语音反馈单元;所述反馈参数包括反馈语种信息,所述语音反馈单元根据所述反馈参数生成与所述反馈语种对应的语音反馈数据。
9.根据权利要求1所述的一种语音交互系统,其特征在于:所述语音交互装置包括激活单元,所述激活单元包含存储有激活指令数据的存储模块;所述激活单元与所述语音处理单元连接,所述激活单元与所述车载交互终端连接;所述激活单元在所述语音指令包含激活指令时,激活所述车载交互终端。
10.根据权利要求9所述的一种语音交互系统,其特征在于:所述激活指令可通过所述语音输入单元输入,并经过所述语音处理单元处理后存储至所述存储模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610468878.7A CN106057194A (zh) | 2016-06-25 | 2016-06-25 | 一种语音交互系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610468878.7A CN106057194A (zh) | 2016-06-25 | 2016-06-25 | 一种语音交互系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106057194A true CN106057194A (zh) | 2016-10-26 |
Family
ID=57165839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610468878.7A Pending CN106057194A (zh) | 2016-06-25 | 2016-06-25 | 一种语音交互系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106057194A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106251868A (zh) * | 2016-08-09 | 2016-12-21 | 江门雷斯诺照明有限公司 | 一种具有智能降噪功能的灯具语音识别控制方法 |
CN106782558A (zh) * | 2016-12-27 | 2017-05-31 | 重庆峰创科技有限公司 | 一种带有图像理解的智能语音车载交互系统 |
CN108665893A (zh) * | 2018-03-30 | 2018-10-16 | 斑马网络技术有限公司 | 车载声音反应系统及方法 |
CN110148399A (zh) * | 2019-05-06 | 2019-08-20 | 北京猎户星空科技有限公司 | 一种智能设备的控制方法、装置、设备及介质 |
CN111105798A (zh) * | 2018-10-29 | 2020-05-05 | 宁波方太厨具有限公司 | 基于语音识别的设备控制方法 |
CN111192580A (zh) * | 2019-12-31 | 2020-05-22 | 浙江合众新能源汽车有限公司 | 一种主动语音开启汽车acc功能的方法及装置 |
CN111554281A (zh) * | 2020-03-12 | 2020-08-18 | 厦门中云创电子科技有限公司 | 自动识别语种的车载人机交互方法、车载终端及存储介质 |
CN112527983A (zh) * | 2020-11-27 | 2021-03-19 | 长威信息科技发展股份有限公司 | 一种个性化政务人机自然交互服务系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130158977A1 (en) * | 2011-06-14 | 2013-06-20 | Andrew Senior | System and Method for Evaluating Speech Exposure |
CN103730119A (zh) * | 2013-12-18 | 2014-04-16 | 惠州市车仆电子科技有限公司 | 车载人机语音交互系统 |
CN104112445A (zh) * | 2014-07-30 | 2014-10-22 | 宇龙计算机通信科技(深圳)有限公司 | 一种终端及语音识别方法 |
CN104538034A (zh) * | 2014-12-31 | 2015-04-22 | 深圳雷柏科技股份有限公司 | 一种语音识别方法及系统 |
CN104978964A (zh) * | 2014-04-14 | 2015-10-14 | 美的集团股份有限公司 | 语音控制指令纠错方法和系统 |
-
2016
- 2016-06-25 CN CN201610468878.7A patent/CN106057194A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130158977A1 (en) * | 2011-06-14 | 2013-06-20 | Andrew Senior | System and Method for Evaluating Speech Exposure |
CN103730119A (zh) * | 2013-12-18 | 2014-04-16 | 惠州市车仆电子科技有限公司 | 车载人机语音交互系统 |
CN104978964A (zh) * | 2014-04-14 | 2015-10-14 | 美的集团股份有限公司 | 语音控制指令纠错方法和系统 |
CN104112445A (zh) * | 2014-07-30 | 2014-10-22 | 宇龙计算机通信科技(深圳)有限公司 | 一种终端及语音识别方法 |
CN104538034A (zh) * | 2014-12-31 | 2015-04-22 | 深圳雷柏科技股份有限公司 | 一种语音识别方法及系统 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106251868A (zh) * | 2016-08-09 | 2016-12-21 | 江门雷斯诺照明有限公司 | 一种具有智能降噪功能的灯具语音识别控制方法 |
CN106782558A (zh) * | 2016-12-27 | 2017-05-31 | 重庆峰创科技有限公司 | 一种带有图像理解的智能语音车载交互系统 |
CN108665893A (zh) * | 2018-03-30 | 2018-10-16 | 斑马网络技术有限公司 | 车载声音反应系统及方法 |
CN111105798A (zh) * | 2018-10-29 | 2020-05-05 | 宁波方太厨具有限公司 | 基于语音识别的设备控制方法 |
CN111105798B (zh) * | 2018-10-29 | 2023-08-18 | 宁波方太厨具有限公司 | 基于语音识别的设备控制方法 |
CN110148399A (zh) * | 2019-05-06 | 2019-08-20 | 北京猎户星空科技有限公司 | 一种智能设备的控制方法、装置、设备及介质 |
CN111192580A (zh) * | 2019-12-31 | 2020-05-22 | 浙江合众新能源汽车有限公司 | 一种主动语音开启汽车acc功能的方法及装置 |
CN111554281A (zh) * | 2020-03-12 | 2020-08-18 | 厦门中云创电子科技有限公司 | 自动识别语种的车载人机交互方法、车载终端及存储介质 |
CN111554281B (zh) * | 2020-03-12 | 2023-11-07 | 厦门中云创电子科技有限公司 | 自动识别语种的车载人机交互方法、车载终端及存储介质 |
CN112527983A (zh) * | 2020-11-27 | 2021-03-19 | 长威信息科技发展股份有限公司 | 一种个性化政务人机自然交互服务系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106057194A (zh) | 一种语音交互系统 | |
CN110211563B (zh) | 面向情景及情感的中文语音合成方法、装置及存储介质 | |
CN106571140B (zh) | 一种基于语音语义的电器智能控制方法及系统 | |
US9635178B2 (en) | Coordinating voice calls between representatives and customers to influence an outcome of the call | |
CN112086086B (zh) | 语音合成方法、装置、设备及计算机可读存储介质 | |
CN111191016A (zh) | 一种多轮对话处理方法、装置及计算设备 | |
CN108447471A (zh) | 语音识别方法及语音识别装置 | |
CN112100349A (zh) | 一种多轮对话方法、装置、电子设备及存储介质 | |
CN103458056B (zh) | 自动外呼系统基于自动分类技术的语音意图判定系统 | |
CN106611597A (zh) | 基于人工智能的语音唤醒方法和装置 | |
US20210193116A1 (en) | Data driven dialog management | |
CN109410927A (zh) | 离线命令词与云端解析结合的语音识别方法、装置和系统 | |
CN110930980B (zh) | 一种中英文混合语音的声学识别方法及系统 | |
CN105469797A (zh) | 一种智能语音识别转接人工服务的控制方法及系统 | |
CN111445898B (zh) | 语种识别方法、装置、电子设备和存储介质 | |
CN111145721A (zh) | 个性化提示语生成方法、装置和设备 | |
CN111177310A (zh) | 电力服务机器人智能场景会话方法及装置 | |
CN110727776B (zh) | 一种基于人工智能的汽车问答交互系统及交互方法 | |
CN109635080A (zh) | 应答策略生成方法及装置 | |
CN109754790A (zh) | 一种基于混合声学模型的语音识别系统及方法 | |
CN114676255A (zh) | 文本处理方法、装置、设备、存储介质及计算机程序产品 | |
WO2019015633A1 (en) | SYSTEMS AND METHODS FOR PROCESSING A CONVERSATION MESSAGE | |
CN112632244A (zh) | 一种人机通话的优化方法、装置、计算机设备及存储介质 | |
CN111128175B (zh) | 口语对话管理方法及系统 | |
CN116303966A (zh) | 基于提示学习的对话行为识别系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161026 |