CN113470637A - 一种车载多个音频媒体的语音控制方法 - Google Patents
一种车载多个音频媒体的语音控制方法 Download PDFInfo
- Publication number
- CN113470637A CN113470637A CN202110506589.2A CN202110506589A CN113470637A CN 113470637 A CN113470637 A CN 113470637A CN 202110506589 A CN202110506589 A CN 202110506589A CN 113470637 A CN113470637 A CN 113470637A
- Authority
- CN
- China
- Prior art keywords
- audio media
- control
- voice
- state
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000012544 monitoring process Methods 0.000 claims abstract description 5
- 230000009471 action Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
本发明涉及汽车信息娱乐技术领域,且公开了一种车载多个音频媒体的语音控制方法,包括以下步骤:S1:监听多个音频媒体应用的状态;S2:根据各个音频媒体应用的状态情况决策出当前状态下应该响应控制指令的音频媒体;S3:接收用户输入的语音控制启动指令;S4:接收所述用户输入的语音信息;S5:根据所述语音信息生成的控制指令;S6:判断音频媒体是否适合执行控制指令;S7:执行控制命令。本发明以语音播报或者文字显示的方式对驾驶者的控制操作做出回应,增强了语音的控制能力,为驾驶者带来方便并减少了因分心带来的潜在安全隐患,实现对多个音频媒体的控制,提供控制的准确性和稳定性。
Description
技术领域
本发明涉及汽车信息娱乐技术领域,具体为一种车载多个音频媒体的语音控制方法。
背景技术
随着语音技术的不断突破,语音基础能力变得更强,语音交互称得上是一个“有价值的工具”,具体的表现有能够支持打断、多轮对话,支持上下文理解,可以自动纠错,支持免唤醒,降低了误触发并提升了响应速度,这些能力的提升将语音技术和车载系统结合变成一种很好的结合,能够给驾驶者提供更加方便和安全的交互方式。
车载系统中可能存在多个音频媒体,对这些音频媒体应用进行基本的语音控制也是用户迫切的需求,但是一般的车载多个音频媒体的语音控制方法语音的控制能力不足,提高了驾驶者因分心带来的潜在安全隐患。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种车载多个音频媒体的语音控制方法,该控制方法增强了语音的控制能力,为驾驶者带来方便并减少了因分心带来的潜在安全隐患。
(二)技术方案
为实现上述目的,本发明提供如下技术方案:
一种车载多个音频媒体的语音控制方法,包括以下步骤:
S1:监听多个音频媒体应用的状态;
S2:根据各个音频媒体应用的状态情况决策出当前状态下应该响应控制指令的音频媒体;
S3:接收用户输入的语音控制启动指令;
S4:接收所述用户输入的语音信息;
S5:根据所述语音信息生成的控制指令;
S6:判断音频媒体是否适合执行控制指令;
S7:执行控制命令;
S8:提示驾驶者执行结果;
S9:识别控制流程结束。
作为本发明再进一步的方案,所述S1中监听并保存多个音频媒体应用的状态,包括但不限于前后台、暂停、播放。
进一步的,所述S2中当某个音频媒体状态发生变化时,根据监听到的其他音频媒体状态决策出当前状态下响应语音控制的音频媒体。
在前述方案的基础上,所述S5中用户下发的控制指令和计算出需要响应的音频媒体状态进行判断,如果判断不成功则不进行控制。
进一步的,所述S8中依据是否适合执行控制指令和执行的结果对用户进行提示。
(三)有益效果
与现有技术相比,本发明提供了一种车载多个音频媒体的语音控制方法,具备以下有益效果:
1、本发明以语音播报或者文字显示的方式对驾驶者的控制操作做出回应,增强了语音的控制能力,为驾驶者带来方便并减少了因分心带来的潜在安全隐患。
2、本发明通过监听各个音频媒体应用的状态,决策出状态变化后应该响应语音指令的音频媒体应用,从而实现对多个音频媒体的控制,提供控制的准确性和稳定性。
3、本发明安全高效,智能化程度高,具有很好的市场前景。
附图说明
图1为本发明提出的一种车载多个音频媒体的语音控制方法的流程结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,一种车载多个音频媒体的语音控制方法,包括以下步骤:
S1:监听多个音频媒体应用的状态,车载系统中包含多个音频媒体应用,需要在开机后监听各个应用的状态变化,包括但不限于前后台、播放、暂停,并全局保存各应用变化后的状态数据;
S2:根据各个音频媒体应用的状态情况决策出当前状态下应该响应控制指令的音频媒体;
在监听到某个音频媒体应用状态发生任何变化时,结合之前保存的歌音频媒体应用的全局状态数据,按照产品的具体需要决策出当前场景下应该接受并处理语音指令的音频媒体应用,并记录下此应用的标识;
在此就某一种决策方案说明如下:
情况1,全局没有其他音频媒体应用的状态数据,则当前监听的状态应用作为接受并处理语音指令的应用;
情况2,状态切换到前台,判断其他音频媒体应用是否有播放状态,如果有继续使用播放状态的应用作为语音控制的应用,如果此状态变化的应用作为语音控制的应用;
情况3,状态切换到后台,继续保持之前的语音控制应用;
情况4,状态切换到播放,此状态变化的应用作为语音控制的应用;
情况5,状态切换为暂停,判断其他音频媒体应用是否有播放状态,如果有继续使用播放状态的应用作为语音控制的应用,如果此状态变化的应用作为语音控制的应用;
这种方案简单描述就是以播放状态为主,如果都没有播放则以最后切换过前台的音频媒体应用作为语音控制的应用;
S3:接收用户输入的语音控制启动指令,具体的,驾驶员通过车内按钮或者唤醒词等方式输入语音控制启动指令,从而激活语音识别功能;
S4:接收所述用户输入的语音信息,具体的,在步骤3激活语音采集功能之后,接收用户输入的语音信息,通过监听各个音频媒体应用的状态,决策出状态变化后应该响应语音指令的音频媒体应用,从而实现对多个音频媒体的控制,提供控制的准确性和稳定性;
S5:根据所述语音信息生成的控制指令,依据采集语音的数据通过相关的语音技术获取到驾驶者控制意图的指令;
S6:判断音频媒体是否适合执行控制指令,获取到指令后,根据当前接收并执行语音指令的应用和其状态情况,判断是否适合执行该指令,如果不适合执行则依据情况生成提示信息后执行步骤8,如果适合执行则执行步骤7;
在此就一种判断是否适合执行的方案进行简单的说明:
如果不存在全局标识的音频应用,则选择一个默认的应用作为判断是否适合执行的应用;
此应用状态没有状态或者处于暂停,则可以进行播放控制;
此应用处于播放状态,则可以进行暂停控制;
上述只是简单说明了两种状态下的判断,其他状态可以依据产品需要自行定义,在此只是说明操作的可执行性;
S7:执行控制命令,对当前全局标识的音频应用执行指令对应的控制操作,并根据操作情况或直接生成提示信息后执行步骤8;
S8:提示驾驶者执行结果,以语音播报或者文字显示的方式对驾驶者的控制操作做出回应,增强了语音的控制能力,为驾驶者带来方便并减少了因分心带来的潜在安全隐患;
S9:识别控制流程结束。
在该文中的描述中,需要说明的是,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (5)
1.一种车载多个音频媒体的语音控制方法,其特征在于,包括以下步骤:
S1:监听多个音频媒体应用的状态;
S2:根据各个音频媒体应用的状态情况决策出当前状态下应该响应控制指令的音频媒体;
S3:接收用户输入的语音控制启动指令;
S4:接收所述用户输入的语音信息;
S5:根据所述语音信息生成的控制指令;
S6:判断音频媒体是否适合执行控制指令;
S7:执行控制命令;
S8:提示驾驶者执行结果;
S9:识别控制流程结束。
2.根据权利要求1所述的一种车载多个音频媒体的语音控制方法,其特征在于,所述S1中监听并保存多个音频媒体应用的状态,包括但不限于前后台、暂停、播放。
3.根据权利要求2所述的一种车载多个音频媒体的语音控制方法,其特征在于,所述S2中当某个音频媒体状态发生变化时,根据监听到的其他音频媒体状态决策出当前状态下响应语音控制的音频媒体。
4.根据权利要求1所述的一种车载多个音频媒体的语音控制方法,其特征在于,所述S5中用户下发的控制指令和计算出需要响应的音频媒体状态进行判断,如果判断不成功则不进行控制。
5.根据权利要求1所述的一种车载多个音频媒体的语音控制方法,其特征在于,所述S8中依据是否适合执行控制指令和执行的结果对用户进行提示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110506589.2A CN113470637A (zh) | 2021-05-10 | 2021-05-10 | 一种车载多个音频媒体的语音控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110506589.2A CN113470637A (zh) | 2021-05-10 | 2021-05-10 | 一种车载多个音频媒体的语音控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113470637A true CN113470637A (zh) | 2021-10-01 |
Family
ID=77870651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110506589.2A Pending CN113470637A (zh) | 2021-05-10 | 2021-05-10 | 一种车载多个音频媒体的语音控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113470637A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102945672A (zh) * | 2012-09-29 | 2013-02-27 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
US20170103754A1 (en) * | 2015-10-09 | 2017-04-13 | Xappmedia, Inc. | Event-based speech interactive media player |
CN109658934A (zh) * | 2018-12-27 | 2019-04-19 | 苏州思必驰信息科技有限公司 | 通过语音控制多媒体app的方法及装置 |
US20190370843A1 (en) * | 2017-12-04 | 2019-12-05 | Spotify Ab | Audio advertising interaction with voice interactive devices |
CN111008532A (zh) * | 2019-12-12 | 2020-04-14 | 广州小鹏汽车科技有限公司 | 语音交互方法、车辆和计算机可读存储介质 |
CN211742644U (zh) * | 2019-11-07 | 2020-10-23 | 上海荣泰健康科技股份有限公司 | 带音乐播放功能的语音控制系统 |
-
2021
- 2021-05-10 CN CN202110506589.2A patent/CN113470637A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102945672A (zh) * | 2012-09-29 | 2013-02-27 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
US20170103754A1 (en) * | 2015-10-09 | 2017-04-13 | Xappmedia, Inc. | Event-based speech interactive media player |
US20190370843A1 (en) * | 2017-12-04 | 2019-12-05 | Spotify Ab | Audio advertising interaction with voice interactive devices |
CN109658934A (zh) * | 2018-12-27 | 2019-04-19 | 苏州思必驰信息科技有限公司 | 通过语音控制多媒体app的方法及装置 |
CN211742644U (zh) * | 2019-11-07 | 2020-10-23 | 上海荣泰健康科技股份有限公司 | 带音乐播放功能的语音控制系统 |
CN111008532A (zh) * | 2019-12-12 | 2020-04-14 | 广州小鹏汽车科技有限公司 | 语音交互方法、车辆和计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11676601B2 (en) | Voice assistant tracking and activation | |
CN106023994B (zh) | 一种语音处理的方法、装置以及系统 | |
CN110341709B (zh) | 基于l2级的智能领航驾驶开关控制方法与系统 | |
CN110928409B (zh) | 车载场景模式控制方法、装置、车辆及存储介质 | |
WO2017118270A1 (zh) | 车载hmi调节方法、车载终端、存储介质 | |
CN104731613A (zh) | 应用快速启动方法和系统 | |
CN106844028B (zh) | 基于双系统的系统切换方法及移动终端 | |
CN104615052A (zh) | Android车载导航全局声控装置及方法 | |
EP3967566B1 (en) | Method for displaying a vehicle notification, a vehicle display device, vehicle and a computer-readable storage medium | |
KR101820291B1 (ko) | 차량용 음성 인식 제어 장치 및 그 방법 | |
CN103218128A (zh) | 使用时间差显示图形用户界面的方法和支持该方法的终端 | |
CN112051887A (zh) | 一种基于方向盘按键的控制方法和装置 | |
CN104333606A (zh) | 一种ktv点歌的方法、点歌系统及移动终端 | |
CN102774321A (zh) | 一种车载系统及其声音控制方法 | |
CN105183469B (zh) | 应用程序切换时的焦点定位方法及装置 | |
CN103600700B (zh) | 基于双机互动模式下的音视频控制方法及系统 | |
CN110097884B (zh) | 一种语音交互方法和装置 | |
CN103187076A (zh) | 语音式音乐控制装置 | |
CN104536673A (zh) | 读取车机微信接受音频信息的方法及系统 | |
CN105100915A (zh) | 一种切换音视频应用的方法及电视机 | |
CN109240638A (zh) | 用于车辆的音频处理方法及装置 | |
CN104898821A (zh) | 一种信息处理的方法及电子设备 | |
CN107436680A (zh) | 用于切换车载设备的应用模式的方法和设备 | |
US20130013310A1 (en) | Speech recognition system | |
CN108762614A (zh) | 中控显示屏界面切换方法、装置、存储介质及中控显示屏 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |