CN110232924A - 车载语音管理方法、装置、车辆及存储介质 - Google Patents
车载语音管理方法、装置、车辆及存储介质 Download PDFInfo
- Publication number
- CN110232924A CN110232924A CN201910477690.2A CN201910477690A CN110232924A CN 110232924 A CN110232924 A CN 110232924A CN 201910477690 A CN201910477690 A CN 201910477690A CN 110232924 A CN110232924 A CN 110232924A
- Authority
- CN
- China
- Prior art keywords
- signal
- microphone
- voice signal
- target
- vehicle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007726 management method Methods 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 15
- 230000015654 memory Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 3
- 235000013399 edible fruits Nutrition 0.000 claims description 3
- 230000006870 function Effects 0.000 description 12
- 238000011946 reduction process Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 241000209140 Triticum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 235000021152 breakfast Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
本发明实施例公开了一种车载语音管理方法、装置、车辆及存储介质。该方法包括:根据至少一个麦克风捕获的唤醒信号,确定目标麦克风,处理所述目标麦克风捕获的语音信号,获得目标语音信号,解析所述目标语音信号,确定解析结果,将所述解析结果展示在所述目标麦克风对应的车载屏幕上。本发明实施例将目标语音信号的解析结果展示在目标麦克风对应的车载屏幕上,解决了现有技术中所有语音信号反馈的信息均在同一车载屏幕上显示而影响用户使用的问题,满足了用户需求。
Description
技术领域
本发明实施例涉及语音管理技术领域,尤其涉及一种车载语音管理方法、装置、车辆及存储介质。
背景技术
近年来,随着人工智能领域的兴起,智能语音在车辆上的应用越来越广泛,目前车载语音控制已经成为车辆的基本功能,也是各大车厂体现智能化、情感化比较集中的领域。
传统的车载语音管理方法中,所有语音反馈的信息均在主驾驶室的中控屏幕上显示,此时如果主驾驶正在使用地图,那么语音反馈的信息就会遮盖导航信息,影响主驾驶使用,存在安全隐患。
发明内容
本发明实施例提供一种车载语音管理方法、装置、车辆及存储介质,以解决现有技术中所有语音反馈的信息均在同一车载屏幕上显示而影响用户使用的问题。
第一方面,本发明实施例提供一种车载语音管理方法,包括:
根据至少一个麦克风捕获的唤醒信号,确定目标麦克风;
处理所述目标麦克风捕获的语音信号,获得目标语音信号;
解析所述目标语音信号,确定解析结果;
将所述解析结果展示在所述目标麦克风对应的车载屏幕上。
第二方面,本发明实施例还提供一种车载语音管理装置,该装置包括:
定位模块,用于根据至少一个麦克风捕获的唤醒信号,确定目标麦克风;
识别模块,用于处理所述目标麦克风捕获的语音信号,获得目标语音信号;
解析模块,用于解析所述目标语音信号,确定解析结果;
展示模块,用于将所述解析结果展示在所述目标麦克风对应的车载屏幕上。
第三方面,本发明实施例还提供一种车辆,包括:至少一个麦克风和至少两个车载屏幕,还包括:
一个或多个控制器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个控制器执行,使得所述一个或多个控制器实现如第一方面所述的车载语音管理方法。
第四方面,本发明实施例还提供一种存储介质,其上存储有计算机程序,该程序被控制器执行时实现如第一方面所述的车载语音管理方法。
本发明实施例提供一种车载语音管理方法、装置、车辆及存储介质,根据至少一个麦克风捕获的唤醒信号,确定目标麦克风,处理所述目标麦克风捕获的语音信号,获得目标语音信号,解析所述目标语音信号,确定解析结果,将所述解析结果展示在所述目标麦克风对应的车载屏幕上。本发明实施例将目标语音信号的解析结果展示在目标麦克风对应的车载屏幕上,解决了现有技术中所有语音信号反馈的信息均在同一车载屏幕上显示而影响用户使用的问题,满足了用户需求。
附图说明
图1为本发明实施例一提供的一种车载语音管理方法的流程图;
图2为本发明实施例二提供的一种车载语音管理方法的流程图;
图3为本发明实施例三提供的一种车载语音管理装置的结构图;
图4为本发明实施例四提供的一种车辆的结构图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
实施例一
图1为本发明实施例一提供的一种车载语音管理方法的流程图,本实施例可适用于将车载语音的解析结果展示在麦克风对应的车载屏幕上的情况,该方法可以由车载语音管理装置来执行,该装置可以通过软件和/或硬件的方式实现,并集成在车辆中,具体的,该方法包括如下步骤:
S110、根据至少一个麦克风捕获的唤醒信号,确定目标麦克风。
麦克风设置于车辆内部,用于捕获车内用户的语音信号,具体的安装位置和数量可以根据实际需要设置,例如可以在每个座位上均设置一个麦克风,也可以是主驾驶室和副驾驶室分别设置一个,还可以是主驾驶室和副驾驶室分别设置一个,后排乘客室左右各设置一个等。当每个座位上均设置有麦克风时,每个座位上的麦克风可以只捕获对应座位上用户的语音信号,也可以捕获车内所有用户的语音信号,其中,每个座位上的麦克风只捕获对应座位上用户的语音信号,可以通过设置捕获范围实现。本实施例以每个座位上均设置有一个麦克风,每个麦克风可以捕获车内所有用户的语音信号为例。
唤醒信号是用于唤醒整车语音功能的语音信号,具体可以是一句话或一个词,例如“你好红旗”、“你好旗宝”、“红旗”或“旗宝”等。唤醒信号可以是车辆出厂时自带的,也可以是用户自定义的。以“你好红旗”为例,当麦克风捕获到“你好红旗”时,语音功能被唤醒,麦克风才可以捕获用户的语音信号,即如果用户需要麦克风捕获某种语音信号,应先利用唤醒信号唤醒整车的语音功能。
本实施例中,所述目标麦克风可认为是最先接收到唤醒信号的麦克风,需要说明的是,设置于车辆内的各麦克风均可以接收车内各用户的语音信号。可以理解的是,用户所在位置不同,同一唤醒信号传输至不同麦克风或不同唤醒信号传输至同一个麦克风的时间不同,即麦克风捕获唤醒信号的时刻值不同。具体的,可以将各个麦克风捕获的时刻值进行比较,确定最先接收到唤醒信号的麦克风,即可确定目标麦克风。
S120、处理所述目标麦克风捕获的语音信号,获得目标语音信号。
目标语音信号是车载屏幕上解析结果对应的语音信号。当车内只有一个用户说话时,可以直接将目标麦克风捕获的语音信号作为目标语音信号。当车内有多个用户说话时,目标麦克风可以捕获所有用户的语音信号。可以理解的是,不同语音信号的语义可能不同,比如用户A是打开音乐,用户B是打开蓝牙,为了后续在车载屏幕上展示一种语音信号对应的信息,需要对目标麦克风捕获的各语音信号进行处理,得到目标语音信号。
可选的,可以提取目标麦克风捕获的各语音信号的信号捕获时刻值和信号能量捕获值等信息,根据信号捕获时刻值和信号能量捕获值确定目标语音信号,其中,信号捕获时刻值是麦克风捕获到语音信号的时刻,捕获到语音信号的时刻越早,对应的信号捕获时刻值越小。信号能量捕获值是麦克风捕获到语音信号时,语音信号具有的能量,可以理解的是,语音信号在传输过程中,能量衰减,通常情况下,传输时间越长,衰减越大,麦克风捕获到语音信号时,语音信号的信号能量捕获值越小。也可以根据各语音信号的优先级和信号捕获时刻值确定目标语音信号,当语音信号的优先级相同时,可以进一步根据捕获时刻值确定。
其中,语音信号的优先级可以根据实际需要设置,比如指令信号的优先级高于非指令信号的优先级,指令信号可以是操控车辆的指令信号或娱乐功能的指令信号等,操控车辆的指令信号的优先级高于娱乐功能的指令信号,非指令信号可以是用户的聊天信息等。例如,目标麦克风捕获的用户A的语音信号和用户B的语音信号均为娱乐功能的指令信号,但用户A的语音信号的信号捕获时刻值小于用户B,用户C的语音信号为非指令信号,则将用户A的语音信号确定为目标语音信号。目标语音信号确定之后,可以对目标麦克风捕获的其他语音信号进行降噪处理,只保留目标语音信号,防止其他语音信号对目标语音信号的干扰。进一步的,还可以对目标语音信号进行滤波等操作,提高目标语音信号的质量。
可选的,在S120之前,还可以包括:对其他麦克风捕获的语音信号进行降噪处理。可以理解的是,除了目标麦克风,其他麦克风也可以捕获用户的语音信号,此时可认为其他麦克风获取的语音信号为噪声信号,由此,在实际应用中,对其他麦克风捕获的语音信号进行降噪处理,只保留目标麦克风捕获的语音信号。
S130、解析所述目标语音信号,确定解析结果。
目标语音信号的内容不同,对应的解析结果不同。比如目标语音信号为指令信号时,解析结果为与指令信号对应的功能菜单,示例性的,目标语音信号为打开音乐,解析结果为音乐菜单。再如,目标语音信号为普通的聊天信息,解析结果为聊天信息对应的文字内容,示例性的,目标语音信号为“你吃早饭了吗”,解析结果为“没有”。具体的,可以对目标语音信号进行语义解析,得到解析结果。
S140、将所述解析结果展示在所述目标麦克风对应的车载屏幕上。
车载屏幕是设置于车辆内的屏幕,可以展示目标语音信号的解析结果,供用户选择或参考。车载屏幕的安装位置和数量可以根据实际需要设置。可选的,可以包括主屏幕和副屏幕,其中,主屏幕可以设置于主驾驶室,副屏幕可以设置于副驾驶室。主屏幕可以展示地图和导航等信息,为驾驶员提供信息参考,还可以展示与驾驶员对应的语音信息解析结果。副屏幕可以展示驾驶员以外的其他用户语音信号的解析结果,这种设置方式可以解决现有技术中所有语音信号的相关信息均展示在主屏幕上而影响驾驶员使用的问题,减少了安全隐患,其中,麦克风与车载屏幕具有关联关系。示例性的,以每个座位上设置有一个麦克风,主驾驶室的麦克风与主屏幕关联,其他位置的麦克风与副屏幕关联为例,当捕获目标语音信号的目标麦克风为主驾驶室的麦克风时,将解析结果展示在主屏幕上,否则,展示在副屏幕上。
可选的,除了包括主屏幕和副屏幕,还可以包括其他屏幕,即除了主驾驶位置和副驾驶位置,其他座位上分别配备相应的屏幕,每个座位上的麦克风与相应的屏幕具有关联关系。目标麦克风确定以后,即可确定关联的屏幕,进而将目标语音信号的解析结果展示在关联的屏幕上,不会影响其他位置屏幕的使用。需要说明的是,当车载屏幕具有多个时,各个车载屏幕之间相互独立。
本发明实施例一提供一种车载语音管理方法,根据至少一个麦克风捕获的唤醒信号,确定目标麦克风,处理所述目标麦克风捕获的语音信号,获得目标语音信号,解析所述目标语音信号,确定解析结果,将所述解析结果展示在所述目标麦克风对应的车载屏幕上。本发明实施例将目标语音信号的解析结果展示在目标麦克风对应的车载屏幕上,解决了现有技术中所有语音信号反馈的信息均在同一车载屏幕上显示而影响用户使用的问题,满足了用户需求。
在上述实施例的基础上,所述车载屏幕的数量至少为两个;相应的,所述方法还包括:
预先设置各麦克风关联的车载屏幕,获得信息关联表。
信息关联表用于存储麦克风和车载屏幕的关联关系,目标麦克风确定之后,查找该信息关联表即可确定与目标麦克风关联的车载屏幕,进而将解析结果展示在关联的车载屏幕上。本实施例的车载屏幕至少包括两个,可选的,包括主屏幕和副屏幕,设置麦克风与车载屏幕的关联关系可以避免所有语音信号的解析结果均展示在一个车载屏幕而影响用户使用的情况,在一定程度上满足了用户的需求。
实施例二
图2为本发明实施例二提供的一种车载语音管理方法的流程图,本实施例是在上述实施例的基础上具体化,具体包括如下步骤:
S210、分析各所述麦克风捕获的唤醒信号,获得各所述唤醒信号的参数信息。
其中,所述参数信息包括:麦克风的信号捕获时刻值及信号能量捕获值。信号捕获时刻值及信号能量捕获值在前面介绍过,此处不再赘述。本实施例假定信号捕获时刻值越小,信号能量捕获值越大。具体的,获取各麦克风捕获的唤醒信号之后,对各唤醒信号的参数信息进行分析,提取各唤醒信号对应的信号捕获时刻值及信号能量捕获值,为后续目标麦克风的确定提供依据。
S220、将满足第一预设条件的参数信息对应的麦克风作为目标麦克风。
其中,所述第一预设条件为:信号捕获时刻值最小且信号能量捕获值最大。本实施例根据信号捕获时刻值和信号能量捕获值确定目标麦克风。具体的,假定车内有5个座位,分别对应1-5号,每个座位上设置有一个麦克风,分别对应A-E,1号座位与麦克风A对应,其他类似。当只有1号座位的用户发出唤醒信号时,五个麦克风均可以接收到该用户发出的唤醒信号。由于该用户与五个麦克风的位置不同,唤醒信号的传播时间不同,各个麦克风捕获的唤醒信号的信号捕获时刻值和对应的信号能量捕获值不同。分别比较各信号捕获时刻值和信号能量捕获值即可确定信号捕获时刻值最小且信号能量捕获值最大对应的麦克风,比如为麦克风A,则麦克风A为目标麦克风。当有多个用户发出唤醒信号时,目标麦克风的确定过程也是类似。将信号捕获时刻值和信号能量捕获值配合使用可以提高目标麦克风确定的准确度。
S230、提取所述目标麦克风所捕获至少一个语音信号的捕获时刻值及相应的信号能量值,每个语音信号对应一个车载用户。
目标麦克风确定以后,其他麦克风捕获的语音信号可以作为噪声,进行降噪处理。具体的,目标麦克风可以捕获车内所有用户的语音信号,对目标麦克风捕获的语音信号的处理过程与唤醒信号类似,也是提取各语音信号的捕获时刻值及相应的信号能量值,为目标语音信号的确定提供依据。本实施例设定每个语音信号对应一个车载用户,比如目标麦克风捕获到三个语音信号,则对应三个用户。
S240、将捕获时刻值最小且信号能量值最大的语音信号作为目标语音信号。
假定目标麦克风为麦克风A,麦克风A捕获到三个语音信号,分别对应用1号用户、3号用户和4号用户,其中,麦克风A设置在1号用户所在的座位上,可以确定1号用户的语音信号为目标语音信号,确定过程与目标麦克风的过程类似,此处不再赘述。目标语音信号确定以后,其他语音信号即可作为噪声,进行降噪处理,防止对目标语音信号的干扰。
S250、解析所述目标语音信号,获得语义信息。
语义信息为目标语音信号代表的含义,为了将目标语音信号对应的信息展示在相应的车载屏幕上,需要对目标语音信号进行解析,获得语义信息。可选的,可以利用解析模型,将目标语音信号输入解析模型,由解析模型输出分析结果,作为语义信息,其中,解析模型可以是深度学习模型或神经网络模型等。
S260、所述语义信息是否为指令触发信息,若是,执行S270,否则执行S280。
语义信息包括指令触发信息和非指令触发信息,其中,指令触发信息为触发某个对象的指令信息,例如当语义信息为“打开音乐”时,该信息为指令触发信息,用于触发音乐。非指令信息可以是用户的聊天信息等。当语义信息为指令触发信息时,执行S270,否则执行S280。
S270、确定所述指令触发信息对应的触发对象,并将所述触发对象作为解析结果。
指令触发信息中包括触发对象对应的关键词,比如指令触发信息为“打开音乐”,触发对象对应的关键词为“音乐”,则将音乐菜单作为解析结果。
S280、将所述语义信息对应的文字作为解析结果。
当语义信息为非指令信息时,将语义信息对应的文字作为解析结果,比如,用户问:今天天气怎么样?对该语音信号进行解析,得到对应的语义信息为“温度查询”“今天”,解析结果为:“今天温度为”。
S290、查找所述信息关联表,确定所述目标麦克风关联的目标车载屏幕。
目标车载屏幕是与目标麦克风匹配的屏幕,目标麦克风确定后,可以通过查找信息关联表确定目标车载屏幕。
S2100、将所述解析结果展示在所述目标车载屏幕上。
目标车载屏幕确定之后,即可将解析结果展示在目标车载屏幕上。示例性的,车载屏幕与麦克风一一对应,均设置在对应的座位上,当目标麦克风位于1号座位时,目标语音信号的解析结果展示在1号座位的车载屏幕上,供1号座位的用户参考或选择。本实施例仅考虑用户在自己对应座位上的情况,这样当目标麦克风位于1号座位时,捕获的目标语音信号即为1号座位对应的用户,相应车载屏幕上展示的解析结果也是与1号座位的用户对应。
本发明实施例二提供一种车载语音管理方法,在上述实施例的基础上,根据唤醒信号的参数信息确定最先被唤醒的麦克风作为目标麦克风,并根据目标麦克风捕获的语音信号的参数信息确定目标语音信号,进而将目标语音信号的解析结果展示在目标麦克风对应的车载屏幕上,既满足了目标语音信号所对应用户的需求,又不影响其他位置车载屏幕的使用。
实施例三
图3为本发明实施例三提供的一种车载语音管理装置的结构图,该装置可以执行上述实施例所述的车载语音管理方法,具体的,该装置包括:
定位模块310,用于根据至少一个麦克风捕获的唤醒信号,确定目标麦克风;
识别模块320,用于处理所述目标麦克风捕获的语音信号,获得目标语音信号;
解析模块330,用于解析所述目标语音信号,确定解析结果;
展示模块340,用于将所述解析结果展示在所述目标麦克风对应的车载屏幕上。
本发明实施例三提供一种车载语音管理装置,根据至少一个麦克风捕获的唤醒信号,确定目标麦克风,处理所述目标麦克风捕获的语音信号,获得目标语音信号,解析所述目标语音信号,确定解析结果,将所述解析结果展示在所述目标麦克风对应的车载屏幕上。本发明实施例将目标语音信号的解析结果展示在目标麦克风对应的车载屏幕上,解决了现有技术中所有语音信号反馈的信息均在同一车载屏幕上显示而影响用户使用的问题,满足了用户需求。
在上述实施例的基础上,定位模块310,包括:
分析单元,用于分析各所述麦克风捕获的唤醒信号,获得各所述唤醒信号的参数信息;
定位单元,用于将满足第一预设条件的参数信息对应的麦克风作为目标麦克风;
其中,所述参数信息包括:麦克风的信号捕获时刻值及信号能量捕获值,所述第一预设条件为:信号捕获时刻值最小且信号能量捕获值最大。
在上述实施例的基础上,识别模块320,包括:
提取单元,用于提取所述目标麦克风所捕获至少一个语音信号的捕获时刻值及相应的信号能量值,每个语音信号对应一个车载用户;
识别单元,用于将捕获时刻值最小且信号能量值最大的语音信号作为目标语音信号。
在上述实施例的基础上,解析模块330,包括:
解析单元,用于解析所述目标语音信号,获得语义信息;
第一确定单元,用于如果所述语义信息为指令触发信息,则确定所述指令触发信息对应的触发对象,并将所述触发对象作为解析结果;
第二确定单元,用于否则,将所述语义信息对应的文字作为解析结果。
在上述实施例的基础上,所述车载屏幕的数量至少为两个;
相应的,所述装置还包括:
关联表确定模块,用于预先设置各麦克风关联的车载屏幕,获得信息关联表。
在上述实施例的基础上,展示模块340,包括:
查找单元,用于查找所述信息关联表,确定所述目标麦克风关联的目标车载屏幕;
展示单元,用于将所述解析结果展示在所述目标车载屏幕上。
本发明实施例三提供的车载语音管理装置可以用于执行上述实施例提供的车载语音管理方法,具备相应的功能和有益效果。
实施例四
图4为本发明实施例四提供的一种车辆的结构图,具体的,参考图4,该车辆包括:麦克风43、车载屏幕44、控制器41和存储器42,车辆中麦克风43和控制器41的数量可以是一个也可以是多个,车载屏幕44与麦克风43对应,车载屏幕44的数量可以是两个及以上,图4中以四个麦克风43、四个车载屏幕44和一个控制器41为例,其中,四个麦克风43与四个车载屏幕44一一对应,即麦克风431与车载屏幕441对应,麦克风432与车载屏幕442对应,麦克风433与车载屏幕443对应,麦克风434与车载屏幕444对应,麦克风43和车载屏幕44设置于对应座位上,麦克风43用于捕获车辆内用户的语音信号,车载屏幕44用于展示语音信号的解析结果。车辆中,麦克风43、车载屏幕44、控制器41和存储器42可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器42作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的车载语音管理方法对应的程序指令/模块。控制器41通过运行存储在存储器42中的软件程序、指令以及模块,从而执行车辆的各种功能应用以及数据处理,即实现上述实施例的车载语音管理方法。
控制器42主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器42可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器42可进一步包括相对于控制器41远程设置的存储器,这些远程存储器可以通过网络连接至车辆。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例四提供的车辆与上述实施例提供的车载语音管理方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例具备执行车载语音管理方法相同的有益效果。
实施例五
本发明实施例五还提供一种存储介质,其上存储有计算机程序,该程序被控制器执行时实现如本发明上述实施例所述的车载语音管理方法。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的车载语音管理方法中的操作,还可以执行本发明实施例所提供的车载语音管理方法中的相关操作,且具备相应的功能和有益效果。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是机器人,个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的车载语音管理方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种车载语音管理方法,其特征在于,包括:
根据至少一个麦克风捕获的唤醒信号,确定目标麦克风;
处理所述目标麦克风捕获的语音信号,获得目标语音信号;
解析所述目标语音信号,确定解析结果;
将所述解析结果展示在所述目标麦克风对应的车载屏幕上。
2.根据权利要求1所述的方法,其特征在于,所述根据至少一个麦克风捕获的唤醒信号,确定目标麦克风,包括:
分析各所述麦克风捕获的唤醒信号,获得各所述唤醒信号的参数信息;
将满足第一预设条件的参数信息对应的麦克风作为目标麦克风;
其中,所述参数信息包括:麦克风的信号捕获时刻值及信号能量捕获值,所述第一预设条件为:信号捕获时刻值最小且信号能量捕获值最大。
3.根据权利要求1所述的方法,其特征在于,所述处理所述目标麦克风接收的语音信号,获得目标语音信号,包括:
提取所述目标麦克风所捕获至少一个语音信号的捕获时刻值及相应的信号能量值,每个语音信号对应一个车载用户;
将捕获时刻值最小且信号能量值最大的语音信号作为目标语音信号。
4.根据权利要求1所述的方法,其特征在于,所述解析所述目标语音信号,确定解析结果,包括:
解析所述目标语音信号,获得语义信息;
如果所述语义信息为指令触发信息,则确定所述指令触发信息对应的触发对象,并将所述触发对象作为解析结果;
否则,将所述语义信息对应的文字作为解析结果。
5.根据权利要求1所述的方法,其特征在于,所述车载屏幕的数量至少为两个;
相应的,所述方法还包括:
预先设置各麦克风关联的车载屏幕,获得信息关联表。
6.根据权利要求5所述的方法,其特征在于,所述将所述解析结果展示在所述目标麦克风对应的车载屏幕上,包括:
查找所述信息关联表,确定所述目标麦克风关联的目标车载屏幕;
将所述解析结果展示在所述目标车载屏幕上。
7.一种车载语音管理装置,其特征在于,包括:
定位模块,用于根据至少一个麦克风捕获的唤醒信号,确定目标麦克风;
识别模块,用于处理所述目标麦克风捕获的语音信号,获得目标语音信号;
解析模块,用于解析所述目标语音信号,确定解析结果;
展示模块,用于将所述解析结果展示在所述目标麦克风对应的车载屏幕上。
8.根据权利要求7所述的装置,其特征在于,所述定位模块,包括:
分析单元,用于分析各所述麦克风捕获的唤醒信号,获得各所述唤醒信号的参数信息;
定位单元,用于将满足第一预设条件的参数信息对应的麦克风作为目标麦克风;
其中,所述参数信息包括:麦克风的信号捕获时刻值及信号能量捕获值,所述第一预设条件为:信号捕获时刻值最小且信号能量捕获值最大。
9.一种车辆,其特征在于,包括:至少一个麦克风和对应各所述麦克风设置的车载屏幕,还包括:
一个或多个控制器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个控制器执行,使得所述一个或多个控制器实现如权利要求1-6中任一项所述的车载语音管理方法。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被控制器执行时实现如权利要求1-6中任一项所述的车载语音管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910477690.2A CN110232924A (zh) | 2019-06-03 | 2019-06-03 | 车载语音管理方法、装置、车辆及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910477690.2A CN110232924A (zh) | 2019-06-03 | 2019-06-03 | 车载语音管理方法、装置、车辆及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110232924A true CN110232924A (zh) | 2019-09-13 |
Family
ID=67859241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910477690.2A Pending CN110232924A (zh) | 2019-06-03 | 2019-06-03 | 车载语音管理方法、装置、车辆及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110232924A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110992946A (zh) * | 2019-11-01 | 2020-04-10 | 上海博泰悦臻电子设备制造有限公司 | 一种语音控制方法、终端及计算机可读存储介质 |
CN111968642A (zh) * | 2020-08-27 | 2020-11-20 | 北京百度网讯科技有限公司 | 语音数据处理方法、装置及智能车辆 |
CN113409785A (zh) * | 2021-06-30 | 2021-09-17 | 中国第一汽车股份有限公司 | 基于车辆的语音交互方法、装置、车辆和存储介质 |
CN115346527A (zh) * | 2022-08-08 | 2022-11-15 | 科大讯飞股份有限公司 | 语音控制方法、装置、系统、车辆和存储介质 |
CN115440211A (zh) * | 2022-06-01 | 2022-12-06 | 北京罗克维尔斯科技有限公司 | 车载语音管理方法、装置、设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262879A (zh) * | 2010-05-24 | 2011-11-30 | 乐金电子(中国)研究开发中心有限公司 | 语音命令竞争处理方法、装置、语音遥控器和数字电视 |
CN104637480A (zh) * | 2015-01-27 | 2015-05-20 | 广东欧珀移动通信有限公司 | 一种控制语音识别方法、装置以及系统 |
CN105976815A (zh) * | 2016-04-22 | 2016-09-28 | 乐视控股(北京)有限公司 | 车载语音识别方法及装置 |
CN107564524A (zh) * | 2017-10-20 | 2018-01-09 | 高井云 | 工业机器人的语音控制系统和方法 |
CN108847225A (zh) * | 2018-06-04 | 2018-11-20 | 上海木木机器人技术有限公司 | 一种机场多人语音服务的机器人及其方法 |
CN109166582A (zh) * | 2018-10-16 | 2019-01-08 | 深圳供电局有限公司 | 一种语音识别的自动控制系统及方法 |
CN109493871A (zh) * | 2017-09-11 | 2019-03-19 | 上海博泰悦臻网络技术服务有限公司 | 车载系统的多屏语音交互方法及装置、存储介质和车机 |
-
2019
- 2019-06-03 CN CN201910477690.2A patent/CN110232924A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262879A (zh) * | 2010-05-24 | 2011-11-30 | 乐金电子(中国)研究开发中心有限公司 | 语音命令竞争处理方法、装置、语音遥控器和数字电视 |
CN104637480A (zh) * | 2015-01-27 | 2015-05-20 | 广东欧珀移动通信有限公司 | 一种控制语音识别方法、装置以及系统 |
CN105976815A (zh) * | 2016-04-22 | 2016-09-28 | 乐视控股(北京)有限公司 | 车载语音识别方法及装置 |
CN109493871A (zh) * | 2017-09-11 | 2019-03-19 | 上海博泰悦臻网络技术服务有限公司 | 车载系统的多屏语音交互方法及装置、存储介质和车机 |
CN107564524A (zh) * | 2017-10-20 | 2018-01-09 | 高井云 | 工业机器人的语音控制系统和方法 |
CN108847225A (zh) * | 2018-06-04 | 2018-11-20 | 上海木木机器人技术有限公司 | 一种机场多人语音服务的机器人及其方法 |
CN109166582A (zh) * | 2018-10-16 | 2019-01-08 | 深圳供电局有限公司 | 一种语音识别的自动控制系统及方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110992946A (zh) * | 2019-11-01 | 2020-04-10 | 上海博泰悦臻电子设备制造有限公司 | 一种语音控制方法、终端及计算机可读存储介质 |
CN111968642A (zh) * | 2020-08-27 | 2020-11-20 | 北京百度网讯科技有限公司 | 语音数据处理方法、装置及智能车辆 |
CN113409785A (zh) * | 2021-06-30 | 2021-09-17 | 中国第一汽车股份有限公司 | 基于车辆的语音交互方法、装置、车辆和存储介质 |
CN115440211A (zh) * | 2022-06-01 | 2022-12-06 | 北京罗克维尔斯科技有限公司 | 车载语音管理方法、装置、设备及介质 |
CN115346527A (zh) * | 2022-08-08 | 2022-11-15 | 科大讯飞股份有限公司 | 语音控制方法、装置、系统、车辆和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110232924A (zh) | 车载语音管理方法、装置、车辆及存储介质 | |
JP4166153B2 (ja) | 鳴声の音声的特徴分析に基づく犬の感情判別装置及びその方法 | |
DE112014000709B4 (de) | Verfahren und vorrichtung zum betrieb eines sprachtriggers für einen digitalen assistenten | |
DE102018128006A1 (de) | Natürlichsprachliche generierung basierend auf dem benutzersprachstil | |
DE112020004504T5 (de) | Kontoverbindung mit Gerät | |
EP3611724A1 (en) | Voice response method and device, and smart device | |
DE112021001064T5 (de) | Vorrichtungsgerichtete Äußerungserkennung | |
CN109637548A (zh) | 基于声纹识别的语音交互方法及装置 | |
CN109410927A (zh) | 离线命令词与云端解析结合的语音识别方法、装置和系统 | |
DE112020002531T5 (de) | Emotionsdetektion unter verwendung der sprechergrundlinie | |
DE102018125966A1 (de) | System und verfahren zur erfassung von stichworten in einer unterhaltung | |
CN108447471A (zh) | 语音识别方法及语音识别装置 | |
CN108595406B (zh) | 一种用户状态的提醒方法、装置、电子设备及存储介质 | |
CN110265013A (zh) | 语音的识别方法及装置、计算机设备、存储介质 | |
CN112562681B (zh) | 语音识别方法和装置、存储介质 | |
CN111462741A (zh) | 语音数据处理方法、装置及存储介质 | |
KR102312993B1 (ko) | 인공신경망을 이용한 대화형 메시지 구현 방법 및 그 장치 | |
US20230419957A1 (en) | User profile linking | |
CN110767240B (zh) | 儿童口音识别的设备控制方法、设备、存储介质及装置 | |
CN111933135A (zh) | 终端控制方法、装置、智能终端及计算机可读存储介质 | |
CN110737422B (zh) | 一种声音信号采集方法及装置 | |
CN115985317A (zh) | 信息处理方法、装置、车辆及存储介质 | |
CN114333817A (zh) | 遥控器及遥控器语音识别方法 | |
DE112021003164T5 (de) | Systeme und Verfahren zum Erkennen von Sprachbefehlen, um eine Peer-to-Peer-Kommunikationsverbindung zu erzeugen | |
KR20220045741A (ko) | 연속 상황을 판단하여 음성 인식 서비스를 제공하는 장치, 방법 및 컴퓨터 프로그램 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190913 |
|
RJ01 | Rejection of invention patent application after publication |