CN108962245A - 车载系统的控制方法、装置及计算机可读存储介质 - Google Patents
车载系统的控制方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN108962245A CN108962245A CN201810736463.2A CN201810736463A CN108962245A CN 108962245 A CN108962245 A CN 108962245A CN 201810736463 A CN201810736463 A CN 201810736463A CN 108962245 A CN108962245 A CN 108962245A
- Authority
- CN
- China
- Prior art keywords
- information
- subscriber identity
- phonetic order
- voice signal
- identity information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims description 63
- 230000001755 vocal effect Effects 0.000 claims description 40
- 238000011946 reduction process Methods 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 7
- 238000004378 air conditioning Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005057 refrigeration Methods 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000009331 sowing Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种车载系统控制方法、装置及计算机可读存储介质,涉及智能化汽车技术领域。该方法包括:获取用于控制车载系统的声音信号;获取所述声音信号对应的语音指令信息及用户身份信息;根据所述用户身份信息查询所述语音指令信息对应的关联指令信息;当查询到所述语音指令信息对应的关联指令信息时,根据所述语音指令信息及所述语音指令信息对应的关联指令信息生成关联控制指令;通过所述关联控制指令对所述车载系统进行控制。通过本公开提供的车载系统控制方法,更够有效提高车载系统的控制效率,提升其智能化水平。
Description
技术领域
本公开涉及智能化汽车技术领域,特别涉及一种车载系统的控制方法、装置及计算机可读存储介质。
背景技术
随着汽车工业的快速发展,智能化成为了汽车的主要发展趋势之一。种类繁多的车载系统是体现汽车智能化的一种重要形式。常见的车载系统包括车载空调、车载多媒体、车载导航等,通过控制车载系统运作,能够为驾驶过程带来诸多便捷。
相关技术中提供了一种车载系统的控制方法,包括:存储请求与指定动作的对应关系;获取请求,并根据请求获取指定动作指令;控制车载系统按照指定动作指令执行指定动作。举例来说,请求“开空调”对应指定动作“开启空调,制冷21℃”,则当获取“开空调”请求后,控制车载空调开启,并制冷21℃。
在实现本公开的过程中,发明人发现相关技术至少存在以下问题:
相关技术中所提供的车载系统控制方法,只能控制车载系统执行指定动作,整体控制方法的智能化程度较低,易出现控制效率低的问题。举例来说,若请求“开空调”对应指定动作“开启空调,制冷温度21℃”,则通过相关技术中的控制方法只能实现车载空调以制冷21℃的温度启动。若空调温度不适宜当前使用环境,则还需再次调整温度。
发明内容
本公开实施例提供了一种车载系统的控制方法、装置及计算机可读存储介质,可以解决上述问题,技术方案具体如下:
本公开实施例提供了一种车载系统控制方法,所述方法包括:
获取用于控制车载系统的声音信号;
获取所述声音信号对应的语音指令信息及用户身份信息;
根据所述用户身份信息查询所述语音指令信息对应的关联指令信息;
当查询到所述语音指令信息对应的关联指令信息时,根据所述语音指令信息及所述语音指令信息对应的关联指令信息生成关联控制指令;
通过所述关联控制指令对所述车载系统进行控制。
可选地,所述获取所述声音信号对应的语音指令信息及用户身份信息,包括:
对所述声音信号进行降噪处理,得到处理后的声音信号;
将所述处理后的声音信号转换成数字信号;
对所述数字信号进行语义分析,得到所述声音信号对应的语音指令信息;
对所述数字信号进行声纹识别,根据声纹识别结果获取所述声音信号对应的用户身份信息。
可选地,所述对所述数字信号进行语义分析,得到所述声音信号对应的语音指令信息,包括:
在本地对所述数字信号进行语义分析,得到第一语义分析结果;
通过云端对所述数字信号进行语义分析,得到第二语义分析结果;
根据所述第一语义分析结果及所述第二语义分析结果获取所述声音信号对应的语音指令信息。
可选地,所述根据声纹识别结果获取所述声音信号对应的用户身份信息,包括:
将所述声纹识别结果与声纹模型库中的声纹进行匹配,所述声纹模型库中存储有声纹及声纹对应的用户身份信息;
当查询到匹配的声纹时,将所述匹配的声纹对应的用户身份信息作为所述声音信号对应的用户身份信息。
可选地,所述方法还包括:收集至少一个用户的声纹,并记录各个用户的用户身份信息;
将每个用户的声纹及用户身份信息对应存储,得到声纹模型库。
可选地,所述根据所述用户身份信息查询所述语音指令信息对应的关联指令信息,包括:
查询所述用户身份信息对应的行车数据;
根据所述行车数据确定所述语音指令信息对应的关联指令信息。
可选地,所述方法还包括:
收集并记录所述用户身份信息对应的语音控制指令;
对所述语音控制指令进行统计,得到所述用户身份信息对应的行车数据。
可选地,所述方法还包括:
当未查询到所述语音指令信息对应的关联指令信息时,根据所述语音指令信息生成语音控制指令;
通过所述语音控制指令对所述车载系统进行控制,并记录所述语音控制指令及所述用户身份信息,用于形成所述用户身份信息对应的行车数据。
本公开实施例还提供了一种车载系统控制装置,所述装置包括:
第一获取模块,用于获取用于控制车载系统的声音信号;
第二获取模块,用于获取所述声音信号对应的语音指令信息及用户身份信息;
查询模块,用于根据所述用户身份信息查询所述语音指令信息对应的关联指令信息;
生成模块,用于当查询到所述语音指令信息对应的关联指令信息时,根据所述语音指令信息及所述文字指令信息对应的关联指令信息生成关联控制指令;
控制模块,用于通过所述关联控制指令对所述车载系统进行控制。
还提供了一种计算机可读存储介质,所述计算机可读存储介质包括至少一段程序或至少一条指令,所述程序或指令用于实现如第一方面所述的车载系统控制方法。
本公开实施例提供的技术方案带来的有益效果是:
本公开实施例提供的车载系统控制系统,通过根据声音信号获取语音指令信息以及用户身份信息,进一步根据语音指令信息和用户身份信息查找关联指令信息,进而生成满足客户行车习惯的关联控制指令。通过关联控制指令可控制车载系统执行语音指令和与该语音指令相关的关联指令。换言之,通过本公开的车载系统控制方法,通过获取一次声音信号能够执行一系列满足用户需求的动作。避免了相关技术中车载控制系统需要多次获取声音信号、多次执行造成的控制效率低下的缺陷,具有更高的执行效率,同时智能化程度更高,优化体验。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的一种车载系统控制方法流程图;
图2是本公开实施例提供的获取声音指令对应的语音指令信息和用户身份信息的流程示意图;
图3是本公开实施例提供的对数字信号进行语义识别的流程示意图;
图4是本公开实施例提供的根据用户身份信息查询语音指令信息对应的关联指令信息的流程示意图;
图5是本公开实施例提供的一种车载系统控制装置的框图;
图6是本公开实施例提供的车载系统控制装置中第二获取模块的框图;
图7是本公开实施例提供的车载系统控制装置中查询模块的框图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
图1是根据一示例性实施例示出的一种车载系统控制方法流程图,如附图1所示,该方法包括:
步骤1、获取用于控制车载系统的声音信号。
声音信号是车载系统所获取的用户发出的语音指令的模拟信号,具体通过车载终端的麦克风获取。
步骤2、获取声音信号对应的语音指令信息及用户身份信息。
语音指令信息是通过对声音信号进行语义识别获取的,且不同的声音信号对应不同的语音指令信息。示例地,声音信号“想要听新闻”对应的语音指令信息为“启动收音机播放新闻”;声音信号“附近有什么好吃的”对应的语音指令信息为“启动导航搜索预设范围内的饭店”。
用户身份信息是指声音信号发出者的身份信息,该用户可以为驾驶员或者乘客。
步骤3、根据用户身份信息查询语音指令信息对应的关联指令信息。
关联指令信息是指与语音指令信息相关联的指令信息,反映了用户的行车习惯。通常,关联指令信息与语音指令信息具有相同的执行主体,并且,关联指令信息反映的是用户在通过语音指令信息进行操作后再进行的操作信息。
举例来说,语音指令信息“听新闻”的执行主体为车载收音机,与之对应的关联指令信息的执行主体同样为收音机。此时,关联指令信息具体可以为“播放军事新闻”或者“播放财经新闻”等。语音指令“调整座椅”的执行主体为座椅,与之对应的关联指令信息的执行主体同样为座椅。此时,关联指令信息具体可以为“座椅后移动10cm”或者“座椅后背向后倾斜20°”等。
并且不同的用户具有不同的行车习惯和操作方式,因此为了增强该控制方法的个性化,在查询关联指令信息时,还需参考用户的身份信息,以查询到符合用户行车习惯的关联指令信息。示例地,在不参考用户身份信息时,语音指令信息“给张三打电话”的关联指令信息为“在电话列表中随机某个手机通讯录中获取张三的号码并拨打”;而根据目标用户身份信息,语音指令信息“给张三打电话”的关联指令信息为“在目标用户手机通讯录中获取张三的号码并拨通”。可以看出,通过用户身份信息可获取的关联指令信息更符合目标用户使用习惯,避免进行多次操作。
步骤4、当查询到语音指令信息对应的关联指令信息时,根据语音指令信息及语音指令信息对应的关联指令信息生成关联控制指令。
当查询到语音指令信息对应的关联指令信息时,说明该用户具有与语音指令信息相关联的行车习惯。此时,通过语音指令信息和关联指令信息生成的关联控制指令包含了一系列指令。示例地,根据语音指令信息“开空调”和关联指令信息“制冷21℃、大风量”生成的关联控制指令包括以下指令:“启动车载空调”、“开启制冷模式”、“温度21℃”、以及“风量大”。
步骤5、通过关联控制指令对车载系统进行控制。
结合步骤4,可以理解的是,通过关联控制指令可控制车载系统执行一系列满足用户行车习惯的动作。
通过上述步骤1至步骤5,实现了本公开实施所提供的车载系统控制方法。在本公开实施例提供的控制方法中,通过获取一次声音信号即可控制车载系统执行一系列满足用户行车习惯的动作。避免了相关技术中为了满足用户需求多次控制带来的控制效率低下的缺陷,同时通过本公开实施例所提供的控制方法也提升了车载系统的智能化水平,优化用户体验。
车辆行驶环境中难以避免地存在空调出风、机械摩擦等行车噪音,因此在获取声音信号时,车载系统的麦克风会同时将行车噪音录入形成噪音信号。不难理解的是,噪音信号会干扰对声音信号中语音指令信息识别的准确度,因此为了削弱噪音信号的影响,在本公开实施例采用以下声音信号获取方式:
具体地,车载系统包括主麦克风和辅麦克风。此时步骤1具体包括:通过主麦克风获取第一声音信号,通过辅麦克风获取第二声音信号。其中,主麦克风在车辆行驶过程始终进行录音,辅麦克风仅在获取声音信号时进行录音。如此,通过主麦克风既可避免在获取声音信号时出现遗漏,又可录入未获取声音信号时的环境噪音,便于与辅麦克风所获取的声音信号比对,以筛除行车噪音对声音信号的干扰。并且,利用辅麦克风获取第二声音信号时,通过按键触发或者语音触发启动辅麦克风。示例地,采用按键触发时,在车载终端设置有录音按钮,通过触发按钮可发送制动指令给辅麦克风进行录音。或者,采用语音触时,设定触发语音,当车载系统获取到触发语音的声音信号时启动辅麦克风,其中触发语音可以为“开始语音识别”等。
图2是根据一示例性实施例示出的获取声音指令对应的语音指令信息和用户身份信息(即步骤2)的流程示意图。如图2所示,步骤2包括:
步骤21、对声音信号进行降噪处理,得到处理后的声音信号。
通过降噪处理能够去除行车噪音的干扰,提高根据声音信号获取的语音指令信息的准确度。具体结合步骤1中所获取的第一声音信号和第二声音信号,此处对声音信号进行降噪处理包括:对第一声音信号和第二声音信号进行相位处理,合并处理后的第一声音信号和第二声音信号,并对合并后的声音信号通过增大信噪比的方式进行降噪处理。
步骤22、将处理后的声音信号转换成数字信号。
步骤21中经过降噪处理的声音信号为模拟信号,为了便于信号传输并提高信号的抗干扰能力,在步骤22中将声音信号转换为数字信号。
步骤23、对数字信号进行语义分析,得到声音信号对应的语音指令信息。
通过语义分析将数字信号转写为文字信息,进而根据文字信息获取与之对应的语音指令信息。可选地,对数字信号进行语义分析包括但不限于以下两种可选方式:
图3示出了第一种可选方式,该方式应用于具有较强信号的行驶环境中,此时车载终端与云端服务器可进行数据传输,如图3所示,该方式具体包括:
步骤231、在本地对数字信号进行语义分析,得到第一语义分析结果;通过云端对数字信号进行语义分析,得到第二语义分析结果。
其中本地是指车载终端,在本地得到第一语义分析结果时,无需将数据上传至云端服务器。通过云端对数字信号进行语义分析时,首先车载终端将数字信号发送至云端服务器,云端服务器接收数字信号并对数字信号进行语义分析,得到第二语义分析结果。
本地语义分析和云端语义分析各具优势,其中,本地语义分析善于分析简短语音的数字信号,特别是命令式语音,例如“开空调”、“听音乐”、“接电话”等。云端语义分析善于分析较长语音的数字信号,其识别效果更优,例如“今天开车好累来点歌听”,“附件有什么吃东西的地方”等。
步骤232、根据第一语义分析结果及第二语义分析结果获取声音信号对应的语音指令信息。
具体地,云端服务器将第二语义分析结果发送至车载终端;车载终端接收第二语义分析结果,并对第一语义分析结果和第二语义分析结果进行仲裁,得到二者中更合乎逻辑的分析结果,将其作为语音指令信息。示例地,车载终端对数字信号进行语义分析,得到第一语义分析结果“听空调”;云端对数字信号进行语义分析,得到第二语义分析结果“听音乐”,并发送给车载终端;车载终端接收第一语义分析结果,并对第一语义分析结果和第二语义分析结果进行仲裁;其中第二语义分析结果“听音乐”更合乎逻辑,将第二语义分析结果作为语音指令信息。
第一种可选方式结合了云端语义分析和本地语义分析,通过比对两种方式得到的语义分析结果确定出合乎逻辑的语音指令信息,这种方式识别准确度更高,给用户提供更为智能的行车体验。
第二种可选方式应用于信号较弱的行驶环境中,如:隧道、偏远山区等。此时,步骤23包括:在本地对数字信号进行语义分析,得到语音指令信息。当车辆行驶环境的信号较弱时,车载终端难以与云端服务器进行数据传输,因此仅在本地对数字信号进行语义分析,以保证对车载系统的持续、稳定控制。
步骤24:对数字信号进行声纹识别,根据声纹识别结果获取声音信号对应的用户身份信息。
声纹具有唯一性,每个人的声纹都各不相同,因此通过识别声纹可以确定声音发出者的身份。具体地,可在本地进行声纹识别,或通过云端进行声纹识别。当在本地进行声纹识别时,车载终端无需将数字信号传输给云端服务器;当通过云端识别时,车载终端首先将数字信号发送给云端服务器,云端服务器接受数字信号后进行声纹识别。
示例地,根据声纹识别结果获取声音信号对应的用户身份信息(即步骤24)具体包括:
首先、将声纹识别结果与声纹模型库中的声纹进行匹配,声纹模型库中存储有声纹及声纹对应的用户身份信息。
示例地,声纹模型库位于云端服务器。进行识别时,云端服务器先接收本地发送的数字信号,之后将接收的声纹识别结果与云端声纹识别库中的声纹进行匹配获取用户身份信息。声纹模型库设置于云端服务器,可具有较大的存储空间。可以理解的是,当存储有越多的声纹和用户身份信息,该声纹识别的效果更佳。
其次、当查询到匹配的声纹时,将匹配的声纹对应的用户身份信息作为声音信号对应的用户身份信息。
进一步地,在步骤24中,声纹模型库通过以下方法形成:
收集至少一个用户的声纹,并记录各个用户的用户身份信息;
将每个用户的声纹及用户身份信息对应存储,得到声纹模型库。
其中身份信息可以为姓名或者代号等,将不同的用户区分开即可。在记录时,用户的身份信息与该用户的声纹一一对应,如此通过声纹即可获取该用户的身份信息。
需要说明的是,步骤23和步骤24之间并没有严格的顺序要求,序号仅用于区分不同的步骤,在实际操作中,用户身份信息和语音指令信息可同时获取。
图4是根据一示例性实施例示出的根据用户身份信息查询语音指令信息对应的关联指令信息(即步骤3)的流程示意图。根据图4,步骤3包括:
步骤31、查询用户身份信息对应的行车数据。
行车数据存储在云端行车数据库中,记录了用户在行车过程中控制车载系统进行的各项操作,包括每次操作的操作时间、语音指令信息、以及用户身份信息。可以理解的是,行车数据能够直观反映出用户的行车习惯。进一步地,不同的用户具有各自的行车数据,因此在获取关联指令信息时,首先需要根据用户身份信息查询当前用户的行车数据,以根据当前用户的行车习惯进行后续分析。
步骤32、根据行车数据确定语音指令信息对应的关联指令信息。
具体地,在行车数据中搜索与语音指令信息相关的关联指令信息。示例地,与语音指令信息“开空调”对应的关联指令信息包括:空调工作模式、温度、湿度、以及风量等。与语音指令信息“听音乐”对应的关联指令信息包括:音乐类型、音量大小、歌手名称等。与语音指令信息“搜索附近美食”对应的关联指令信息包括:该用户增消费过的店铺、用户消费次数最多的店铺,距离当前位置最近的店铺等。
其中,行车数据存储与云端服务器的行车数据库中,具体由如下步骤形成:
收集并记录用户身份信息对应的语音控制指令信息。
语音控制指令信息由本地发送至云端服务器。具体地,本地在根据第一语义分析结果和第二意义分析结果确定语音指令信息后发送至行车数据。
对语音控制指令进行统计,得到用户身份信息对应的行车数据。
其中对于语音控制指令的统计分析包括但不限于:统计相同语音控制指令的次数、在预设时间段内语音控制指令出现的频率、不用语音控制指令之间的关联程度、按照执行主体对语音控制指令进行分类等。
通过上述步骤可以通过关联控制指令控制车载系统进行一系列动作。但除此之外,本公开实施例提供的车载系统控制方法还包括未查询到语音指令信息对应的关联指令信息的情况。具体地,这种情况包括以下两类:
第一类、未获取到用户身份信息。这类情况说明该用户首次使用控制系统,因此在声纹库中并未存储该用户的声纹以及用户身份信息。
第二类、根据用户身份信息和语音指令信息未查询到关联指令信息。这类情况说明该语音指令信息为新指令。
基于此,本公开实施例提供的车载系统控制方法还包括:
当未查询到语音指令信息对应的关联指令信息时,根据语音指令信息生成语音控制指令。
其中,语音控制指令是指与语音指令信息对应的控制指令,示例地,语音指令信息“给小明打电话”对应的语音控制指令为“随机选择用户手机并拨通小明电话”;语音指令信息“听歌”对应的语音控制指令为“启动收音机并随机播放”;语音指令信息“调整座椅”执行“无可操作记录”。
进一步地,在未查询到语音指令信息对应的关联指令信息时,通过语音控制指令对车载系统进行控制,并记录语音控制指令及用户身份信息,用于形成用户身份信息对应的行车数据。
此时,需要说明的是,当属于第一类情况时,则将该语音控制指令对应的语音指令信息存储于目标用户的行车数据中。当属于第二类情况,则车载系统发出提示对当前用户进行注册,具体录入至少2组未注册用户的语音,以在声纹模型库中存储该用户的声纹。其中车载系统可以语音形式或者指示灯形式发出提示,提示未注册用户进行录音。
图5是根据一示例性实施例示出的车载系统控制装置的示意图,该控制装置具体包括:
第一获取模块1,用于获取用于控制车载系统的声音信号;
第二获取模块2,用于获取声音信号对应的语音指令信息及用户身份信息;
查询模块3,用于根据用户身份信息查询语音指令信息对应的关联指令信息;
指令生成模块4,用于当查询到语音指令信息对应的关联指令信息时,根据语音指令信息及文字指令信息对应的关联指令信息生成关联控制指令;
控制模块5,用于通过关联控制指令对车载系统进行控制。
在一种可能实现的方式中,第一获取模块1包括:
主麦克风101,用于录入第一声音信号;以及,辅麦克风102,用于录入第二声音信号。
在一种可能实现的方式中,如图6所示,第二获取模块2包括:
降噪单元201,用于将对第一声音信号和第二声音信号进行降噪处理。
信号转换单元202,用于将降噪处理后的声音信号转换为数字信号,并发送数字信号至云端。
第一语义分析单元203A,用于对数字信号进行本地语义分析,得到第一语义分析结果。
第二语义分析单元203B,用于接受信号转换单元202发送的数字信号,并对数字信号进行云端语义分析,得到第二语义分析结果。
语音指令信息获取单元204,用于根据第一语义分析结果和第二语义分析结果获取语音指令信息。
声纹识别单元205,用于进行云端声纹识别,接受信号转换单元202发送的数字信号,并对数字信号进行声纹识别获取声纹识别结果。
声纹库206,位于云端用于存储用户声纹与对应的声纹信息。
匹配单元207,用于根据声纹识别单元205获取的声纹识别结果在声纹库206中进行匹配;
且匹配单元207被配置为:当在声纹库206中匹配到声纹时,将该声纹对应的用户身份信息作为声音信号对应的用户身份信息;
当未在声纹库206中匹配到声纹时,发送提示指令至车载终端,以提醒用户录入声纹。
在一种可能实现的方式中,如图7所示,查询模块3包括:
行车数据库301,设置在云端,用于存储至少一个用户的行车数据。
第一查询单元302,用于在行车数据库301中查询与用户身份信息对应的行车数据;
第二查询单元303,用于当第一查询单元302在行车数据库301中查询到对应的行车数据时,根据行车数据确定语音指令信息对应的关联指令信息,并将关联指令信息发送至指令生成模块4。
在一种可能的实施方式中,当匹配单元207未在声纹库206中匹配到声纹时,或者,当第一查询单元302未在行车数据库301中与用户身份信息对应的行车数据时,指令生成模块4还用于根据语音指令信息生成语音控制指令,并发送至控制模块5。
此时,控制模块5还用于接收语音控制指令,并根据语音控制指令对车载系统进行控制。
并且,该车载控制系统还包括:指令收集模块6,位于车载终端,用于收集用户发出的语音指令并上传至行车数据库301,以记录在对应用户的行车数据中。
本公开实施例提供的车载系统控制系统,通过获取一次声音信号能够执行一系列满足用户需求的动作。避免了相关技术中车载控制系统需要多次获取声音信号、多次执行造成的控制效率低下的缺陷,具有更高的执行效率,同时智能化程度更高,优化体验。
本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质包括至少一段程序或至少一条指令,程序或指令用于实现如上述的车载系统控制方法或者车载系统控制装置。
关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
需要说明的是:上述实施例提供的一种车载系统控制装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将车载终端的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
以上所述仅为本公开的较佳实施例,并不用以限制本公开的保护范围,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种车载系统控制方法,其特征在于,所述方法包括:
获取用于控制车载系统的声音信号;
获取所述声音信号对应的语音指令信息及用户身份信息;
根据所述用户身份信息查询所述语音指令信息对应的关联指令信息;
当查询到所述语音指令信息对应的关联指令信息时,根据所述语音指令信息及所述语音指令信息对应的关联指令信息生成关联控制指令;
通过所述关联控制指令对所述车载系统进行控制。
2.根据权利要求1所述的方法,其特征在于,所述获取所述声音信号对应的语音指令信息及用户身份信息,包括:
对所述声音信号进行降噪处理,得到处理后的声音信号;
将所述处理后的声音信号转换成数字信号;
对所述数字信号进行语义分析,得到所述声音信号对应的语音指令信息;
对所述数字信号进行声纹识别,根据声纹识别结果获取所述声音信号对应的用户身份信息。
3.根据权利要求2所述的方法,其特征在于,所述对所述数字信号进行语义分析,得到所述声音信号对应的语音指令信息,包括:
在本地对所述数字信号进行语义分析,得到第一语义分析结果;
通过云端对所述数字信号进行语义分析,得到第二语义分析结果;
根据所述第一语义分析结果及所述第二语义分析结果获取所述声音信号对应的语音指令信息。
4.根据权利要求2所述的方法,其特征在于,所述根据声纹识别结果获取所述声音信号对应的用户身份信息,包括:
将所述声纹识别结果与声纹模型库中的声纹进行匹配,所述声纹模型库中存储有声纹及声纹对应的用户身份信息;
当查询到匹配的声纹时,将所述匹配的声纹对应的用户身份信息作为所述声音信号对应的用户身份信息。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
收集至少一个用户的声纹,并记录各个用户的用户身份信息;
将每个用户的声纹及用户身份信息对应存储,得到声纹模型库。
6.根据权利要求1-5中任一所述的方法,其特征在于,所述根据所述用户身份信息查询所述语音指令信息对应的关联指令信息,包括:
查询所述用户身份信息对应的行车数据;
根据所述行车数据确定所述语音指令信息对应的关联指令信息。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
收集并记录所述用户身份信息对应的语音控制指令;
对所述语音控制指令进行统计,得到所述用户身份信息对应的行车数据。
8.根据权利要求1-5中任一所述的方法,其特征在于,所述方法还包括:
当未查询到所述语音指令信息对应的关联指令信息时,根据所述语音指令信息生成语音控制指令;
通过所述语音控制指令对所述车载系统进行控制,并记录所述语音控制指令及所述用户身份信息,用于形成所述用户身份信息对应的行车数据。
9.一种车载系统控制装置,其特征在于,所述装置包括:
第一获取模块,用于获取用于控制车载系统的声音信号;
第二获取模块,用于获取所述声音信号对应的语音指令信息及用户身份信息;
查询模块,用于根据所述用户身份信息查询所述语音指令信息对应的关联指令信息;
生成模块,用于当查询到所述语音指令信息对应的关联指令信息时,根据所述语音指令信息及所述文字指令信息对应的关联指令信息生成关联控制指令;
控制模块,用于通过所述关联控制指令对所述车载系统进行控制。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括至少一段程序或至少一条指令,所述程序或指令用于实现如权利要求1-8中任一所述的车载系统控制方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810736463.2A CN108962245A (zh) | 2018-07-06 | 2018-07-06 | 车载系统的控制方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810736463.2A CN108962245A (zh) | 2018-07-06 | 2018-07-06 | 车载系统的控制方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108962245A true CN108962245A (zh) | 2018-12-07 |
Family
ID=64482222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810736463.2A Pending CN108962245A (zh) | 2018-07-06 | 2018-07-06 | 车载系统的控制方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108962245A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110001549A (zh) * | 2019-04-17 | 2019-07-12 | 百度在线网络技术(北京)有限公司 | 用于控制车辆的方法和装置 |
CN110111791A (zh) * | 2019-05-21 | 2019-08-09 | 扬州航盛科技有限公司 | 一种基于车载智能网联的语音识别系统 |
CN110825093A (zh) * | 2019-11-28 | 2020-02-21 | 安徽江淮汽车集团股份有限公司 | 自动驾驶策略生成方法、装置、设备及存储介质 |
CN110932862A (zh) * | 2019-10-22 | 2020-03-27 | 安信通科技(澳门)有限公司 | 一种车辆中的车载设备登录管理方法及装置 |
CN111292742A (zh) * | 2020-01-14 | 2020-06-16 | 京东数字科技控股有限公司 | 数据处理方法、装置、电子设备和计算机存储介质 |
CN111312238A (zh) * | 2019-07-30 | 2020-06-19 | 中国第一汽车股份有限公司 | 一种车辆动作的控制方法及汽车 |
CN111312237A (zh) * | 2019-07-30 | 2020-06-19 | 中国第一汽车股份有限公司 | 一种车辆动作的控制方法及汽车 |
CN111428512A (zh) * | 2020-03-27 | 2020-07-17 | 大众问问(北京)信息科技有限公司 | 一种语义识别方法、装置及设备 |
CN111508086A (zh) * | 2020-04-13 | 2020-08-07 | 深圳栩峰科技有限公司 | 一种停车场无人管理系统及方法 |
CN111619304A (zh) * | 2019-02-28 | 2020-09-04 | 上海博泰悦臻电子设备制造有限公司 | 车辆空调的控制方法、系统及车辆 |
CN111883125A (zh) * | 2020-07-24 | 2020-11-03 | 北京蓦然认知科技有限公司 | 一种车辆语音控制方法、装置和系统 |
CN113140219A (zh) * | 2021-05-08 | 2021-07-20 | 广东电网有限责任公司 | 调控指令生成方法、装置、电子设备及存储介质 |
CN114043987A (zh) * | 2021-10-13 | 2022-02-15 | 集度科技有限公司 | 指令处理方法、装置、终端和存储介质 |
CN114999490A (zh) * | 2022-08-03 | 2022-09-02 | 成都智暄科技有限责任公司 | 一种智能座舱音频控制系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5826233A (en) * | 1996-05-16 | 1998-10-20 | Honda Giken Kogyo Kabushiki Kaisha | Speech-input control device |
CN104994456A (zh) * | 2015-07-07 | 2015-10-21 | 惠州Tcl移动通信有限公司 | 一种提高通话音质的耳机及其方法 |
CN106683673A (zh) * | 2016-12-30 | 2017-05-17 | 智车优行科技(北京)有限公司 | 驾驶模式的调整方法、装置和系统、车辆 |
CN206528432U (zh) * | 2016-11-21 | 2017-09-29 | 东莞市云创网络科技有限公司 | 一种具有记忆功能的智能汽车 |
CN108091329A (zh) * | 2017-12-20 | 2018-05-29 | 江西爱驰亿维实业有限公司 | 基于语音识别控制汽车的方法、装置及计算设备 |
-
2018
- 2018-07-06 CN CN201810736463.2A patent/CN108962245A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5826233A (en) * | 1996-05-16 | 1998-10-20 | Honda Giken Kogyo Kabushiki Kaisha | Speech-input control device |
CN104994456A (zh) * | 2015-07-07 | 2015-10-21 | 惠州Tcl移动通信有限公司 | 一种提高通话音质的耳机及其方法 |
CN206528432U (zh) * | 2016-11-21 | 2017-09-29 | 东莞市云创网络科技有限公司 | 一种具有记忆功能的智能汽车 |
CN106683673A (zh) * | 2016-12-30 | 2017-05-17 | 智车优行科技(北京)有限公司 | 驾驶模式的调整方法、装置和系统、车辆 |
CN108091329A (zh) * | 2017-12-20 | 2018-05-29 | 江西爱驰亿维实业有限公司 | 基于语音识别控制汽车的方法、装置及计算设备 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111619304A (zh) * | 2019-02-28 | 2020-09-04 | 上海博泰悦臻电子设备制造有限公司 | 车辆空调的控制方法、系统及车辆 |
CN110001549A (zh) * | 2019-04-17 | 2019-07-12 | 百度在线网络技术(北京)有限公司 | 用于控制车辆的方法和装置 |
CN110111791A (zh) * | 2019-05-21 | 2019-08-09 | 扬州航盛科技有限公司 | 一种基于车载智能网联的语音识别系统 |
CN111312238A (zh) * | 2019-07-30 | 2020-06-19 | 中国第一汽车股份有限公司 | 一种车辆动作的控制方法及汽车 |
CN111312237A (zh) * | 2019-07-30 | 2020-06-19 | 中国第一汽车股份有限公司 | 一种车辆动作的控制方法及汽车 |
CN110932862A (zh) * | 2019-10-22 | 2020-03-27 | 安信通科技(澳门)有限公司 | 一种车辆中的车载设备登录管理方法及装置 |
CN110825093A (zh) * | 2019-11-28 | 2020-02-21 | 安徽江淮汽车集团股份有限公司 | 自动驾驶策略生成方法、装置、设备及存储介质 |
CN111292742A (zh) * | 2020-01-14 | 2020-06-16 | 京东数字科技控股有限公司 | 数据处理方法、装置、电子设备和计算机存储介质 |
CN111428512B (zh) * | 2020-03-27 | 2023-12-12 | 大众问问(北京)信息科技有限公司 | 一种语义识别方法、装置及设备 |
CN111428512A (zh) * | 2020-03-27 | 2020-07-17 | 大众问问(北京)信息科技有限公司 | 一种语义识别方法、装置及设备 |
CN111508086A (zh) * | 2020-04-13 | 2020-08-07 | 深圳栩峰科技有限公司 | 一种停车场无人管理系统及方法 |
CN111883125A (zh) * | 2020-07-24 | 2020-11-03 | 北京蓦然认知科技有限公司 | 一种车辆语音控制方法、装置和系统 |
CN113140219A (zh) * | 2021-05-08 | 2021-07-20 | 广东电网有限责任公司 | 调控指令生成方法、装置、电子设备及存储介质 |
CN114043987A (zh) * | 2021-10-13 | 2022-02-15 | 集度科技有限公司 | 指令处理方法、装置、终端和存储介质 |
CN114043987B (zh) * | 2021-10-13 | 2024-07-09 | 北京集度科技有限公司 | 指令处理方法、装置、终端和存储介质 |
CN114999490A (zh) * | 2022-08-03 | 2022-09-02 | 成都智暄科技有限责任公司 | 一种智能座舱音频控制系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108962245A (zh) | 车载系统的控制方法、装置及计算机可读存储介质 | |
CN106816149B (zh) | 车辆自动语音识别系统的优先化内容加载 | |
CN110660397B (zh) | 对话系统、车辆和用于控制车辆的方法 | |
US10380992B2 (en) | Natural language generation based on user speech style | |
CN110232912B (zh) | 语音识别仲裁逻辑 | |
US7881929B2 (en) | Ambient noise injection for use in speech recognition | |
US8600741B2 (en) | Method of using microphone characteristics to optimize speech recognition performance | |
CN110648661A (zh) | 对话系统、车辆和用于控制车辆的方法 | |
US10990703B2 (en) | Cloud-configurable diagnostics via application permissions control | |
CN102543077B (zh) | 基于语言独立女性语音数据的男性声学模型适应方法 | |
CN108447488B (zh) | 增强语音识别任务完成 | |
CN109671424B (zh) | 车辆特征的响应激活 | |
US10861460B2 (en) | Dialogue system, vehicle having the same and dialogue processing method | |
US10997974B2 (en) | Dialogue system, and dialogue processing method | |
CN105702254A (zh) | 基于移动终端的语音控制装置及其语音控制方法 | |
CN106042933A (zh) | 自适应的车辆界面系统 | |
US20130211832A1 (en) | Speech signal processing responsive to low noise levels | |
CN109785827A (zh) | 在语音识别仲裁中使用的神经网络 | |
US7596370B2 (en) | Management of nametags in a vehicle communications system | |
CN111611402B (zh) | 一种基于位置的驾驶行为知识图谱生成方法、装置和系统 | |
CN110503947A (zh) | 对话系统、包括其的车辆和对话处理方法 | |
US11593447B2 (en) | Pre-fetch and lazy load results of in-vehicle digital assistant voice searches | |
US10593323B2 (en) | Keyword generation apparatus and keyword generation method | |
CN112712799A (zh) | 一种误触发语音信息的获取方法、装置、设备及存储介质 | |
US10951590B2 (en) | User anonymity through data swapping |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181207 |
|
RJ01 | Rejection of invention patent application after publication |