CN113450785A - 车载语音处理的实现方法、系统、介质及云端服务器 - Google Patents
车载语音处理的实现方法、系统、介质及云端服务器 Download PDFInfo
- Publication number
- CN113450785A CN113450785A CN202010157545.9A CN202010157545A CN113450785A CN 113450785 A CN113450785 A CN 113450785A CN 202010157545 A CN202010157545 A CN 202010157545A CN 113450785 A CN113450785 A CN 113450785A
- Authority
- CN
- China
- Prior art keywords
- voice
- processing
- information
- vehicle
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 152
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 67
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 67
- 230000008569 process Effects 0.000 claims abstract description 21
- 230000006870 function Effects 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 10
- 230000026676 system process Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
- H04L67/025—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
- H04L67/125—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks involving control of end-device applications over a network
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Navigation (AREA)
Abstract
本发明提供一种车载语音处理的实现方法、系统、介质及云端服务器;所述方法包括以下步骤:接收车载终端发送来的语音信息;根据预设语音系统,选择与所述预设语音系统一致的目标语音系统并接入,使所述目标语音系统对所述语音信息进行处理;将对所述语音信息处理后的结果发送至所述车载终端进行处理;本发明能够根据实际需求,选择使用不同的语音识别处理手段、语义理解处理手段和语音合成技术手段,由语音识别处理手段、语义理解处理手段和语音合成技术手段组合成语音识别系统,对语音信息进行处理,从而可达到最优的语音处理功效,给用户带来良好的使用体验。
Description
技术领域
本发明属于语音处理技术领域,特别是涉及一种车载语音处理的实现方法、系统、介质及云端服务器。
背景技术
随着语音处理技术的快速发展,语音处理被广泛应用在汽车领域,用户通过语音对车载设备进行控制,提高了用户对车辆的使用体验,而且有利于用户在驾驶车辆的时候,能专心开车,当需要使用车载设备的时候,仅通过发出语音信号即可,不需专门去启动车载设备,提高了用户驾驶车辆的安全性。
目前,车载语音处理通常是借助车内的硬件设备进行语音信息的采集和处理,硬件设备具有预先配置好的固定的语音处理系统,一个语音处理系统包括一语音识别单元、一语义理解单元和一语音合成单元,分别对语音信息进行语音识别、语义理解和语音合成,当用户发出语音信息时,即由该语音处理系统对其进行处理,由于语音处理系统的单一性,会导致对语音信息处理的单一性,不能满足实际需求,无法结合不同供应商提供的其在语音识别、语义理解、语音合成方面较为优势的语音识别单元、语义理解单元和语音合成单元,以搭建一可充分利用各家供应商优势的语音处理平台,从而会降低用户的使用体验。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种车载语音处理的实现方法、系统、介质及云端服务器,能够根据实际需求,选择使用不同的语音识别处理手段、语义理解处理手段和语音合成技术手段,由语音识别处理手段、语义理解处理手段和语音合成技术手段组合成语音识别系统,对语音信息进行处理,从而可达到最优的语音处理功效,给用户带来良好的使用体验。
为实现上述目的及其他相关目的,本发明提供一种车载语音处理的实现方法,应用于云端服务器,包括以下步骤:接收车载终端发送来的语音信息;根据预设语音系统,选择与所述预设语音系统一致的目标语音系统并接入,使所述目标语音系统对所述语音信息进行处理;将对所述语音信息处理后的结果发送至所述车载终端进行处理。
于本发明的一实施例中,选择与所述预设语音系统一致的目标语音系统并接入包括以下步骤:选择目标语音识别单元并接入;选择目标语义理解单元并接入;选择目标语音合成单元并接入。
于本发明的一实施例中,所述目标语音系统对所述语音信息进行处理包括以下步骤:通过目标语音识别单元对所述语音信息进行语音识别处理;通过目标语义理解单元对经过所述语音识别处理后的语音信息进行语义理解处理;通过目标语音合成单元对经过所述语义理解处理后的语音信息进行语音合成处理。
于本发明的一实施例中,还包括在选择所述目标语音系统之前,获取配置信息以从所述配置信息中选择出与所述预设语音系统一致的目标语音系统;其中,所述目标语音系统包括一语音识别单元、一语义理解单元和一语音合成单元;所述配置信息包括语音识别单元组、语义理解单元组和语音合成单元组,所述语音识别单元组、所述语义理解单元组和所述语音合成单元组中分别包括至少一种语音识别单元、至少一种语义理解单元、至少一种语音合成单元。
于本发明的一实施例中,所述配置信息还包括:功能配置信息和判断信息;所述功能配置信息为对所述语音识别单元组中的所述语音识别单元、所述语义理解单元组中的所述语义理解单元及所述语音合成单元组中的所述语音合成单元的功能配置信息;所述判断信息包括:是否开启实时反馈功能、是否支持长文本输入模式、是否支持方言中的一种或多种。
本发明提供一种车载语音处理的实现系统,应用于云端服务器,包括:信息接收模块,用于接收车载终端发送来的语音信息;选择处理模块,用于根据预设语音系统,选择与所述预设语音系统一致的目标语音系统并接入,使所述目标语音系统对所述语音信息进行处理;信息发送模块,用于将对所述语音信息处理后的结果发送至所述车载终端进行处理。
本发明提供一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的车载语音处理的实现方法。
本发明提供一种云端服务器,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序,以使所述云端服务器执行上述的车载语音处理的实现方法。
本发明提供一种车载语音处理的实现系统,包括车载终端及上述的云端服务器;所述车载终端与所述云端服务器连接,用于获取语音信息,并将所述语音信息发送至所述云端服务器。
于本发明的一实施例中,还包括语音系统供应模块;所述语音系统供应模块与所述云端服务器连接,用于向所述云端服务器提供至少一种语音系统,以使所述云端服务器选择出目标语音系统。
如上所述,本发明所述的车载语音处理的实现方法、系统、介质及云端服务器,具有以下有益效果:能够根据实际需求,选择使用不同的语音识别处理手段、语义理解处理手段和语音合成技术手段,由语音识别处理手段、语义理解处理手段和语音合成技术手段组合成语音识别系统,对语音信息进行处理,从而可达到最优的语音处理功效,给用户带来良好的使用体验。
附图说明
图1显示为本发明的车载语音处理的实现方法于一实施例中的应用背景架构图。
图2显示为本发明的车载语音处理的实现方法于一实施例中的流程图。
图3显示为本发明的选择并接入目标语音系统,对语音信息进行处理于一实施例中的流程图。
图4显示为本发明的车载语音处理的实现系统于一实施例中的结构示意图。
图5显示为本发明的云端服务器于一实施例中的结构示意图。
图6显示为本发明的车载语音处理的实现系统于另一实施例中的结构示意图。
图7显示为本发明的车载语音处理的实现方法于另一实施例中的流程图。
元件标号说明
41 信息接收模块
42 选择处理模块
43 信息发送模块
51 处理器
52 存储器
61 车载终端
62 云端服务器
S1~S3 车载语音处理的实现方法于一实施例中的步骤
S21~S26 选择并接入目标语音系统,对语音信息进行处理的步骤
S71~S75 车载语音处理的实现方法于另一实施例中的步骤
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明的车载语音处理的实现方法、系统、介质及云端服务器,能够根据实际需求,选择使用不同的语音识别处理手段、语义理解处理手段和语音合成技术手段,由语音识别处理手段、语义理解处理手段和语音合成技术手段组合成语音识别系统,对语音信息进行处理,从而可达到最优的语音处理功效,给用户带来良好的使用体验。
以下将结合图1至图3对本发明提供的车载语音处理的实现方法进行详细地解释说明。
如图1所示,于一实施例中,将所述车载语音处理的实现方法应用于云端服务器对车辆内的语音信息进行处理的过程中;具体地,车载终端与云端服务器连接,当用户发出语音信息,以想要通过语音信息对车载设备进行控制时,车辆内的语音采集装置首先会采集语音信息,并将采集后的语音信息发送至车载终端,车载终端接收该语音信息后会再发送至云端服务器,通过云端服务器对该语音信息进行处理,并将对语音信息处理后的结果反馈至车载终端,以使车载终端根据反馈后的结果对车载设备进行相应的控制。
需要说明的是,所述车载设备是指汽车上能够执行车载控制命令的设备,包括车内任何一通过执行控制命令使用的设备,诸如,汽车发动机、车载娱乐系统、车内充电设备、空调设备、座椅靠背、车窗、天窗、空调、音响等。
如图2所示,于一实施例中,本发明的车载语音处理的实现方法应用于云端服务器,包括以下步骤:
步骤S1、接收车载终端发送来的语音信息。
具体地,将车载终端与云端服务器建立通信连接,以使车载终端将获取的语音信息发送至云端服务器。
需要说明的是,车载终端与云端服务器可采用无线通信模块建立通信连接;具体地,所述无线通信模块可采用eSIM卡、蓝牙模块、WiFi模块或ZigBee中的任一种方式。
进一步地,车辆内设有语音采集装置,当用户发出语音信息时,由所述语音采集装置采集该语音信息,并将采集到的该语音信息发送至车载终端,车载终端获取该语音信息后,再将其发送至云端服务器。
需要说明的是,车载终端本身也可具有语音采集的功能,这样,当用户发出语音信息时,车载终端直接采集该语音信息,并将其发送至云端服务器上。
步骤S2、根据预设语音系统,选择与所述预设语音系统一致的目标语音系统并接入,使所述目标语音系统对所述语音信息进行处理。
具体地,用户在云端服务器上配置好预设语音系统,当云端服务器接收到语音信息时,根据预设语音系统,选择与预设语音系统一致的目标语音系统并接入,以使目标语音系统实现对语音信息的处理。
在本实施例中,还包括在选择所述目标语音系统之前,获取配置信息以从所述配置信息中选择出与所述预设语音系统一致的目标语音系统;其中,所述预设语音系统和所述目标语音系统均包括一语音识别单元、一语义理解单元和一语音合成单元。
具体地,通过语音系统供应模块向云端服务器提供配置信息;所述配置信息包括语音识别单元组、语义理解单元组和语音合成单元组,所述语音识别单元组、所述语义理解单元组和所述语音合成单元组中分别包括至少一种语音识别单元、至少一种语义理解单元、至少一种语音合成单元,根据预设语音系统,从语音识别单元组、语义理解单元组和语音合成单元组中各选择一与预设语音系统中的语音识别单元、语义理解单元、语音合成单元一致的语音识别单元、语义理解单元、语音合成单元,组成目标语音系统。
需要说明的是,语音系统供应模块向云端服务器提供的语音识别单元、语义理解单元和语音合成单元是由不同供应商提供的,诸如百度、思必驰、科大讯飞等等,在进行目标语音系统的选择之前,将这些供应商提供的不同的语音识别单元、不同的语义理解单元和不同的语音合成单元分别组成语音识别单元组、语义理解单元组、语音合成单元组,并存入语音系统供应模块中,以便在云端服务器选择目标语音系统的时候,能够从中选取与预设语音系统一致的语音识别单元、语义理解单元和语音合成单元。
在本实施例中,所述配置信息还包括:功能配置信息和判断信息;所述功能配置信息为对所述语音识别单元组中的所述语音识别单元、所述语义理解单元组中的所述语义理解单元及所述语音合成单元组中的所述语音合成单元的功能配置信息;所述判断信息包括:是否开启实时反馈功能、是否支持长文本输入模式、是否支持方言中的一种或多种。
进一步地,所述配置信息还包括接入规范和处理规则;其中,云端服务器在接入目标语音系统时按照接入规范来接入,具体地,接入规范是统一的接入协议,诸如MRCP协议,MRCP(Media Resource Control Protocol)协议是一种通讯协议,用于语音服务器向客户端提供各种语音服务(如:语音识别、语音合成、声纹识别、录音服务等);处理规则是用于云端服务器在对语音信息进行语音识别、语义理解和语音合成的过程中,对什么时候进行语音识别,什么时候进行语义理解,什么时候进行语音合成的一个处理标准;诸如,当语音信息发送至云端服务器的时候,接入的语音识别单元开始对该语音信息进行处理;当识别完成后,通过接入的语义理解单元对经过语音识别处理后的语音信息进行语义理解处理;当语义理解处理完成后,通过接入的语音合成单元对经过语义理解处理后的语音信息进行语音合成处理;那何时进行语音识别、何时进行语义理解及何时进行语音合成,都需要云端服务器有一个判断,或者说是有一个处理规则,按照这个处理规则进行处理;具体地,可根据上述实时反馈功能来实现,即语音识别单元识别完成后,会产生一个反馈结果,以表示识别完成,语义理解单元和语音合成单元处理完成后,也均会产生一个相应的处理结果,从而可对语音信息进行语音识别、语义理解和语音合成的依次处理;同时,也可配置一处理规则,诸如,当云端服务器接收到语音信息时(车载终端会向云端服务器发送一完整的语音信息流),即通过接入的语音识别单元对其进行语音处理,而在处理一预设时间后,即通过接入语义理解单元对语音识别单元处理后的语音信息进行语义理解处理,这个预设时间就作为一处理规则,是用户在云端服务器上预先配置好的,同样,该处理规则还可包含其它一些处理手段,在此不再一一论述。
如图3所示,于一实施例中,选择与所述预设语音系统一致的目标语音系统并接入,使所述目标语音系统对所述语音信息进行处理包括以下步骤:
步骤S21、选择目标语音识别单元并接入。
具体地,从语音识别单元组中选择与预设语音系统中的语音识别单元相同的目标语音识别单元并接入。
步骤S22、选择目标语义理解单元并接入。
具体地,从语义理解单元组中选择与预设语音系统中的语义理解单元相同的目标语义理解单元并接入。
步骤S23、选择目标语音合成单元并接入。
具体地,从语音合成单元组中选择与预设语音系统中的语音合成单元相同的目标语音合成单元并接入。
步骤S24、通过目标语音识别单元对所述语音信息进行语音识别处理。
步骤S25、通过目标语义理解单元对经过所述语音识别处理后的语音信息进行语义理解处理。
步骤S26、通过目标语音合成单元对经过所述语义理解处理后的语音信息进行语音合成处理。
需要说明的是,S21至S26的执行步骤并不一定按照上述先后顺序进行,只需保证在需要对语音信息进行语音识别处理的时候,已经选择好目标语音识别单元并接入;在需要对语音信息进行语义理解处理的时候,已经选择好目标语义理解单元并接入;在需要对语音信息进行语音合成处理的时候,已经选择好目标语音合成单元并接入即可,所以,在满足此保证的前提下,步骤S21至S26的执行顺序是可以发生变化的,S21至S26的执行顺序不作为限制本发明的条件,在此不再对其它执行顺序进行一一赘述。
步骤S3、将对所述语音信息处理后的结果发送至所述车载终端进行处理。
具体地,云端服务器通过选择的目标语音系统对语音信息进行处理后,会将处理后的结果发送至车载终端,车载终端根据接收到的信息,实现对该语音信息预要达到的目的执行相应的操作控制。
需要说明的是,本发明所述的车载语音处理的实现方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
如图4所示,于一实施例中,本发明的车载语音处理的实现系统应用于云端服务器,包括信息接收模块41,用于接收车载终端发送来的语音信息;选择处理模块42,用于根据预设语音系统,选择与所述预设语音系统一致的目标语音系统并接入,使所述目标语音系统对所述语音信息进行处理;信息发送模块43,用于将对所述语音信息处理后的结果发送至所述车载终端进行处理。
具体地,通过信息接收模块41接收车载终端发送来的语音信息,并将该语音信息发送至选择处理模块42,以使选择处理模块42根据预设语音系统,选择出目标语音系统对该语音信息进行处理,处理完成后,选择处理模块42再将处理后的结果通过信息发送模块43发送至车载终端,以完成对车载语音的整个处理过程。
需要说明的是,信息接收模块41、选择处理模块42和信息发送模块43的结构及原理与上述车载语音处理的实现方法中的步骤一一对应,故在此不再赘述。
需要说明的是,应理解以上系统的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,x模块可以为单独设立的处理元件,也可以集成在上述系统的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述系统的存储器中,由上述系统的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个数字信号处理器(Digital Singnal Processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
本发明的存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述的车载语音处理的实现方法。所述存储介质包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
如图5所示,本发明的云端服务器包括处理器51及存储器52。
所述存储器52用于存储计算机程序。优选地,所述存储器52包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
所述处理器51与所述存储器52相连,用于执行所述存储器52存储的计算机程序,以使所述云端服务器执行上述的车载语音处理的实现方法。
优选地,所述处理器51可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
需要说明的是,本发明的车载语音处理的实现系统可以实现本发明的车载语音处理的实现方法,但本发明的车载语音处理的实现方法的实现装置包括但不限于本实施例列举的车载语音处理的实现系统的结构,凡是根据本发明的原理所做的现有技术的结构变形和替换,都包括在本发明的保护范围内。
如图6所示,于一实施例中,本发明的车载语音处理的实现系统包括车载终端61及上述的云端服务器62。
所述车载终端61与所述云端服务器62连接,用于获取语音信息,并将所述语音信息发送至所述云端服务器62。
具体地,车载终端61与云端服务器62建立通信连接,以将获取的语音信息发送至云端服务器62,云端服务器62对该语音信息进行处理,并将处理后的结果再反馈至车载终端61,实现对车载语音的处理。
在本实施例中,还包括语音系统供应模块;所述语音系统供应模块与所述云端服务器62连接,用于向所述云端服务器62提供至少一种语音系统,以使所述云端服务器62选择出目标语音系统。
具体地,通过语音系统供应模块向云端服务器62提供不同供应商的语音系统,以使云端服务器62在对语音信息进行处理时,能够从这些语音系统(至少一种)中选择出与预设语音系统一致的目标语音系统对该语音信息进行处理,满足对语音处理的实际需求,结合不同供应商在语音处理领域(语音识别、语义理解、语音合成)的优势,从而达到最优的语音处理效果,提高用户的使用体验。
下面通过具体实施例来进一步验证本发明的车载语音处理的实现方法。
如图7所示,将该车载语音处理的实现方法用于对车辆内用户发出的语音进行处理;处理过程包括以下步骤:
S71、当用户在车辆内发出语音信息时,车辆内的语音采集装置采集所述语音信息,并将其发送至车载终端。
S72、车载终端接收到所述语音信息后,将其发送至云端服务器。
S73、将云端服务器与语音系统供应模块连接,以获取配置信息。
具体地,所述语音系统供应模块向云端服务器提供配置信息,该配置信息包括至少一种语音系统。
需要说明的是,该语音系统是由不同供应商提供的,一语音系统包括一语音识别单元、一语义理解单元和一语音合成单元,供应商在提供语音系统时,是以语音识别单元、语义理解单元和语音合成单元的形式提供的,而不是以一个整体语音系统提供,这样,云端服务器可从不同的供应商提供的不同的语音识别单元、不同的语义理解单元和不同的语音合成单元中分别选择一个语音识别单元、一个语义理解单元和一个语音合成单元,组成一语音系统,即一个语音系统中可包括由不同供应商提供的语音识别单元、语义理解单元和语音合成单元,结合不同供应商在语音识别、语义理解和/或语音合成方面的优势,组成一目标语音系统(与预设语音系统一致),从而达到最优的语音处理功效。
S74、云端服务器根据预设语音系统,从所述配置信息中选择与所述预设语音系统一致的目标语音系统并接入,使所述目标语音系统对所述语音信息进行处理。
具体地,用户在云端服务器上配置好预设语音系统,当需要对语音信息进行处理时,根据预设语音系统,从步骤S73中获取的至少一种语音系统中选择出与预设语音系统一致的目标语音系统,以使目标语音系统对语音信息进行处理。
S75、云端服务器将对所述语音信息处理后的结果发送至所述车载终端进行处理。
需要说明的是,该车载语音处理的实现方法还可用于其它领域内,用于对用户发出的语音进行处理,诸如用于智能终端对语音的处理,此时,是将智能终端获取的语音信息发送至云端服务器,而云端服务器对该语音信息进行处理后,会将处理后的结果再发送给智能终端,工作原理与上述用于对车辆内用户发出的语音进行处理的工作原理相同,在此不再赘述。
综上所述,本发明的车载语音处理的实现方法、系统、介质及云端服务器,能够根据实际需求,选择使用不同的语音识别处理手段、语义理解处理手段和语音合成技术手段,由语音识别处理手段、语义理解处理手段和语音合成技术手段组合成语音识别系统,对语音信息进行处理,从而可达到最优的语音处理功效,给用户带来良好的使用体验。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (10)
1.一种车载语音处理的实现方法,应用于云端服务器,其特征在于,包括以下步骤:
接收车载终端发送来的语音信息;
根据预设语音系统,选择与所述预设语音系统一致的目标语音系统并接入,使所述目标语音系统对所述语音信息进行处理;
将对所述语音信息处理后的结果发送至所述车载终端进行处理。
2.根据权利要求1所述的车载语音处理的实现方法,其特征在于,选择与所述预设语音系统一致的目标语音系统并接入包括以下步骤:
选择目标语音识别单元并接入;
选择目标语义理解单元并接入;
选择目标语音合成单元并接入。
3.根据权利要求2所述的车载语音处理的实现方法,其特征在于,所述目标语音系统对所述语音信息进行处理包括以下步骤:
通过目标语音识别单元对所述语音信息进行语音识别处理;
通过目标语义理解单元对经过所述语音识别处理后的语音信息进行语义理解处理;
通过目标语音合成单元对经过所述语义理解处理后的语音信息进行语音合成处理。
4.根据权利要求1所述的车载语音处理的实现方法,其特征在于,还包括在选择所述目标语音系统之前,获取配置信息以从所述配置信息中选择出与所述预设语音系统一致的目标语音系统;
其中,所述目标语音系统包括一语音识别单元、一语义理解单元和一语音合成单元;所述配置信息包括语音识别单元组、语义理解单元组和语音合成单元组,所述语音识别单元组、所述语义理解单元组和所述语音合成单元组中分别包括至少一种语音识别单元、至少一种语义理解单元、至少一种语音合成单元。
5.根据权利要求4所述的车载语音处理的实现方法,其特征在于,所述配置信息还包括:功能配置信息和判断信息;所述功能配置信息为对所述语音识别单元组中的所述语音识别单元、所述语义理解单元组中的所述语义理解单元及所述语音合成单元组中的所述语音合成单元的功能配置信息;所述判断信息包括:是否开启实时反馈功能、是否支持长文本输入模式、是否支持方言中的一种或多种。
6.一种车载语音处理的实现系统,应用于云端服务器,其特征在于,包括:
信息接收模块,用于接收车载终端发送来的语音信息;
选择处理模块,用于根据预设语音系统,选择与所述预设语音系统一致的目标语音系统并接入,使所述目标语音系统对所述语音信息进行处理;
信息发送模块,用于将对所述语音信息处理后的结果发送至所述车载终端进行处理。
7.一种存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至5中任一项所述的车载语音处理的实现方法。
8.一种云端服务器,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述云端服务器执行权利要求1至5中任一项所述的车载语音处理的实现方法。
9.一种车载语音处理的实现系统,其特征在于,包括车载终端及权利要求8中所述的云端服务器;
所述车载终端与所述云端服务器连接,用于获取语音信息,并将所述语音信息发送至所述云端服务器。
10.根据权利要求9所述的车载语音处理的实现系统,其特征在于,还包括语音系统供应模块;所述语音系统供应模块与所述云端服务器连接,用于向所述云端服务器提供至少一种语音系统,以使所述云端服务器选择出目标语音系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010157545.9A CN113450785B (zh) | 2020-03-09 | 2020-03-09 | 车载语音处理的实现方法、系统、介质及云端服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010157545.9A CN113450785B (zh) | 2020-03-09 | 2020-03-09 | 车载语音处理的实现方法、系统、介质及云端服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113450785A true CN113450785A (zh) | 2021-09-28 |
CN113450785B CN113450785B (zh) | 2023-12-19 |
Family
ID=77806276
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010157545.9A Active CN113450785B (zh) | 2020-03-09 | 2020-03-09 | 车载语音处理的实现方法、系统、介质及云端服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113450785B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1514995A (zh) * | 2002-04-04 | 2004-07-21 | �ձ�������ʽ���� | 话音识别对话选择装置,话音识别对话系统,话音识别选择方法及程序 |
WO2006083690A2 (en) * | 2005-02-01 | 2006-08-10 | Embedded Technologies, Llc | Language engine coordination and switching |
CN101794577A (zh) * | 2009-01-30 | 2010-08-04 | 株式会社Ntt都科摩 | 声音识别服务器、电话机、声音识别系统以及声音识别方法 |
CN103117058A (zh) * | 2012-12-20 | 2013-05-22 | 四川长虹电器股份有限公司 | 基于智能电视平台的多语音引擎切换系统及方法 |
CN103730119A (zh) * | 2013-12-18 | 2014-04-16 | 惠州市车仆电子科技有限公司 | 车载人机语音交互系统 |
CN107657950A (zh) * | 2017-08-22 | 2018-02-02 | 广州小鹏汽车科技有限公司 | 基于云端和多命令词的汽车语音控制方法、系统及装置 |
CN108335692A (zh) * | 2018-03-21 | 2018-07-27 | 上海木爷机器人技术有限公司 | 一种语音切换方法、服务器及系统 |
CN109359629A (zh) * | 2018-11-30 | 2019-02-19 | 深圳蚁石科技有限公司 | 人工智能飞行器及其智能控制方法 |
CN109767758A (zh) * | 2019-01-11 | 2019-05-17 | 中山大学 | 车载语音分析方法、系统、存储介质以及设备 |
CN110602197A (zh) * | 2019-09-06 | 2019-12-20 | 北京海益同展信息科技有限公司 | 物联网控制装置和方法、电子设备 |
US20200012724A1 (en) * | 2017-12-06 | 2020-01-09 | Sourcenext Corporation | Bidirectional speech translation system, bidirectional speech translation method and program |
-
2020
- 2020-03-09 CN CN202010157545.9A patent/CN113450785B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1514995A (zh) * | 2002-04-04 | 2004-07-21 | �ձ�������ʽ���� | 话音识别对话选择装置,话音识别对话系统,话音识别选择方法及程序 |
WO2006083690A2 (en) * | 2005-02-01 | 2006-08-10 | Embedded Technologies, Llc | Language engine coordination and switching |
CN101794577A (zh) * | 2009-01-30 | 2010-08-04 | 株式会社Ntt都科摩 | 声音识别服务器、电话机、声音识别系统以及声音识别方法 |
CN103117058A (zh) * | 2012-12-20 | 2013-05-22 | 四川长虹电器股份有限公司 | 基于智能电视平台的多语音引擎切换系统及方法 |
CN103730119A (zh) * | 2013-12-18 | 2014-04-16 | 惠州市车仆电子科技有限公司 | 车载人机语音交互系统 |
CN107657950A (zh) * | 2017-08-22 | 2018-02-02 | 广州小鹏汽车科技有限公司 | 基于云端和多命令词的汽车语音控制方法、系统及装置 |
US20200012724A1 (en) * | 2017-12-06 | 2020-01-09 | Sourcenext Corporation | Bidirectional speech translation system, bidirectional speech translation method and program |
CN108335692A (zh) * | 2018-03-21 | 2018-07-27 | 上海木爷机器人技术有限公司 | 一种语音切换方法、服务器及系统 |
CN109359629A (zh) * | 2018-11-30 | 2019-02-19 | 深圳蚁石科技有限公司 | 人工智能飞行器及其智能控制方法 |
CN109767758A (zh) * | 2019-01-11 | 2019-05-17 | 中山大学 | 车载语音分析方法、系统、存储介质以及设备 |
CN110602197A (zh) * | 2019-09-06 | 2019-12-20 | 北京海益同展信息科技有限公司 | 物联网控制装置和方法、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113450785B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110310633B (zh) | 多音区语音识别方法、终端设备和存储介质 | |
US11876856B2 (en) | Method for computational-power sharing and related device | |
US20140357248A1 (en) | Apparatus and System for Interacting with a Vehicle and a Device in a Vehicle | |
CN109637548A (zh) | 基于声纹识别的语音交互方法及装置 | |
CN106790938B (zh) | 一种基于人工智能的人机交互车载系统 | |
CN108984157A (zh) | 用于语音对话平台的技能配置和调用方法及系统 | |
CN105551494A (zh) | 一种基于手机互联的车载语音识别系统及识别方法 | |
CN107018228B (zh) | 一种语音控制系统、语音处理方法及终端设备 | |
CN103095325A (zh) | 具有远程服务接口的移动语音平台架构 | |
JP2018524620A (ja) | 音声の発生位置を特定するための方法及び端末デバイス | |
CN102774321A (zh) | 一种车载系统及其声音控制方法 | |
CN109841214A (zh) | 语音唤醒处理方法、装置和存储介质 | |
CN105516853A (zh) | 一种车载娱乐系统音效参数调试装置及方法 | |
CN111049982A (zh) | 车载蓝牙电话模式切换方法及系统、存储介质及车载终端 | |
CN109995861A (zh) | 车载系统应用与车载外围器件的中继通信方法及系统 | |
CN105025075A (zh) | 采用来自移动设备的内容更新交通工具音响单元 | |
CN113450785A (zh) | 车载语音处理的实现方法、系统、介质及云端服务器 | |
CN111489762B (zh) | 三维语谱图生成方法、装置、终端及存储介质 | |
US20180192448A1 (en) | Method, device, and system for audio bluetooth pairing and connecting | |
US20180217953A1 (en) | Method and apparatus for distributed computing using controller area network protocols | |
CN115037787B (zh) | 一种测试汽车网络通信的方法、系统和装置 | |
CN111400281B (zh) | 一种面向oss对象存储的gis数据质检与入库方法 | |
CN113656285A (zh) | 一种车载苹果手机互联自动化测试的方法和系统 | |
CN113270094A (zh) | 一种电器设备控制方法和装置 | |
US9620148B2 (en) | Systems, vehicles, and methods for limiting speech-based access to an audio metadata database |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |