CN106384594A - 语音识别的车载终端及其方法 - Google Patents

语音识别的车载终端及其方法 Download PDF

Info

Publication number
CN106384594A
CN106384594A CN201610969587.6A CN201610969587A CN106384594A CN 106384594 A CN106384594 A CN 106384594A CN 201610969587 A CN201610969587 A CN 201610969587A CN 106384594 A CN106384594 A CN 106384594A
Authority
CN
China
Prior art keywords
identification result
voice
voice identification
speech recognition
car
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610969587.6A
Other languages
English (en)
Inventor
陈宏州
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Sea Wing E-Commerce Ltd By Share Ltd
Original Assignee
Hunan Sea Wing E-Commerce Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Sea Wing E-Commerce Ltd By Share Ltd filed Critical Hunan Sea Wing E-Commerce Ltd By Share Ltd
Priority to CN201610969587.6A priority Critical patent/CN106384594A/zh
Publication of CN106384594A publication Critical patent/CN106384594A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明涉及一种语音识别的车载终端及其方法。该车载终端包括:麦克风,用于收集语音信息;通信单元,用于将语音信息发送至云端服务器,并接收云端服务器对语音信息进行识别后获得的第二语音识别结果;存储器,用于存储应用程序、从麦克风接收的语音信息;处理器,用于运行存储于存储器中的应用程序,对语音信息进行解析和识别得到第一语音识别结果;对第一语音识别结果和第二语音识别结果进行仲裁,确定最终的语音识别结果,并根据最终的语音识别结果并生成相应控制指令。通过本发明可以保证识别率和识别速度,解决车载终端内存与语音识别的网络资源问题。

Description

语音识别的车载终端及其方法
【技术领域】
本发明实施方式涉及汽车电子技术领域,特别是涉及一种语音识别装置与方法。
【背景技术】
随着汽车电子领域的迅速发展,特别是车载信息及娱乐系统功能的丰富化和复杂化,传统的操作方式越来增加驾驶员分神,行车安全在不断的受到各种各样的威胁。语音识别技术的引入能够最大程度的解决行车过程中双手和双眼脱离驾驶行为,使得操作简单化和智能化。因此,最近几年语音识别技术在汽车电子领域得到迅速发展和普及。
如今具有语音识别技术的车载智能系统可以用于汽车导航设备,用户可以通过语音与所述汽车导航设备进行交互。所述汽车导航设备通过麦克风采集音频信息后进行语音识别,再通过自然语言处理了解用户的意图,并自动执行用户需要的动作,如打电话、发短信、地图导航等等。
普通的汽车导航设备只支持识别表达用户的意图的固定的句式和固定的动词。用户使用其他句式来表达相同意思的意图时,所述汽车导航设备的识别引擎往往无法识别用户的意图。并且所述识别引擎对于专属词的识别性能比较差,如人名、地名、品牌名称等等,给用户的生活造成较大的不便。
【发明内容】
本发明实施方式主要解决的技术问题是提供一种语音识别的车载终端及其方法,能够保证车载语音识别率和识别速度。
为解决上述技术问题,本发明实施方式采用的技术方案是:
一方面,提供一种语音识别的车载终端,其包括:麦克风112,用于收集语音信息;通信单元122,用于将所述语音信息发送至云端服务器12,并接收所述云端服务器12对所述语音信息进行识别后获得的第二语音识别结果;存储器133,用于存储应用程序145、从所述麦克风112接收的语音信息;处理器144,用于运行存储于所述存储器133中的应用程序145,对所述语音信息进行解析和识别得到第一语音识别结果;对所述第一语音识别结果和所述第二语音识别结果进行仲裁,确定最终的语音识别结果,并根据最终的语音识别结果并生成相应控制指令。
另一方面,提供一种语音识别方法,该方法包括:收集用户的语音信息,并对所述语音信息进行解析和识别得到第一语音识别结果;将所述语音信息发送至云端服务器,并接收所述云端服务器对所述语音信息进行识别后得到的第二语音识别结果;对所述第一语音识别结果和所述第二语音识别结果进行仲裁,确定最终的语音识别结果;根据所述最终的语音识别结果生成相应控制汽指令。
本发明具体实施方式的车载终端和云端服务器对汽车语音进行识别,并通过仲裁系统判断采用所述车载终端的语音识别结果或云端服务器的语音识别结果,既能保证识别率和识别速度,又解决车载终端内存与语音识别的网络资源问题。
【附图说明】
图1是本发明语音识别的车载终端的具体实施方式具体实施方式的应用场景示意图。
图2是本发明语音识别的车载终端的具体实施方式具体实施方式的方框示意图。
图3是本发明语音识别的云端服务器的具体实施方式具体实施方式的方框示意图。
图4是本发明语音识别方法具体实施方式的具体实施方式的实施流程图。
附图标记:
语音识别系统 1
车载终端 11
麦克风 112
存储器 133
处理器 144
通信单元 122
应用程序 145
OBD获取单元 155
云端服务器 12
服务器通信单元 121
服务器处理单元 124
流程步骤 S01-S06
【具体实施方式】
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施方式,对本发明进行进一步详细说明。应当理解,此处所描述的具体具体实施方式仅用以解释本发明,并不用于限定本发明。
此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
具体实施方式一
请参阅图1,是本发明一种语音识别的车载终端的具体实施方式的应用场景示意图具体实施方式。在本具体实施方式中,所述的语音识别系统1包括,但不仅限于,车载终端11和云端服务器12。所述车载终端11与所述云端服务器12通过无线网络通信连接。该无线网络可以为传统无线通讯的任何类型,例如无线电、无线保真(Wireless Fidelity,WIFI)、蜂窝、卫星、广播等。无线通讯技术可以包括,但不限于,全球移动通信系统(Global Systemfor Mobile Communications,GSM)、通用分组无线业务(General Packet Radio Service,GPRS)、码分多址(Code Division Multiple Access,CDMA),宽带码分多址(W-CDMA)、CDMA2000、IMT单载波(IMT Single Carrier)、增强型数据速率GSM演进(Enhanced DataRates for GSM Evolution,EDGE)、长期演进技术(Long-Term Evolution,LTE)、高级长期演进技术、时分长期演进技术(Time-Division LTE,TD-LTE)、高性能无线电局域网(HighPerformance Radio Local Area Network,HiperLAN)、高性能无线电广域网(HighPerformance Radio Wide Area Network,HiperWAN)、本地多点派发业务(LocalMultipoint Distribution Service,LMDS)、全微波存取全球互通(WorldwideInteroperability for Microwave Access,WiMAX)、紫蜂协议(ZigBee)、蓝牙、正交频分复用技术(Flash Orthogonal Frequency-Division Multiplexing,Flash-OFDM)、大容量空分多路存取(High Capacity Spatial Division Multiple Access,HC-SDMA)、通用移动电信系统(Universal Mobile Telecommunications System,UMTS)、通用移动电信系统时分双工(UMTS Time-Division Duplexing,UMTS-TDD)、演进式高速分组接入(Evolved HighSpeed Packet Access,HSPA+)、时分同步码分多址(Time Division Synchronous CodeDivision Multiple Access,TD-SCDMA)、演进数据最优化(Evolution-Data Optimized,EV-DO)、数字增强无绳通信(Digital Enhanced Cordless Telecommunications,DECT)及其他。
所述车载终端11,用于接收语音信息并将所述语音信息发送至云端服务器,以及对所述语音信息进行解析和识别得到第一语音识别结果;优化的,所述车载终端11,还用于接收OBD(On-board diagnostics,车载诊断系统)信息,并将所述OBD信息发送至云端服务器;
所述云端服务器12,用于进行云端语音识别,即,进行语义理解;具体的,用于接收所述语音信息,并对所述语音信息进行识别得到第二语音识别结果,将所述第二语音识别结果发送至所述车载终端11;优化的,所述云端服务器12,还用于接收OBD信息,并根据所述OBD信息对所述语音信息进行识别得到第二语音识别结果,将所述第二语音识别结果发送至所述车载终端11;
所述车载终端11,还用于在接收所述第二语音识别结果后,对所述第一语音识别结果和所述第二语音识别结果进行仲裁,将所述第一语音识别结果和所述第二语音识别结果中置信度高的语音信息生成最终的语音识别结果,并根据最终的语音识别结果并生成相应控制指令;优化的,所述车载终端11根据OBD信息对所述第一语音识别结果和所述第二语音识别结果进行仲裁,将所述第一语音识别结果和所述第二语音识别结果中置信度最高的语音信息生成最终的语音识别结果,并根据最终的语音识别结果并生成相应控制指令。
具体的,所述车载终端11可以是智能手机、桌上型计算机、笔记本、掌上电脑等便携式电子设备,也可以是为该语音识别系统1特别定制的智能型电子设备。所述车载终端11可以是通过其他设备间接采集OBD信息,例如,从车载OBD系统中获取OBD信息;也可以是包括具备OBD信息采集功能的硬件,直接采集ODB信息。
具体的,所述OBD信息包括实时信息和储存的信息。所述实时信息包括车速(转速)、水温等信息,所述储存的信息包括故障信息等。如,汽车的车速越快,就更容易产生更多的噪声,进而影响语音识别的精确度,所以根据OBD信息适时调整置信度的计算方法是很有意义的。
本发明的具体实施方式中,车载终端11将接收的语音信息通过无线网络发送至云端服务器12进行语音识别,识别结束后云端服务器12将结果传送回车载终端11。其优点是能够充分运用云端强大的计算、存储能力、以及大量的语法规则、海量的词库对所述语音信息进行识别,不断地提高语音识别准确率,且系统更新也较为方便。同时,车载终端11也进行语音识别,并将所述车载终端11的第一语音识别结果和所述云端服务器12的第二语音识别结果进行仲裁,由此,还能保证在网络断开或者网络信号较弱时,语音识别的识别率和识别速度。
优化的,所述移动终端11,采用语音信息与预设指令词比对的方式,实现语音识别与控制。其优点在于原理简单,容易实现,识别率高;该系统的缺点为用户需要记忆大量固定的命令词,无法进行模糊识别,人机交互不够友好,因此不具有很高的实用价值。
优化的,所述车载终端11获取语音信息并对所述语音信息进行预处理。所述预处理包括对所述语音信息进行降噪,以减少环境噪音的影响。所述车载终端11判断所述语音信息的声音能量是否大于预设值。当所述语音信息的声音能量大于预设值时,则对所述语音信息进行语音识别。并且,所述车载终端11还将所述语音信息发送至云端服务器12。在本实施方式中,所述车载终端11先对所述语音信息进行编码处理后,再将编码处理后的语音信息通过网络发送至所述云端服务器12,并根据预设的语法规则对所述语音信息进行识别并进行自然语音处理,以生成第一语音识别结果。
优化的,所述云端服务器12中的处理器接收编码处理过的语音信息后,对所述语音信息进行解码。再对所述语音信息进行云端语音识别,以生成第二语音识别结果,并将所述第二语音识别结果发送至所述车载终端11。在本实施方式中,所述云端服务器12使用比所述移动终端11本地多得多的语法规则,以及海量的词库对所述语音信息进行识别。
优化的,当所述第二语音识别结果的置信度低于预设阈值时,所述云端服务器12中的处理器还可以通过智能自然语言处理模块处理所述语音信息,分析语法规则,映射用户意图,以找出用户的表达方式,生成新的语法规则。所述云端服务器12中的处理器还可以动态更新用户的语法规则,并将更新后的语法规则同步到车载终端11的本地语音识别系统113。如此,可以使所述车载终端11和云端服务器12都响应用户新的表达方式。
优化的,所述云端服务器12中的处理器还可以根据用户使用习惯,结合其他信息(如用户所在地址),找出用户使用率较高的专属词,并将所述专属词同步到所述车载终端11,以提高所述车载终端11对专属词的识别率。
优化的,所述仲裁系统114在网络状况良好的情况下,获取所述第一语音识别结果和所述第二语音识别结果,再根据接收的OBD数据对所述第一语音识别结果和所述第二语音识别结果进行置信度判断,当所述第一语音识别结果的置信度或所述第二语音识别结果的置信度大于预设值时,再结合用户使用历史信息对置信度大于预设值的所述第一语音识别结果或所述第二语音识别结果进行过滤。过滤掉其中的非用户使用历史信息,最后将过滤后的识别结果中置信度最高的语音信息生成最终的语音识别结果。
具体实施方式二
请参阅图2,是本发明语音识别车载终端具体实施方式具体实施方式的方框示意图。在本具体实施方式中,所述车载终端11可以为笔记本电脑、平板电脑、智能手机、个人数字助手(Personnal Digital Assistant,PDA)等便携式电子装置。
在本具体实施方式中,所述车载终端11包括,但不限于:麦克风112、通信单元122、存储器133及处理器144。上述各个元件之间电气连接。所述处理器144中运行应用程序145,所述应用程序145为运行于所述车载终端11的客户端软件,可以执行语音识别及仲裁功能。
在本实施方式中,所述应用程序145包括本地语音识别系统和仲裁系统。具体的,所述本地语音识别系统包括本地指令和本地自然语言。所述本地语音识别系统采用语音信息与预设指令词比对的方式,实现语音识别与控制。该系统的优点在于原理简单,容易实现,识别率高;该系统的缺点为用户需要记忆大量固定的命令词,无法进行模糊识别,人机交互不够友好,因此不具有很高的实用价值。具体的,所述仲裁系统用于根据本地语音识别系统的第一语音识别结果和云端服务器12对语音的第二语音识别结果进行仲裁,生成最终的语音识别结果。
所述麦克风112,用于接收语音信息。
所述通信单元122,用于通过有线或无线网络传输方式为车载终端11提供网络通讯功能。在本实施方式中,所述车载终端11通过所述通信单元122与云端服务器12进行通信连接。具体的,所述通信单元122,用于发送所述语音信息至云端服务器12;并接收所述云端服务器12对所述语音信息进行识别后产生的第二语音识别结果。所述OBD信息包括实时信息和储存的信息。所述实时信息包括转速、水温等信息,所述储存的信息包括故障信息等。
所述存储器133,用于存储应用程序145、从麦克风112接收的语音信息。优化的,还用于存储OBD(On-board diagnostics,随车诊断系统)信息。具体的,所述存储器133可以是车载终端11本身的内存,是所述车载终端11的内部存储单元,例如该车载终端11的硬盘或内存,也可以是所述车载终端11的外部存储设备,例如该车载终端11上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。进一步地,所述存储器133还可以既包括所述车载终端1的内部存储单元也包括外部存储设备。
所述处理器144,用于运行存储于所述存储器133中的应用程序145,对所述语音信息进行解析和识别得到第一语音识别结果;对所述第一语音识别结果和所述第二语音识别结果进行仲裁,将所述第一语音识别结果和所述通信单元122接收的第二语音识别结果中置信度最高的语音信息生成最终的语音识别结果,并根据最终的语音识别结果并生成相应控制指令。其中,所述处理器144可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片。优化的,所述处理器144,用于根据OBD信息和置信度算法确定所述第一语音识别结果和所述第二语音识别结果,将所述第一语音识别结果和所述第二语音识别结果中置信度最高的语音信息生成最终的语音识别结果,并根据最终的语音识别结果并生成相应控制指令。
优化的,所述处理器144,采用语音信息与预设指令词比对的方式,实现语音识别与控制。其优点在于原理简单,容易实现,识别率高;该系统的缺点为用户需要记忆大量固定的命令词,无法进行模糊识别,人机交互不够友好,因此不具有很高的实用价值。
优化的,所述处理器144,还用于对所述麦克风112获取的语音信息进行预处理,将预处理后的语音信息通过所述通信单元122发送给云端服务器12。所述预处理包括对所述语音信息进行降噪,以减少环境噪音的影响。
优化的,所述处理器144,还用于判断所述语音信息的声音能量是否大于预设值。当所述语音信息的声音能量大于预设值时,则对所述语音信息进行语音识别。
优化的,所述处理器144,还用于对所述麦克风112获取的语音信息进行编码处理后,再通过所述通信单元122发送至所述云端服务器12。
优化的,所述处理器144,在网络状况良好的情况下,所述应用程序145通过所述仲裁系统结合OBD信息以及置信度算法,确定所述第一语音识别结果和所述第二语音识别结果的置信度;当所述第一语音识别结果的置信度或所述第二语音识别结果的置信度大于预设值时,再结合存储器(133)中存储的用户使用历史信息,过滤所述第一语音识别结果或所述第二语音识别结果中的非用户使用历史信息,最后将过滤后的识别结果中置信度最高的语音信息生成最终的语音识别结果。
优化的,该车载终端11还包括OBD信息获取单元155,用于获取OBD信息。当该车载终端11包括OBD信息获取单元155时,该处理器144则不必通过通信单元122获取从其他电子设备获取OBD信息,而是可以直接通过车载终端11自身携带的OBD信息获取单元155获取OBD信息。
具体实施方式三
请参阅图3,是本发明语音识别云端服务器具体实施方式具体实施方式的方框示意图。在本具体实施方式中,云端服务器12包括:服务器通信单元121,服务器处理单元124。
所述服务器通信单元121,用于接收车载终端11发送的语音信息,并将所述语音信息发送给处理器单元122;优化的,还接收车载终端12发送的OBD信息,并将所述语音信息以及OBD信息一并发送给处理器单元122。
服务器处理单元124,用于对所述语音信息进行云端语音识别,以生成第二语音识别结果,并通过所述服务器通信单元121将所述第二语音识别结果发送至所述车载终端11。优化的,服务器处理单元124,用于根据所述OBD信息对所述语音信息进行云端语音识别,以生成第二语音识别结果,并通过所述服务器通信单元121将所述第二语音识别结果发送至所述车载终端11。
优化的,服务器处理单元124,用于当所述第二语音识别结果的置信度低于预设阈值时,通过智能自然语言处理模块处理所述语音信息,分析语法规则,映射用户意图,以找出用户的表达方式,生成新的语法规则。
优化的,服务器处理单元124,还可以用于动态更新用户的语法规则,并将更新后的语法规则同步到车载终端11的应用程序145中。如此,可以使所述车载终端11和云端服务器12都响应用户新的表达方式。使得该语音识别系统具备一定的学习能力,学习用户语言习惯和更新语音规则,由此提升语音识别的精确度。
优化的,服务器处理单元124,还可以用于根据用户使用习惯,结合其他信息(如用户所在地址),找出用户使用率较高的专属词,并将所述专属词同步到所述车载终端11的本地语音识别系统,以提高所述本地语音识别系统对专属词的识别率。
服务器处理单元124,还用于对所述语音信息进行解码。
本具体实施方式中,所述云端服务器12使用比本地语音识别系统多得多的语法规则,以及海量的词库对所述语音信息进行识别。由此可极大地提升语音识别的精确度
具体实施方式四
请参阅图4,是本发明语音识别方法具体实施方式具体实施方式的步骤流程图。根据不同的需求,图3所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。
步骤S01,收集用户的语音信息。在本实施方式中,所述车载终端11通过麦克风112接收语音信息后,还可以对所述语音信息进行预处理。所述预处理包括对所述语音信息进行降噪,以减少环境噪音的影响。所述车载终端11判断所述语音信息的声音能量是否大于预设值。当所述语音信息的声音能量大于预设值时,通过所述本地语音识别系统对所述语音信息进行语音识别。
步骤S02,通过本地语音识别系统对所述语音信息进行解析和识别,得到第一语音识别结果。具体而言,所述应用程序145通过本地语音识别系统根据预设的语法规则对所述语音信息进行识别并进行自然语音处理,以生成第一语音识别结果,并将所述第一语音识别结果传输至所述仲裁系统。
步骤S03,将所述语音信息发送至云端服务器12。在本实施方式中,所述车载终端11先对所述语音信息进行编码处理后,再通过通信单元122将编码处理后的语音信息通过网络发送至所述云端服务器12。所述云端服务器12接收编码处理过的语音信息后,对所述语音信息进行解码。再对所述语音信息进行云端语音识别,以生成第二语音识别结果,并将所述第二语音识别结果发送至所述车载终端11的仲裁系统。在本实施方式中,所述云端服务器12使用比本地语音识别系统多得多的语法规则,以及海量的词库对所述语音信息进行识别。
步骤S04,接收所述云端服务器对所述语音信息进行识别后得到的第二语音识别结果。在本实施方式中,所述车载终端11可以与所述云端服务器12通过无线网络通信连接。所述通信单元122接收所述云端服务器12对所述语音信息处理后生成的第二语音识别结果。
当所述第二语音识别结果的置信度低于预设阈值时,所述云端服务器12还可以通过智能自然语言处理模块处理所述语音信息,分析语法规则,映射用户意图,以找出用户的表达方式,生成新的语法规则。所述云端服务器12还可以动态更新用户的语法规则,并将更新后的语法规则同步到车载终端11的本地语音识别系统。如此,可以使所述车载终端11和云端服务器12都响应用户新的表达方式。
在本实施方式中,所述云端服务器12还可以根据用户使用习惯,结合其他信息(如用户所在地址),找出用户使用率较高的专属词,并将所述专属词同步到所述车载终端11的本地语音识别系统,以提高所述本地语音识别系统对专属词的识别率。
步骤S05,对所述第一语音识别结果和所述第二语音识别结果进行仲裁,确定最终的语音识别结果。具体的,是将所述第一语音识别结果和所述第二语音识别结果中置信度最高的语音信息生成最终的语音识别结果。
更为具体的是,在网络状况良好的情况下,所述应用程序145通过所述仲裁系统获取所述第一语音识别结果和所述第二语音识别结果,再根据所述车载终端11获取的OBD数据以及置信度算法确定所述第一语音识别结果和所述第二语音识别结果的置信度,当所述第一语音识别结果的置信度或所述第二语音识别结果的-置信度大于预设值时,再根据存储器133中预先存储的用户使用历史信息,过滤所述第一语音识别结果的置信度或所述第二语音识别结果中的非用户使用历史信息,最后将过滤后的识别结果中置信度最高的语音信息生成最终的语音识别结果。
步骤S06,根据所述语音识别结果生成相应控制指令。在本实施方式中,所述车载终端与所述车载终端11通信连接。
通过以上步骤S01至步骤S06,可以结合车载终端11和云端服务器12对语音进行识别,并通过仲裁系统判断采用所述车载终端11的语音识别结果或云端服务器12的语音识别结果,既能保证识别率和识别速度,又解决车载终端内存与语音识别的网络资源问题。
以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音识别的车载终端,其特征在于,该车载终端包括:
麦克风(112),用于收集语音信息;
通信单元(122),用于将所述语音信息发送至云端服务器(12),并接收所述云端服务器(12)对所述语音信息进行识别后获得的第二语音识别结果;
存储器(133),用于存储应用程序(145)、从所述麦克风(112)接收的语音信息;
处理器(144),用于运行存储于所述存储器(133)中的应用程序(145),对所述语音信息进行解析和识别得到第一语音识别结果;对所述第一语音识别结果和所述第二语音识别结果进行仲裁,确定最终的语音识别结果,并根据最终的语音识别结果并生成相应控制指令。
2.如权利要求1所述的语音识别车载终端,其特征在于,所述处理器(114)还用于通过所述通信单元(122)从汽车的OBD系统获取OBD信息,并将所述OBD信息发送至所述云端服务器(12)。
3.如权利要求1所述的语音识别的车载终端,其特征在于,所述处理器(114),具体用于将所述第一语音识别结果和所述通信单元(122)接收的第二语音识别结果中置信度最高的语音信息生成最终的语音识别结果。
4.如权利要求3所述的语音识别车载终端,其特征在于,所述处理器(144),具体用于根据OBD信息确定所述第一语音识别结果和所述第二语音识别结果中置信度最高的语音信息。
5.如权利要求2至4中任意一项权利要求所述的语音识别的车载终端,其特征在于,所述存储器(133),还用于存储用户的历史信息;
所述处理器(144),具体用于根据OBD信息和置信度算法确定所述第一语音识别结果和所述第二语音识别结果的置信度,当所述第一语音识别结果的置信度或所述第二语音识别结果的置信度大于预设值时,过滤所述第一语音识别结果或所述第二语音识别结果中的非用户使用历史信息,并将过滤后的识别结果中置信度最高的语音信息生成最终的语音识别结果。
6.如权利要求2所述的语音识别的车载终端,其特征在于,所述处理器(144),根据所述OBD信息以及语音识别算法对所述语音信息进行解析得到所述第一语音识别结果。
7.如权利要求1所述的语音识别的车载终端,其特征在于,所述通信单元(122)还用于从所述服务器(12)接收更新的语法规则;所述存储器(133)还用于存储所述更新的语法规则。
8.一种语音识别方法,应用于车载终端中,其特征在于,该方法包括:
收集用户的语音信息,并对所述语音信息进行解析和识别得到第一语音识别结果;
将所述语音信息发送至云端服务器,并接收所述云端服务器对所述语音信息进行识别后得到的第二语音识别结果;
对所述第一语音识别结果和所述第二语音识别结果进行仲裁,确定最终的语音识别结果;
根据所述最终的语音识别结果生成相应控制汽指令。
9.如权利要求10所述的语音识别方法,其特征在于,对“对所述第一语音识别结果和所述第二语音识别结果进行仲裁”的步骤,具体为:
将所述第一语音识别结果和所述第二语音识别结果中置信度最高的语音信息生成最终的语音识别结果。
10.如权利要求9所述的语音识别方法,其特征在于,所述“将所述第一语音识别结果和所述第二语音识别结果中置信度最高的语音信息生成最终的语音识别结果”,具体包括:
获取OBD信息;
根据所述OBD信息和置信度算法确定对所述第一语音识别结果和所述第二语音识别结果的置信度;
当所述第一语音识别结果的置信度或所述第二语音识别结果的置信度大于预设值时,过滤所述第一语音识别结果或所述第二语音识别结果中的非用户使用历史信息;
将过滤后的识别结果中置信度最高的语音信息生成最终的语音识别结果。
CN201610969587.6A 2016-11-04 2016-11-04 语音识别的车载终端及其方法 Pending CN106384594A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610969587.6A CN106384594A (zh) 2016-11-04 2016-11-04 语音识别的车载终端及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610969587.6A CN106384594A (zh) 2016-11-04 2016-11-04 语音识别的车载终端及其方法

Publications (1)

Publication Number Publication Date
CN106384594A true CN106384594A (zh) 2017-02-08

Family

ID=57957367

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610969587.6A Pending CN106384594A (zh) 2016-11-04 2016-11-04 语音识别的车载终端及其方法

Country Status (1)

Country Link
CN (1) CN106384594A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305620A (zh) * 2018-05-09 2018-07-20 上海蓥石汽车技术有限公司 一种依赖大数据的本地云端混合的主动式交互语音识别系统
CN110737420A (zh) * 2018-07-19 2020-01-31 上海博泰悦臻电子设备制造有限公司 语音冲突管理方法、系统、计算机可读存储介质及设备
CN112298080A (zh) * 2019-07-26 2021-02-02 上海博泰悦臻电子设备制造有限公司 车辆控制方法及系统
CN112562673A (zh) * 2020-12-29 2021-03-26 苏州思必驰信息科技有限公司 语音识别方法及装置
JP2022037100A (ja) * 2020-12-22 2022-03-08 北京百度網訊科技有限公司 車載機器の音声処理方法、装置、機器及び記憶媒体
CN115410579A (zh) * 2022-10-28 2022-11-29 广州小鹏汽车科技有限公司 语音交互方法、语音交互装置、车辆和可读存储介质

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101194305A (zh) * 2005-08-19 2008-06-04 思科技术公司 用于分发语音识别语法的系统和方法
CN101454775A (zh) * 2006-05-23 2009-06-10 摩托罗拉公司 通过基于协同客户端和服务器的语言识别的语法调整
CN101847405A (zh) * 2009-03-23 2010-09-29 索尼公司 语音识别装置和方法、语言模型产生装置和方法及程序
CN103065631A (zh) * 2013-01-24 2013-04-24 华为终端有限公司 一种语音识别的方法、装置
CN103440867A (zh) * 2013-08-02 2013-12-11 安徽科大讯飞信息科技股份有限公司 语音识别方法及系统
CN103578468A (zh) * 2012-08-01 2014-02-12 联想(北京)有限公司 一种语音识别中置信度阈值的调整方法及电子设备
CN103945044A (zh) * 2013-01-22 2014-07-23 中兴通讯股份有限公司 一种信息处理方法和移动终端
CN103971680A (zh) * 2013-01-24 2014-08-06 华为终端有限公司 一种语音识别的方法、装置
CN104618569A (zh) * 2013-11-01 2015-05-13 现代自动车株式会社 使用智能手机控制车内声音的系统及其方法
CN105261366A (zh) * 2015-08-31 2016-01-20 努比亚技术有限公司 语音识别方法、语音引擎及终端
CN105551494A (zh) * 2015-12-11 2016-05-04 奇瑞汽车股份有限公司 一种基于手机互联的车载语音识别系统及识别方法
US9401140B1 (en) * 2012-08-22 2016-07-26 Amazon Technologies, Inc. Unsupervised acoustic model training

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101194305A (zh) * 2005-08-19 2008-06-04 思科技术公司 用于分发语音识别语法的系统和方法
CN101454775A (zh) * 2006-05-23 2009-06-10 摩托罗拉公司 通过基于协同客户端和服务器的语言识别的语法调整
CN101847405A (zh) * 2009-03-23 2010-09-29 索尼公司 语音识别装置和方法、语言模型产生装置和方法及程序
CN103578468A (zh) * 2012-08-01 2014-02-12 联想(北京)有限公司 一种语音识别中置信度阈值的调整方法及电子设备
US9401140B1 (en) * 2012-08-22 2016-07-26 Amazon Technologies, Inc. Unsupervised acoustic model training
CN103945044A (zh) * 2013-01-22 2014-07-23 中兴通讯股份有限公司 一种信息处理方法和移动终端
CN103065631A (zh) * 2013-01-24 2013-04-24 华为终端有限公司 一种语音识别的方法、装置
CN103971680A (zh) * 2013-01-24 2014-08-06 华为终端有限公司 一种语音识别的方法、装置
CN103440867A (zh) * 2013-08-02 2013-12-11 安徽科大讯飞信息科技股份有限公司 语音识别方法及系统
CN104618569A (zh) * 2013-11-01 2015-05-13 现代自动车株式会社 使用智能手机控制车内声音的系统及其方法
CN105261366A (zh) * 2015-08-31 2016-01-20 努比亚技术有限公司 语音识别方法、语音引擎及终端
CN105551494A (zh) * 2015-12-11 2016-05-04 奇瑞汽车股份有限公司 一种基于手机互联的车载语音识别系统及识别方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305620A (zh) * 2018-05-09 2018-07-20 上海蓥石汽车技术有限公司 一种依赖大数据的本地云端混合的主动式交互语音识别系统
CN110737420A (zh) * 2018-07-19 2020-01-31 上海博泰悦臻电子设备制造有限公司 语音冲突管理方法、系统、计算机可读存储介质及设备
CN110737420B (zh) * 2018-07-19 2023-04-28 博泰车联网科技(上海)股份有限公司 语音冲突管理方法、系统、计算机可读存储介质及设备
CN112298080A (zh) * 2019-07-26 2021-02-02 上海博泰悦臻电子设备制造有限公司 车辆控制方法及系统
JP2022037100A (ja) * 2020-12-22 2022-03-08 北京百度網訊科技有限公司 車載機器の音声処理方法、装置、機器及び記憶媒体
JP7213943B2 (ja) 2020-12-22 2023-01-27 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 車載機器の音声処理方法、装置、機器及び記憶媒体
CN112562673A (zh) * 2020-12-29 2021-03-26 苏州思必驰信息科技有限公司 语音识别方法及装置
CN115410579A (zh) * 2022-10-28 2022-11-29 广州小鹏汽车科技有限公司 语音交互方法、语音交互装置、车辆和可读存储介质

Similar Documents

Publication Publication Date Title
CN106384594A (zh) 语音识别的车载终端及其方法
CN111835627B (zh) 车载网关的通信方法、车载网关及智能车辆
CN110635933B (zh) 用于管理sdn的网络的装置、控制方法及记录介质
CN105551494A (zh) 一种基于手机互联的车载语音识别系统及识别方法
US10298492B2 (en) System and method for interworking between vehicle controller and external resource
US11257497B2 (en) Voice wake-up processing method, apparatus and storage medium
US20230040934A1 (en) Method for sidelink communication, device and storage medium
CN106535333A (zh) 一种物理下行控制信道传输方法及装置
CN101606147A (zh) 在通信系统中从应用服务提供商向客户端提供服务
EP3920615B1 (en) Method to dynamically change the minimum candidate resources ratio in mode 2 resource selection procedure of nr v2x
AU2019382495B9 (en) Method and device for transmitting V2X message and system
JP2022044590A (ja) センサーベースの検証を用いた車両機能制御
CN113543015A (zh) 一种通信方法、装置及系统
CN112788622B (zh) 一种感知窗口的配置方法、装置及设备
CN114145028A (zh) 用于车对外界信息交互通信的通信装置、方法和应用
CN111726284A (zh) 用于车载智能音箱的微信发送方法和装置
CN110545556B (zh) 一种mac ce、信息发送方法、接收方法及通信设备
CN106547228A (zh) 车库门控制装置及其方法
WO2019239354A1 (en) Prediction-based vehicle reservation systems
CN104917679A (zh) 一种面向手持移动设备的延迟容忍网络个性化路由方案选择系统
US20150237561A1 (en) Communication system for vehicle-to-environment communication
CN110475325A (zh) 功率分配方法、装置、终端及存储介质
CN116567719B (zh) 数据传输方法、车载系统、设备和存储介质
WO2019136011A1 (en) In-vehicle telematics blade array and methods for using the same
EP4322568A1 (en) Resource selection method and terminal device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 410000 Room 701, Building 7, First Phase of Changsha Zhongdian Software Park Co., Ltd., No. 39 Jianshan Road, Changsha High-tech Development Zone, Changsha, Hunan Province

Applicant after: ANKER INNOVATIONS TECHNOLOGY Co.,Ltd.

Address before: 410000 Room A805, Headquarters Building of Changsha Zhongdian Software Park Co., Ltd., No. 39 Jianshan Road, Changsha High-tech Development Zone, Hunan Province

Applicant before: HUNAN OCEANWING E-COMMERCE Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20170208

RJ01 Rejection of invention patent application after publication