CN105913844A - 车载语音获取方法及装置 - Google Patents

车载语音获取方法及装置 Download PDF

Info

Publication number
CN105913844A
CN105913844A CN201610258330.XA CN201610258330A CN105913844A CN 105913844 A CN105913844 A CN 105913844A CN 201610258330 A CN201610258330 A CN 201610258330A CN 105913844 A CN105913844 A CN 105913844A
Authority
CN
China
Prior art keywords
voice
seat
identification information
vehicle
pickup module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610258330.XA
Other languages
English (en)
Inventor
耿雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leshi Zhixin Electronic Technology Tianjin Co Ltd
LeTV Holding Beijing Co Ltd
Original Assignee
Leshi Zhixin Electronic Technology Tianjin Co Ltd
LeTV Holding Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leshi Zhixin Electronic Technology Tianjin Co Ltd, LeTV Holding Beijing Co Ltd filed Critical Leshi Zhixin Electronic Technology Tianjin Co Ltd
Priority to CN201610258330.XA priority Critical patent/CN105913844A/zh
Publication of CN105913844A publication Critical patent/CN105913844A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R11/00Arrangements for holding or mounting articles, not otherwise provided for
    • B60R11/02Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R11/00Arrangements for holding or mounting articles, not otherwise provided for
    • B60R11/02Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof
    • B60R11/0264Arrangements for holding or mounting articles, not otherwise provided for for radio sets, television sets, telephones, or the like; Arrangement of controls thereof for control means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Mechanical Engineering (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本发明实施例提供的一种车载语音获取方法及装置,涉及车载语音识别技术领域,用于解决现有的车载语音获取的准确率低的问题,本发明主要的技术方案为:接收用户输入的语音录制指令,所述语音录制指令中包括录制语音的座位标识信息;向车载语音识别系统发送所述录制语音的座位标识信息,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音;根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。本发明主要用于获取用户输入的车载语音。

Description

车载语音获取方法及装置
技术领域
本发明实施例涉及车载语音识别技术领域,尤其涉及一种车载语音获取方法及装置。
背景技术
如今,人们的生活水平不断提高,私人购车的比例不断增加,汽车消费者对整车性能的要求也越来越高。在这种情况下,车载语音识别技术被日渐应用在汽车系统上来实现一些智能操作,顺应现代汽车消费者对在车内工作、休息、娱乐及安全等方面的要求。人们已能在汽车中集成具有无限连接能力的DVD播放器、移动电话、全球定位系统(GPS)、MP3播放器、卫星电台和因特网浏览器,所有这些系统都可以通过语音进行控制。
目前,现有的车载语音识别系统通过一个拾音模组麦克接收多路的语音,然后通过车载语音识别系统对接收的多路语音指令进行分析,并从多路语音当中获取一路控制语音做语音识别处理,然而这种拾音方式需要配合较高的语音算法,一旦通过语音算法提取的一路语音是错误的,将会导致后续识别的控制命令也是错误的,因此现有的车载语音获取的准确率较低。
发明内容
本发明实施例提供了一种车载语音获取方法及装置,用以解决现有技术中车载语音获取的准确率低的问题。
针对现有技术存在的问题,本发明实施例提供了一种车载语音获取方法,包括:
接收用户输入的语音录制指令,所述语音录制指令中包括录制语音的座位标识信息;
向车载语音识别系统发送所述录制语音的座位标识信息,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音;
根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。
进一步地,所述根据与所述录制控制语音的座位标识信息对应的拾音模组获取用户输入的语音之后,所述方法还包括:
对所述语音进行降噪处理;
根据预置语音属性参数从经过降噪处理的语音中提取控制语音。
具体的,所述根据预置语音属性参数从经过降噪处理的语音中提取控制语音包括:
根据预置语音能量、预置语音频率、预置语音时间中的一个或多个属性参数,从经过降噪处理的语音中提取所述控制语音。
进一步地,所述方法还包括:
若在预置时间内不能够从经过降噪处理的语音中提取出所述控制语音,则关闭与所述录制语音的座位标识信息对应的拾音模组。
进一步地,所述根据预置语音属性参数从经过降噪处理的语音中提取控制语音之后,所述方法还包括:
将所述控制语音发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并执行所述控制语音对应的控制命令。
具体的,所述将所述控制语音发送给所述车载语音识别系统包括:
将所述控制语音和与所述控制语音对应的座位标识信息发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并根据与所述座位标识信息对应控制权限执行所述控制语音对应的控制命令。
本发明实施例提供了一种车载语音获取装置,包括:
接收单元,用于接收用户输入的语音录制指令,所述语音录制指令中包括录制语音的座位标识信息;
发送单元,用于向车载语音识别系统发送录制语音的座位标识信息,所以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音;
获取单元,用于根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。
进一步地,所述装置还包括:
降噪单元,用于对所述语音进行降噪处理;
提取单元,用于根据预置语音属性参数从经过降噪处理的语音中提取控制语音。
具体的,所述提取单元,具体用于根据预置语音能量、预置语音频率、预置语音时间中的一个或多个属性参数,从经过降噪处理的语音中提取所述控制语音。
进一步地,所述方法还包括:
关闭单元,用于若在预置时间内不能够从经过降噪处理的语音中提取出所述控制语音,则关闭与所述录制语音的座位标识信息对应的拾音模组。
所发送单元,还用于将所述控制语音发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并执行所述控制语音对应的控制命令。
所述发送单元,具体用于将所述控制语音和与所述控制语音对应的座位标识信息发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并根据与所述座位标识信息对应控制权限执行所述控制语音对应的控制命令。
本发明实施例提供的一种车载语音获取方法及装置,首先接收用户输入的语音录制指令,所述语音录制指令中包括录制语音的座位标识信息,然后向车载语音识别系统发送所述录制语音的座位标识信息,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,其中,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音,最后根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。与目前通过一个拾音模组录制的多路语音中获取一路控制语音做语音识别处理相比,本发明实施例在收到用户输入的语音录制指令之后,开启语音录制指令中与所述录制语音的座位标识信息对应的拾音模组,并通过与所述录制语音的座位标识信息对应的拾音模组获取用输入的语音,由于与所述座位标识信息对应的拾音模组仅可接收该座位用户输入的语音,因此通过本发明实施例获取的语音即为一路的语音,无需额外进行从路语音当中获取一路语音的处理操作,从而通过本发明实施例可以提高车载语音获取的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种车载语音获取方法流程图;
图2为本发明实施例提供的另一种车载语音获取方法流程图;
图3为本发明实施例提供的一种车载语音获取装置结构示意图;
图4为本发明实施例提供的另一种车载语音获取装置结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种车载语音获取方法,如图1所示,所述方法包括:
101、接收用户输入的语音录制指令。
其中,所述语音录制指令中包括录制语音的座位标识信息,所述语音录制指令用于启动录制语音的座位标识信息对应的拾音模组,所述语音录制指令具体可以为用户说出的包含有座位标识信息的关键词。在本发明实施例中,不同座位设置的关键词是不同的,关键词的设定可以根据用户的使用习惯进行设置,也可以由系统统一配置,如所述关键词具体可以为:“开启1号位置语音”、“开启2号位置语音”、“开启驾驶员位置语音控制指令”、“启动驾驶员位置语音”、“启动副驾驶位置语音”等,本发明实施例不做具体限定。
需要说明的是,本发明实施例是通过车内座位的顶部设置的拾音硬件模组接收用户输入的语音录制指令,拾音硬件模组当中内置有关键词识别引擎,当用户说出的关键词符合拾音硬件模组当中的关键词时,拾音硬件模组会将语音录制指令中包括的录制语音的座位标识信息发送给车载语音识别系统,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,其中所述拾音硬件模组具体可以为麦克风等收音设备。例如,用户在车内的驾驶位置上的用户说出“启动驾驶员位置语音”之后,驾驶位置上设置的拾音模组就会获取到用户输入的语音录制指令,即获取关键词“启动驾驶员位置语音”,若获取关键词符合驾驶位置拾音硬件模组内置的关键词,则驾驶位置上的拾音硬件模组会将语音录制指令中包括的录制语音的座位标识信息发送给车载语音识别系统,以使得所述车载语音识别系统开启驾驶位置上的拾音模组。
在本发明实施例中,为了防止用户误输入语音录制指令,即防止用户无意当中说出启动拾音模组的关键词,在不影响用户正常输入语音录制指令的情况下,可将启动拾音模组的关键词设置的稍微长一些,以此解决用户误输入语音录制指令的问题。
102、向车载语音识别系统发送所述录制语音的座位标识信息。
进一步地,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音。其中,所述拾音模组设置在各个座位的顶部,每个拾音模组都具有指向性,用于接收对应座位输入的语音。
在本发明实施例中,当接收到用户输入的语音录制指令之后,即触发开启拾音模组的关键词之后,接收语音录制指令的拾音模组会将录制语音的座位标识信息发送给车载语音识别系统,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,之后开启的拾音模组开始工作,接收在录制语音座位用户输入的语音。
103、根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。
对于本发明实施例,在收到用户输入的语音录制指令之后,开启语音录制指令中与所述录制语音的座位标识信息对应的拾音模组,并通过与所述录制语音的座位标识信息对应的拾音模组获取用输入的语音,由于与所述座位标识信息对应的拾音模组仅可接收该座位用户输入的语音,因此通过本发明实施例获取的语音即为一路的语音,无需额外进行从路语音当中获取一路语音的处理操作,从而通过本发明实施例可以提高车载语音获取的准确率。
本发明实施例提供的一种车载语音获取方法,首先接收用户输入的语音录制指令,所述语音录制指令中包括录制语音的座位标识信息,然后向车载语音识别系统发送所述录制语音的座位标识信息,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,其中,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音,最后根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。与目前通过一个拾音模组录制的多路语音当中获取一路控制语音做语音识别处理相比,本发明实施例在收到用户输入的语音录制指令之后,开启语音录制指令中与所述录制语音的座位标识信息对应的拾音模组,并通过与所述录制语音的座位标识信息对应的拾音模组获取用输入的语音,由于与所述座位标识信息对应的拾音模组仅可接收该座位用户输入的语音,因此通过本发明实施例获取的语音即为一路的语音,无需额外进行从路语音当中获取一路语音的处理操作,从而通过本发明实施例可以提高车载语音获取的准确率。
本发明实施例提供了另一种车载语音获取方法,如图2所示,所述方法包括:
201、接收用户输入的语音录制指令。
其中,所述语音录制指令中包括录制语音的座位标识信息,所述语音录制指令用于启动录制语音的座位标识信息对应的拾音模组,所述语音录制指令具体可以为用户说出的包含有座位标识信息的关键词。在本发明实施例中,为了防止用户误输入语音录制指令,即防止用户无意当中说出启动拾音模组的关键词,在不影响用户正常输入语音录制指令的情况下,可将启动拾音模组的关键词设置的稍微长一些,以此解决用户误输入语音录制指令的问题。
202、向车载语音识别系统发送所述录制语音的座位标识信息。
进一步地,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音。其中,所述拾音模组设置在各个座位的顶部,每个拾音模组都具有指向性,用于接收对应座位输入的语音。
203、根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。
对于本发明实施例,在收到用户输入的语音录制指令之后,开启语音录制指令中与所述录制语音的座位标识信息对应的拾音模组,并通过与所述录制语音的座位标识信息对应的拾音模组获取用输入的语音,由于与所述座位标识信息对应的拾音模组仅可接收该座位用户输入的语音,因此通过本发明实施例获取的语音即为一路的语音,无需额外进行从路语音当中获取一路语音的处理操作,从而通过本发明实施例可以提高车载语音获取的准确率。
204、对所述语音进行降噪处理。
在本发明实施例中,对所述语音进行降噪处理可以削弱或者剔除非人的声音,如开关车门声音、风声、发动机声音、雨刮器声音等,本发明实施例不做具体限定。
205、根据预置语音属性参数从经过降噪处理的语音中提取控制语音。
对于本发明实施例,所述根据预置语音属性参数从经过降噪处理的语音中提取控制语音包括:根据预置语音能量、预置语音频率、预置语音时间中的一个或多个属性参数,从经过降噪处理的语音中提取所述控制语音。其中,预置语音能量、预置语音频率、预置语音时间的值可以根据用户的需求进行设置,也可以由系统统一设置,本发明实施例不做具体限定。若预置语音能量为50分贝,则将经过降噪处理的语音中声音分贝超过50的语音过滤掉;若预置语音频率为每秒20个字,则将经过降噪处理的语音中语速每秒超过20个字的语音过滤掉;若预置语音时间为10秒,则将经过降噪处理的语音中字的间隔时间超过10秒的语音过滤掉。经过上述过滤过程序之后得到的语音就是控制语音。
在本发明实施例中,所述方法还包括:若在预置时间内不能够从经过降噪处理的语音中提取出所述控制语音,则关闭与所述录制语音的座位标识信息对应的拾音模组。其中,所述预置时间可以根据实际需求进行设置,具体可以为5分钟、10分钟、15分钟等,本发明实施例不做具体限定。对于本发明实施例,若在预置时间内不能够从经过降噪处理的语音中提取出所述控制语音,关闭与所述录制语音的座位标识信息对应的拾音模组,可以节省拾音模组的系统资源。
206、将所述控制语音发送给所述车载语音识别系统。
进一步地,以使得所述车载语音识别系统识别出所述控制语音,并执行所述控制语音对应的控制命令。
对于本发明实施例,所述将所述控制语音发送给所述车载语音识别系统包括:将所述控制语音和与所述控制语音对应的座位标识信息发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并根据与所述座位标识信息对应控制权限执行所述控制语音对应的控制命令。需要说明的是,座位标识信息对应的控制权限是根据实际需求进行设置的,且不同座位标识信息对应的控制权限是不同的,比如除驾驶员外其它乘客无法进行车辆控制,只能对车载娱乐系统进行语音操控。在本发明实施例中,设置不同座位对应的控制权限,可以使车载语音识别系统更好为乘客服务,避免因为驾驶员外其它乘客发出的语音进行车辆控制而发生的安全隐患。
本发明实施例提供的另一种车载语音获取方法,首先接收用户输入的语音录制指令,所述语音录制指令中包括录制语音的座位标识信息,然后向车载语音识别系统发送所述录制语音的座位标识信息,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,其中,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音,最后根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。与目前通过一个拾音模组录制的多路语音当中获取一路控制语音做语音识别处理相比,本发明实施例在收到用户输入的语音录制指令之后,开启语音录制指令中与所述录制语音的座位标识信息对应的拾音模组,并通过与所述录制语音的座位标识信息对应的拾音模组获取用输入的语音,由于与所述座位标识信息对应的拾音模组仅可接收该座位用户输入的语音,因此通过本发明实施例获取的语音即为一路的语音,无需额外进行从路语音当中获取一路语音的处理操作,从而通过本发明实施例可以提高车载语音获取的准确率。
进一步地,作为图1所述方法的具体实现,本发明实施例提供了一种车载语音获取装置,如图3所示,所述装置包括:接收单元31、发送单元32、获取单元33。
接收单元31,用于接收用户输入的语音录制指令。
其中,所述语音录制指令中包括录制语音的座位标识信息,所述语音录制指令用于启动录制语音的座位标识信息对应的拾音模组,所述语音录制指令具体可以为用户说出的包含有座位标识信息的关键词。在本发明实施例中,不同座位设置的关键词是不同的,关键词的设定可以根据用户的使用习惯进行设置,也可以由系统统一配置,如所述关键词具体可以为:“开启1号位置语音”、“开启2号位置语音”、“开启驾驶员位置语音控制指令”、“启动驾驶员位置语音”、“启动副驾驶位置语音”等,本发明实施例不做具体限定。
需要说明的是,本发明实施例是通过车内座位的顶部设置的拾音硬件模组接收用户输入的语音录制指令,拾音硬件模组当中内置有关键词识别引擎,当用户说出的关键词符合拾音硬件模组当中的关键词时,拾音硬件模组会将语音录制指令中包括的录制语音的座位标识信息发送给车载语音识别系统,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,其中所述拾音硬件模组具体可以为麦克风等收音设备。例如,用户在车内的驾驶位置上的用户说出“启动驾驶员位置语音”之后,驾驶位置上设置的拾音模组就会获取到用户输入的语音录制指令,即获取关键词“启动驾驶员位置语音”,若获取关键词符合驾驶位置拾音硬件模组内置的关键词,则驾驶位置上的拾音硬件模组会将语音录制指令中包括的录制语音的座位标识信息发送给车载语音识别系统,以使得所述车载语音识别系统开启驾驶位置上的拾音模组。
在本发明实施例中,为了防止用户误输入语音录制指令,即防止用户无意当中说出启动拾音模组的关键词,在不影响用户正常输入语音录制指令的情况下,可将启动拾音模组的关键词设置的稍微长一些,以此解决用户误输入语音录制指令的问题。
发送单元32,用于向车载语音识别系统发送录制语音的座位标识信息,所以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音。其中,所述拾音模组设置在各个座位的顶部,每个拾音模组都具有指向性,用于接收对应座位输入的语音。
在本发明实施例中,当接收到用户输入的语音录制指令之后,即触发开启拾音模组的关键词之后,接收语音录制指令的拾音模组会将录制语音的座位标识信息发送给车载语音识别系统,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,之后开启的拾音模组开始工作,接收在录制语音座位用户输入的语音。
获取单元33,用于根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。
对于本发明实施例,在收到用户输入的语音录制指令之后,开启语音录制指令中与所述录制语音的座位标识信息对应的拾音模组,并通过与所述录制语音的座位标识信息对应的拾音模组获取用输入的语音,由于与所述座位标识信息对应的拾音模组仅可接收该座位用户输入的语音,因此通过本发明实施例获取的语音即为一路的语音,无需额外进行从路语音当中获取一路语音的处理操作,从而通过本发明实施例可以提高车载语音获取的准确率。
需要说明的是,本发明实施例提供的一种车载语音获取装置所涉及各功能单元的其他相应描述,可以参考图1中的对应描述,在此不再赘述。本发明实施例中可以通过硬件处理器(hardware processor)来实现相关功能模块。
本发明实施例提供的一种车载语音获取装置,首先接收用户输入的语音录制指令,所述语音录制指令中包括录制语音的座位标识信息,然后向车载语音识别系统发送所述录制语音的座位标识信息,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,其中,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音,最后根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。与目前通过一个拾音模组录制的多路语音当中获取一路控制语音做语音识别处理相比,本发明实施例在收到用户输入的语音录制指令之后,开启语音录制指令中与所述录制语音的座位标识信息对应的拾音模组,并通过与所述录制语音的座位标识信息对应的拾音模组获取用输入的语音,由于与所述座位标识信息对应的拾音模组仅可接收该座位用户输入的语音,因此通过本发明实施例获取的语音即为一路的语音,无需额外进行从路语音当中获取一路语音的处理操作,从而通过本发明实施例可以提高车载语音获取的准确率。
进一步地,作为图2所述方法的具体实现,本发明实施例提供了另一种车载语音获取装置,如图4所示,所述装置包括:接收单元41、发送单元42、获取单元43。
接收单元41,用于接收用户输入的语音录制指令。
其中,所述语音录制指令中包括录制语音的座位标识信息,所述语音录制指令用于启动录制语音的座位标识信息对应的拾音模组,所述语音录制指令具体可以为用户说出的包含有座位标识信息的关键词。在本发明实施例中,为了防止用户误输入语音录制指令,即防止用户无意当中说出启动拾音模组的关键词,在不影响用户正常输入语音录制指令的情况下,可将启动拾音模组的关键词设置的稍微长一些,以此解决用户误输入语音录制指令的问题。
发送单元42,用于向车载语音识别系统发送录制语音的座位标识信息,所以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音。其中,所述拾音模组设置在各个座位的顶部,每个拾音模组都具有指向性,用于接收对应座位输入的语音。
获取单元43,用于根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。
对于本发明实施例,在收到用户输入的语音录制指令之后,开启语音录制指令中与所述录制语音的座位标识信息对应的拾音模组,并通过与所述录制语音的座位标识信息对应的拾音模组获取用输入的语音,由于与所述座位标识信息对应的拾音模组仅可接收该座位用户输入的语音,因此通过本发明实施例获取的语音即为一路的语音,无需额外进行从路语音当中获取一路语音的处理操作,从而通过本发明实施例可以提高车载语音获取的准确率。
进一步地,所述装置还包括:
降噪单元44,用于对所述语音进行降噪处理;
在本发明实施例中,对所述语音进行降噪处理可以削弱或者剔除非人的声音,如开关车门声音、风声、发动机声音、雨刮器声音等,本发明实施例不做具体限定。
提取单元45,用于根据预置语音属性参数从经过降噪处理的语音中提取控制语音。
所述提取单元45,具体用于根据预置语音能量、预置语音频率、预置语音时间中的一个或多个属性参数,从经过降噪处理的语音中提取所述控制语音。其中,预置语音能量、预置语音频率、预置语音时间的值可以根据用户的需求进行设置,也可以由系统统一设置,本发明实施例不做具体限定。若预置语音能量为50分贝,则将经过降噪处理的语音中声音分贝超过50的语音过滤掉;若预置语音频率为每秒20个字,则将经过降噪处理的语音中语速每秒超过20个字的语音过滤掉;若预置语音时间为10秒,则将经过降噪处理的语音中字的间隔时间超过10秒的语音过滤掉。经过上述过滤过程序之后得到的语音就是控制语音。
进一步地,所述方法还包括:
关闭单元46,用于若在预置时间内不能够从经过降噪处理的语音中提取出所述控制语音,则关闭与所述录制语音的座位标识信息对应的拾音模组。其中,所述预置时间可以根据实际需求进行设置,具体可以为5分钟、10分钟、15分钟等,本发明实施例不做具体限定。对于本发明实施例,若在预置时间内不能够从经过降噪处理的语音中提取出所述控制语音,关闭与所述录制语音的座位标识信息对应的拾音模组,可以节省拾音模组的系统资源。
所述发送单元42,还用于将所述控制语音发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并执行所述控制语音对应的控制命令。
所述发送单元42,具体用于将所述控制语音和与所述控制语音对应的座位标识信息发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并根据与所述座位标识信息对应控制权限执行所述控制语音对应的控制命令。需要说明的是,座位标识信息对应的控制权限是根据实际需求进行设置的,且不同座位标识信息对应的控制权限是不同的,比如除驾驶员外其它乘客无法进行车辆控制,只能对车载娱乐系统进行语音操控。在本发明实施例中,设置不同座位对应的控制权限,可以使车载语音识别系统更好为乘客服务,避免因为驾驶员外其它乘客发出的语音进行车辆控制而发生的安全隐患。
需要说明的是,本发明实施例提供的另一种车载语音获取装置所涉及各功能单元的其他相应描述,可以参考图2中的对应描述,在此不再赘述。本发明实施例中可以通过硬件处理器来实现相关功能模块。
本发明实施例提供的另一种车载语音获取装置,首先接收用户输入的语音录制指令,所述语音录制指令中包括录制语音的座位标识信息,然后向车载语音识别系统发送所述录制语音的座位标识信息,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,其中,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音,最后根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。与目前通过一个拾音模组录制的多路语音当中获取一路控制语音做语音识别处理相比,本发明实施例在收到用户输入的语音录制指令之后,开启语音录制指令中与所述录制语音的座位标识信息对应的拾音模组,并通过与所述录制语音的座位标识信息对应的拾音模组获取用输入的语音,由于与所述座位标识信息对应的拾音模组仅可接收该座位用户输入的语音,因此通过本发明实施例获取的语音即为一路的语音,无需额外进行从路语音当中获取一路语音的处理操作,从而通过本发明实施例可以提高车载语音获取的准确率。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种车载语音获取方法,其特征在于,包括:
接收用户输入的语音录制指令,所述语音录制指令中包括录制语音的座位标识信息;
向车载语音识别系统发送所述录制语音的座位标识信息,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音;
根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。
2.根据权利要求1所述的方法,其特征在于,所述根据与所述录制控制语音的座位标识信息对应的拾音模组获取用户输入的语音之后,所述方法还包括:
对所述语音进行降噪处理;
根据预置语音属性参数从经过降噪处理的语音中提取控制语音。
3.根据权利要求2所述的方法,其特征在于,所述根据预置语音属性参数从经过降噪处理的语音中提取控制语音包括:
根据预置语音能量、预置语音频率、预置语音时间中的一个或多个属性参数,从经过降噪处理的语音中提取所述控制语音。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若在预置时间内不能够从经过降噪处理的语音中提取出所述控制语音,则关闭与所述录制语音的座位标识信息对应的拾音模组。
5.根据权利要求2所述的方法,其特征在于,所述根据预置语音属性参数从经过降噪处理的语音中提取控制语音之后,所述方法还包括:
将所述控制语音发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并执行所述控制语音对应的控制命令。
6.根据权利要求5所述的方法,其特征在于,所述将所述控制语音发送给所述车载语音识别系统包括:
将所述控制语音和与所述控制语音对应的座位标识信息发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并根据与所述座位标识信息对应控制权限执行所述控制语音对应的控制命令。
7.一种车载语音获取装置,其特征在于,包括:
接收单元,用于接收用户输入的语音录制指令,所述语音录制指令中包括录制语音的座位标识信息;
发送单元,用于向车载语音识别系统发送录制语音的座位标识信息,以使得所述车载语音识别系统开启与所述录制语音的座位标识信息对应的拾音模组,并关闭其他座位标识信息对应的拾音模组,与所述座位标识信息对应的拾音模组用于接收该座位用户输入的语音;
获取单元,用于根据与所述录制语音的座位标识信息对应的拾音模组获取用户输入的语音。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
降噪单元,用于对所述语音进行降噪处理;
提取单元,用于根据预置语音属性参数从经过降噪处理的语音中提取控制语音。
9.根据权利要求8所述的装置,其特征在于,
所述提取单元,具体用于根据预置语音能量、预置语音频率、预置语音时间中的一个或多个属性参数,从经过降噪处理的语音中提取所述控制语音。
10.根据权利要求9所述的装置,其特征在于,所述方法还包括:
关闭单元,用于若在预置时间内不能够从经过降噪处理的语音中提取出所述控制语音,则关闭与所述录制语音的座位标识信息对应的拾音模组。
11.根据权利要求8所述的装置,其特征在于,
所述发送单元,还用于将所述控制语音发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并执行所述控制语音对应的控制命令。
12.根据权利要求11所述的装置,其特征在于,
所述发送单元,具体用于将所述控制语音和与所述控制语音对应的座位标识信息发送给所述车载语音识别系统,以使得所述车载语音识别系统识别出所述控制语音,并根据与所述座位标识信息对应控制权限执行所述控制语音对应的控制命令。
CN201610258330.XA 2016-04-22 2016-04-22 车载语音获取方法及装置 Pending CN105913844A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610258330.XA CN105913844A (zh) 2016-04-22 2016-04-22 车载语音获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610258330.XA CN105913844A (zh) 2016-04-22 2016-04-22 车载语音获取方法及装置

Publications (1)

Publication Number Publication Date
CN105913844A true CN105913844A (zh) 2016-08-31

Family

ID=56751731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610258330.XA Pending CN105913844A (zh) 2016-04-22 2016-04-22 车载语音获取方法及装置

Country Status (1)

Country Link
CN (1) CN105913844A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105957523A (zh) * 2016-04-22 2016-09-21 乐视控股(北京)有限公司 车载系统控制方法及装置
CN106686243A (zh) * 2016-12-31 2017-05-17 深圳市优必选科技有限公司 语音控制方法和装置
CN108376058A (zh) * 2018-02-09 2018-08-07 斑马网络技术有限公司 语音控制方法与装置,以及电子设备与存储介质
CN108621981A (zh) * 2018-03-30 2018-10-09 斑马网络技术有限公司 基于座椅的语音识别系统及其识别方法
CN110045904A (zh) * 2018-11-14 2019-07-23 蔚来汽车有限公司 人机交互系统、方法及包括该系统的车辆
CN110082726A (zh) * 2019-04-10 2019-08-02 北京梧桐车联科技有限责任公司 声源定位方法及装置、定位设备及存储介质
CN110097877A (zh) * 2018-01-29 2019-08-06 阿里巴巴集团控股有限公司 权限识别的方法和装置
CN110349580A (zh) * 2019-07-16 2019-10-18 Oppo广东移动通信有限公司 录音配置方法、装置、存储介质及电子设备
CN110808041A (zh) * 2019-09-24 2020-02-18 深圳市火乐科技发展有限公司 语音识别方法、智能投影仪及相关产品
CN111145604A (zh) * 2019-12-30 2020-05-12 西安Tcl软件开发有限公司 绘本识别方法、装置及计算机可读存储介质
CN111319566A (zh) * 2018-12-14 2020-06-23 现代自动车株式会社 车辆的语音识别功能链接控制系统和方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007104343A (ja) * 2005-10-04 2007-04-19 Kenwood Corp ハンズフリー装置、制御方法及びプログラム
JP2009025715A (ja) * 2007-07-23 2009-02-05 Xanavi Informatics Corp 車載装置および音声認識方法
CN102057691A (zh) * 2008-06-11 2011-05-11 罗伯特·博世有限公司 会议音频系统、用于分发音频信号的方法以及计算机程序
CN102800315A (zh) * 2012-07-13 2012-11-28 上海博泰悦臻电子设备制造有限公司 车载语音控制方法及系统
US20130179163A1 (en) * 2012-01-10 2013-07-11 Tobias Herbig In-car communication system for multiple acoustic zones
CN103344973A (zh) * 2013-06-24 2013-10-09 开平市中铝实业有限公司 一种汽车语音输入导航系统
WO2013172827A1 (en) * 2012-05-16 2013-11-21 Nuance Communications, Inc. Speech communication system for combined voice recognition, hands-free telephony and in-communication
CN103678456A (zh) * 2012-09-11 2014-03-26 通用汽车环球科技运作有限责任公司 语音标记驱动的车载功能
CN104332159A (zh) * 2014-10-30 2015-02-04 上海修源网络科技有限公司 一种车载语音操作系统人机互动方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007104343A (ja) * 2005-10-04 2007-04-19 Kenwood Corp ハンズフリー装置、制御方法及びプログラム
JP2009025715A (ja) * 2007-07-23 2009-02-05 Xanavi Informatics Corp 車載装置および音声認識方法
CN102057691A (zh) * 2008-06-11 2011-05-11 罗伯特·博世有限公司 会议音频系统、用于分发音频信号的方法以及计算机程序
US20130179163A1 (en) * 2012-01-10 2013-07-11 Tobias Herbig In-car communication system for multiple acoustic zones
WO2013172827A1 (en) * 2012-05-16 2013-11-21 Nuance Communications, Inc. Speech communication system for combined voice recognition, hands-free telephony and in-communication
CN102800315A (zh) * 2012-07-13 2012-11-28 上海博泰悦臻电子设备制造有限公司 车载语音控制方法及系统
CN103678456A (zh) * 2012-09-11 2014-03-26 通用汽车环球科技运作有限责任公司 语音标记驱动的车载功能
CN103344973A (zh) * 2013-06-24 2013-10-09 开平市中铝实业有限公司 一种汽车语音输入导航系统
CN104332159A (zh) * 2014-10-30 2015-02-04 上海修源网络科技有限公司 一种车载语音操作系统人机互动方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105957523A (zh) * 2016-04-22 2016-09-21 乐视控股(北京)有限公司 车载系统控制方法及装置
CN106686243A (zh) * 2016-12-31 2017-05-17 深圳市优必选科技有限公司 语音控制方法和装置
CN110097877A (zh) * 2018-01-29 2019-08-06 阿里巴巴集团控股有限公司 权限识别的方法和装置
CN108376058A (zh) * 2018-02-09 2018-08-07 斑马网络技术有限公司 语音控制方法与装置,以及电子设备与存储介质
CN108621981A (zh) * 2018-03-30 2018-10-09 斑马网络技术有限公司 基于座椅的语音识别系统及其识别方法
CN110045904A (zh) * 2018-11-14 2019-07-23 蔚来汽车有限公司 人机交互系统、方法及包括该系统的车辆
CN111319566A (zh) * 2018-12-14 2020-06-23 现代自动车株式会社 车辆的语音识别功能链接控制系统和方法
CN110082726A (zh) * 2019-04-10 2019-08-02 北京梧桐车联科技有限责任公司 声源定位方法及装置、定位设备及存储介质
CN110349580A (zh) * 2019-07-16 2019-10-18 Oppo广东移动通信有限公司 录音配置方法、装置、存储介质及电子设备
CN110808041A (zh) * 2019-09-24 2020-02-18 深圳市火乐科技发展有限公司 语音识别方法、智能投影仪及相关产品
CN110808041B (zh) * 2019-09-24 2021-01-12 深圳市火乐科技发展有限公司 语音识别方法、智能投影仪及相关产品
CN111145604A (zh) * 2019-12-30 2020-05-12 西安Tcl软件开发有限公司 绘本识别方法、装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN105913844A (zh) 车载语音获取方法及装置
US9286030B2 (en) Methods and apparatus for processing multiple audio streams at a vehicle onboard computer system
US9420431B2 (en) Vehicle telematics communication for providing hands-free wireless communication
US8738368B2 (en) Speech processing responsive to a determined active communication zone in a vehicle
CN105976815A (zh) 车载语音识别方法及装置
US9489966B1 (en) Discreet emergency response
DE102011108365B4 (de) Telematikeinheit und Verfahren zum Steuern einer Telematikeinheit für ein Fahrzeug
CN110070868A (zh) 车载系统的语音交互方法、装置、汽车和机器可读介质
CN105957523A (zh) 车载系统控制方法及装置
DE102019111529A1 (de) Automatisierte spracherkennung unter verwendung einer dynamisch einstellbaren hörzeitüberschreitung
CN105225660B (zh) 语音系统的适应方法和系统
US8762151B2 (en) Speech recognition for premature enunciation
DE102019105269A1 (de) Spracherkennungs-arbitrierungslogik
DE102012218938A1 (de) Identifikation von Diensten und Auslösung für eine sprachbasierte Schnittstelle zu einer Mobilvorrichtung
DE102012218934A1 (de) Sprachbasierte Nutzerschnittstelle für eine Mobilvorrichtung
US8521235B2 (en) Address book sharing system and method for non-verbally adding address book contents using the same
DE102014111816A1 (de) Fahrzeugtelematikeinheit und Verfahren zum Bedienen dieser
US9302677B2 (en) Methods for providing operator support utilizing a vehicle telematics service system
DE102010034433B4 (de) Verfahren zum Erkennen von Sprache
US9830925B2 (en) Selective noise suppression during automatic speech recognition
CN108447488A (zh) 增强语音识别任务完成
US9609408B2 (en) Directional control of a vehicle microphone
DE102016123857A1 (de) Authentifizierung eines Fahrzeugbenutzers
US20100245122A1 (en) Unit Configuration/Reactivation Through VDU Services
US20240127814A1 (en) Dynamic microphone system for autonomous vehicles

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160831