CN106448662A - 利用汽车喇叭声纹中断车机消息播报的方法及系统 - Google Patents

利用汽车喇叭声纹中断车机消息播报的方法及系统 Download PDF

Info

Publication number
CN106448662A
CN106448662A CN201610991111.2A CN201610991111A CN106448662A CN 106448662 A CN106448662 A CN 106448662A CN 201610991111 A CN201610991111 A CN 201610991111A CN 106448662 A CN106448662 A CN 106448662A
Authority
CN
China
Prior art keywords
vocal print
message
loudspeaker
sound
groove model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610991111.2A
Other languages
English (en)
Other versions
CN106448662B (zh
Inventor
邹兴旺
陈吉胜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Shanghai Intelligent Technology Co Ltd
Original Assignee
SHANGHAI YUZHIYI INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI YUZHIYI INFORMATION TECHNOLOGY Co Ltd filed Critical SHANGHAI YUZHIYI INFORMATION TECHNOLOGY Co Ltd
Priority to CN201610991111.2A priority Critical patent/CN106448662B/zh
Publication of CN106448662A publication Critical patent/CN106448662A/zh
Application granted granted Critical
Publication of CN106448662B publication Critical patent/CN106448662B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60QARRANGEMENT OF SIGNALLING OR LIGHTING DEVICES, THE MOUNTING OR SUPPORTING THEREOF OR CIRCUITS THEREFOR, FOR VEHICLES IN GENERAL
    • B60Q9/00Arrangement or adaptation of signal devices not provided for in one of main groups B60Q1/00 - B60Q7/00, e.g. haptic signalling
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/023Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for transmission of signals between vehicle parts or subsystems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mechanical Engineering (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

本发明涉及一种利用汽车喇叭声纹中断车机消息播报的方法及系统,该方法包括:于车机设备上建立喇叭声纹模型;在所述车机设备收到需进行消息播报的消息时,激活所述喇叭声纹模型;通过所述车机设备上的麦克风连续不断地进行监听录音以获取录音信号;对所述录音信号进行降噪处理并提取对应的声纹特征;以及将所提取的声纹特征输入到所述喇叭声纹模型中进行匹配判断,若所提取的声纹特征与喇叭声纹特征相匹配,则形成中断播报指令发送给所述车机设备以中断消息播报进而使得所述消息播报结束。本发明利用了喇叭声音来中断消息播报,对车主的隐私起到了很好的保护。按喇叭的操作经常发生且极易操作,能够快速有效的中断消息播报。

Description

利用汽车喇叭声纹中断车机消息播报的方法及系统
技术领域
本发明涉及建筑施工领域,特指一种利用汽车喇叭声纹中断车机消息播报的方法及系统。
背景技术
语音交互方式在车载设备的广泛运用,涉及到的技术包括:语音识别、语音合成、声纹识别等。用户通过语音交互系统,说话就能操控汽车上车机设备,实现打电话、导航、听音乐等功能。同时,当设备收到消息时,如来电、来短信、微信消息、推送通知等,也会通过语音合成技术,提示用户接收到新信息,是否需要播报内容或执行操作。
在车机设备上的消息播报系统进行消息播报时,当所播报的消息为私人信息,而车内同乘有多人时,为避免私人信息被直接播报出来,车主需通过操作中断消息播报系统的播报,中断操作一般通过车机设备的控制面板来实施,可能会存在操作不及时而导致播报未及时终止的情形,即使及时终止了播报也会给车主带来尴尬的情境。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种利用汽车喇叭声纹中断车机消息播报的方法及系统,解决现有技术中消息播报系统在消息播报时通过操作控制面板终止播报而存在的操作不及时和为车主带来尴尬情境的问题。
实现上述目的的技术方案是:
本发明提供了一种利用汽车喇叭声纹中断车机消息播报的方法,包括如下步骤:
于车机设备上建立喇叭声纹模型;
在所述车机设备收到需进行消息播报的消息时,激活所述喇叭声纹模型;
通过所述车机设备上的麦克风连续不断地进行监听录音以获取录音信号;
对所述录音信号进行降噪处理并提取对应的声纹特征;以及
将所提取的声纹特征输入到所述喇叭声纹模型中进行匹配判断,
若所提取的声纹特征与喇叭声纹特征相匹配,则形成中断播报指令发送给所述车机设备以中断消息播报进而使得所述消息播报结束;
若所提取的声纹特征与所述喇叭声纹特征不匹配,则继续进行匹配判断直至所述消息播报结束。
本发明利用了喇叭声音来中断消息播报,在车机声波进行消息播报的过程中,始终对车内的环境进行监听,当监听到喇叭声音时,立即中断消息播报并取消播报流程,对车主的隐私起到了很好的保护。按喇叭的操作经常发生且极易操作,能够快速有效的中断消息播报,另外,利用喇叭中断播报,按喇叭能够转移其他同乘人员的注意力,且按喇叭的动作不会产生违和感,能够较好的化解尴尬情境,提升了语音产品的人文关怀。
本发明利用汽车喇叭声纹中断车机消息播报的方法的进一步改进在于,于车机设备上建立喇叭声纹模型,包括:
采集多种环境下的喇叭声音信号,并从所采集的喇叭声音信号中提取出对应的喇叭声纹特征;
利用所提取的喇叭声纹特征进行声学模型训练以得到对应的喇叭声纹模型。
本发明利用汽车喇叭声纹中断车机消息播报的方法的进一步改进在于,采集多种环境下的喇叭声音信号,包括:
采集汽车在不同档位行驶的环境下的喇叭声音信号;
采集汽车在开、关窗的环境下的喇叭声音信号;以及
采集汽车内有、无背景声音的环境下的喇叭声音信号。
本发明利用汽车喇叭声纹中断车机消息播报的方法的进一步改进在于,在消息播报结束时,释放所述喇叭声纹模型。
本发明还提供了一种利用汽车喇叭声纹中断车机消息播报的系统,包括:
装设于车机设备上的喇叭声纹模型,所述喇叭声纹模型与所述车机设备上的消息播报系统连接,所述消息播报系统在收到需进行消息播报的消息时形成激活指令发送给所述喇叭声纹模型,以激活所述喇叭声纹模型;
与所述喇叭声纹模型连接的音频获取模块,所述音频获取模块与所述车机设备上的麦克风控制连接,所述喇叭声纹模型被激活后向所述音频获取模块发送录音获取指令,所述音频获取模块根据所述录音获取指令控制所述麦克风连续不断地进行监听录音并获取所形成录音信号,所述音频获取模块对所获取的所述录音信号进行降噪处理;
与所述音频获取模块和所述喇叭声纹模型连接的特征提取模块,所述特征提取模块接收所述音频获取模块所获取的录音信号并对所述录音信号进行特征提取以获得对应的声纹特征,所述特征提取模块将所提取的声纹特征发送给所述喇叭声纹模型;以及
与所述喇叭声纹模型和所述消息播报系统连接中断控制模块;
其中:
所述喇叭声纹模型对所提取的声纹特征与喇叭声纹特征进行匹配判断并输出匹配判断结果给所述中断控制模块;
当所述匹配判断结果为所提取的声纹特征与喇叭声纹特征相匹配时,所述中断控制模块形成中断播报指令发送给所述消息播报系统以中断消息播报进而使得消息播报结束;
当所述匹配判断结果为所提取的声纹特征与喇叭声纹特征不匹配时,则中断控制模块不处理。
本发明利用汽车喇叭声纹中断车机消息播报的系统的进一步改进在于,所述喇叭声纹模型通过喇叭声纹特征进行声学模型训练得到,所述喇叭声纹特征通过对多种环境下的喇叭声音信号进行提取获得。
本发明利用汽车喇叭声纹中断车机消息播报的系统的进一步改进在于,多种环境下的喇叭声音信号包括汽车在不同档位行驶的环境下的喇叭声音信号,汽车在开、关窗的环境下的喇叭声音信号以及汽车内有、无背景声音的环境下的喇叭声音信号。
本发明利用汽车喇叭声纹中断车机消息播报的系统的进一步改进在于,所述消息播报系统在消息播报结束时,形成结束播报指令发送给所述喇叭声纹模型以释放所述喇叭声纹模型。
本发明利用汽车喇叭声纹中断车机消息播报的系统的进一步改进在于,所述喇叭声纹模型在接收到所述结束播报指令后形成关闭指令并发送至所述音频获取模块、所述特征提取模块以及所述中断控制模块,以令所述音频获取模块、所述特征提取模块以及所述中断控制模块停止运行。
附图说明
图1为本发明利用汽车喇叭声纹中断车机消息播报的方法及系统的流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
本发明提供了一种利用汽车喇叭声纹中断车机消息播报的方法及系统,为车机设备在消息播报过程提供了一种中断播报的方法,即利用喇叭声音来中断车机设备的消息播报流程。汽车喇叭声音是一种固定的声音信号,具有固定频谱和声域,通过采集、归纳、提取汽车喇叭声音的声纹特征,并利用该声纹特征训练得到喇叭声纹模型,进而结合声纹识别技术,在车机设备的消息播报流程中持续监听声音信号,当监听到声音信号匹配喇叭声纹模型中的已知的喇叭声纹特征,就判断为喇叭声音,并且执行中断消息播报流程的操作,当监听到的声音不匹配时,就继续监听直至消息播报流程结束。由于按喇叭操作经常发生且极易操作,能够快速有效的中断消息播报流程,按喇叭还能够转移车内其他乘坐人的注意力,且按喇叭动作不会产生违和感,化解尴尬情境,保护了用户的隐私信息不被播报,还提升了语音产品的人文关怀。下面结合附图对本发明利用汽车喇叭声纹中断车机消息播报的方法及系统进行说明。
本发明提供了一种利用汽车喇叭声纹中断车机消息播报的系统,该系统包括有喇叭声纹模型、音频获取模块、特征提取模块、以及中断控制模块。该系统可集成到车机设备的语音交互系统中,也可以作为单独的产品装设到车机设备上,并与语音交互系统通信连接,语音交互系统内设置有消息播报系统,用于接收到的需要进行消息播报的消息进行语音播报。本发明利用汽车喇叭声纹中断车机消息播报的系统中的喇叭声纹模型装设于车机设备上,在系统集成于车机设备的语音交互系统中的情形下,该喇叭声纹模型可集成于车机设备的语音交互系统中。该喇叭声纹模型与车机设备上的消息播报系统连接,喇叭声纹模型还与音频获取模块、特征提取模块、以及中断控制模块连接,特征提取模块与音频获取模块连接,中断控制模块与消息播报系统连接。
消息播报系统在收到需要进行消息播报的消息时形成激活指令,如图1所示,在收到消息后形成激活指令发送给喇叭声纹模型以激活喇叭声纹模型。消息播报系统在收到消息后,在发送激活指令的同时还进行tts播报新信息提示(tts,text to speech,从文本到语音),利用语音交互系统询问用户是否需要对新信息进行语音播报,提示后等待用户反馈。若用户反馈为播报,则该消息播报系统对新信息进行语音播报,即进入语音播报流程直至完成播报,若用户反馈为不播报,则消息播报系统的播报流程结束,在播报流程结束后形成结束播报指令给喇叭声纹模型以释放喇叭声纹模型。
在喇叭声纹模型被激活指令激活后,该喇叭声纹模型向音频获取模块发送录音获取指令,音频获取模块根据录音获取指令开始运行。该音频获取模块与车机设备上的麦克风控制连接,音频获取模块运行后控制车机设备上的麦克风连续不断地进行监听录音并获取所形成的录音信号,该音频获取模块还用于对获取的录音信号进行降噪处理。具体地,麦克风在被音频获取模块控制开启后,实时地进行录音,所形成的录音信号为模拟信号,该音频获取模块中设有模数转换器,形成的录音信号经模数转换器转换为数字信号。在音频获取模块中还设有降噪子模块,降噪子模块利用环境噪音对转换成数字信号的录音信号进行降噪,该降噪子模块所利用的环境噪音可以是预先存储的,也可以是在车机设备开启后录取的车内环境声音所形成的。
特征提取模块接收音频获取模块所获取的录音信号,音频获取模块对录音信号进行降噪处理后,将处理后的录音信号发送给特征提取模块,该特征提取模块用于对录音信号进行特征提取以获得对应的声纹特征,该特征提取模块所提取的声纹特征发送给喇叭声纹模型,以令喇叭声纹模型进行识别。
喇叭声纹模型在接收到特征提取模块发送的提取的声纹特征后,对该提取的声纹特征进行匹配判断,并输出匹配判断结果给中断控制模块。当匹配判断结果为所提取的声纹特征与喇叭声纹特征相匹配时,该中断控制模块根据该匹配判断结果形成中断播报指令发送给消息播报信息以中断消息播报进而使得消息播报结果;当匹配判断结果为所提取的声纹特征与喇叭声纹特征不匹配时,则中断控制模块不作处理。匹配判断结果为提取的声纹特征与喇叭声纹特征相匹配时,表示用户进行了按喇叭操作,在监听到喇叭声音时立即中断消息播报流程,实现快速及时有效的中断,以保护用户隐私,解决现有通过操作面板操作不及时的问题。
本发明中的喇叭声纹模型是通过喇叭声纹特征进行声学模型训练得到的,为了提高喇叭声纹模型识别的准确率,需要采集大量的喇叭声纹特征进行声学模型训练,且喇叭声纹特征还要通过多种环境下的喇叭声音信号进行提取获得。多种环境下的喇叭声音信号包括有汽车在不同档位行驶的环境下的喇叭声音信号,汽车在开、关窗的环境下的喇叭声音信号以及汽车内有、无背景声音的环境下的喇叭声音信号。采集喇叭声音信号时,在真实场景的不同状态中进行,若是前装车机,则需要采集该汽车车型在各种状态的喇叭声音,包括各档车速、开关窗、是否有背景声音的状态下。若是后装车机,则需要采集不同车型在各种状态的喇叭声音,对车型和上述的各档车速、开关窗、是否有背景声音的状态进行组合采集喇叭声音。
消息播报系统在消息播报结束时,形成结束播报指令发送给喇叭声纹模型以释放喇叭声纹模型。该消息播报系统的消息播报结束包括完成播报消息、用户反馈不播报以及中断控制模块发送中断播报指令而中断消息播报。该喇叭声纹模型在接收到结束播报指令后形成关闭指令并发送给音频获取模块、特征提取模块以及中断控制模块,令音频获取模块、特征提取模块以及中断控制模块停止运行,以待下次被激活。
本发明利用汽车喇叭声纹中断车机消息播报的系统的有益效果为:
本发明的系统针对车载场景且同乘车又有多个人的情况,为了避免私人信息被直接播报,在语音播报消息过程中,进行实施监听,在监听到喇叭声音,立即中断语音播报,有效保护用户隐私。
按喇叭操作在汽车使用过程中经常发生且极易操作,实现了快速及时有效的中断消息播报,解决了现有操作面板操控不及时的问题。
按喇叭还能够转移其他乘坐人的注意力,同时按喇叭的动作不会产生违和感,化解尴尬情境,提升了语音产品的人文关怀。
下面对本发明利用汽车喇叭声纹中断车机消息播报的方法进行说明。
本发明的利用汽车喇叭声纹中断车机消息播报的方法包括如下步骤:
在车机设备上建立喇叭声纹模型,该喇叭声纹模型用于识别喇叭声音;
在车机设备收到需进行消息播报的消息时,激活所建立的喇叭声纹模型,使得喇叭声纹模型处于运行状态;
通过车机设备上的麦克风连续不断地进行监听录音以获取录音信号;
对所获取的录音信号进行降噪处理并提取对应的声纹特征;
将所提取的声纹特征输入到喇叭声纹模型中进行匹配判断,即通过喇叭声纹模型对所提取的声纹特征进行识别;当所提取的声纹特征与喇叭声纹特征相匹配,则形成中断播报指令发送给车机设备以中断消息播报进而使得消息播报结束;当所提取的声纹特征与喇叭声纹特征不匹配,则继续进行匹配判断直至消息播报结束。
本发明的方法针对车机设备的语音交互系统,该语音交互系统内设置有消息播报系统,用于接收到的需要进行消息播报的消息进行语音播报。本发明的方法对消息播报系统实现控制,在消息播报的过程中,通过获取到了喇叭声音从而中断消息播报,避免了私人信息被直接播报。下面结合图1,对本发明的利用汽车喇叭声纹中断车机消息播报方法的流程进行说明。
如图1所示,消息播报系统接收到新信息时,即步骤S101,收到消息,消息播报系统接着执行步骤S102和步骤S107。
执行步骤S102,激活喇叭声纹模型,该消息播报系统可以通过发送激活指令的方式激活喇叭声纹模型,被激活的喇叭声纹模型处于运行状态。接着执行步骤S103。
执行步骤S103,监听录音,在喇叭声纹模型被激活后,开始持续地监听录音,可以通过控制车机设备的麦克风开启进行监听录音,连续不断地录制以形成录音信号。接着执行步骤S104。
执行步骤S104,降噪处理,对所录制的录音信号进行降噪处理,可以利用实现预存的环境噪音进行降噪处理,也可以在车机设备启动时,对车内环境声音进行录制形成环境噪音。接着执行步骤S105。
执行步骤S105,对经过降噪处理的录音信号进行声纹特征提取,以提取与录音信号对应的声纹特征。接着执行步骤S106。
执行步骤S106,喇叭声纹模型对所提取的声纹特征进行匹配判断,即对所提取的声纹特征进行识别,识别其是否为喇叭声音。喇叭声纹模型将所提取的声纹特征与喇叭声纹特征进行匹配判断,若所提取的声纹特征与喇叭声纹特征相匹配,则接着执行步骤S109。若所提取的声纹特征与喇叭声纹特征不匹配,则接着执行步骤S102,以继续进行监听录音。
执行步骤S107,tts播报新信息提示,即语音提示用户收到新信息是否需要播报,接着执行步骤S108。
执行步骤S108,等待用户反馈。这步骤S107和步骤S108中接收到用户反馈后,若反馈信息为播报,则执行步骤S110,若反馈信息为不播报,则执行步骤S109。
执行步骤S110,语音播报流程,对新信息进行语音播报。接着执行步骤S111。
执行步骤S109,中断当前播报流程,接着执行步骤S111。
执行步骤S111,流程结束,语音播报流程结束,接着执行步骤S112。
执行步骤S112,释放喇叭声纹模型。
在步骤S111的流程结束中,会有多种结束情况,在语音播报完成后进入到流程结束,在用户反馈不播报而通过中断当前播报流程而进入流程结束,在喇叭声纹模型识别到有喇叭声音而通过中断当前播报流程而进入流程结束。本发明利用了喇叭声音来中断消息播报,在车机声波进行消息播报的过程中,始终对车内的环境进行监听,当监听到喇叭声音时,立即中断消息播报并取消播报流程,对车主的隐私起到了很好的保护。按喇叭的操作经常发生且极易操作,能够快速有效的中断消息播报,另外,利用喇叭中断播报,按喇叭能够转移其他同乘人员的注意力,且按喇叭的动作不会产生违和感,能够较好的化解尴尬情境,提升了语音产品的人文关怀。
本发明的方法的一较佳实施方式,在车机设备上建立喇叭声纹模型包括:
采集多种环境下的喇叭声音信号,并从所采集的喇叭声音信号中提取出对应的喇叭声纹特征,为提高喇叭声纹模型的识别准确率,需采集大量的喇叭声音信号。利用所提取的喇叭声纹特征进行声学模型训练以得到对应的喇叭声纹模型。
采集多种环境下的喇叭声音信号包括:采集汽车在不同档位行驶的环境下的喇叭声音信号;采集汽车在开、关窗的环境下的喇叭声音信号;以及采集汽车内有、无背景声音的环境下的喇叭声音信号。采集喇叭声音信号时,在真实场景的不同状态中进行,若是前装车机,则需要采集该汽车车型在各种状态的喇叭声音,包括各档车速、开关窗、是否有背景声音的状态下。若是后装车机,则需要采集不同车型在各种状态的喇叭声音,对车型和上述的各档车速、开关窗、是否有背景声音的状态进行组合采集喇叭声音。
在消息播报结束时,释放喇叭声纹模型,可通过形成结束播报指令的方式来释放喇叭声纹模型,以待下次被激活。
以上结合附图实施例对本发明进行了详细说明,本领域中普通技术人员可根据上述说明对本发明做出种种变化例。因而,实施例中的某些细节不应构成对本发明的限定,本发明将以所附权利要求书界定的范围作为本发明的保护范围。

Claims (9)

1.一种利用汽车喇叭声纹中断车机消息播报的方法,其特征在于,包括如下步骤:
于车机设备上建立喇叭声纹模型;
在所述车机设备收到需进行消息播报的消息时,激活所述喇叭声纹模型;
通过所述车机设备上的麦克风连续不断地进行监听录音以获取录音信号;
对所述录音信号进行降噪处理并提取对应的声纹特征;以及
将所提取的声纹特征输入到所述喇叭声纹模型中进行匹配判断,
若所提取的声纹特征与喇叭声纹特征相匹配,则形成中断播报指令发送给所述车机设备以中断消息播报进而使得所述消息播报结束;
若所提取的声纹特征与所述喇叭声纹特征不匹配,则继续进行匹配判断直至所述消息播报结束。
2.如权利要求1所述的利用汽车喇叭声纹中断车机消息播报的方法,其特征在于,于车机设备上建立喇叭声纹模型,包括:
采集多种环境下的喇叭声音信号,并从所采集的喇叭声音信号中提取出对应的喇叭声纹特征;
利用所提取的喇叭声纹特征进行声学模型训练以得到对应的喇叭声纹模型。
3.如权利要求2所述的利用汽车喇叭声纹中断车机消息播报的方法,其特征在于,采集多种环境下的喇叭声音信号,包括:
采集汽车在不同档位行驶的环境下的喇叭声音信号;
采集汽车在开、关窗的环境下的喇叭声音信号;以及
采集汽车内有、无背景声音的环境下的喇叭声音信号。
4.如权利要求1所述的利用汽车喇叭声纹中断车机消息播报的方法,其特征在于,在消息播报结束时,释放所述喇叭声纹模型。
5.一种利用汽车喇叭声纹中断车机消息播报的系统,其特征在于,包括:
装设于车机设备上的喇叭声纹模型,所述喇叭声纹模型与所述车机设备上的消息播报系统连接,所述消息播报系统在收到需进行消息播报的消息时形成激活指令发送给所述喇叭声纹模型,以激活所述喇叭声纹模型;
与所述喇叭声纹模型连接的音频获取模块,所述音频获取模块与所述车机设备上的麦克风控制连接,所述喇叭声纹模型被激活后向所述音频获取模块发送录音获取指令,所述音频获取模块根据所述录音获取指令控制所述麦克风连续不断地进行监听录音并获取所形成的录音信号,所述音频获取模块对所获取的所述录音信号进行降噪处理;
与所述音频获取模块和所述喇叭声纹模型连接的特征提取模块,所述特征提取模块接收所述音频获取模块所获取的录音信号并对所述录音信号进行特征提取以获得对应的声纹特征,所述特征提取模块将所提取的声纹特征发送给所述喇叭声纹模型;以及
与所述喇叭声纹模型和所述消息播报系统连接中断控制模块;
其中:
所述喇叭声纹模型对所提取的声纹特征与喇叭声纹特征进行匹配判断并输出匹配判断结果给所述中断控制模块;
当所述匹配判断结果为所提取的声纹特征与喇叭声纹特征相匹配时,所述中断控制模块形成中断播报指令发送给所述消息播报系统以中断消息播报进而使得消息播报结束;
当所述匹配判断结果为所提取的声纹特征与喇叭声纹特征不匹配时,则中断控制模块不处理。
6.如权利要求5所述的利用汽车喇叭声纹中断车机消息播报的系统,其特征在于,所述喇叭声纹模型通过喇叭声纹特征进行声学模型训练得到,所述喇叭声纹特征通过对多种环境下的喇叭声音信号进行提取获得。
7.如权利要求6所述的利用汽车喇叭声纹中断车机消息播报的系统,其特征在于,多种环境下的喇叭声音信号包括汽车在不同档位行驶的环境下的喇叭声音信号,汽车在开、关窗的环境下的喇叭声音信号以及汽车内有、无背景声音的环境下的喇叭声音信号。
8.如权利要求5所述的利用汽车喇叭声纹中断车机消息播报的系统,其特征在于,所述消息播报系统在消息播报结束时,形成结束播报指令发送给所述喇叭声纹模型以释放所述喇叭声纹模型。
9.如权利要求8所述的利用汽车喇叭声纹中断车机消息播报的系统,其特征在于,所述喇叭声纹模型在接收到所述结束播报指令后形成关闭指令并发送至所述音频获取模块、所述特征提取模块以及所述中断控制模块,以令所述音频获取模块、所述特征提取模块以及所述中断控制模块停止运行。
CN201610991111.2A 2016-11-01 2016-11-01 利用汽车喇叭声纹中断车机消息播报的方法及系统 Active CN106448662B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610991111.2A CN106448662B (zh) 2016-11-01 2016-11-01 利用汽车喇叭声纹中断车机消息播报的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610991111.2A CN106448662B (zh) 2016-11-01 2016-11-01 利用汽车喇叭声纹中断车机消息播报的方法及系统

Publications (2)

Publication Number Publication Date
CN106448662A true CN106448662A (zh) 2017-02-22
CN106448662B CN106448662B (zh) 2020-10-13

Family

ID=58207303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610991111.2A Active CN106448662B (zh) 2016-11-01 2016-11-01 利用汽车喇叭声纹中断车机消息播报的方法及系统

Country Status (1)

Country Link
CN (1) CN106448662B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107277230A (zh) * 2017-05-26 2017-10-20 广东欧珀移动通信有限公司 消息的语音播报方法及相关产品
CN111081262A (zh) * 2019-12-30 2020-04-28 杭州中科先进技术研究院有限公司 一种基于定制化模型的轻量级语音识别系统及方法
CN112672924A (zh) * 2018-08-03 2021-04-16 格雷斯诺特公司 具有音频广告和导航相关动作同步功能的基于车辆的媒体系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030063756A1 (en) * 2001-09-28 2003-04-03 Johnson Controls Technology Company Vehicle communication system
CN103297613A (zh) * 2013-04-27 2013-09-11 华为终端有限公司 语音合成tts打断信号处理方法及装置
CN104978958A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 语音控制方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030063756A1 (en) * 2001-09-28 2003-04-03 Johnson Controls Technology Company Vehicle communication system
CN103297613A (zh) * 2013-04-27 2013-09-11 华为终端有限公司 语音合成tts打断信号处理方法及装置
CN104978958A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 语音控制方法和系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107277230A (zh) * 2017-05-26 2017-10-20 广东欧珀移动通信有限公司 消息的语音播报方法及相关产品
CN107277230B (zh) * 2017-05-26 2020-03-10 Oppo广东移动通信有限公司 消息的语音播报方法及相关产品
CN112672924A (zh) * 2018-08-03 2021-04-16 格雷斯诺特公司 具有音频广告和导航相关动作同步功能的基于车辆的媒体系统
CN111081262A (zh) * 2019-12-30 2020-04-28 杭州中科先进技术研究院有限公司 一种基于定制化模型的轻量级语音识别系统及方法

Also Published As

Publication number Publication date
CN106448662B (zh) 2020-10-13

Similar Documents

Publication Publication Date Title
CN204836533U (zh) 一种具有回声消除功能的声控智能音箱
CN104396275B (zh) 使用耳内插入型麦克风的有线无线耳机
CN104158944B (zh) 低成本的手机与车机的互联系统
CN110070868A (zh) 车载系统的语音交互方法、装置、汽车和机器可读介质
CN113345433B (zh) 一种车外语音交互系统
CN104521247B (zh) 蓝牙耳机助听及抗噪方法和装置
CN107919132A (zh) 环境声音监听方法、装置及耳机
CN110475180A (zh) 车载多音区音频处理系统及方法
DE112009004411T5 (de) Ein System und ein Verfahren, um eine Befehlsaufforderung zu unterbrechen und eine anstehende Eingabe über eine drahtlose Kommunikationsverbindung zu signalisieren
CN107438209A (zh) 具有助听特征的有源降噪耳机设备
CN105530171A (zh) 车载终端播放即时消息音的方法和装置
CN106448662A (zh) 利用汽车喇叭声纹中断车机消息播报的方法及系统
CN102711030B (zh) 一种用于交通工具的智能音频系统及其音源调校方法
CN110460729A (zh) 一种车辆会议模式全方位语音交互系统及方法
CN106782589A (zh) 移动终端及其语音输入方法和装置
CN103456305A (zh) 终端和基于多个声音采集单元的语音处理方法
CN105390136A (zh) 用于用户适配型服务的车辆设备控制装置及方法
CN107613132A (zh) 语音接听方法与移动终端装置
CN106548797A (zh) 一种集可视、语音控制一体化的车载智能平台
CN103079145A (zh) 新型车载多媒体播放器及其实现方法
CN108534297A (zh) 一种基于语音识别的智能空调系统及控制方法
CN110447055A (zh) 用于在运载工具中传送口头消息的系统和方法
CN209183265U (zh) 音频处理装置
CN109618266A (zh) 双向实时通话音频处理方法及双向实时通话对讲系统
CN206388506U (zh) 一种集可视、语音控制一体化的车载智能平台

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20170929

Address after: 200233 Shanghai City, Xuhui District Guangxi 65 No. 1 Jinglu room 702 unit 03

Applicant after: Cloud known sound (Shanghai) Technology Co. Ltd.

Address before: 200233 Shanghai, Qinzhou, North Road, No. 82, building 2, layer 1198,

Applicant before: SHANGHAI YUZHIYI INFORMATION TECHNOLOGY CO., LTD.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant