CN203338756U - 语音图像识别双控无线汽车音响 - Google Patents
语音图像识别双控无线汽车音响 Download PDFInfo
- Publication number
- CN203338756U CN203338756U CN2013204714162U CN201320471416U CN203338756U CN 203338756 U CN203338756 U CN 203338756U CN 2013204714162 U CN2013204714162 U CN 2013204714162U CN 201320471416 U CN201320471416 U CN 201320471416U CN 203338756 U CN203338756 U CN 203338756U
- Authority
- CN
- China
- Prior art keywords
- module
- sound equipment
- central processing
- image
- phonetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 claims abstract description 27
- 230000005540 biological transmission Effects 0.000 claims abstract description 5
- 230000009977 dual effect Effects 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60K—ARRANGEMENT OR MOUNTING OF PROPULSION UNITS OR OF TRANSMISSIONS IN VEHICLES; ARRANGEMENT OR MOUNTING OF PLURAL DIVERSE PRIME-MOVERS IN VEHICLES; AUXILIARY DRIVES FOR VEHICLES; INSTRUMENTATION OR DASHBOARDS FOR VEHICLES; ARRANGEMENTS IN CONNECTION WITH COOLING, AIR INTAKE, GAS EXHAUST OR FUEL SUPPLY OF PROPULSION UNITS IN VEHICLES
- B60K35/00—Instruments specially adapted for vehicles; Arrangement of instruments in or on vehicles
- B60K35/10—Input arrangements, i.e. from user to vehicle, associated with vehicle functions or specially adapted therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/03—Arrangements for converting the position or the displacement of a member into a coded form
- G06F3/0304—Detection arrangements using opto-electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Chemical & Material Sciences (AREA)
- Combustion & Propulsion (AREA)
- Transportation (AREA)
- Mechanical Engineering (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
本实用新型提供一种语音图像识别双控无线汽车音响,其包括语音接收模块,语音识别模块,图像摄取模块,图像识别模块,中央处理模块,信息存储模块,显示模块以及音响播放单元,其中该语音接收模块与语音识别模块相连,该语音识别模块与该中央处理模块相连,同时图像摄取模块和图像识别模块相连,而图像识别模块也与中央处理模块相连,该信息存储模块,显示模块以及音响播放单元分别与该中央处理模块相连,上述各个模块以及音响播放单元间的信息传输采用无线连接传输的方式实现,本实用新型采用语音识别和图像识别双控制,保证单独供驾驶员控制,其他人员不能随意控制,而且驾驶员只需要发出声音命令即可操控,使用方便。
Description
技术领域
本实用新型涉及一种汽车音响,特别是一种语音图像识别双控无线汽车音响。
背景技术
如今的生活中,汽车已经成为人们重要的交通工具,甚至超出了代步工具的概念。于是,汽车中的各种附加的功能也随之成为人们关注的热点。在驾驶的时候同时享受音乐的乐趣是大家都喜欢的驾驶状态,于是车载的卡带式音响,车载CD播放器,车载VCD/DVD播放器,车载MP3播放器都应运而生了,大大丰富了人们在驾驶时候的乐趣。但是这些音乐的播放装置都存在一个显著的问题就是其歌曲选择和播放的状态需要人们用手进行调节和控制,这对于驾驶人员是很大的安全隐患,而且当要播放的音乐越来越多的时候,要选择喜欢的音乐播放就需要不断去调节,例如,音乐的播放清单里有1000首音乐,驾驶员听完第三首以后想听第三百首的话,这个调节的工作量是难以想象的,也是难以忍受的。而且除了驾驶员以外,目前很多乘客也可以手动去控制音乐的选择,驾驶途中如果驾驶员旁边以及身后的人手动去控制音乐选择,对驾驶的安全性产生威胁,而且会影响到驾驶员的情绪。所以市场需要一种单独供驾驶员控制,其他人员不能随意控制,而且驾驶员不需要手动选择,只需要发出声音命令即可操控的汽车音响。
实用新型内容
为了解决现有技术中存在的缺陷,本实用新型需要解决的技术问题是提供一种单独供驾驶员控制,其他人员不能随意控制,而且驾驶员不需要手动选择,只需要发出声音命令即可操控的无线汽车音响。
本实用新型解决现有的技术问题所采用的技术方案是:一种语音图像识别双控无线汽车音响,其包括语音接收模块,语音识别模块,图像摄取模块,图像识别模块,中央处理模块,信息存储模块,显示模块以及音响播放单元,其中该语音接收模块与语音识别模块相连,该语音识别模块与该中央处理模块相连,同时图像摄取模块和图像识别模块相连,而图像识别模块也与中央处理模块相连,该信息存储模块,显示模块以及音响播放单元分别与该中央处理模块相连,上述各个模块以及音响播放单元间的信息传输采用无线连接传输的方式实现。
本实用新型更进一步的改进是:语音接收模块进一步包括麦克风,所述麦克风设置于驾驶员前面的方向盘上,用于接收语音信号。
本实用新型更进一步的改进是:该麦克风采用无线方式将声音传输给语音识别模块,语音识别模块将识别的指令或曲目传给中央处理模块进行下一步控制。
本实用新型更进一步的改进是:所述的图像摄取模块包括摄像头,所述摄像头设置于驾驶员前面的方向盘上,用于摄取图像信号。
本实用新型更进一步的改进是:该摄像头采用无线方式将图像传输给图像识别模块,图像识别模块将识别的图像信息和预先录入的驾驶员头像信息进行比对识别并将识别结果传输给中央处理模块。
根据以上的结构,本实用新型相对于现有技术,本实用新型采用语音识别和图像识别双控制,保证单独供驾驶员控制,其他人员不能随意控制,而且驾驶员不需要手动选择,只需要发出声音命令即可操控,使用方便,同时保障了驾驶过程中的安全。
附图说明
图1本实用新型的结构示意框图。
具体实施方式
下面结合具体实施方式和附图说明对本实用新型进一步描述。
本实用新型的语音图像识别双控无线汽车音响,其语音识别模块包括:针对特定人的语音识别模块。在针对特定人的语音识别模块中,用户需要事先对每一个词条进行训练。在训练阶段,用户每个词条依次说数遍,语音识别模块提取词条的特征量,并将特征量按序列存入存储模块中。在识别阶段,语音识别模块将输入词条的特征量依次与信息存储模块中存储的每一个特征量进行相似度比较,将相似度大于预定值的词条作为识别结果输出。针对特定人的识别单元识别的词条数目一般在1000条以下,识别性能随着词条数目的增加会有明显的下降,并且对于不同用户、在不同的噪声环境中,以及不同的时间相同用户的不同生理、心理状态下,系统的性能都会受到明显的影响。
如图l所示,本实用新型的语音图像识别双控无线汽车音响,其包括语音接收模块11,语音识别模块12,图像摄取模块21,图像识别模块22,中央处理模块13,信息存储模块14,显示模块15以及音响播放单元16,其中该语音接收模块11与语音识别模块12相连,该语音识别模块12与该中央处理模块13相连,同时图像摄取模块21和图像识别模块22相连,而图像识别模块22也与中央处理模块13相连,该信息存储模块14,显示模块15以及音响播放单元16分别与该中央处理模块13相连,上述各个模块以及音响播放单元间的信息传输采用无线连接传输的方式实现。
语音接收模块11进一步包括麦克风,所述麦克风设置于驾驶员前面的方向盘上,用于接收语音信号。
本实用新型更进一步的改进是:该麦克风采用无线方式将声音传输给语音识别模块12,语音识别模块12将识别的指令或曲目传给中央处理模块13进行下一步控制。
本实用新型更进一步的改进是:所述的图像摄取模块21包括摄像头,所述摄像头设置于驾驶员前面的方向盘上,用于摄取图像信号。
本实用新型更进一步的改进是:该摄像头采用无线方式将图像传输给图像识别模块22,图像识别模块22将识别的图像信息和预先录入的驾驶员头像信息进行比对识别并将识别结果传输给中央处理模块13。
该语音接收模块1l用于接收使用者的语音命令,该语音识别模块12用于对目标用户的语音命令信息进行识别,图像摄取模块21用于摄取用户的头部图像,图像识别模块22用于接收用户的头像信息并与其预先录入的头像信息进行比对识别,以确定是否为真正的“主人”,该中央处理模块13用于进行功能控制和数据处理,该信息存储模块14用于存储相关的信息,该显示模块15用于显示播放的信息。
使用时,使用者只需说出自己想要的播放的名目,所述语音接收模块11会接收使用者的语音信息,并将语音信息信号传给所述语音识别模块12以及中央处理模块13,同时中央处理模块13会将接收到的来自于图像摄取模块21和图像识别模块22的信息进行处理,识别是其真正“主人”后,该中央处理模块13控制该存储模块14的信息提取,该显示模块15的显示以及该音响播放单元16声音播放。
Claims (5)
1.一种语音图像识别双控无线汽车音响,其特征在于:其包括语音接收模块,语音识别模块,图像摄取模块,图像识别模块,中央处理模块,信息存储模块,显示模块以及音响播放单元,其中该语音接收模块与语音识别模块相连,该语音识别模块与该中央处理模块相连,同时图像摄取模块和图像识别模块相连,而图像识别模块也与中央处理模块相连,该信息存储模块,显示模块以及音响播放单元分别与该中央处理模块相连,上述各个模块以及音响播放单元间的信息传输采用无线连接传输的方式实现。
2. 根据权利要求1所述的语音图像识别双控无线汽车音响,其特征在于:语音接收模块进一步包括麦克风,所述麦克风设置于驾驶员前面的方向盘上,用于接收语音信号。
3.根据权利要求2所述的语音图像识别双控无线汽车音响,其特征在于:该麦克风采用无线方式将声音传输给语音识别模块,语音识别模块将识别的指令或曲目传给中央处理模块进行下一步控制。
4.根据权利要求1所述的语音图像识别双控无线汽车音响,其特征在于:所述的图像摄取模块包括摄像头,所述摄像头设置于驾驶员前面的方向盘上,用于摄取图像信号。
5.根据权利要求4所述的语音图像识别双控无线汽车音响,其特征在于:该摄像头采用无线方式将图像传输给图像识别模块,图像识别模块将识别的图像信息和预先录入的驾驶员头像信息进行比对识别并将识别结果传输给中央处理模块。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013204714162U CN203338756U (zh) | 2013-08-03 | 2013-08-03 | 语音图像识别双控无线汽车音响 |
PCT/CN2014/081756 WO2015018257A1 (zh) | 2013-08-03 | 2014-07-07 | 语音图像识别双控无线汽车音响 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013204714162U CN203338756U (zh) | 2013-08-03 | 2013-08-03 | 语音图像识别双控无线汽车音响 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN203338756U true CN203338756U (zh) | 2013-12-11 |
Family
ID=49707420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013204714162U Expired - Fee Related CN203338756U (zh) | 2013-08-03 | 2013-08-03 | 语音图像识别双控无线汽车音响 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN203338756U (zh) |
WO (1) | WO2015018257A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015018253A1 (zh) * | 2013-08-03 | 2015-02-12 | Yuan Zhi’Xian | 智能操控及报警的无线汽车音响设备 |
WO2015018258A1 (zh) * | 2013-08-03 | 2015-02-12 | Yuan Zhi’Xian | 一种智能操控汽车音响 |
WO2015018257A1 (zh) * | 2013-08-03 | 2015-02-12 | Yuan Zhi Xian | 语音图像识别双控无线汽车音响 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110662124B (zh) * | 2019-04-11 | 2024-02-23 | 深圳市哎哟宝贝科技有限公司 | 全息3d投影音响 |
CN114043939B (zh) * | 2021-11-09 | 2022-12-09 | 东风汽车集团股份有限公司 | 一种使用全息投影技术的车载中控系统及控制方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007256541A (ja) * | 2006-03-22 | 2007-10-04 | Matsushita Electric Ind Co Ltd | 表示装置 |
CN201174237Y (zh) * | 2007-10-31 | 2008-12-31 | 陈修志 | 声控式汽车音响 |
CN102707801B (zh) * | 2012-05-07 | 2015-08-19 | 广东好帮手电子科技股份有限公司 | 车载识别控制系统及其控制方法 |
CN202615313U (zh) * | 2012-05-07 | 2012-12-19 | 广东好帮手电子科技股份有限公司 | 车载识别控制系统 |
CN202794541U (zh) * | 2012-09-03 | 2013-03-13 | 惠州天缘电子有限公司 | 一种语音控制车载影音导航装置 |
CN102945672B (zh) * | 2012-09-29 | 2013-10-16 | 深圳市国华识别科技开发有限公司 | 一种多媒体设备语音控制系统及方法 |
CN203338752U (zh) * | 2013-08-03 | 2013-12-11 | 袁志贤 | 智能操控及报警的有线汽车音响设备 |
CN203381548U (zh) * | 2013-08-03 | 2014-01-08 | 袁志贤 | 智能操控及报警的无线汽车音响设备 |
CN203338750U (zh) * | 2013-08-03 | 2013-12-11 | 袁志贤 | 一种智能操控汽车音响 |
CN203338749U (zh) * | 2013-08-03 | 2013-12-11 | 袁志贤 | 语音图像识别双控有线汽车音响 |
CN203338756U (zh) * | 2013-08-03 | 2013-12-11 | 袁志贤 | 语音图像识别双控无线汽车音响 |
CN203338753U (zh) * | 2013-08-03 | 2013-12-11 | 袁志贤 | 一种无线智能操控汽车音响 |
-
2013
- 2013-08-03 CN CN2013204714162U patent/CN203338756U/zh not_active Expired - Fee Related
-
2014
- 2014-07-07 WO PCT/CN2014/081756 patent/WO2015018257A1/zh active Application Filing
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015018253A1 (zh) * | 2013-08-03 | 2015-02-12 | Yuan Zhi’Xian | 智能操控及报警的无线汽车音响设备 |
WO2015018258A1 (zh) * | 2013-08-03 | 2015-02-12 | Yuan Zhi’Xian | 一种智能操控汽车音响 |
WO2015018257A1 (zh) * | 2013-08-03 | 2015-02-12 | Yuan Zhi Xian | 语音图像识别双控无线汽车音响 |
Also Published As
Publication number | Publication date |
---|---|
WO2015018257A1 (zh) | 2015-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN203381548U (zh) | 智能操控及报警的无线汽车音响设备 | |
CN203338749U (zh) | 语音图像识别双控有线汽车音响 | |
CN203338753U (zh) | 一种无线智能操控汽车音响 | |
CN201174237Y (zh) | 声控式汽车音响 | |
CN203338751U (zh) | 前排后排乘客操控有线汽车音响 | |
CN203338756U (zh) | 语音图像识别双控无线汽车音响 | |
CN203338750U (zh) | 一种智能操控汽车音响 | |
CN203338752U (zh) | 智能操控及报警的有线汽车音响设备 | |
CN110214351A (zh) | 记录的媒体热词触发抑制 | |
CN105488227B (zh) | 一种电子设备及其基于声纹特征处理音频文件的方法 | |
US8909525B2 (en) | Interactive voice recognition electronic device and method | |
CN106663422A (zh) | 利用单一声学模型和自动口音检测实现的基于文本规则的多口音言语识别 | |
CN104980790B (zh) | 语音字幕的生成方法和装置、播放方法和装置 | |
US20150006541A1 (en) | Intelligent multimedia system | |
CN107545029A (zh) | 智能设备的语音反馈方法、设备及可读介质 | |
CN109964270A (zh) | 用于关键短语识别的系统和方法 | |
CN107924416A (zh) | 在其他媒体内容中引用的媒体内容的提醒 | |
JP2012023510A5 (zh) | ||
CN108389440A (zh) | 一种基于麦克风的语音播放方法、装置及语音播放设备 | |
CN101088085A (zh) | 便携式音频播放设备及其操作方法 | |
CN107273086A (zh) | 基于导航的音频处理方法和装置 | |
CN106328133A (zh) | 一种语音应答响应装置 | |
CN103518235A (zh) | 用于媒体呈现的装置和方法 | |
CN109346057A (zh) | 一种智能儿童玩具的语音处理系统 | |
CN203386472U (zh) | 一种个性语音变声装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20131211 Termination date: 20150803 |
|
EXPY | Termination of patent right or utility model |