CN112073866A - 一种具有计算机视觉的智能耳机装置 - Google Patents
一种具有计算机视觉的智能耳机装置 Download PDFInfo
- Publication number
- CN112073866A CN112073866A CN202010744282.1A CN202010744282A CN112073866A CN 112073866 A CN112073866 A CN 112073866A CN 202010744282 A CN202010744282 A CN 202010744282A CN 112073866 A CN112073866 A CN 112073866A
- Authority
- CN
- China
- Prior art keywords
- computer vision
- earphone
- wearer
- micro
- video acquisition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 8
- 238000005516 engineering process Methods 0.000 claims abstract description 8
- WABPQHHGFIMREM-UHFFFAOYSA-N lead(0) Chemical compound [Pb] WABPQHHGFIMREM-UHFFFAOYSA-N 0.000 claims 1
- 230000002452 interceptive effect Effects 0.000 abstract description 2
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1016—Earpieces of the intra-aural type
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/16—Speech classification or search using artificial neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1091—Details not provided for in groups H04R1/1008 - H04R1/1083
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/10—Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephone Function (AREA)
Abstract
本发明公开一种具有计算机视觉的智能耳机装置,包括项圈式耳机、视频采集装置、微型计算装置,项圈式耳机包括项圈和耳机,项圈内置麦克风,可佩戴于颈部;所述微型计算装置安装在项圈后方,内置蓝牙模块、网络通信模块、微处理器,微型计算装置可通过蓝牙模块或网络通信模块与手机或云服务器进行通信;所述视频采集装置固定于项圈一端,视频采集装置中的微型摄像头可通过旋转调整角度,获取前方图像并通过计算机视觉技术进行识别,并将图像的分析结果通过耳机和麦克风与佩戴者交互;本装置是一种便携的图像实时采集分析装置,通过语音与佩戴者交互,从而实现多种场景的应用。
Description
技术领域
本发明涉及计算机视觉领域,具体是一种具有计算机视觉的智能耳机装置。
背景技术
随着以深度学习为代表的人工智能技术的兴起,计算机视觉技术发展迅速,通过神经网络算法,能够让计算机捕捉图像特征信息,实现图像分类、目标检测的功能,目前,以ResNet为代表的神经网络结构,识别准确率已经超过95%,相比传统特征识别方法,人工智能技术已经取得了巨大的进步。
目前市场上已具有的计算机视觉方案,采用人脸识别、智能识物的功能,应用于手机解锁、手机智能拍照,技术成熟,但需要借助手机为载体,是人与设备短暂的信息交换,缺少交互式场景,应用单一,且没有便携式结构帮助人们解脱双手。
耳机是一对转换单元,通过连接现有智能设备,接受媒体播放器的电信号,转化为声信号播放,可有效隔离环境噪音,在多场景下应用,给人良好的听觉体验。以蓝牙耳机为代表的无线耳机,帮助使用者免除了线的牵制,凭借其便捷性,用户需求仍处于上升期。目前市场上已具有的无线耳机方案,采用简单便携的结构,虽具有便捷的优势,但算力较低,无法处理复杂数据;功能单一,在旅游、医疗、公益方向应用面窄;缺少智能模块,无法实现视觉识别、目标定位、网络通信的功能。
发明内容
本发明将计算机视觉更好地应用在耳机设备中,实现多功能,所述技术方案如下:
一种具有计算机视觉的智能耳机装置,包括项圈式耳机、视频采集装置、微型计算装置。
进一步的,所述项圈式耳机上安装有微型计算装置和视频采集装置,获取前方图像并通过计算机视觉技术进行识别,并将图像的分析结果通过耳机和麦克风与佩戴者交互。
进一步的,所述视频采集装置包括至少一个微型摄像头,微型摄像头固定于耳机项圈一端引线上,可通过旋转调整角度,获取前方图像。
进一步的,所述微型计算装置安装在项圈式耳机项圈后方,内置蓝牙模块、网络通信模块、微处理器,蓝牙模块用于短距离与手机交互,微型计算装置可通过蓝牙模块或网络通信模块与手机或云服务器进行通信。
本发明与现有的装置相比,有益的效果是采用简单便携的结构,运用智能模块实现图像实时采集分析,通过语音与佩戴者交互,从而实现多种场景的应用。
附图说明
图1是智能耳机装置结构示意图。
图2是是视频采集装置结构示意图。
图3是微型计算装置结构示意图。
具体实施方式
下面结合附图和实施方式对本发明做进一步的描述。
参照图1-3,本发明是一种具有计算机视觉的智能耳机装置,包括项圈式耳机(1)、视频采集装置(3)、微型计算装置(2),项圈式耳机(1)包括项圈式耳机项圈(4)和耳机(11),项圈式耳机项圈(4)内置麦克风(10),可佩戴于颈部;所述微型计算装置(2)安装在项圈式耳机项圈(4)后方,内置蓝牙模块(6)、网络通信模块(7)、微处理器(9),用盖板(5)进行密封;所述视频采集装置(3)固定于项圈式耳机项圈(4)一端,视频采集装置(3)中的微型摄像头(8)可通过旋转调整角度。
参照图1-3,微型计算装置(2)通过中断方式对外界进行监听,声音通过麦克风(10)录入到微型计算装置(2)中的微处理器(9)中,经神经网络的语义分析技术分析声音有效信息,再由微型计算装置(2)驱动视频采集装置(3)、蓝牙模块(6)、耳机(11)或网络通信模块(7),下达相应的指令命令,实现人机交互。
参照图1-2,视频采集装置(3)中的微型摄像头(8)可通过旋转调整角度,微型计算装置(2)驱动视频采集装置(3),获取对应角度实时画面图像,传入神经网络深度学习的模型,检测出画面中的物体信息,并将图像的分析结果通过耳机(11)和麦克风(10)与佩戴者交互。
参照图1-3,微型计算装置(2)内置蓝牙模块(6)、网络通信模块(7)、微处理器(9),蓝牙模块(6)可用于短距离与手机交互,微型计算装置(2)可通过蓝牙模块(6)或网络通信模块(7)与手机或云服务器进行通信,当微处理器(9)驱动网路通信模块(7)后,可以远距离连接联网的智能设备,在连接的过程中,首先通过网络通信模块(7)将画面传送到云服务器,以实现远距离通信。
Claims (10)
1.一种具有计算机视觉的智能耳机装置,包括项圈式耳机(1)、视频采集装置(3)、微型计算装置(2),其特征在于:项圈式耳机(1)上安装有微型计算装置(2)和视频采集装置(3),获取前方图像并通过计算机视觉技术进行识别,并将图像的分析结果通过耳机(11)和麦克风(10)与佩戴者交互。
2.根据权利要求1所述的具有计算机视觉的智能耳机装置,其特征在于:包括项圈式耳机(1)、视频采集装置(3)、微型计算装置(2),视频采集装置(3)可获取前方图像并通过计算机视觉技术进行识别,并将图像的分析结果通过耳机(11)和麦克风(10)与佩戴者交互。
3.根据权利要求1所述的微型计算装置(2),其特征在于:安装在项圈式耳机项圈(4)后方,内置蓝牙模块(6)、网络通信模块(7)、微处理器(9),蓝牙模块(6)用于短距离与手机交互,微型计算装置(2)可通过蓝牙模块(6)或网络通信模块(7)与手机或云服务器进行通信。
4.根据权利要求1所述的视频采集装置(3),其特征在于:包括一个微型摄像头(8),视频采集装置(3)固定于项圈式耳机项圈(4)一端引线上,微型摄像头(8)可通过旋转调整角度,获取前方图像。
5.一种旅游景点识别与解说装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,可识别摄像头前方景点并播报相应解说词。
6.一种导盲装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,可识别前方障碍物并通过语音提醒佩戴者。
7.一种商品价格查询装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,可识别摄像头前商品,通过互联网获取价格,并通过语音播报给佩戴者。
8.一种外文翻译装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,可识别指定外文单词,翻译成中文并通过语音播报给佩戴者。
9.一种外文学习装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,可识别物体,并将对应外文单词通过语音播报给佩戴者。
10.一种远程协助装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,协助者可远程获取摄像头的图像,并通过语音给佩戴者提供协助信息或指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010744282.1A CN112073866A (zh) | 2020-07-29 | 2020-07-29 | 一种具有计算机视觉的智能耳机装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010744282.1A CN112073866A (zh) | 2020-07-29 | 2020-07-29 | 一种具有计算机视觉的智能耳机装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112073866A true CN112073866A (zh) | 2020-12-11 |
Family
ID=73656238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010744282.1A Pending CN112073866A (zh) | 2020-07-29 | 2020-07-29 | 一种具有计算机视觉的智能耳机装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112073866A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113630680A (zh) * | 2021-07-22 | 2021-11-09 | 深圳市易万特科技有限公司 | 一种耳机音频视频交互系统、方法及智能头戴式耳机 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104983511A (zh) * | 2015-05-18 | 2015-10-21 | 上海交通大学 | 针对全盲视觉障碍者的语音帮助智能眼镜系统 |
CN106685929A (zh) * | 2016-12-06 | 2017-05-17 | 南京金雀智能科技有限公司 | 基于可穿戴式蓝牙视频耳机的通信处理系统及方法 |
CN208623868U (zh) * | 2018-06-19 | 2019-03-19 | 信利光电股份有限公司 | 一种耳机 |
-
2020
- 2020-07-29 CN CN202010744282.1A patent/CN112073866A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104983511A (zh) * | 2015-05-18 | 2015-10-21 | 上海交通大学 | 针对全盲视觉障碍者的语音帮助智能眼镜系统 |
CN106685929A (zh) * | 2016-12-06 | 2017-05-17 | 南京金雀智能科技有限公司 | 基于可穿戴式蓝牙视频耳机的通信处理系统及方法 |
CN208623868U (zh) * | 2018-06-19 | 2019-03-19 | 信利光电股份有限公司 | 一种耳机 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113630680A (zh) * | 2021-07-22 | 2021-11-09 | 深圳市易万特科技有限公司 | 一种耳机音频视频交互系统、方法及智能头戴式耳机 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104410883B (zh) | 一种移动可穿戴非接触式交互系统与方法 | |
CN104983511A (zh) | 针对全盲视觉障碍者的语音帮助智能眼镜系统 | |
CN107230476A (zh) | 一种自然的人机语音交互方法和系统 | |
CN106205293A (zh) | 用于语音识别和手语识别的智能眼镜 | |
CN102932212A (zh) | 一种基于多通道交互方式的智能家居控制系统 | |
WO2017092396A1 (zh) | 一种虚拟现实交互系统及方法 | |
CN109147787A (zh) | 一种智能电视声控识别系统及其识别方法 | |
CN210090827U (zh) | 一种轻便化的ar眼镜实现系统 | |
WO2021013043A1 (zh) | 虚拟现实场景中的交互方法及装置 | |
WO2019100915A1 (zh) | 一种脑电控制的视频输入听觉显示导盲装置及方法 | |
CN206179323U (zh) | 用于语音识别和手语识别的智能眼镜 | |
CN115620727B (zh) | 音频处理方法、装置、存储介质及智能眼镜 | |
CN115620728B (zh) | 音频处理方法、装置、存储介质及智能眼镜 | |
CN115480923A (zh) | 一种多模态的智慧教室边缘计算控制系统 | |
CN112073866A (zh) | 一种具有计算机视觉的智能耳机装置 | |
WO2022048455A1 (zh) | 一种基于增强现实技术的信息无障碍系统及方法 | |
US20230239800A1 (en) | Voice Wake-Up Method, Electronic Device, Wearable Device, and System | |
CN110271017A (zh) | 一种机器人装置 | |
CN111081120A (zh) | 一种协助听说障碍人士交流的智能穿戴设备 | |
CN218045797U (zh) | 一种盲人穿戴智慧云眼镜及系统 | |
WO2023109862A1 (zh) | 视频播放中协同播放音频的方法及通信系统 | |
CN111985252A (zh) | 对话翻译方法及装置、存储介质和电子设备 | |
CN208299890U (zh) | 一种头戴式远程协助装置 | |
CN208905094U (zh) | 一种基于kinect的会议内容控制系统 | |
CN110597122A (zh) | 一种嵌入式多媒体的控制系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20201211 |