CN112073866A - 一种具有计算机视觉的智能耳机装置 - Google Patents

一种具有计算机视觉的智能耳机装置 Download PDF

Info

Publication number
CN112073866A
CN112073866A CN202010744282.1A CN202010744282A CN112073866A CN 112073866 A CN112073866 A CN 112073866A CN 202010744282 A CN202010744282 A CN 202010744282A CN 112073866 A CN112073866 A CN 112073866A
Authority
CN
China
Prior art keywords
computer vision
earphone
wearer
micro
video acquisition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010744282.1A
Other languages
English (en)
Inventor
马竞
刘昊琰
李雨珮
李心远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University
Original Assignee
Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University filed Critical Zhengzhou University
Priority to CN202010744282.1A priority Critical patent/CN112073866A/zh
Publication of CN112073866A publication Critical patent/CN112073866A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1016Earpieces of the intra-aural type
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1091Details not provided for in groups H04R1/1008 - H04R1/1083
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/80Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/10Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开一种具有计算机视觉的智能耳机装置,包括项圈式耳机、视频采集装置、微型计算装置,项圈式耳机包括项圈和耳机,项圈内置麦克风,可佩戴于颈部;所述微型计算装置安装在项圈后方,内置蓝牙模块、网络通信模块、微处理器,微型计算装置可通过蓝牙模块或网络通信模块与手机或云服务器进行通信;所述视频采集装置固定于项圈一端,视频采集装置中的微型摄像头可通过旋转调整角度,获取前方图像并通过计算机视觉技术进行识别,并将图像的分析结果通过耳机和麦克风与佩戴者交互;本装置是一种便携的图像实时采集分析装置,通过语音与佩戴者交互,从而实现多种场景的应用。

Description

一种具有计算机视觉的智能耳机装置
技术领域
本发明涉及计算机视觉领域,具体是一种具有计算机视觉的智能耳机装置。
背景技术
随着以深度学习为代表的人工智能技术的兴起,计算机视觉技术发展迅速,通过神经网络算法,能够让计算机捕捉图像特征信息,实现图像分类、目标检测的功能,目前,以ResNet为代表的神经网络结构,识别准确率已经超过95%,相比传统特征识别方法,人工智能技术已经取得了巨大的进步。
目前市场上已具有的计算机视觉方案,采用人脸识别、智能识物的功能,应用于手机解锁、手机智能拍照,技术成熟,但需要借助手机为载体,是人与设备短暂的信息交换,缺少交互式场景,应用单一,且没有便携式结构帮助人们解脱双手。
耳机是一对转换单元,通过连接现有智能设备,接受媒体播放器的电信号,转化为声信号播放,可有效隔离环境噪音,在多场景下应用,给人良好的听觉体验。以蓝牙耳机为代表的无线耳机,帮助使用者免除了线的牵制,凭借其便捷性,用户需求仍处于上升期。目前市场上已具有的无线耳机方案,采用简单便携的结构,虽具有便捷的优势,但算力较低,无法处理复杂数据;功能单一,在旅游、医疗、公益方向应用面窄;缺少智能模块,无法实现视觉识别、目标定位、网络通信的功能。
发明内容
本发明将计算机视觉更好地应用在耳机设备中,实现多功能,所述技术方案如下:
一种具有计算机视觉的智能耳机装置,包括项圈式耳机、视频采集装置、微型计算装置。
进一步的,所述项圈式耳机上安装有微型计算装置和视频采集装置,获取前方图像并通过计算机视觉技术进行识别,并将图像的分析结果通过耳机和麦克风与佩戴者交互。
进一步的,所述视频采集装置包括至少一个微型摄像头,微型摄像头固定于耳机项圈一端引线上,可通过旋转调整角度,获取前方图像。
进一步的,所述微型计算装置安装在项圈式耳机项圈后方,内置蓝牙模块、网络通信模块、微处理器,蓝牙模块用于短距离与手机交互,微型计算装置可通过蓝牙模块或网络通信模块与手机或云服务器进行通信。
本发明与现有的装置相比,有益的效果是采用简单便携的结构,运用智能模块实现图像实时采集分析,通过语音与佩戴者交互,从而实现多种场景的应用。
附图说明
图1是智能耳机装置结构示意图。
图2是是视频采集装置结构示意图。
图3是微型计算装置结构示意图。
具体实施方式
下面结合附图和实施方式对本发明做进一步的描述。
参照图1-3,本发明是一种具有计算机视觉的智能耳机装置,包括项圈式耳机(1)、视频采集装置(3)、微型计算装置(2),项圈式耳机(1)包括项圈式耳机项圈(4)和耳机(11),项圈式耳机项圈(4)内置麦克风(10),可佩戴于颈部;所述微型计算装置(2)安装在项圈式耳机项圈(4)后方,内置蓝牙模块(6)、网络通信模块(7)、微处理器(9),用盖板(5)进行密封;所述视频采集装置(3)固定于项圈式耳机项圈(4)一端,视频采集装置(3)中的微型摄像头(8)可通过旋转调整角度。
参照图1-3,微型计算装置(2)通过中断方式对外界进行监听,声音通过麦克风(10)录入到微型计算装置(2)中的微处理器(9)中,经神经网络的语义分析技术分析声音有效信息,再由微型计算装置(2)驱动视频采集装置(3)、蓝牙模块(6)、耳机(11)或网络通信模块(7),下达相应的指令命令,实现人机交互。
参照图1-2,视频采集装置(3)中的微型摄像头(8)可通过旋转调整角度,微型计算装置(2)驱动视频采集装置(3),获取对应角度实时画面图像,传入神经网络深度学习的模型,检测出画面中的物体信息,并将图像的分析结果通过耳机(11)和麦克风(10)与佩戴者交互。
参照图1-3,微型计算装置(2)内置蓝牙模块(6)、网络通信模块(7)、微处理器(9),蓝牙模块(6)可用于短距离与手机交互,微型计算装置(2)可通过蓝牙模块(6)或网络通信模块(7)与手机或云服务器进行通信,当微处理器(9)驱动网路通信模块(7)后,可以远距离连接联网的智能设备,在连接的过程中,首先通过网络通信模块(7)将画面传送到云服务器,以实现远距离通信。

Claims (10)

1.一种具有计算机视觉的智能耳机装置,包括项圈式耳机(1)、视频采集装置(3)、微型计算装置(2),其特征在于:项圈式耳机(1)上安装有微型计算装置(2)和视频采集装置(3),获取前方图像并通过计算机视觉技术进行识别,并将图像的分析结果通过耳机(11)和麦克风(10)与佩戴者交互。
2.根据权利要求1所述的具有计算机视觉的智能耳机装置,其特征在于:包括项圈式耳机(1)、视频采集装置(3)、微型计算装置(2),视频采集装置(3)可获取前方图像并通过计算机视觉技术进行识别,并将图像的分析结果通过耳机(11)和麦克风(10)与佩戴者交互。
3.根据权利要求1所述的微型计算装置(2),其特征在于:安装在项圈式耳机项圈(4)后方,内置蓝牙模块(6)、网络通信模块(7)、微处理器(9),蓝牙模块(6)用于短距离与手机交互,微型计算装置(2)可通过蓝牙模块(6)或网络通信模块(7)与手机或云服务器进行通信。
4.根据权利要求1所述的视频采集装置(3),其特征在于:包括一个微型摄像头(8),视频采集装置(3)固定于项圈式耳机项圈(4)一端引线上,微型摄像头(8)可通过旋转调整角度,获取前方图像。
5.一种旅游景点识别与解说装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,可识别摄像头前方景点并播报相应解说词。
6.一种导盲装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,可识别前方障碍物并通过语音提醒佩戴者。
7.一种商品价格查询装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,可识别摄像头前商品,通过互联网获取价格,并通过语音播报给佩戴者。
8.一种外文翻译装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,可识别指定外文单词,翻译成中文并通过语音播报给佩戴者。
9.一种外文学习装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,可识别物体,并将对应外文单词通过语音播报给佩戴者。
10.一种远程协助装置,包括如权利要求1所述的具有计算机视觉的智能耳机装置,协助者可远程获取摄像头的图像,并通过语音给佩戴者提供协助信息或指令。
CN202010744282.1A 2020-07-29 2020-07-29 一种具有计算机视觉的智能耳机装置 Pending CN112073866A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010744282.1A CN112073866A (zh) 2020-07-29 2020-07-29 一种具有计算机视觉的智能耳机装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010744282.1A CN112073866A (zh) 2020-07-29 2020-07-29 一种具有计算机视觉的智能耳机装置

Publications (1)

Publication Number Publication Date
CN112073866A true CN112073866A (zh) 2020-12-11

Family

ID=73656238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010744282.1A Pending CN112073866A (zh) 2020-07-29 2020-07-29 一种具有计算机视觉的智能耳机装置

Country Status (1)

Country Link
CN (1) CN112073866A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113630680A (zh) * 2021-07-22 2021-11-09 深圳市易万特科技有限公司 一种耳机音频视频交互系统、方法及智能头戴式耳机

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104983511A (zh) * 2015-05-18 2015-10-21 上海交通大学 针对全盲视觉障碍者的语音帮助智能眼镜系统
CN106685929A (zh) * 2016-12-06 2017-05-17 南京金雀智能科技有限公司 基于可穿戴式蓝牙视频耳机的通信处理系统及方法
CN208623868U (zh) * 2018-06-19 2019-03-19 信利光电股份有限公司 一种耳机

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104983511A (zh) * 2015-05-18 2015-10-21 上海交通大学 针对全盲视觉障碍者的语音帮助智能眼镜系统
CN106685929A (zh) * 2016-12-06 2017-05-17 南京金雀智能科技有限公司 基于可穿戴式蓝牙视频耳机的通信处理系统及方法
CN208623868U (zh) * 2018-06-19 2019-03-19 信利光电股份有限公司 一种耳机

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113630680A (zh) * 2021-07-22 2021-11-09 深圳市易万特科技有限公司 一种耳机音频视频交互系统、方法及智能头戴式耳机

Similar Documents

Publication Publication Date Title
CN104410883B (zh) 一种移动可穿戴非接触式交互系统与方法
CN104983511A (zh) 针对全盲视觉障碍者的语音帮助智能眼镜系统
CN107230476A (zh) 一种自然的人机语音交互方法和系统
CN106205293A (zh) 用于语音识别和手语识别的智能眼镜
CN102932212A (zh) 一种基于多通道交互方式的智能家居控制系统
WO2017092396A1 (zh) 一种虚拟现实交互系统及方法
CN109147787A (zh) 一种智能电视声控识别系统及其识别方法
CN210090827U (zh) 一种轻便化的ar眼镜实现系统
WO2021013043A1 (zh) 虚拟现实场景中的交互方法及装置
WO2019100915A1 (zh) 一种脑电控制的视频输入听觉显示导盲装置及方法
CN206179323U (zh) 用于语音识别和手语识别的智能眼镜
CN115620727B (zh) 音频处理方法、装置、存储介质及智能眼镜
CN115620728B (zh) 音频处理方法、装置、存储介质及智能眼镜
CN115480923A (zh) 一种多模态的智慧教室边缘计算控制系统
CN112073866A (zh) 一种具有计算机视觉的智能耳机装置
WO2022048455A1 (zh) 一种基于增强现实技术的信息无障碍系统及方法
US20230239800A1 (en) Voice Wake-Up Method, Electronic Device, Wearable Device, and System
CN110271017A (zh) 一种机器人装置
CN111081120A (zh) 一种协助听说障碍人士交流的智能穿戴设备
CN218045797U (zh) 一种盲人穿戴智慧云眼镜及系统
WO2023109862A1 (zh) 视频播放中协同播放音频的方法及通信系统
CN111985252A (zh) 对话翻译方法及装置、存储介质和电子设备
CN208299890U (zh) 一种头戴式远程协助装置
CN208905094U (zh) 一种基于kinect的会议内容控制系统
CN110597122A (zh) 一种嵌入式多媒体的控制系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201211