CN218526433U - 一种基于人脸关键点定位的音频控制装置 - Google Patents

一种基于人脸关键点定位的音频控制装置 Download PDF

Info

Publication number
CN218526433U
CN218526433U CN202222894301.6U CN202222894301U CN218526433U CN 218526433 U CN218526433 U CN 218526433U CN 202222894301 U CN202222894301 U CN 202222894301U CN 218526433 U CN218526433 U CN 218526433U
Authority
CN
China
Prior art keywords
operational amplifier
resistor
amplification circuit
key point
face key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202222894301.6U
Other languages
English (en)
Inventor
黄海涛
宋春华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xihua University
Original Assignee
Xihua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xihua University filed Critical Xihua University
Priority to CN202222894301.6U priority Critical patent/CN218526433U/zh
Application granted granted Critical
Publication of CN218526433U publication Critical patent/CN218526433U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Stereophonic System (AREA)

Abstract

本实用新型公开了一种基于人脸关键点定位的音频控制装置,主要涉及一种通过神经网络算法预测人脸关键点坐标,然后根据图像几何关系判断出头部运动情况,如左倾、右倾、上仰、下仰,最后根据头部运动情况控制音频强弱、播放顺序的音频控制装置。包括单片机最小系统、电源模块、通讯模块、显示模块、摄像头、人脸关键点检测模块、音频放大电路、喇叭。所述音频放大电路为一个双声道放大电路,通过控制可编程电阻控制声音强弱,本实用新型有益效果在于:可不用手动控制音频强弱、播放顺序,提高了自动化程度,特别是为不方便使用手动控制的情况或者人提供便利。

Description

一种基于人脸关键点定位的音频控制装置
技术领域
本实用新型专利涉及一种基于人脸关键点定位的音频控制装置,具体是一种利用人脸关键点检测模块估计人脸姿态并将估计结果传递给单片机芯片,并通过单片机芯片控制左右声道音频放大电路进而控制音频强弱、播放顺序的音频控制装置。
背景技术
目前控制音频强弱、播放顺序的方式通过手动按按钮的方式,当使用人在不方便或者有手部残疾的情况下这种方式体现出了不便性甚至无法使用。中国发明专利申请号为CN201510813273.2中,公开了一种人脸姿态估计方法及装置,此装置利用人脸关键点,判断图像几何关系进而估计出人脸姿态,利用此装置作为本实用新型人脸关键点检测模块并将估计结果传递给单片机芯片,并通过单片机芯片控制左右声道音频放大电路进而控制音频强弱、播放顺序则很大程度解决了上述不便性,且装置识别准确度较高,结构较为简单,成本低,便于维护。
实用新型内容
本实用新型目的在于提供一种基于人脸关键点定位的音频控制装置,它能利用人脸关键点检测模块估计人脸姿态并将估计结果传递给单片机芯片,并通过单片机芯片控制左右声道音频放大电路进而控制音频强弱、播放顺序。
本实用新型为实现上述目的,通过以下技术方案实现:
一种基于人脸关键点定位的音频控制装置,包括单片机最小系统(1)、电源模块(2)、通讯模块(3)、显示模块(4)、摄像头(5)、人脸关键点检测模块(6)、音频放大电路(7)、喇叭(8);其特征是:所述音频放大电路(7)为5V供电,包括左声道音频放大电路(75)和右声道音频放大电路(76),所述左声道音频放大电路(75)包括运算放大器OP1(71)和运算放大器OP2(72),所述运算放大器OP1(71)输出端通过电阻R2引入反馈接运算放大器OP1(71)负极和电阻R1,电阻R1接旁路电容C1,C1接左声道信号源Vil,所述运算放大器OP1(71)输出端接旁路电容C2,C2连接电阻R3,所述运算放大器OP2(72)输出端通过电阻R4引入反馈接运算放大器OP2(72)负极和电阻R3,R3阻值与R4相同,所述运算放大器OP2(72)输出端通过一个旁路电容C4接左声道喇叭(81),所述运算放大器OP2(72)正极接电阻R5、R6、旁路电容C3,改变R5的阻值可改善失真度, R2为可编程电阻,通过改变R2的阻值可改变左声道音频放大电路(75)的放大倍数,所述右声道音频放大电路(76)包括运算放大器OP3(73)和运算放大器OP4(74),所述运算放大器OP3(73)输出端通过电阻R8引入反馈接运算放大器OP3(73)负极和电阻R7,电阻R7接旁路电容C5,C5接右声道信号源Vir,所述运算放大器OP3(73)输出端接旁路电容C6,C6连接电阻R9,所述运算放大器OP4(74)输出端通过电阻R10引入反馈接运算放大器OP4(74)负极和电阻R9,R9阻值与R10相同,所述运算放大器OP4(74)输出端通过一个旁路电容C8接右声道喇叭(82),所述运算放大器OP4(74)正极接电阻R11、R12、旁路电容7,改变R11的阻值可改善失真度, R8为可编程电阻,通过改变R8的阻值可改变右声道音频放大电路(76)的放大倍数,所述单片机最小系统(1)用于运算关键点几何关系以及提供音频信号,所述电源模块(2)为装置提供稳定的5V直流电源,所述通讯模块(3)用于下载程序设备间的通讯,所述显示模块(4)用于显示装置状态以及运算结果,所述人脸关键点检测模块(6)用于人脸关键点预测,并把坐标数据返回给单片机最小系统(1)。
所述通讯模块(3)还包括蓝牙,用于将转换后的数据上传至手机APP中。
所述显示模块(4)为LED显示器。
所述单片机最小系统(1)包括音频输出功能以及存储功能。
所述左声道音频放大电路(75)和右声道音频放大电路(76)中的电容均为大电容,左声道信号源接左声道音频放大电路(75)信号源输入端Vil,右声道信号源接右声道音频放大电路(76)信号源输入端Vir。
附图说明
图1是本实用新型总体结构框图;
图2是音频放大电路结构图;
图3是音频放大电路电气原理图。
附图中标号:1、单片机最小系统;2、电源模块;3、通讯模块;4、显示模块;5、摄像头;6、人脸关键点检测模块;7、音频放大电路;8、喇叭;71、运算放大器OP1;72、运算放大器OP2;73、运算放大器OP3;74、运算放大器OP4;75、左声道音频放大电路;76、右声道音频放大电路。
具体实施方式
下面结合具体实施例,进一步阐述本实用新型。应理解,这些实施例仅用于说明本实用新型而不用于限制本实用新型的范围。此外应理解,在阅读了本实用新型讲授的内容之后,本领域技术人员可以对本实用新型作各种改动或修改,这些等价形式同样落于本申请所限定的范围。
一种基于人脸关键点定位的音频控制装置,包括单片机最小系统(1)、电源模块(2)、通讯模块(3)、显示模块(4)、摄像头(5)、人脸关键点检测模块(6)、音频放大电路(7)、喇叭(8);其特征是:所述音频放大电路(7)为5V供电,包括左声道音频放大电路(75)和右声道音频放大电路(76),所述左声道音频放大电路(75)包括运算放大器OP1(71)和运算放大器OP2(72),所述运算放大器OP1(71)输出端通过电阻R2引入反馈接运算放大器OP1(71)负极和电阻R1,电阻R1接旁路电容C1,C1接左声道信号源Vil,所述运算放大器OP1(71)输出端接旁路电容C2,C2连接电阻R3,所述运算放大器OP2(72)输出端通过电阻R4引入反馈接运算放大器OP2(72)负极和电阻R3,R3阻值与R4相同,所述运算放大器OP2(72)输出端通过一个旁路电容C4接左声道喇叭(81),所述运算放大器OP2(72)正极接电阻R5、R6、旁路电容C3,改变R5的阻值可改善失真度, R2为可编程电阻,通过改变R2的阻值可改变左声道音频放大电路(75)的放大倍数,所述右声道音频放大电路(76)包括运算放大器OP3(73)和运算放大器OP4(74),所述运算放大器OP3(73)输出端通过电阻R8引入反馈接运算放大器OP3(73)负极和电阻R7,电阻R7接旁路电容C5,C5接右声道信号源Vir,所述运算放大器OP3(73)输出端接旁路电容C6,C6连接电阻R9,所述运算放大器OP4(74)输出端通过电阻R10引入反馈接运算放大器OP4(74)负极和电阻R9,R9阻值与R10相同,所述运算放大器OP4(74)输出端通过一个旁路电容C8接右声道喇叭(82),所述运算放大器OP4(74)正极接电阻R11、R12、旁路电容7,改变R11的阻值可改善失真度, R8为可编程电阻,通过改变R8的阻值可改变右声道音频放大电路(76)的放大倍数,所述单片机最小系统(1)用于运算关键点几何关系以及提供音频信号,所述电源模块(2)为装置提供稳定的5V直流电源,所述通讯模块(3)用于下载程序设备间的通讯,所述显示模块(4)用于显示装置状态以及运算结果,所述人脸关键点检测模块(6)用于人脸关键点预测,并把坐标数据返回给单片机最小系统(1)。所述通讯模块(3)还包括蓝牙,用于将转换后的数据上传至手机APP中。所述显示模块(4)为LED显示器。所述单片机最小系统(1)包括音频输出功能以及存储功能。所述左声道音频放大电路(75)和右声道音频放大电路(76)中的电容均为大电容,左声道信号源接左声道音频放大电路(75)信号源输入端Vil,右声道信号源接右声道音频放大电路(76)信号源输入端Vir。
应用本实施例包括以下步骤:
1、开机:
开启电源开关,等待系统初始化。
2、开始运行:
将摄像头对准人脸,装置根据人脸关键点自动运算,判断出头部动作,如:左倾、右倾、上仰、下仰,如果头部左倾播放上一首音频,头部右倾播放下一首音频,上仰放大音量,下仰减小音量。

Claims (5)

1.一种基于人脸关键点定位的音频控制装置,包括单片机最小系统(1)、电源模块(2)、通讯模块(3)、显示模块(4)、摄像头(5)、人脸关键点检测模块(6)、音频放大电路(7)、喇叭(8);其特征是:所述音频放大电路(7)为5V供电,包括左声道音频放大电路(75)和右声道音频放大电路(76),所述左声道音频放大电路(75)包括运算放大器OP1(71)和运算放大器OP2(72),所述运算放大器OP1(71)输出端通过电阻R2引入反馈接运算放大器OP1(71)负极和电阻R1,电阻R1接旁路电容C1,C1接左声道信号源Vil,所述运算放大器OP1(71)输出端接旁路电容C2,C2连接电阻R3,所述运算放大器OP2(72)输出端通过电阻R4引入反馈接运算放大器OP2(72)负极和电阻R3,R3阻值与R4相同,所述运算放大器OP2(72)输出端通过一个旁路电容C4接左声道喇叭(81),所述运算放大器OP2(72)正极接电阻R5、R6、旁路电容C3,改变R5的阻值可改善失真度,R2为可编程电阻,通过改变R2的阻值可改变左声道音频放大电路(75)的放大倍数,所述右声道音频放大电路(76)包括运算放大器OP3(73)和运算放大器OP4(74),所述运算放大器OP3(73)输出端通过电阻R8引入反馈接运算放大器OP3(73)负极和电阻R7,电阻R7接旁路电容C5,C5接右声道信号源Vir,所述运算放大器OP3(73)输出端接旁路电容C6,C6连接电阻R9,所述运算放大器OP4(74)输出端通过电阻R10引入反馈接运算放大器OP4(74)负极和电阻R9,R9阻值与R10相同,所述运算放大器OP4(74)输出端通过一个旁路电容C8接右声道喇叭(82),所述运算放大器OP4(74)正极接电阻R11、R12、旁路电容C7,改变R11的阻值可改善失真度,R8为可编程电阻,通过改变R8的阻值可改变右声道音频放大电路(76)的放大倍数,所述单片机最小系统(1)用于运算关键点几何关系以及提供音频信号,所述电源模块(2)为装置提供稳定的5V直流电源,所述通讯模块(3)用于下载程序设备间的通讯,所述显示模块(4)用于显示装置状态以及运算结果,所述人脸关键点检测模块(6)用于人脸关键点预测,并把坐标数据返回给单片机最小系统(1)。
2.根据权利要求1所述的一种基于人脸关键点定位的音频控制装置,其特征是:所述通讯模块(3)还包括蓝牙,用于将转换后的数据上传至手机APP中。
3.根据权利要求1所述的一种基于人脸关键点定位的音频控制装置,其特征是:所述显示模块(4)为LED显示器。
4.根据权利要求1所述的一种基于人脸关键点定位的音频控制装置,其特征是:所述单片机最小系统(1)包括音频输出功能以及存储功能。
5.根据权利要求1所述的一种基于人脸关键点定位的音频控制装置,其特征是:所述左声道音频放大电路(75)和右声道音频放大电路(76)中的电容均为大电容,左声道信号源接左声道音频放大电路(75)信号源输入端Vil,右声道信号源接右声道音频放大电路(76)信号源输入端Vir。
CN202222894301.6U 2022-11-01 2022-11-01 一种基于人脸关键点定位的音频控制装置 Active CN218526433U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202222894301.6U CN218526433U (zh) 2022-11-01 2022-11-01 一种基于人脸关键点定位的音频控制装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202222894301.6U CN218526433U (zh) 2022-11-01 2022-11-01 一种基于人脸关键点定位的音频控制装置

Publications (1)

Publication Number Publication Date
CN218526433U true CN218526433U (zh) 2023-02-24

Family

ID=85251122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202222894301.6U Active CN218526433U (zh) 2022-11-01 2022-11-01 一种基于人脸关键点定位的音频控制装置

Country Status (1)

Country Link
CN (1) CN218526433U (zh)

Similar Documents

Publication Publication Date Title
CN205490994U (zh) 一种多功能智能音响
CN102973404A (zh) 桑拿房或远红外光波房及其控制方法
CN107896355A (zh) Ai音箱的控制方法和装置
CN218526433U (zh) 一种基于人脸关键点定位的音频控制装置
CN205486698U (zh) 基于单片机控制的语音识别寻物系统
CN205829872U (zh) 一种网络门铃
CN211237722U (zh) 一种具有语音识别功能的电动家具遥控系统
EP3910354A1 (en) Power supply on-off detection circuit, method, apparatus and storage medium
CN112506354A (zh) 一种利用戒指操控数码设备的方法以及戒指
CN211427558U (zh) 一种交互投影式远程教育系统
CN111491286A (zh) 一种紧急救助方法、装置及终端
CN213724701U (zh) 具有握力检测功能的电视系统、握力器及电视机
CN202190298U (zh) 带健康测试功能的老人手机的成品电路板
CN210520242U (zh) 一种具有语音交互功能的智能手环
CN111093134B (zh) 耳机控制装置、耳机控制方法以及耳机
CN219122965U (zh) 语音播报的语音识别装置
CN113133741A (zh) 一种肌肤检测方法、装置及肌肤检测仪
CN213458412U (zh) 控制设备和控制系统
CN214846208U (zh) 一种投影仪系统
CN220874258U (zh) 带智能语音遥控及夜间照明功能的移动电源
CN216352759U (zh) 遥控器及电器设备的控制系统
CN216670690U (zh) 智能笔及电子设备组件
CN220173399U (zh) 一种可适用多场所的语音宣传设备
CN212305452U (zh) 图像调节装置
CN212489888U (zh) 关节运动语音提示器

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant