CN112380972A - 一种应用于电视场景的音量调节方法 - Google Patents

一种应用于电视场景的音量调节方法 Download PDF

Info

Publication number
CN112380972A
CN112380972A CN202011261065.3A CN202011261065A CN112380972A CN 112380972 A CN112380972 A CN 112380972A CN 202011261065 A CN202011261065 A CN 202011261065A CN 112380972 A CN112380972 A CN 112380972A
Authority
CN
China
Prior art keywords
user
information
face
angle
television
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011261065.3A
Other languages
English (en)
Other versions
CN112380972B (zh
Inventor
高岚
谢涛
邹军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN202011261065.3A priority Critical patent/CN112380972B/zh
Publication of CN112380972A publication Critical patent/CN112380972A/zh
Application granted granted Critical
Publication of CN112380972B publication Critical patent/CN112380972B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/4223Cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种应用于电视场景的音量调节方法,包括实时获取用户画面,调用预先训练完毕的人脸检测模型和人脸关键点检测模型对用户画面进行检测识别,得到用户人脸信息;根据用户人脸信息,判断用户是否在观看电视;对用户画面进行单帧和多帧处理,获取用户的当前状态信息,包括位置距离信息、位置角度信息和场景信息;根据所获得的用户当前状态信息,对电视机的音量进行调节。本发明的技术方案对用户画面进行单帧和多帧相结合的处理方式,并根据用户位置的距离和角度,以及用户的状态场景,自动为用户调节舒适的音量,让智能电视更加智能,并提高了智能电视音量调节的快捷性和准确性,从而提升了用户体验度。

Description

一种应用于电视场景的音量调节方法
技术领域
本发明涉及图像处理技术领域,特别涉及一种应用于电视场景的音量调节方法。
背景技术
AI技术的大力发展推动了各行业智能化的发展进程,硬件、算法与数据共同发展,使得AI技术在各行各业获得越来越广泛的应用。在电视领域中,更是利用AI技术为电视赋予更多的能力。如何提升用户的电视场景交互体验,如何为用户提供更加智能便捷的服务,一直都是重点研究的方向。
在电视观看过程中,电视画面和声音是影响用户观影体验的两个重要因素。当前大多数用户调节声音,主要还是通过遥控器端或者语音来操控音量的调节,这两种方式都是用户根据自身或者周边环境的实际情况来主动操控音量。电视端如何根据用户情况主动为用户调节音量,成为了研究方向。基于这样的目的,电视自动调节音量技术近几年也开始发展,一种基于外界环境,如外部噪声、来电通话等语音场景来判断;一种基于电视内部数据,如预设表单、节目类型等等。AI技术更多在第一种基于外界环境的自动调节音量技术上赋予更多的能力。
在基于外界环境中,一种是基于图像技术,通过计算图像中人物的方向和相对距离进行声音调节,这种方式会计算多帧图像来获取位置信息数据,实时性稍差,同时忽略了用户的一些场景,如聊天场景、通话场景;另一种是基于语音技术,分析语音场景,根据不同场景调节音量,当用户在安静情况下,无法自动调节音量。因此,现有的电视音量调节方法存在不能自动进行调节、以及不能够进行及时、有效调节的缺点。
发明内容
为解决现有技术中存在的问题,本发明的目的是提供一种应用于电视场景的音量调节方法,在图像技术的基础上,利用单帧图像及多帧图像处理,获取用户的位置距离信息、位置角度信息和场景信息,并通过获取的相应信息为用户自动调节并恢复音量,从而提高用户体验度。
为实现上述目的,本发明采用的技术方案是:
一种应用于电视场景的实时智能音量调节方法,包括
实时获取用户画面,调用预先训练完毕的人脸检测模型和人脸关键点检测模型对用户画面进行检测识别,得到用户人脸信息;根据用户人脸信息,判断用户是否在观看电视;对用户画面进行单帧和多帧处理,获取用户的当前状态信息,包括位置距离信息、位置角度信息和场景信息;根据所获得的用户当前状态信息,对电视机的音量进行调节。
进一步地,所述用户人脸信息包括人脸位置坐标、人脸关键点坐标和姿态角的角度数据。
进一步地,所述姿态角包括航向角、俯仰角和横滚角。
进一步地,所述判断用户是否在观看电视的方法为:预先设置航向角和俯视角的阈值,当检测到所述用户人脸信息的航向角和俯视角均小于该阈值时,则判定用户在观看电视。
进一步地,所述方法中,对用户画面进行单帧处理时,通过人脸宽度、瞳距与距离之间的比例关系,利用用户人脸信息计算用户的位置距离信息。
进一步地,所述方法中,对用户画面进行单帧处理时,通过相机成像原理进行标定获得用户的位置角度信息。
进一步地,通过所述相机成像原理对用户的位置角度信息进行标定的公式为:
cmos=pix_x/screen_width*camera_x (公式一)
其中,cmos为用户在相机感光元器件的成像位置;pix_x为用户在屏幕中显示的位置;screen_width—屏幕的宽度;camera_x为相机固件中的成像尺寸;
angle=arctan(cmos/J) (公式二)
angle为用户相对于相机的位置角度;J为相机焦距;
通过上述公式计算出用户的位置角度信息。
进一步地,所述方法中,当用户的场景信息为说话场景时,获取用户语音信息,根据所获取的用户语音信息判断用户是否处于该场景,并根据场景所对应的用户当前状态对电视机的音量进行自动调节。
进一步地,所述人脸关键点检测模型为卷积神经网络,该神经网络的训练过程包括以下步骤:
步骤A、针对神经网络输入特点,收集预设数量的人脸图像样本;
步骤B、对每一张人脸图像样本,通过软件和人工处理提取出人脸106个关键点信息;
步骤C、针对所获取的图像样本及其样本信息,将其生成tensorflow支持的tfrecord格式的训练文件和验证文件;
步骤D、利用训练文件对模型进行训练,以生成预先确定的人脸关键点检测模型,并利用验证文件对生成的人脸关键点检测模型进行验证;
步骤E、对模型loss至和预设阈值进行比较,若模型loss未下降到预设阈值,则增加人脸图像样本,或者调试模型参数,重复步骤A-D;若模型loss下降到预设阈值,或者训练步数达到一定的步数,则训练完成。
本发明的有益效果是:
本发明在用户观影过程中,根据用户位置的距离和角度,以及用户的状态场景,自动为用户调节舒适的音量,让智能电视更加智能,从而增加用户体验的乐趣。且对用户画面进行单帧和多帧相结合的处理方式,利用一帧图像获取用户位置信息数据,达到毫秒级响应,解决现有的基于图像调节音量的延迟性问题,进一步提升自动调节的精度;利用多帧图像判断用户的当前场景,利用多模态的信息数据,为用户自动调节音量,从而提高电视音量调节的智能化、及快捷准确性。
附图说明
图1为本发明实施例应用于电视场景的音量调节方法的流程图。
图2为本发明实施例相机成像原理示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。
下面结合附图1-2对本发明的具体实施方式进行说明。
如图1所示,本发明实施例提供了一种应用于电视场景的音量调节方法,对用户图像信息进行图像处理,判断当前用户的位置信息和观影场景,自动调节电视音量的技术。通过图像识别技术获取用户人脸信息,包括人脸位置、人脸关键点坐标、人脸姿态角信息。通过这些信息,我们可以在单帧图像数据上计算出人物与电视之间的角度信息、距离信息,另在连续多帧图像数据上判断用户的嘴部动作,进而判断用户是否在聊天或者通话这样的简单场景,根据判断结果对电视音量进行调节并恢复。该方法具体包括以下步骤:
步骤S101、实时获取用户画面,调用预先训练完毕的人脸检测模型和人脸关键点检测模型对用户画面进行检测识别,得到用户人脸信息。
通过电视机上的摄像头持续获取1080P(1920*1080)的用户画面图像,调用预先训练完毕的人脸检测模型和人脸关键点检测模型对用户画面进行检测识别,实时得到用户的人脸信息,包括用户的人脸位置坐标、人脸106点关键点坐标和三个姿态角的角度数据,其中,三个姿态角包括航向角、俯仰角和横滚角。
步骤S102、根据用户人脸信息,判断用户是否在观看电视。
预先设置航向角和俯视角的阈值,当检测到所述用户人脸信息的航向角和俯视角均小于该阈值时,则判定用户在观看电视;若否,则判定用户未在观看电视,则返回步骤S101,重新对用户画面进行获取。本实施例通过对姿态角进行分析,得出用户面部是否朝向电视,即是否在观看电视。在这个前提下,对人脸数据进行分析,判断用户状态。
本方法中,系统分为单帧图像处理和多帧图像处理,分别处理用户不同的当前状态信息,并根据用户当前状态信息,对电视机的音量进行调节。本实施例仅对电视的音量进行调节,而音效不变。
步骤S103、对用户画面进行单帧处理,计算用户的位置距离信息和位置角度信息,根据计算结果对电视机的音量进行调节。
利用位置距离信息和位置角度信息调节音量;通过多次试验中得到的人脸宽度、瞳距与距离之间的比例关系,直接利用人脸大小和瞳距数据,计算出用户的位置距离信息。在已知摄像头的焦距、成像面积和镜头角度范围后,根据如图2所示的相机成像原理便可标定用户位置,确定用户位置角度信息。
相对位置的计算公式如式1-1、1-2所示。
cmos=pix_x/screen_width*camera_x (1-1)
式1-1中,
cmos—用户在相机感光元器件的成像位置;
pix_x–用户在屏幕中显示的位置;
screen_width—屏幕的宽度;
camera_x—相机固件中的成像尺寸。
angle=arctan(cmos/J) (1-2)
式1-2中,
angle—用户相对于相机的位置(用角度来表示);
J—相机焦距。
通过以上公式,可计算出用户的位置角度信息。
得到用户位置和距离后,再通过简单的逻辑关系判断处理,调节两侧的喇叭音量。即,用户距离越近,两侧喇叭音量越小;用户位置越靠近哪侧喇叭,哪侧的喇叭音量降低,另一侧的音量提高。另外,通过实时获取用户画面,对用户的位置和距离进行检测,判断用户是否移动位置,若是,则根据用户位置分别调节两侧喇叭的音量;若否,则进入步骤S104,判断用户是否处于聊天或通话的说话场景。
步骤S104、对用户画面进行多帧处理,检测用户当前场景,根据所检测用户场景对电视机的音量进行调节。利用场景信息调节音量,场景信息的判断需要多帧处理,系统通过说话检测应用服务,对人脸的脸部轮廓和嘴部的关键点数据进行计算比对,分析判断当前用户的嘴部行为:打哈欠、吃东西以及说话。
如图1所示,现以说话场景的处理过程进行说明,当用户的场景信息为说话场景时,获取用户语音信息,根据所获取的用户语音信息判断用户是否处于该场景;若是,则将音量调低一级,若否,则不进行音量调整。例如,当说话检测应用服务发出用户说话的数据信号,同时系统的麦克设备检测到用户语音信息,则表示用户处在通话或者聊天的说话场景中,系统的喇叭模块在接收到相关信号后将喇叭音量调低一级。另外,当检测到结束通话或聊天,系统自动将喇叭音量进行恢复。如果在未恢复音量过程中,用户通过遥控器或者语音触发音量调节,系统则响应用户主动的音量调节。
在本实施例中,所述步骤S102中,调用预先训练完毕的人脸检测模型和人脸关键点检测模型对用户画面进行检测识别;其预先训练完毕的人脸关键点检测模型为卷积神经网络,基础网络采用基于tensorflow的mobilenet神经网络。该神经网络的训练过程如下:
A、针对神经网络输入特点,收集预设数量的人脸图像样本,例如,收集整理约10w张人脸图像样本,统一设置成224*224*3的图像大小;
B、对每一张人脸图像样本,通过软件和人工处理提取出人脸106个关键点信息;提取出人脸关键点信息以及图像样本本身的图像大小和图像格式等信息;
C、针对上述两步获取的图像样本及其样本信息,将其生成tensorflow支持的tfrecord格式的训练文件和验证文件,训练文件和验证文件的图像数据不同,但其存储的图像格式和图像信息格式相同。
D、利用训练文件对模型进行训练,以生成预先确定的人脸关键点检测模型,并利用验证文件对生成的人脸关键点检测模型进行验证;
E、若模型loss未下降到预设阈值0.1时,则增加人脸图像样本,或者调试模型参数,重复执行上述步骤A、B、C、D、E,直到训练完成。
F、若模型loss下降到预设阈值,或者训练步数达到一定的步数,则训练完成,例如,设置预设阈值为0.1,预设步数为2万步,当达到其预设数值时,完成训练。
本实施例中,预先训练完毕的人脸检测模型的训练过程,同上述人脸关键点检测模型的训练过程,现不进行赘述。
通过本发明的一种应用于电视场景的实时智能音量调节方法,在用户观影过程中,根据用户位置的距离和角度,以及用户的状态场景,自动为用户调节舒适的音量,让Android智能电视更加智能,更能增加用户体验的乐趣。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (9)

1.一种应用于电视场景的音量调节方法,其特征在于,包括
实时获取用户画面,调用预先训练完毕的人脸检测模型和人脸关键点检测模型对用户画面进行检测识别,得到用户人脸信息;
根据用户人脸信息,判断用户是否在观看电视;
对用户画面进行单帧和多帧处理,获取用户的当前状态信息,包括位置距离信息、位置角度信息和场景信息;
根据所获得的用户当前状态信息,对电视机的音量进行调节。
2.根据权利要求1所述的方法,其特征在于,所述用户人脸信息包括人脸位置坐标、人脸关键点坐标和姿态角的角度数据。
3.根据权利要求2所述的方法,其特征在于,所述姿态角包括航向角、俯仰角和横滚角。
4.根据权利要求3所述的方法,其特征在于,所述判断用户是否在观看电视的方法为:预先设置航向角和俯视角的阈值,当检测到所述用户人脸信息的航向角和俯视角均小于该阈值时,则判定用户在观看电视。
5.根据权利要求1所述的方法,其特征在于,所述方法中,对用户画面进行单帧处理时,通过人脸宽度、瞳距与距离之间的比例关系,利用用户人脸信息计算用户的位置距离信息。
6.根据权利要求1所述的方法,其特征在于,所述方法中,对用户画面进行单帧处理时,通过相机成像原理进行标定获得用户的位置角度信息。
7.根据权利要求6所述的方法,其特征在于,通过所述相机成像原理对用户的位置角度信息进行标定的公式为:
cmos=pix_x/screen_width*camera_x (公式一)
其中,cmos为用户在相机感光元器件的成像位置;pix_x为用户在屏幕中显示的位置;screen_width—屏幕的宽度;camera_x为相机固件中的成像尺寸;
angle=arctan(cmos/J) (公式二)
angle为用户相对于相机的位置角度;J为相机焦距;
通过上述公式计算出用户的位置角度信息。
8.根据权利要求1所述的方法,其特征在于,所述方法中,当用户的场景信息为说话场景时,获取用户语音信息,根据所获取的用户语音信息判断用户是否处于该场景,并根据场景所对应的用户当前状态对电视机的音量进行自动调节。
9.根据权利要求1所述的方法,其特征在于,所述人脸关键点检测模型为卷积神经网络,该神经网络的训练过程包括以下步骤:
步骤A、针对神经网络输入特点,收集预设数量的人脸图像样本;
步骤B、对每一张人脸图像样本,通过软件和人工处理提取出人脸106个关键点信息;
步骤C、针对所获取的图像样本及其样本信息,将其生成tensorflow支持的tfrecord格式的训练文件和验证文件;
步骤D、利用训练文件对模型进行训练,以生成预先确定的人脸关键点检测模型,并利用验证文件对生成的人脸关键点检测模型进行验证;
步骤E、对模型loss至和预设阈值进行比较,若模型loss未下降到预设阈值,则增加人脸图像样本,或者调试模型参数,重复步骤A-D;若模型loss下降到预设阈值,或者训练步数达到一定的步数,则训练完成。
CN202011261065.3A 2020-11-12 2020-11-12 一种应用于电视场景的音量调节方法 Active CN112380972B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011261065.3A CN112380972B (zh) 2020-11-12 2020-11-12 一种应用于电视场景的音量调节方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011261065.3A CN112380972B (zh) 2020-11-12 2020-11-12 一种应用于电视场景的音量调节方法

Publications (2)

Publication Number Publication Date
CN112380972A true CN112380972A (zh) 2021-02-19
CN112380972B CN112380972B (zh) 2022-03-15

Family

ID=74583108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011261065.3A Active CN112380972B (zh) 2020-11-12 2020-11-12 一种应用于电视场景的音量调节方法

Country Status (1)

Country Link
CN (1) CN112380972B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112904986A (zh) * 2021-03-24 2021-06-04 重庆电子工程职业学院 一种计算机辅助支架
CN113055785A (zh) * 2021-03-29 2021-06-29 珠海格力电器股份有限公司 音量调节方法、系统和装置
CN113099302A (zh) * 2021-04-06 2021-07-09 深圳市通久电子有限公司 一种基于三合一模式的机顶盒及其工作方法
CN113377323A (zh) * 2021-04-30 2021-09-10 荣耀终端有限公司 一种音频控制方法及电子设备
CN113965700A (zh) * 2021-11-26 2022-01-21 四川长虹电器股份有限公司 智能电视场景的自动调节方法及系统
CN113965641A (zh) * 2021-09-16 2022-01-21 Oppo广东移动通信有限公司 音量调节方法及装置、终端及计算机可读存储介质
CN114253502A (zh) * 2021-12-16 2022-03-29 浙江康旭科技有限公司 一种根据人脸特征点计算的动态音量调节方法

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110235807A1 (en) * 2010-03-23 2011-09-29 Panasonic Corporation Audio output device
JP2013005208A (ja) * 2011-06-16 2013-01-07 Panasonic Corp 音量調整システムおよび音量調整方法
CN203859815U (zh) * 2013-12-16 2014-10-01 深圳Tcl新技术有限公司 音频播放电路及电视机
CN104683847A (zh) * 2015-02-04 2015-06-03 四川长虹电器股份有限公司 智能控制音量的电视机与方法
CN105208443A (zh) * 2015-09-21 2015-12-30 合一网络技术(北京)有限公司 一种实现电视音量调节的方法、装置及系统
CN106331371A (zh) * 2016-09-14 2017-01-11 维沃移动通信有限公司 一种音量调节方法及移动终端
CN107329729A (zh) * 2017-06-26 2017-11-07 深圳市泰衡诺科技有限公司 音量调节方法、音量调节装置及终端
CN107613128A (zh) * 2017-09-26 2018-01-19 努比亚技术有限公司 一种音量调节方法、终端及计算机可读存储介质
WO2018040419A1 (zh) * 2016-08-31 2018-03-08 深圳Tcl数字技术有限公司 曲面电视视频播放方法及装置
CN110012258A (zh) * 2019-03-29 2019-07-12 努比亚技术有限公司 最佳音视频感知点获取方法、系统、可穿戴设备及存储介质
CN110113665A (zh) * 2019-04-25 2019-08-09 深圳市国华识别科技开发有限公司 显示设备自动控制方法、装置、计算机设备和存储介质
CN110309799A (zh) * 2019-07-05 2019-10-08 四川长虹电器股份有限公司 基于摄像头的说话判断方法
CN110806849A (zh) * 2019-10-30 2020-02-18 歌尔科技有限公司 智能设备及其音量调节方法和计算机可读存储介质
CN111356008A (zh) * 2018-12-21 2020-06-30 深圳Tcl数字技术有限公司 一种电视音量自动调节方法、智能电视及存储介质
CN111385649A (zh) * 2018-12-28 2020-07-07 深圳Tcl新技术有限公司 一种电视声音传输控制方法、装置、智能电视及存储介质
CN111683177A (zh) * 2020-05-14 2020-09-18 北京小米移动软件有限公司 功能参数调节方法、功能参数调节装置及存储介质
CN111914693A (zh) * 2020-07-16 2020-11-10 上海云从企业发展有限公司 一种人脸姿态调整方法、系统、装置、设备及介质
CN112073804A (zh) * 2020-09-10 2020-12-11 深圳创维-Rgb电子有限公司 电视声音调整方法、电视及存储介质

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110235807A1 (en) * 2010-03-23 2011-09-29 Panasonic Corporation Audio output device
JP2013005208A (ja) * 2011-06-16 2013-01-07 Panasonic Corp 音量調整システムおよび音量調整方法
CN203859815U (zh) * 2013-12-16 2014-10-01 深圳Tcl新技术有限公司 音频播放电路及电视机
CN104683847A (zh) * 2015-02-04 2015-06-03 四川长虹电器股份有限公司 智能控制音量的电视机与方法
CN105208443A (zh) * 2015-09-21 2015-12-30 合一网络技术(北京)有限公司 一种实现电视音量调节的方法、装置及系统
WO2018040419A1 (zh) * 2016-08-31 2018-03-08 深圳Tcl数字技术有限公司 曲面电视视频播放方法及装置
CN106331371A (zh) * 2016-09-14 2017-01-11 维沃移动通信有限公司 一种音量调节方法及移动终端
CN107329729A (zh) * 2017-06-26 2017-11-07 深圳市泰衡诺科技有限公司 音量调节方法、音量调节装置及终端
CN107613128A (zh) * 2017-09-26 2018-01-19 努比亚技术有限公司 一种音量调节方法、终端及计算机可读存储介质
CN111356008A (zh) * 2018-12-21 2020-06-30 深圳Tcl数字技术有限公司 一种电视音量自动调节方法、智能电视及存储介质
CN111385649A (zh) * 2018-12-28 2020-07-07 深圳Tcl新技术有限公司 一种电视声音传输控制方法、装置、智能电视及存储介质
CN110012258A (zh) * 2019-03-29 2019-07-12 努比亚技术有限公司 最佳音视频感知点获取方法、系统、可穿戴设备及存储介质
CN110113665A (zh) * 2019-04-25 2019-08-09 深圳市国华识别科技开发有限公司 显示设备自动控制方法、装置、计算机设备和存储介质
CN110309799A (zh) * 2019-07-05 2019-10-08 四川长虹电器股份有限公司 基于摄像头的说话判断方法
CN110806849A (zh) * 2019-10-30 2020-02-18 歌尔科技有限公司 智能设备及其音量调节方法和计算机可读存储介质
CN111683177A (zh) * 2020-05-14 2020-09-18 北京小米移动软件有限公司 功能参数调节方法、功能参数调节装置及存储介质
CN111914693A (zh) * 2020-07-16 2020-11-10 上海云从企业发展有限公司 一种人脸姿态调整方法、系统、装置、设备及介质
CN112073804A (zh) * 2020-09-10 2020-12-11 深圳创维-Rgb电子有限公司 电视声音调整方法、电视及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WILLIAM T. FREEMAN等: "Television Control by Hand Gestures", 《IEEE INTL. WKSHP. ON AUTOMATIC FACE AND GESTURE RECOGNITION》 *
张丽华: "模糊技术的应用与发展", 《电子工程师》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112904986A (zh) * 2021-03-24 2021-06-04 重庆电子工程职业学院 一种计算机辅助支架
CN113055785A (zh) * 2021-03-29 2021-06-29 珠海格力电器股份有限公司 音量调节方法、系统和装置
CN113099302A (zh) * 2021-04-06 2021-07-09 深圳市通久电子有限公司 一种基于三合一模式的机顶盒及其工作方法
CN113099302B (zh) * 2021-04-06 2021-11-30 深圳市通久电子有限公司 一种基于三合一模式的机顶盒及其工作方法
CN113377323A (zh) * 2021-04-30 2021-09-10 荣耀终端有限公司 一种音频控制方法及电子设备
CN113965641A (zh) * 2021-09-16 2022-01-21 Oppo广东移动通信有限公司 音量调节方法及装置、终端及计算机可读存储介质
WO2023040547A1 (zh) * 2021-09-16 2023-03-23 Oppo广东移动通信有限公司 音量调节方法及装置、终端及计算机可读存储介质
CN113965700A (zh) * 2021-11-26 2022-01-21 四川长虹电器股份有限公司 智能电视场景的自动调节方法及系统
CN114253502A (zh) * 2021-12-16 2022-03-29 浙江康旭科技有限公司 一种根据人脸特征点计算的动态音量调节方法

Also Published As

Publication number Publication date
CN112380972B (zh) 2022-03-15

Similar Documents

Publication Publication Date Title
CN112380972B (zh) 一种应用于电视场景的音量调节方法
US10375296B2 (en) Methods apparatuses, and storage mediums for adjusting camera shooting angle
CN109361865B (zh) 一种拍摄方法及终端
US7555141B2 (en) Video phone
US6545699B2 (en) Teleconferencing system, camera controller for a teleconferencing system, and camera control method for a teleconferencing system
WO2016011747A1 (zh) 肤色调整方法和装置
CN110602401A (zh) 一种拍照方法及终端
CN108628572B (zh) 机器人调节音量的方法、装置、计算机设备和存储介质
CN105653032B (zh) 显示调整方法及装置
WO2017032035A1 (zh) 调节方法、调节装置和终端
JP7162683B2 (ja) 画像ノイズ除去モデルの訓練方法、画像ノイズ除去方法、装置及び媒体
CN102104767A (zh) 具有透视失真校正的脸部姿势改进
CN109936697B (zh) 一种视频拍摄目标跟踪方法和装置
CN106506959A (zh) 照相方法和照相设备
CN107436681A (zh) 自动调节文字的显示大小的移动终端及其方法
CN112532911A (zh) 图像数据处理方法、装置、设备及存储介质
US20130308829A1 (en) Still image extraction apparatus
JP2022133267A (ja) 端末装置、画像切り出し方法、および画像切り出しプログラム
CN111182280A (zh) 一种投影方法、投影装置、音箱设备及存储介质
WO2021147650A1 (zh) 拍照方法、装置、存储介质及电子设备
CN111247787A (zh) 拍照方法及拍照终端
CN110086921B (zh) 终端性能状态的检测方法、装置、便携式终端和存储介质
CN111914785A (zh) 一种提高人脸图像清晰度的方法、装置及存储介质
CN115601316A (zh) 图像处理方法、装置、电子设备及计算机可读存储介质
WO2022007681A1 (zh) 拍摄控制方法、移动终端和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant