CN112533070A - 视频声音和画面的调整方法、终端和计算机可读存储介质 - Google Patents

视频声音和画面的调整方法、终端和计算机可读存储介质 Download PDF

Info

Publication number
CN112533070A
CN112533070A CN202011299526.6A CN202011299526A CN112533070A CN 112533070 A CN112533070 A CN 112533070A CN 202011299526 A CN202011299526 A CN 202011299526A CN 112533070 A CN112533070 A CN 112533070A
Authority
CN
China
Prior art keywords
video
user
chat
sound
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011299526.6A
Other languages
English (en)
Other versions
CN112533070B (zh
Inventor
王云华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen TCL New Technology Co Ltd
Original Assignee
Shenzhen TCL New Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen TCL New Technology Co Ltd filed Critical Shenzhen TCL New Technology Co Ltd
Priority to CN202011299526.6A priority Critical patent/CN112533070B/zh
Publication of CN112533070A publication Critical patent/CN112533070A/zh
Application granted granted Critical
Publication of CN112533070B publication Critical patent/CN112533070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration

Abstract

本申请公开了一种视频声音和画面的调整方法、终端和计算机可读存储介质,视频声音和画面的调整方法包括:当监测到用户在视频聊天时,获取当前发出语音信号的用户对应的位置坐标;根据位置坐标确定视频声音播放与视频画面显示的方向;根据方向调整视频声音播放与视频画面显示。解决了用户在视频聊天时发生位置变化,未调整视频声音播放与视频画面显示,导致收音效果与播放效果差的技术问题,通过用户所在的方向调整视频声音播放与视频画面显示,提高了收音效果与播放效果。

Description

视频声音和画面的调整方法、终端和计算机可读存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种视频声音和画面的调整方法、终端和计算机可读存储介质。
背景技术
随着智能大屏技术的发展,智能大屏如今不仅仅是用户的影音娱乐工具,也逐渐成为用户的通讯工具,因为智能大屏搭载的各种视频聊天软件与其智能摄像头、麦克风以及扬声器等设备组件相结合,可以为用户提供优质的视频体验。然而,在一些情况下,尤其是春节期间视频拜年时,用户家庭往往会出现在同一视频画面中与视频对象进行交流,这时就容易出现画面中用户的位置不同,而声音播放和声音采集的位置却没有任何变化,导致收音效果差,播放效果差的问题。
发明内容
本申请实施例通过提供一种视频声音和画面的调整方法、终端和计算机可读存储介质,旨在解决了用户在视频聊天时发生位置变化,未调整视频声音播放与视频画面显示,导致收音效果与播放效果差的问题。
为实现上述目的,本申请一方面提供一种视频声音和画面的调整方法,所述视频声音和画面的调整方法包括以下步骤:
当监测到用户在视频聊天时,获取当前发出语音信号的用户对应的位置坐标;
根据所述位置坐标确定视频声音播放与视频画面显示的方向;
根据所述方向调整所述视频声音播放与所述视频画面显示。
可选地,所述根据所述位置坐标确定视频声音播放与视频画面显示的方向的步骤包括:
根据所述位置坐标确定与发出语音信号的用户的距离和角度;
根据所述距离和所述角度确定所述视频声音播放与所述视频画面显示的方向。
可选地,所述获取当前发出语音信号的用户对应的位置坐标的步骤包括:
确定当前发出语音信号的用户个数;
若所述用户个数为单个,则获取单个发出语音信号的用户对应的位置坐标;或者,
若所述用户个数为多个,则获取多个发出语音信号的用户分别对应的位置坐标。
可选地,所述获取多个发出语音信号的用户分别对应的位置坐标的步骤之后,包括:
采集声音信息,根据所述声音信息确定声源位置;
将所述声源位置与多个发出语音信号的用户分别对应的位置坐标进行匹配,确定与所述声源位置在同一方向的位置坐标。
可选地,所述获取单个发出语音信号的用户对应的位置坐标的步骤之后,包括:
检测单个发出语音信号的用户的位置是否发生变化;
若所述位置未发生变化,则在设定时间后执行检测单个发出语音信号的用户的位置是否发生变化的步骤;或者,
若所述位置发生变化,则获取发生变化后的位置坐标。
可选地,所述当监测到用户在视频聊天时,获取当前发出语音信号的用户对应的位置坐标的步骤之前,包括:
采集用户信息,根据所述用户信息确定用户类型,每种所述用户类型设置不同的第一权重值;
确定每种所述用户类型分别对应的视频聊天对象,每类所述视频聊天对象设置不同的第二权重值;
确定每种所述用户类型与每类所述视频聊天对象进行视频聊天时使用的聊天软件,每种所述聊天软件设置不同的第三权重值。
可选地,所述确定每种所述用户类型与每类所述视频聊天对象进行视频聊天时使用的聊天软件,每种所述聊天软件设置不同的第三权重值的步骤之后,包括:
在确定所述用户类型时,获取所述用户类型对应的视频聊天对象;
根据所述用户类型以及所述视频聊天对象确定目标聊天软件,开启所述目标聊天软件进行视频聊天。
可选地,所述确定每种所述用户类型与每类所述视频聊天对象进行视频聊天时使用的聊天软件,每种所述聊天软件设置不同的第三权重值的步骤之后,还包括:
在确定所述用户类型时,获取当前已开启的聊天软件;
获取所述用户类型对应的所述第一权重值以及所述聊天软件对应的所述第三权重值;
根据所述用户类型对应的所述第一权重值以及所述聊天软件对应的所述第三权重值确定目标视频聊天对象,并与所述目标视频聊天对象进行视频聊天。
此外,为实现上述目的,本申请另一方面还提供一种终端,所述终端包括存储器、处理器及存储在所述存储器上并在处理器上运行的视频声音和画面的调整程序,所述处理器执行所述视频声音和画面的调整程序时实现如上所述视频声音和画面的调整方法的步骤。
此外,为实现上述目的,本申请另一方面还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有视频声音和画面的调整程序,所述视频声音和画面的调整程序被处理器执行时实现如上所述视频声音和画面的调整方法的步骤。
本实施例当监测到用户在视频聊天时,获取当前发出语音信号的用户对应的位置坐标;根据位置坐标确定视频声音播放与视频画面显示的方向;根据方向调整视频声音播放与视频画面显示。通过实时获取用户的位置坐标,确定用户位置变化,在用户所在的方向调整视频声音播放与视频画面显示,提高了收音效果与播放效果。
附图说明
图1为本申请实施例方案涉及的硬件运行环境的终端结构示意图;
图2为本申请视频声音和画面的调整方法第一实施例的流程示意图;
图3为本申请视频声音和画面的调整方法第二实施例的流程示意图;
图4为本申请视频声音和画面的调整方法第三实施例的流程示意图;
图5为本申请视频声音和画面的调整方法中获取当前发出语音信号的用户对应的位置坐标的流程示意图;
图6为本申请视频声音和画面的调整方法中获取单个发出语音信号的用户对应的位置坐标的步骤之后的流程示意图;
图7为本申请视频声音和画面的调整方法中获取多个发出语音信号的用户分别对应的位置坐标的步骤之后的流程示意图;
图8为本申请视频声音和画面的调整方法中根据所述位置坐标确定视频声音播放与视频画面显示的方向的流程示意图;
图9为本申请视频声音和画面的调整方法中确定每种所述用户类型与每类所述视频聊天对象进行视频聊天时使用的聊天软件,每种所述聊天软件设置不同的第三权重值的步骤之后的流程示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例的主要解决方案是:当监测到用户在视频聊天时,获取当前发出语音信号的用户对应的位置坐标;根据位置坐标确定视频声音播放与视频画面显示的方向;根据方向调整视频声音播放与视频画面显示。
由于在进行视频聊天时,用户可能会出现走动等现象,使得用户的位置发生变化,而视频声音播放、声音采集以及视频话画面显示的位置却没有任何变化,导致收音效果与播放效果差的问题。本申请当监测到用户在视频聊天时,基于雷达对发出语音信号的用户进行定位,获取用户对应的位置坐标;根据位置坐标确定视频声音播放与视频画面显示的方向,根据方向调整视频声音播放与视频画面显示。通过实时获取用户的位置坐标,确定用户位置变化,在用户所在的方向调整视频声音播放与视频画面显示,提高了收音效果与播放效果。
如图1所示,图1为本申请实施例方案涉及的硬件运行环境的终端结构示意图。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、遥控器、音频电路、WiFi模块、检测器等等。当然,所述终端还可配置陀螺仪、气压计、湿度计、温度传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及视频声音和画面的调整程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中视频声音和画面的调整程序,并执行以下操作:
当监测到用户在视频聊天时,获取当前发出语音信号的用户对应的位置坐标;
根据所述位置坐标确定视频声音播放与视频画面显示的方向;
根据所述方向调整所述视频声音播放与所述视频画面显示。
参考图2,图2为本申请视频声音和画面的调整方法第一实施例的流程示意图。
本申请实施例提供了视频声音和画面的调整方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
视频声音和画面的调整方法包括:
步骤S10,当监测到用户在视频聊天时,获取当前发出语音信号的用户对应的位置坐标;
终端在监测到当前用户在进行视频聊天时,启动声画定向传输模块,进行声音控制模块初始化,如对声音算法块初始化,配置参数初始化;在完成声音控制模块初始化后,进行激光雷达驱动初始化以及雷达设备初始化,进一步若雷达驱动初始化成功,则进入用户位置捕捉线程,通过雷达对发出语音信号的用户位置进行定位,并保存检测到的用户位置分布信息坐标。具体地,终端中的雷达定位系统至少包括两个雷达模组,在接收到定位指令时,各雷达模组之间进行校准定位,配合探测目标用户位置信息,并将探测到的目标用户位置信息上传至数据处理中心,由数据处理中心拟合目标用户的信息总图,确定用户的真实位置信息。其中,在数据处理时,以终端所在位置为原点,建立虚拟的三维坐标系,包括X轴、Y轴以及Z轴,将用户的位置信息用三维坐标表示,如用户A(2,3,4)。若雷达驱动初始化失败,则将当前的视频聊天转入普通声音播放模式。其中,在获取用户位置坐标时,需要获取当前发出语音信号的用户个数。因此,参考图5,所述获取当前发出语音信号的用户对应的位置坐标的步骤包括:
步骤S11,确定当前发出语音信号的用户个数;
步骤S12,若所述用户个数为单个,则获取单个发出语音信号的用户对应的位置坐标;或者,
终端在获取用户位置坐标时,需要先确定发出语音信号的用户个数,例如:通过采集当前用户发出的声音信息,对该声音信息进行声纹识别,若获取到一个声纹特征,则说明当前只有一个用户参与视频聊天;若获取到多个不同的声纹特征,则说明当前有多个用户参与视频聊天。又或者是通过对当前视频画面进行人脸识别,确定视频画面中的人脸数量,当识别到的人脸数量等于1时,则说明当前只有一个用户参与视频聊天;当识别到的人脸数量大于1时,则说明当前有多个用户参与视频聊天。
若发出语音信号的用户个数为单个,则基于雷达获取单个发出语音信号的用户对应的位置坐标。其中,若用户使用的是电脑或者电视进行视频聊天,还可以通过用户随身携带的电子设备进行定位,如手机、智能手表等,例如:手机与电脑通过网络连接,电脑获取手机中的定位数据,确定用户当前所在的位置。又或者是终端还可以通过采集用户的声音信息,基于该声音信息进行声源定位,确定用户当前所在的位置。在获取到单个用户的位置坐标后,还需要实时检测用户位置是否发生变化,因此,参考图6,所述获取单个发出语音信号的用户对应的位置坐标的步骤之后,包括:
步骤S120,检测单个发出语音信号的用户的位置是否发生变化;
步骤S121,若所述位置未发生变化,则在设定时间后执行检测单个发出语音信号的用户的位置是否发生变化的步骤;或者,
步骤S122,若所述位置发生变化,则获取发生变化后的位置坐标。
若用户进行的是一对一视频聊天,则终端需要实时检测该用户的位置是否发生变化,若用户的位置未发生变化,则控制雷达睡眠300毫秒之后重复判断用户位置是否发生变化的步骤;若用户的位置发生变化,则获取发生变化后的位置坐标。
步骤S13,若所述用户个数为多个,则获取多个发出语音信号的用户分别对应的位置坐标。
若用户进行的是多对一或者多对多的视频聊天时,需要基于雷达系统获取各个发出语音信号的用户分别对应的位置坐标。由于当前存在多个用户参与视频聊天,在确定各用户所在的位置后,还需要确定当前是哪一个用户在说话。因此,参考图7,所述获取多个发出语音信号的用户分别对应的位置坐标的步骤之后,包括:
步骤S130,采集声音信息,根据所述声音信息确定声源位置;
步骤S131,将所述声源位置与多个发出语音信号的用户分别对应的位置坐标进行匹配,确定与所述声源位置在同一方向的位置坐标。
终端通过麦克风采集用户及周围环境的声音信息,将采集到的声音信息进行识别,判断该声音信息是否为人声,若该声音信息为人声,则基于该声音信息进行声源定位。具体地,对采集到的用户声音信息进行语音识别,确定用户声音信息所属的声源角度区域,对语音识别成功的次数进行统计,并获取每次语音识别成功时用户声音信息所属的声源角度区域;当语音识别成功的次数达到预设次数(如3次)时,基于获取到的角度区域计算当前发出声音的用户所在的方向。例如:以终端右侧水平方向为起点,逆时针将360°声源角度范围划分为10个声源角度区域,其中,每36°为一个声源角度区域。若当前计算得到用户所在的角度为90°,则可以确定发出声音的用户在终端的正前方。进一步在该方向上进行声音测距,获取用户距离终端的距离,基于该距离与方向即可获取用户当前所在的位置。
终端将获取到的声源位置与多个发出语音信号的用户分别对应的位置坐标进行匹配,确定与声源位置在同一方向的位置坐标,例如:终端将该声源位置与用户对应的位置坐标进行逐一匹配,若声源位置为距离终端正前方1米,用户的位置坐标为(0,1,1),该三维坐标表示用户在终端正前方1米的位置,则可以确定该位置坐标与声源位置在同一方向上,进一步说明该坐标位置对应的用户为当前发出声音的用户,其中,与声源位置在用一方向上的用户可以有多个。需要说明的是,在判断位置坐标与声源位置是否在同一方向时,两者的角度不需要完全一致,角度偏差在10°以内可以认为两者在同一方向。
步骤S20,根据所述位置坐标确定视频声音播放与视频画面显示的方向;
终端在获取到用户的位置坐标后,根据该位置坐标确定视频声音播放与视频画面显示的方向,即需要确定用户位置变化后所在的方向区域,其中,该方向区域是通过用户与终端的距离和角度确定的。因此,参考图8,所述根据所述位置坐标确定视频声音播放与视频画面显示的方向的步骤包括:
步骤S21,根据所述位置坐标确定与发出语音信号的用户的距离和角度;
步骤S22,根据所述距离和所述角度确定所述视频声音播放与所述视频画面显示的方向。
终端根据位置坐标确定与发出语音信号的用户的距离和角度,根据距离和角度确定视频声音播放与视频画面显示的方向,例如:终端获取到用户的位置坐标为(1,1,2),则说明当前用户位于终端右侧45°,距离约为1.4米;又或者是用户的位置坐标为(0,2,1),则说明当前用户位于终端的正前方90°,距离为2米。其中,该三维坐标是以终端为原点,右侧水平面为X轴、正前方水平面为Y轴,正上方水平面为Z轴建立的。因此,在获取到用户的三维位置坐标时,通过算法程序,便可计算出当前用户与终端之间的距离与角度,基于该距离与角度确定用户所在的方向。
步骤S30,根据所述方向调整所述视频声音播放与所述视频画面显示。
终端在获取到发出声音的用户对应的方向时,控制屏幕与扬声器动力装置向该方向进行转动,当屏幕与扬声器成功转动至该方向时,进行视频声音播放与视频画面显示。具体地,获取终端与用户之间的距离,以及获取声音输出装置输出的声音的分贝值,将距离与分贝值发送至控制器,控制器根据该距离与分贝值判断是否向声音输出装置发送调节音量的操作命令。其中,声音输出装置中包括数据库,其内预先存有用户自定义分贝值与距离的调整信息,如2m≥距离值>0m,调节差为0DB;7m≥距离值>2m,调节差为2DB;10m≥距离值>7m,调节差为5DB。可选地,还可以获取周围环境的音量信息,基于该音量信息和用户与终端的距离调整当前扬声器的音量,例如:若周围环境声音的分贝值大于设定分贝值,则在已完成基于距离调整音量的情况下,进一步增加扬声器的音量。其次,终端还通过识别当前视频画面中人脸的数量调整显示屏幕的显示画面比例大小,当识别到一张人脸时,则可以按照终端默认比例显示;当识别到多张人脸时,检测每张人脸的轮廓大小,基于该轮廓大小调整显示画面中每张人脸的显示比例。
本实施例在监测到用户在视频聊天时,进入用户位置捕捉线程,并通过雷达对发出语音信号的用户进行定位以获取用户对应的位置坐标;根据位置坐标确定视频声音播放与视频画面显示的方向,控制屏幕与扬声器的动力装置向该方向旋转,当成功旋转至该方向时,进行视频声音播放与视频画面显示。通过实时获取用户的位置坐标,确定用户位置变化,在用户所在的方向调整视频声音播放与视频画面显示,提高了收音效果与播放效果。
进一步地,参考图3,提出本申请视频声音和画面的调整方法第二实施例。
所述视频声音和画面的调整方法第二实施例与所述视频声音和画面的调整方法第一实施例的区别在于,所述当监测到用户在视频聊天时,获取当前发出语音信号的用户对应的位置坐标的步骤之前,包括:
步骤S14,采集用户信息,根据所述用户信息确定用户类型,每种所述用户类型设置不同的第一权重值;
步骤S15,确定每种所述用户类型分别对应的视频聊天对象,每类所述视频聊天对象设置不同的第二权重值;
步骤S16,确定每种所述用户类型与每类所述视频聊天对象进行视频聊天时使用的聊天软件,每种所述聊天软件设置不同的第三权重值。
终端在检测到用户触发“视频聊天”功能时,启动视频聊天工具推荐模块,并向摄像机发送采集人脸图像的指令,摄像机基于该指令对用户进行拍摄,获取拍摄得到的用户图像,提取用户图像中的脸部特征信息,如眼睛、鼻子、嘴巴等;进一步将提取的脸部特征信息与预先存储的脸部特征信息进行匹配,确定用户类型,该用户类型包括男主人、女主人以及小主人。当识别到的用户类型为男主人时,为男主人设置的权重值为30%,当识别到的用户类型为女主人时,为女主人设置的权重值为45%,当识别到的用户类型为小主人时,为小主人设置的权重值为25%。
在完成用户类型识别时,确定每种用户类型分别对应的视频聊天对象,为每类视频聊天对象设置不同的第二权重值。具体地,当识别的用户类型为男主人时,控制系统查询男主人经常视频聊天对象,例如:男主人经常与父母、领导以及同事进行视频聊天,则将“男主人父母”、“男主人领导”以及“男主人同事”的权重值分别设置为40%、35%、25%。当识别的用户类型为女主人时,控制系统查询女主人经常视频聊天对象,例如:女主人经常与父母、领导、同事进行视频聊天,则将“女主人父母”、“女主人闺蜜”以及“女主人同事”的权重值分别设置为40%、35%、25%。当识别的用户类型为小主人时,控制系统查询小主人经常视频聊天对象,例如:主人经常与好友、老师进行视频聊天,则将“小主人好友”和“小主人老师”的权重值分别设置为60%和40%。
在确定每种用户类型对应的聊天对象时,确定每种用户类型与每类视频聊天对象进行视频聊天时使用的聊天软件,为每种聊天软件设置不同的第三权重值。具体地,开启聊天软件查询模块,该模块用于查询用户与不同聊天对象聊天时使用的聊天软件;在获取男主人的视频聊天对象时,基于聊天软件查询模块依次查询男主人与各视频聊天对象聊天最常使用的APP,例如:男主人与父母使用微信,与领导使用腾讯会议,与同事使用钉钉,为微信、腾讯会议和钉钉分别设置30%、35%、45%的权重值。在获取女主人的视频聊天对象时,基于聊天软件查询模块依次查询女主人与各视频聊天对象聊天最常使用的APP,例如:女主人与父母使用微信,与闺蜜使用QQ,与同事使用钉钉,为微信、QQ和钉钉分别设置15%、20%、30%的权重值。在获取小主人的视频聊天对象时,基于聊天软件查询模块依次查询小主人与各视频聊天对象聊天最常使用的APP,例如:小主人与好友使用QQ,与老师使用钉钉,为QQ和钉钉分别设置15%、35%的权重值。
本实施例通过确定用户类型、每种用户类型分别对应的视频聊天对象以及每种用户类型与每类视频聊天对象进行视频聊天时使用的聊天软件,通过确定上述信息,为用户确定视频聊天对象以及推荐视频聊天软件做准备,保证为用户推荐适合的视频聊天软件。
进一步地,参考图4,提出本申请视频声音和画面的调整方法第三实施例。
所述视频声音和画面的调整方法第三实施例与所述视频声音和画面的调整方法第一实施例和第二实施例的区别在于,所述确定每种所述用户类型与每类所述视频聊天对象进行视频聊天时使用的聊天软件,每种所述聊天软件设置不同的第三权重值的步骤之后,包括:
步骤S160,在确定所述用户类型时,获取所述用户类型对应的视频聊天对象;
步骤S161,根据所述用户类型以及所述视频聊天对象确定目标聊天软件,开启所述目标聊天软件进行视频聊天。
终端在获取当前用户对应的用户类型时,如男主人,通过弹窗或语音询问“您要与谁聊天?”,在接收到用户发送的“我要与父母聊天”语音信息时,识别语音信息,并提取语音信息中的关键词“父母”,或者识别用户在任务栏输入的文本信息,如“父母”;在确定当前男主人的视频聊天对象为父母时,生成对应的查询指令,基于该查询指令在存储器中获取与男主人和父母对应的目标聊天软件,如微信;此时,终端会自动打开微信,并向男主人的父母发起视频聊天。
进一步地,参考图9,所述确定每种所述用户类型与每类所述视频聊天对象进行视频聊天时使用的聊天软件,每种所述聊天软件设置不同的第三权重值的步骤之后,还包括:
步骤S162,在确定所述用户类型时,获取当前已开启的聊天软件;
步骤S163,获取所述用户类型对应的所述第一权重值以及所述聊天软件对应的所述第三权重值;
步骤S164,根据所述用户类型对应的所述第一权重值以及所述聊天软件对应的所述第三权重值确定目标视频聊天对象,并与所述目标视频聊天对象进行视频聊天。
终端在确定用户类型时,获取当前已开启的聊天软件,并获取用户类型对应的第一权重值以及聊天软件对应的第三权重值,根据用户类型对应的第一权重值以及聊天软件对应的第三权重值确定目标视频聊天对象,并与目标视频聊天对象进行视频聊天。具体地,终端通过弹窗或语音询问“您要打开那个软件?”,在检测到用户打开微信时,自动访问存储器,选择与用户类型权重值以及聊天软件权重值相加为100%的目标视频聊天对象,并自动向该目标视频聊天对象发起视频聊天。例如:当前的用户类型为男主人,该男主人打开了腾讯视频,男主人权重值为30%,腾讯会议权重值为35%,则需要查找权重值为35%的视频聊天对象,访问存储器发现权重值为35%的视频聊天对象是领导,则自动发起与领导的视频聊天。
本实施例在获取用户类型和视频聊天对象时,可自动识别与该用户类型与视频聊天对象匹配的聊天软件,以及在获取用户类型与聊天软件时,基于对应的权重值确定视频聊天对象,使得智能地为用户匹配合适的聊天软件和视频聊天对象,提高了视频聊天的效率。
此外,本申请还提供一种终端,所述终端包括存储器、处理器及存储在存储器上并在处理器上运行的视频声音和画面的调整程序,所述终端在监测到用户在视频聊天时,进入用户位置捕捉线程,并通过雷达对发出语音信号的用户进行定位以获取用户对应的位置坐标;根据位置坐标确定视频声音播放与视频画面显示的方向,控制屏幕与扬声器的动力装置向该方向旋转,当成功旋转至该方向时,进行视频声音播放与视频画面显示。通过实时获取用户的位置坐标,确定用户位置变化,在用户所在的方向调整视频声音播放与视频画面显示,提高了收音效果与播放效果。
此外,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有视频声音和画面的调整程序,所述视频声音和画面的调整程序被处理器执行时实现如上所述视频声音和画面的调整方法的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本申请可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本申请的可选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括可选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种视频声音和画面的调整方法,其特征在于,所述方法包括:
当监测到用户在视频聊天时,获取当前发出语音信号的用户对应的位置坐标;
根据所述位置坐标确定视频声音播放与视频画面显示的方向;
根据所述方向调整所述视频声音播放与所述视频画面显示。
2.根据权利要求1所述的视频声音和画面的调整方法,其特征在于,所述根据所述位置坐标确定视频声音播放与视频画面显示的方向的步骤包括:
根据所述位置坐标确定与发出语音信号的用户的距离和角度;
根据所述距离和所述角度确定所述视频声音播放与所述视频画面显示的方向。
3.根据权利要求1所述的视频声音和画面的调整方法,其特征在于,所述获取当前发出语音信号的用户对应的位置坐标的步骤包括:
确定当前发出语音信号的用户个数;
若所述用户个数为单个,则获取单个发出语音信号的用户对应的位置坐标;或者,
若所述用户个数为多个,则获取多个发出语音信号的用户分别对应的位置坐标。
4.根据权利要求3所述的视频声音和画面的调整方法,其特征在于,所述获取多个发出语音信号的用户分别对应的位置坐标的步骤之后,包括:
采集声音信息,根据所述声音信息确定声源位置;
将所述声源位置与多个发出语音信号的用户分别对应的位置坐标进行匹配,确定与所述声源位置在同一方向的位置坐标。
5.根据权利要求3所述的视频声音和画面的调整方法,其特征在于,所述获取单个发出语音信号的用户对应的位置坐标的步骤之后,包括:
检测单个发出语音信号的用户的位置是否发生变化;
若所述位置未发生变化,则在设定时间后执行检测单个发出语音信号的用户的位置是否发生变化的步骤;或者,
若所述位置发生变化,则获取发生变化后的位置坐标。
6.根据权利要求1所述的视频声音和画面的调整方法,其特征在于,所述当监测到用户在视频聊天时,获取当前发出语音信号的用户对应的位置坐标的步骤之前,包括:
采集用户信息,根据所述用户信息确定用户类型,每种所述用户类型设置不同的第一权重值;
确定每种所述用户类型分别对应的视频聊天对象,每类所述视频聊天对象设置不同的第二权重值;
确定每种所述用户类型与每类所述视频聊天对象进行视频聊天时使用的聊天软件,每种所述聊天软件设置不同的第三权重值。
7.根据权利要求6所述的视频声音和画面的调整方法,其特征在于,所述确定每种所述用户类型与每类所述视频聊天对象进行视频聊天时使用的聊天软件,每种所述聊天软件设置不同的第三权重值的步骤之后,包括:
在确定所述用户类型时,获取所述用户类型对应的视频聊天对象;
根据所述用户类型以及所述视频聊天对象确定目标聊天软件,开启所述目标聊天软件进行视频聊天。
8.根据权利要求6所述的视频声音和画面的调整方法,其特征在于,所述确定每种所述用户类型与每类所述视频聊天对象进行视频聊天时使用的聊天软件,每种所述聊天软件设置不同的第三权重值的步骤之后,还包括:
在确定所述用户类型时,获取当前已开启的聊天软件;
获取所述用户类型对应的所述第一权重值以及所述聊天软件对应的所述第三权重值;
根据所述用户类型对应的所述第一权重值以及所述聊天软件对应的所述第三权重值确定目标视频聊天对象,并与所述目标视频聊天对象进行视频聊天。
9.一种终端,其特征在于,所述终端包括存储器、处理器及存储在存储器上并在所述处理器上运行的视频声音和画面的调整程序,所述处理器执行所述视频声音和画面的调整程序时实现如权利要求1至8中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有视频声音和画面的调整程序,所述视频声音和画面的调整程序被处理器执行时实现如权利要求1至8中任一项所述的方法的步骤。
CN202011299526.6A 2020-11-18 2020-11-18 视频声音和画面的调整方法、终端和计算机可读存储介质 Active CN112533070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011299526.6A CN112533070B (zh) 2020-11-18 2020-11-18 视频声音和画面的调整方法、终端和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011299526.6A CN112533070B (zh) 2020-11-18 2020-11-18 视频声音和画面的调整方法、终端和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN112533070A true CN112533070A (zh) 2021-03-19
CN112533070B CN112533070B (zh) 2024-02-06

Family

ID=74981436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011299526.6A Active CN112533070B (zh) 2020-11-18 2020-11-18 视频声音和画面的调整方法、终端和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112533070B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113286088A (zh) * 2021-05-31 2021-08-20 江苏文旭信息技术股份有限公司 一种通过声音定位进行视频优化的视频系统
WO2023070788A1 (zh) * 2021-10-29 2023-05-04 歌尔科技有限公司 音量实时调整方法、电子设备及可读存储介质

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1901663A (zh) * 2006-07-25 2007-01-24 华为技术有限公司 一种具有声音位置信息的视频通讯系统及其获取方法
KR20110121303A (ko) * 2010-04-30 2011-11-07 주식회사 에스원 음원 위치 표시 장치 및 그 방법
KR20140023456A (ko) * 2012-08-13 2014-02-27 한국과학기술원 모바일 인스턴트 메신저를 이용한 인터랙티브 방송 프로그램의 사용자 인터페이스 제공 방법 및 그 시스템
US20140282111A1 (en) * 2013-03-15 2014-09-18 Samsung Electronics Co., Ltd. Capturing and analyzing user activity during a multi-user video chat session
US20160241498A1 (en) * 2015-02-18 2016-08-18 DeNA Co., Ltd. Server, method, and computer-readable storage medium storing a program for providing video chat
CN106201178A (zh) * 2016-06-29 2016-12-07 深圳市金立通信设备有限公司 一种调整屏幕显示方向控制方法及终端
CN106973007A (zh) * 2017-04-01 2017-07-21 宇龙计算机通信科技(深圳)有限公司 一种即时通讯应用管理方法及系统
CN107800967A (zh) * 2017-10-30 2018-03-13 维沃移动通信有限公司 一种拍摄方法及移动终端
CN108152788A (zh) * 2017-12-22 2018-06-12 西安Tcl软件开发有限公司 声源追踪方法、声源追踪设备及计算机可读存储介质
CN108231073A (zh) * 2016-12-16 2018-06-29 深圳富泰宏精密工业有限公司 语音控制装置、系统及控制方法
CN108470566A (zh) * 2018-03-08 2018-08-31 腾讯科技(深圳)有限公司 一种应用操作方法以及装置
WO2019071826A1 (zh) * 2017-10-10 2019-04-18 武汉斗鱼网络科技有限公司 视频交友的对象指定方法、存储介质、电子设备及系统
CN110062200A (zh) * 2018-01-19 2019-07-26 浙江宇视科技有限公司 视频监控方法、装置、网络摄像机及存储介质
CN110082723A (zh) * 2019-05-16 2019-08-02 浙江大华技术股份有限公司 一种声源定位方法、装置、设备及存储介质
CN110198264A (zh) * 2019-05-31 2019-09-03 联想(北京)有限公司 处理方法、装置及电子设备
JP2019215865A (ja) * 2018-06-12 2019-12-19 Line株式会社 チャットルームリストの表示方法及び媒体
CN110830771A (zh) * 2019-11-11 2020-02-21 广州国音智能科技有限公司 智能监控方法、装置、设备及计算机可读存储介质

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1901663A (zh) * 2006-07-25 2007-01-24 华为技术有限公司 一种具有声音位置信息的视频通讯系统及其获取方法
KR20110121303A (ko) * 2010-04-30 2011-11-07 주식회사 에스원 음원 위치 표시 장치 및 그 방법
KR20140023456A (ko) * 2012-08-13 2014-02-27 한국과학기술원 모바일 인스턴트 메신저를 이용한 인터랙티브 방송 프로그램의 사용자 인터페이스 제공 방법 및 그 시스템
US20140282111A1 (en) * 2013-03-15 2014-09-18 Samsung Electronics Co., Ltd. Capturing and analyzing user activity during a multi-user video chat session
US20160241498A1 (en) * 2015-02-18 2016-08-18 DeNA Co., Ltd. Server, method, and computer-readable storage medium storing a program for providing video chat
CN106201178A (zh) * 2016-06-29 2016-12-07 深圳市金立通信设备有限公司 一种调整屏幕显示方向控制方法及终端
CN108231073A (zh) * 2016-12-16 2018-06-29 深圳富泰宏精密工业有限公司 语音控制装置、系统及控制方法
CN106973007A (zh) * 2017-04-01 2017-07-21 宇龙计算机通信科技(深圳)有限公司 一种即时通讯应用管理方法及系统
WO2019071826A1 (zh) * 2017-10-10 2019-04-18 武汉斗鱼网络科技有限公司 视频交友的对象指定方法、存储介质、电子设备及系统
CN107800967A (zh) * 2017-10-30 2018-03-13 维沃移动通信有限公司 一种拍摄方法及移动终端
CN108152788A (zh) * 2017-12-22 2018-06-12 西安Tcl软件开发有限公司 声源追踪方法、声源追踪设备及计算机可读存储介质
CN110062200A (zh) * 2018-01-19 2019-07-26 浙江宇视科技有限公司 视频监控方法、装置、网络摄像机及存储介质
CN108470566A (zh) * 2018-03-08 2018-08-31 腾讯科技(深圳)有限公司 一种应用操作方法以及装置
JP2019215865A (ja) * 2018-06-12 2019-12-19 Line株式会社 チャットルームリストの表示方法及び媒体
CN110082723A (zh) * 2019-05-16 2019-08-02 浙江大华技术股份有限公司 一种声源定位方法、装置、设备及存储介质
CN110198264A (zh) * 2019-05-31 2019-09-03 联想(北京)有限公司 处理方法、装置及电子设备
CN110830771A (zh) * 2019-11-11 2020-02-21 广州国音智能科技有限公司 智能监控方法、装置、设备及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113286088A (zh) * 2021-05-31 2021-08-20 江苏文旭信息技术股份有限公司 一种通过声音定位进行视频优化的视频系统
WO2023070788A1 (zh) * 2021-10-29 2023-05-04 歌尔科技有限公司 音量实时调整方法、电子设备及可读存储介质

Also Published As

Publication number Publication date
CN112533070B (zh) 2024-02-06

Similar Documents

Publication Publication Date Title
US11647172B2 (en) Content presentation method, content presentation mode push method, and intelligent terminal
CN109032039B (zh) 一种语音控制的方法及装置
CN109361865B (zh) 一种拍摄方法及终端
US10027888B1 (en) Determining area of interest in a panoramic video or photo
WO2021184952A1 (zh) 增强现实处理方法及装置、存储介质和电子设备
US20200251101A1 (en) Method and apparatus for controlling device
CN106791893A (zh) 视频直播方法及装置
CN111163906B (zh) 能够移动的电子设备及其操作方法
CN111918018B (zh) 视频会议系统、视频会议设备以及视频会议方法
CN110853095B (zh) 相机定位方法、装置、电子设备及存储介质
CN108683850B (zh) 一种拍摄提示方法及移动终端
CN110741377A (zh) 人脸图像处理方法、装置、存储介质及电子设备
CN106792341A (zh) 一种音频输出方法、装置及终端设备
CN109284081B (zh) 一种音频的输出方法、装置及音频设备
CN112533070B (zh) 视频声音和画面的调整方法、终端和计算机可读存储介质
WO2020048441A1 (zh) 通信连接方法、终端设备及无线通信系统
WO2022048398A1 (zh) 多媒体数据拍摄方法及终端
KR20200076169A (ko) 놀이 컨텐츠를 추천하는 전자 장치 및 그의 동작 방법
CN113038165B (zh) 确定编码参数组的方法、设备及存储介质
CN112532911A (zh) 图像数据处理方法、装置、设备及存储介质
EP2888716B1 (en) Target object angle determination using multiple cameras
CN108965861B (zh) 定位摄像头的方法和装置、存储介质和智能交互设备
CN108055461B (zh) 自拍角度的推荐方法、装置、终端设备及存储介质
CN111610886A (zh) 触控屏幕亮度的调整方法、设备及计算机可读存储介质
CN112423011A (zh) 消息回复方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant