CN113542583A - 基于TensorFlowLite的移动客户端智能跟随方法及装置 - Google Patents

基于TensorFlowLite的移动客户端智能跟随方法及装置 Download PDF

Info

Publication number
CN113542583A
CN113542583A CN202110373254.8A CN202110373254A CN113542583A CN 113542583 A CN113542583 A CN 113542583A CN 202110373254 A CN202110373254 A CN 202110373254A CN 113542583 A CN113542583 A CN 113542583A
Authority
CN
China
Prior art keywords
tensorflowlite
mobile phone
screen
target
app
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110373254.8A
Other languages
English (en)
Inventor
鲁鹏飞
鲁霖
王清洲
王春海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamenshi C Chip Co ltd
Original Assignee
Xiamenshi C Chip Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamenshi C Chip Co ltd filed Critical Xiamenshi C Chip Co ltd
Priority to CN202110373254.8A priority Critical patent/CN113542583A/zh
Publication of CN113542583A publication Critical patent/CN113542583A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72406User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by software upgrading or downloading
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72409User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
    • H04M1/72412User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories using two-way short-range wireless interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72439User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for image or video messaging

Abstract

本发明公开了一种基于TensorFlowLite的移动客户端智能跟随方法及装置,包括以下步骤:打开手机APP软件建立设备之间的BLE连接;用户从APP上选定当前屏幕上待拍摄追踪的目标类型;APP转入后台,并抓取前台屏幕上其他直播类APP软件正在拍摄的内容;图像预处理;调用TensorFlowLite算法识别图像;识别结果坐标转换;控制设备旋转;还公开了一种装置,该装置包括用于架设移动终端且带动移动终端旋转的支撑装置、以及支撑装置上带有跟随拍摄功能的APP软件的移动终端,本发明APP软件从后台抓取屏幕的内容,并控制设备转动,使被跟踪目标类型一直处于拍摄的中心,帮助第三方直播类软件扩大了的拍摄范围,只要将载有直播APP和本发明APP的手机放在本发明的支撑装置上,就可以控制该手机转动。

Description

基于TensorFlowLite的移动客户端智能跟随方法及装置
技术领域
本发明属于物体识别跟随领域,尤其涉及一种基于TensorFlowLite的移动客户端智能跟随方法及装置。
背景技术
当今社会,直播类自媒体已经迅速蔓延至人民生活的方方面面,成为一种新的社交方式,又是一种新的经济形态;直播门槛低,人人能参与,直观性强,互动性强;直播的真实性和丰富性,区别于图文时代,所见即所得,真实再现直播场景,直播的多样性使得平台更加垂直丰富,直接增加了与消费者互动性,有效进行沟通交流。
直播现场的硬件设施主要包括带有直播APP软件的手机和用于架设手机的稳定支架,现有技术存在的问题是:该稳定支架只能用于架设手机而不能控制手机旋转,当手机放在稳定支架上时,由于手机位置是固定的,使得手机摄像头能够拍摄的范围是有限的,往往人们只能拍摄固定范围的图像,如放置在桌上,拍摄手机正前方的画面是可以的,但如果拍摄对象移动到相机可拍摄的范围外,则无法记录到拍摄对象。也就是说,如果只是在手机上单纯开设一个抖音APP并放到支架上,那就只能拍摄到一个固定的角度。
发明内容
本发明为解决现有技术存在的问题,提出一种基于TensorFlowLite的移动客户端智能跟随方法及装置,目的在于解决现有技术的直播类软件受限于手机放置的位置、只能拍摄到一个固定的角度的问题。
本发明为解决其技术问题采用以下技术方案
一种基于TensorFlowLite的移动客户端智能跟随方法,包括以下步骤:
步骤一、打开手机APP软件建立设备之间的BLE连接;
步骤二、用户从APP上选定当前屏幕上待拍摄追踪的目标类型;
步骤三、APP转入后台,并抓取前台屏幕上其他直播类APP软件正在拍摄的内容;
步骤四、图像预处理;
步骤五、调用TensorFlowLite算法识别图像;
步骤六、识别结果坐标转换;
步骤七、控制设备旋转;
其特征在于:所述APP软件从后台抓取屏幕的内容,并控制设备转动,使被跟踪目标类型一直处于拍摄的中心。
所述步骤一的具体过程如下:
1)在手机上安装智能跟拍APP软件;
2)将手机放在可带动手机转动的支撑设备上;
2)APP启动后,主动开启BLE搜索,扫描附近的设备,当发现与此APP配套的支撑装置时,主动发起连接,与支撑装置建立BLE连接,用于后续发送旋转控制指令。
所述步骤二的具体过程如下:
1)APP软件在开始识别目标前,由用户从手机屏幕上指定将要识别的目标类别,目标类别可以是人脸、人形、猫、狗动物等;
2)所述可识别的目标分类包括但不限于以上几种分类,TensorFlowLite通过机器学习可以识别各种物体,因此可识别的目标分类可以根据需求的不同进行替换。
所述步骤三的具体过程如下:
1)用户选择目标类别后,APP软件从前台转入后台运行;
2)后台APP软件启动程序准备抓取当前屏幕的内容;
3)前台开启其他直播类APP,后台APP获取其他直播类APP正在拍摄的内容,该正在拍摄的内容包括用户选择的目标类别。
所述步骤四的具体过程如下:
1)对步骤三获取到的图像数据进一步处理,通过MediaCodec类创建一个解码器对象;
2)将图像数据交由解码器对象解码,即可获得YUV颜色格式的图像数据。
所述步骤五的具体过程如下:
1)将解码后的图像数据交由TensorFlowLite;
2)根据用户所选择的目标分类,使用相应的模型进行识别;
3)TensorFlowLite在识别出结果后,通过方法回调将识别结果告知APP。
所述步骤六的具体过程如下:
1)根据手机屏幕的大小与图像的大小计算缩放比例,按比例放大识别结果的坐标系;
2)坐标系转换公式为:
新识别结果坐标X=(手机屏幕宽度÷480)x识别结果坐标X;
新识别结果坐标Y=(手机屏幕高度÷640)x识别结果坐标Y。
所述步骤七的具体过程如下:
1)计算手机屏幕中心线;
2)使用步骤六中转换过的坐标计算出目标矩形在坐标系中的中心线;
3)若目标矩形的中心线与手机屏幕中心线的距离大于手机屏幕宽度的十分之一时,则通过BLE向设备发送开始旋转的指令,当检测到目标矩形的中心线与手机屏幕中心线的距离小于手机屏幕宽度的十分之一时,则通过BLE向设备发送停止开始旋转指令。
一种智能跟踪装置,其特征在于,该装置包括用于架设移动终端且带动移动终端旋转的支撑装置、以及支撑装置上带有跟随拍摄功能的APP软件的移动终端,所述的支撑装置和带有跟随拍摄功能的APP软件的移动终端通过蓝牙通讯,所述带有跟随拍摄功能的APP软件为基于TensorFlowLite算法的跟拍软件;所述支撑装置包括底座、底座上方的转动支架;所述转动支架包括支架臂、手机夹、角度转轴,支架壁上方设有手机夹、支架壁下方设有角度转轴,转动支架通过角度转轴与底座相连接;所述底座上设有带动角度转轴转动电机驱动装置,该电机驱动装置接收跟随拍摄APP软件指令,从而带动角度转轴转动。
所述带有跟随拍摄功能的APP软件包括初始化模块、用户标定目标类型模块、后台抓取屏幕内容模块、图像预处理模块、使用TensorFlowLite算法识别图像模块、识别结果坐标转换模块、目标位置偏离屏幕中心计算模块、控制设备旋转模块;所述初始化模块用于通过BLE技术将移动终端与支撑装置建立连接,并按照约定的协议发送旋转指令对支撑装置进行控制;所述用户标定目标类型模块用于在手机屏幕的列表上选择目标类型;所述后台抓取屏幕内容模块利用Android系统提供的功能从后台提取前台屏幕上的图像数据;所述图像预处理模块用于对屏幕抓取的图像数据交由解码器对象解码,从而获得YUV颜色格式的图像数据、并将解码后的图像数据交由TensorFlowLite;所述使用TensorFlowLite算法识别图像模块用于对用户所选择的目标分类,使用相应的模型进行识别;所述的识别结果坐标转换模块用于将图像坐标系与手机屏幕坐标系取得一致,以实现按比例放大识别结果;所述目标位置偏离屏幕中心计算模块用于计算目标中心点到屏幕中心点的偏离位置;所述控制设备旋转模块用于根据偏离位置控制支撑装置转动角度。
本发明的优点效果
1、本发明将初始化模块、用户标定目标类型模块、后台抓取屏幕内容模块、图像预处理模块、使用TensorFlowLite识别图像模块、识别结果坐标转换模块、目标位置偏离中心计算模块、控制设备扭转模块进行有机组合,组合以后各个模块相互支持、相互依赖,解决了现有技术的直播软件受限于手机可以拍摄的范围或手机放置的位置、只能拍摄到一个固定的角度的问题,组合以后的效果要比组合以前的效果优越得多,具有突出的实质性特点和显著进步。
2、本发明克服了传统的从摄像头获取图像数据的偏见,采用本领域技术人员不容易想到的从后台抓取屏幕内容的方法:利用Android系统提供的一个准许APP拥有截取屏幕或者是记录系统音频的能力类MediaProjection,调用MediaProjection类对象的createVirtualDisplay方法,将Surface对象做为参数传入,通过Surface对象获取到屏幕图像内容并进行编码。本发明采用后台抓取屏幕内容代替前台抓取屏幕内容、可旋转角度的支撑装置代替固定角度的支撑装置,取得了预料不到的效果:帮助第三方直播类软件扩大了的拍摄范围,只要将载有直播APP和本发明APP的手机放在本发明的支撑装置上,并完成双方的蓝牙通讯,就可以控制该手机向左偏转、向右偏转、向上偏转、向下偏转,从而扩大第三方直播类软件的拍摄范围。
附图说明
图1为本发明移动客户端和支撑设备蓝牙通讯示意图;
图2为本发明用于移动客户端的跟拍支撑设备示意图;
图3为本发明跟随拍摄APP软件功能模块示意图;
图4为本发明基于TensorFlowLite的移动客户端跟随拍摄方法流程图;
图中,1:支撑装置;2:带有跟随拍摄APP软件的移动终端;
1-1:底座;1-2:转动支架;1-2-1:支架壁;1-2-2:手机夹;1-2-3:角度转轴;1-2-4:锁钮;1-3:开机按键;1-3-1:蓝牙指示灯;1-3-2:拍摄指示灯;
具体实施方式
本发明设计原理
1、本发明的两个关键点:第一,APP后台抓取屏幕内容;第二、控制手机旋转。这两个关键点是本发明区别于现有技术的特定技术特征。实现APP后台抓取屏幕内容的意义在于:极大地扩大了应用范围,由于APP在后台运行,并不影响在前台开启的任何第三方直播类软件,可以帮助前台任何第三方直播类软件提高视频拍摄效果,第三方直播类软件视频不再仅限于对目标物当前一个固定角度拍摄,而是对目标物的跟随拍摄。当待拍摄物体移动到屏幕以外时,可以通过控制手机转动的方法跟踪拍摄,使得待拍摄物体始终保持在拍摄画面的中心。这一功能的开发解决了长期以来主播人做主播时其活动范围只能限定在在手机正前方的难题,使得主播人在做直播时可以根据需要灵活地在直播间来回走动变换位置,扩大了主播人做主播时的活动场景,有效提高了直播效果。
2、本发明APP和第三方直播类APP的关系:通过用户选择的目标类型关联本发明APP和第三方直播APP。在本发明APP中,用户选择待拍摄追踪的目标类型,例如目标类型是“人脸”或者“人形”,后台APP根据用户选择的目标类型,在前台打开的第三方直播内容中进行目标类别“人脸”或“人形”的搜索和跟踪。
3、APP后台抓取屏幕内容的设计原理:本发明利用了Android系统提供的两个类实现后台抓取屏幕内容。MediaProjection:是Android系统提供的一个准许APP拥有截取屏幕或者是记录系统音频的能力类;MediaCodec:是Android系统提供的用于对音视频进行编解码的类,它通过访问底层的codec来实现编解码的功能。具体如下:
1)在APP中创建MediaProjection类对象,通过MediaCodec类创建一个编码器对象,指定编码器对象的编码格式为video/avc,码率为4000000,帧率为30,宽度为480,高度为640。并通过编码器对象创建一个Surface对象,调用MediaProjection类对象的createVirtualDisplay方法,将Surface对象做为参数传入,开始抓取屏幕图像内容,通过Surface编码器对象可以获取到屏幕图像内容,并进行编码。此方式抓取屏幕内容APP可以在后台运行,因此在开始抓取屏幕内容后即可开启其他APP,如系统相机或其他具有拍摄功能的APP等,即可获取其他APP正在拍摄的内容。其中,video/avc:一种视频编码格式;码率:数据传输时单位时间传送的数据位数;帧率:是以帧称为单位的位图图像连续出现在显示器上的频率;YUV:是一种颜色编码方法,常使用在各个视频处理组件中。
2)通过Surface编码器对象编码后的屏幕图像的图像数据,TensorFlowLite无法直接使用,需要进一步处理。通过MediaCodec类创建一个解码器对象,指定解码器对象的解码格式为video/avc,解码输出的颜色格式为YUV,宽度为480,高度为640。将编码器对象编码后的图像数据交由MediaCodec类创建解码器对象解码,即可获得YUV颜色格式的图像数据。
3、APP控制手机旋转的设计原理:APP当发现前台屏幕中的目标类别偏离中心点超出一定范围时才会控制手机旋转,因此,控制手机旋转需要两步:
第一步是计算两个中心点的偏离位置。所述两个中心点一个是矩形框中心点,另一个是屏幕中心点:由于目标在识别结果的坐标系中是以矩形的形式存在,因此矩形框中心点就是目标中心点。首先需要计算出手机屏幕的中心线,然后使用转换过的坐标计算出目标矩形在坐标系中的中心线,若目标矩形的中心线与手机屏幕中心线的距离大于手机屏幕宽度的十分之一时,则通过BLE向设备发送开始旋转的指令,当检测到目标矩形的中心线与手机屏幕中心线的距离小于手机屏幕宽度的十分之一时,则通过BLE向设备发送停止开始旋转指令。所述的旋转包括向左、向右、向上、向下旋转。
所述转换过的坐标是指:由于手机屏幕和图像屏幕的分辨率不一致,为了完整显示手机屏幕的图像,需要图像屏幕按照手机屏幕进行放大或缩小,放大或缩小的标准是不产生图像的拉伸。根据手机屏幕的大小与图像的大小计算缩放比例,本实施例记载的是按比例放大识别结果的坐标系,坐标系转换公式为:
新识别结果坐标X=(手机屏幕宽度÷480)x识别结果坐标X
新识别结果坐标Y=(手机屏幕高度÷640)x识别结果坐标Y
第二步是根据两个中心点的偏离位置控制手机旋转。当发现目标类别向左、或向右、或向上、或向下偏离中心点到达一定范围时,控制手机作出同方向的向左、向右、向上、向下旋转,以此实现目标类别总是位于拍摄画面的中心。手机旋转的同时,APP实时计算目标类别偏离中心的位置,直到目标类别的偏离达到允许范围内时停止手机的旋转。
基于以上发明原理,本发明设计了一种基于TensorFlowLite的移动客户端智能跟随方法,该方法是基于一种智能跟踪装置,该装置包括用于架设移动终端且带动移动终端旋转的支撑装置、以及支撑装置上带有跟随拍摄功能的APP软件的移动终端,所述的支撑装置和带有跟随拍摄功能的APP软件的移动终端通过蓝牙通讯,所述带有跟随拍摄功能的APP软件为基于TensorFlowLite算法的跟拍软件;所述支撑装置包括底座、底座上方的转动支架;所述转动支架包括支架臂、手机夹、角度转轴,支架壁上方设有手机夹、支架壁下方设有角度转轴,转动支架通过角度转轴与底座相连接;所述底座上设有带动角度转轴转动电机驱动装置,该电机驱动装置接收跟随拍摄APP软件指令,从而带动角度转轴转动。所述带有跟随拍摄功能的APP软件包括初始化模块、用户标定目标类型模块、后台抓取屏幕内容模块、图像预处理模块、使用TensorFlowLite算法识别图像模块、识别结果坐标转换模块、目标位置偏离屏幕中心计算模块、控制设备旋转模块;所述初始化模块用于通过BLE技术将移动终端与支撑装置建立连接,并按照约定的协议发送旋转指令对支撑装置进行控制;所述用户标定目标类型模块用于在手机屏幕的列表上选择目标类型;所述后台抓取屏幕内容模块利用Android系统提供的功能从后台提取前台屏幕上的图像数据;所述图像预处理模块用于对屏幕抓取的图像数据交由解码器对象解码,从而获得YUV颜色格式的图像数据、并将解码后的图像数据交由TensorFlowLite;所述使用TensorFlowLite算法识别图像模块用于对用户所选择的目标分类,使用相应的模型进行识别;所述的识别结果坐标转换模块用于将图像坐标系与手机屏幕坐标系取得一致,以实现按比例放大识别结果;所述目标位置偏离屏幕中心计算模块用于计算目标中心点到屏幕中心点的偏离位置;所述控制设备旋转模块用于根据偏离位置控制支撑装置转动角度。
本发明一种基于TensorFlowLite的移动客户端智能跟随方法,包括以下步骤:
步骤一、打开手机APP软件建立设备之间的BLE连接;
具体过程如下:
1)在手机上安装智能跟随APP软件;
2)将手机放在可带动手机转动的支撑设备上;
2)APP启动后,主动开启BLE搜索,扫描附近的设备,当发现与此APP配套的支撑装置时,主动发起连接,与支撑装置建立BLE连接,用于后续发送旋转控制指令。
步骤二、用户从APP上选定当前屏幕上待拍摄追踪的目标类型;
具体过程如下:
1)APP软件在开始识别目标前,由用户从手机屏幕上指定将要识别的目标类别,目标类别可以是人脸、人形、猫、狗动物等;
2)所述可识别的目标分类包括但不限于以上几种分类,TensorFlowLite通过机器学习可以识别各种物体,因此可识别的目标分类可以根据需求的不同进行替换。
补充说明:
用户选择目标类型时,限定该类型的目标对象在第三方直播画面中只有一个,如:选择人脸或人形的目标类型时,画面中只有1个人脸或1个人形。
步骤三、APP转入后台,并抓取前台屏幕上其他直播类APP软件正在拍摄的内容;
具体过程如下:
1)用户选择目标类别后,APP软件从前台转入后台运行;
2)后台APP软件启动程序准备抓取当前屏幕的内容;
补充说明:
在APP中创建MediaProjection类对象,通过MediaCodec类创建一个编码器对象,通过编码器对象创建一个Surface对象,调用MediaProjection类对象的createVirtualDisplay方法,将Surface对象做为参数传入,开始抓取屏幕图像内容,通过Surface编码器对象可以获取到屏幕图像内容,并进行编码。
3)前台开启其他直播类APP,后台APP获取其他直播类APP正在拍摄的内容,该正在拍摄的内容包括用户选择的目标类别。
步骤四、图像预处理;
具体过程如下:
1)对步骤三获取到的图像数据进一步处理,通过MediaCodec类创建一个解码器对象;
2)将图像数据交由解码器对象解码,即可获得YUV颜色格式的图像数据。
步骤五、调用TensorFlowLite算法识别图像;
具体过程如下:
1)将解码后的图像数据交由TensorFlowLite;
2)根据用户所选择的目标分类,使用相应的模型进行识别;
3)TensorFlowLite在识别出结果后,通过方法回调将识别结果告知APP。
补充说明:
所述的TensorFlowLite识别结果为识别到的目标类别在图像上的坐标。
步骤六、识别结果坐标转换;
具体过程如下:
1)根据手机屏幕的大小与图像的大小计算放大比例,按比例放大识别结果的坐标系;
2)坐标系转换公式为:
新识别结果坐标X=(手机屏幕宽度÷480)x识别结果坐标X;
新识别结果坐标Y=(手机屏幕高度÷640)x识别结果坐标Y。
补充说明:
上述公式中“识别结果坐标”为图像上的坐标,该图像上的坐标为解码后交由TensorFlowLite识别出的坐标,所述“新识别结果坐标”为屏幕上的坐标,屏幕上的坐标需要进行换算。
步骤七、控制设备旋转;
具体过程如下:
1)计算手机屏幕中心线;
2)使用步骤六中转换过的坐标计算出目标矩形在坐标系中的中心线;
3)若目标矩形的中心线与手机屏幕中心线的距离大于手机屏幕宽度的十分之一时,则通过BLE向设备发送开始旋转的指令,当检测到目标矩形的中心线与手机屏幕中心线的距离小于手机屏幕宽度的十分之一时,则通过BLE向设备发送停止开始旋转指令。
本发明并不限于上述具体实施方式,本领域技术人员根据本发明的技术方案得出其他的实施方式,同样属于本发明的技术创新范围。

Claims (10)

1.一种基于TensorFlowLite的移动客户端智能跟随方法,包括以下步骤:
步骤一、打开手机APP软件建立设备之间的BLE连接;
步骤二、用户从APP上选定当前屏幕上待拍摄追踪的目标类型;
步骤三、APP转入后台,并抓取前台屏幕上其他直播类APP软件正在拍摄的内容;
步骤四、图像预处理;
步骤五、调用TensorFlowLite算法识别图像;
步骤六、识别结果坐标转换;
步骤七、控制设备旋转;
其特征在于:所述APP软件从后台抓取屏幕的内容,并控制设备转动,使被跟踪目标类型一直处于拍摄的中心。
2.根据权利要求1所述一种基于TensorFlowLite的移动客户端智能跟随方法,其特征在于:所述步骤一的具体过程如下:
1)在手机上安装智能跟拍APP软件;
2)将手机放在可带动手机转动的支撑设备上;
2)APP启动后,主动开启BLE搜索,扫描附近的设备,当发现与此APP配套的支撑装置时,主动发起连接,与支撑装置建立BLE连接,用于后续发送旋转控制指令。
3.根据权利要求1所述一种基于TensorFlowLite的移动客户端智能跟随方法,其特征在于:所述步骤二的具体过程如下:
1)APP软件在开始识别目标前,由用户从手机屏幕上指定将要识别的目标类别,目标类别可以是人脸、人形、猫、狗动物等;
2)所述可识别的目标分类包括但不限于以上几种分类,TensorFlowLite通过机器学习可以识别各种物体,因此可识别的目标分类可以根据需求的不同进行替换。
4.根据权利要求1所述一种基于TensorFlowLite的移动客户端智能跟随方法,其特征在于:所述步骤三的具体过程如下:
1)用户选择目标类别后,APP软件从前台转入后台运行;
2)后台APP软件启动程序准备抓取当前屏幕的内容;
3)前台开启其他直播类APP,后台APP获取其他直播类APP正在拍摄的内容,该正在拍摄的内容包括用户选择的目标类别。
5.根据权利要求1所述一种基于TensorFlowLite的移动客户端智能跟随方法,其特征在于:所述步骤四的具体过程如下:
1)对步骤三获取到的图像数据进一步处理,通过MediaCodec类创建一个解码器对象;
2)将图像数据交由解码器对象解码,即可获得YUV颜色格式的图像数据。
6.根据权利要求1所述一种基于TensorFlowLite的移动客户端智能跟随方法,其特征在于:所述步骤五的具体过程如下:
1)将解码后的图像数据交由TensorFlowLite;
2)根据用户所选择的目标分类,使用相应的模型进行识别;
3)TensorFlowLite在识别出结果后,通过方法回调将识别结果告知APP。
7.根据权利要求1所述一种基于TensorFlowLite的移动客户端智能跟随方法,其特征在于:所述步骤六的具体过程如下:
1)根据手机屏幕的大小与图像的大小计算缩放比例,按比例放大识别结果的坐标系;
2)坐标系转换公式为:
新识别结果坐标X=(手机屏幕宽度÷480)x识别结果坐标X;
新识别结果坐标Y=(手机屏幕高度÷640)x识别结果坐标Y。
8.根据权利要求1所述一种基于TensorFlowLite的移动客户端智能跟随方法,其特征在于:所述步骤七的具体过程如下:
1)计算手机屏幕中心线;
2)使用步骤六中转换过的坐标计算出目标矩形在坐标系中的中心线;
3)若目标矩形的中心线与手机屏幕中心线的距离大于手机屏幕宽度的十分之一时,则通过BLE向设备发送开始旋转的指令,当检测到目标矩形的中心线与手机屏幕中心线的距离小于手机屏幕宽度的十分之一时,则通过BLE向设备发送停止开始旋转指令。
9.一种用于权利要求1-8任意一项所述一种基于TensorFlowLite的移动客户端智能跟随方法的智能跟踪装置,其特征在于,该装置包括用于架设移动终端且带动移动终端旋转的支撑装置、以及支撑装置上带有跟随拍摄功能的APP软件的移动终端,所述的支撑装置和带有跟随拍摄功能的APP软件的移动终端通过蓝牙通讯,所述带有跟随拍摄功能的APP软件为基于TensorFlowLite算法的跟拍软件;所述支撑装置包括底座、底座上方的转动支架;所述转动支架包括支架臂、手机夹、角度转轴,支架壁上方设有手机夹、支架壁下方设有角度转轴,转动支架通过角度转轴与底座相连接;所述底座上设有带动角度转轴转动电机驱动装置,该电机驱动装置接收跟随拍摄APP软件指令,从而带动角度转轴转动。
10.根据权利要求9所述的一种智能跟踪装置,其特征在于:所述带有跟随拍摄功能的APP软件包括初始化模块、用户标定目标类型模块、后台抓取屏幕内容模块、图像预处理模块、使用TensorFlowLite算法识别图像模块、识别结果坐标转换模块、目标位置偏离屏幕中心计算模块、控制设备旋转模块;所述初始化模块用于通过BLE技术将移动终端与支撑装置建立连接,并按照约定的协议发送旋转指令对支撑装置进行控制;所述用户标定目标类型模块用于在手机屏幕的列表上选择目标类型;所述后台抓取屏幕内容模块利用Android系统提供的功能从后台提取前台屏幕上的图像数据;所述图像预处理模块用于对屏幕抓取的图像数据交由解码器对象解码,从而获得YUV颜色格式的图像数据、并将解码后的图像数据交由TensorFlowLite;所述使用TensorFlowLite算法识别图像模块用于对用户所选择的目标分类,使用相应的模型进行识别;所述的识别结果坐标转换模块用于将图像坐标系与手机屏幕坐标系取得一致,以实现按比例放大识别结果;所述目标位置偏离屏幕中心计算模块用于计算目标中心点到屏幕中心点的偏离位置;所述控制设备旋转模块用于根据偏离位置控制支撑装置转动角度。
CN202110373254.8A 2021-04-07 2021-04-07 基于TensorFlowLite的移动客户端智能跟随方法及装置 Pending CN113542583A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110373254.8A CN113542583A (zh) 2021-04-07 2021-04-07 基于TensorFlowLite的移动客户端智能跟随方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110373254.8A CN113542583A (zh) 2021-04-07 2021-04-07 基于TensorFlowLite的移动客户端智能跟随方法及装置

Publications (1)

Publication Number Publication Date
CN113542583A true CN113542583A (zh) 2021-10-22

Family

ID=78094425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110373254.8A Pending CN113542583A (zh) 2021-04-07 2021-04-07 基于TensorFlowLite的移动客户端智能跟随方法及装置

Country Status (1)

Country Link
CN (1) CN113542583A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292287A (zh) * 2017-07-14 2017-10-24 深圳云天励飞技术有限公司 人脸识别方法、装置、电子设备及存储介质
CN108595217A (zh) * 2018-04-11 2018-09-28 南昌黑鲨科技有限公司 应用程序的内容推送方法、内容推送系统及智能终端
CN108803993A (zh) * 2018-06-13 2018-11-13 南昌黑鲨科技有限公司 应用程序的交互方法、智能终端及计算机可读存储介质
CN108984146A (zh) * 2018-06-13 2018-12-11 南昌黑鲨科技有限公司 应用程序的语音控制方法、智能终端及计算机可读存储介质
CN110493639A (zh) * 2019-10-21 2019-11-22 南京创维信息技术研究院有限公司 一种基于场景识别的自动调整声音和图像模式的方法及系统
CN111866353A (zh) * 2019-08-05 2020-10-30 深圳市威尔电器有限公司 巡逻智能监控终端及其使用方法
CN112073641A (zh) * 2020-09-18 2020-12-11 深圳市众志联城科技有限公司 影像拍摄方法、装置、移动终端以及存储介质
CN112165629A (zh) * 2020-09-30 2021-01-01 中国联合网络通信集团有限公司 智能直播方法、可穿戴设备及智能直播系统
CN112584036A (zh) * 2020-11-06 2021-03-30 深圳市逗映科技有限公司 云台控制方法、装置、计算机设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107292287A (zh) * 2017-07-14 2017-10-24 深圳云天励飞技术有限公司 人脸识别方法、装置、电子设备及存储介质
CN108595217A (zh) * 2018-04-11 2018-09-28 南昌黑鲨科技有限公司 应用程序的内容推送方法、内容推送系统及智能终端
CN108803993A (zh) * 2018-06-13 2018-11-13 南昌黑鲨科技有限公司 应用程序的交互方法、智能终端及计算机可读存储介质
CN108984146A (zh) * 2018-06-13 2018-12-11 南昌黑鲨科技有限公司 应用程序的语音控制方法、智能终端及计算机可读存储介质
CN111866353A (zh) * 2019-08-05 2020-10-30 深圳市威尔电器有限公司 巡逻智能监控终端及其使用方法
CN110493639A (zh) * 2019-10-21 2019-11-22 南京创维信息技术研究院有限公司 一种基于场景识别的自动调整声音和图像模式的方法及系统
CN112073641A (zh) * 2020-09-18 2020-12-11 深圳市众志联城科技有限公司 影像拍摄方法、装置、移动终端以及存储介质
CN112165629A (zh) * 2020-09-30 2021-01-01 中国联合网络通信集团有限公司 智能直播方法、可穿戴设备及智能直播系统
CN112584036A (zh) * 2020-11-06 2021-03-30 深圳市逗映科技有限公司 云台控制方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN104023192B (zh) 一种录制视频的方法和装置
US9270941B1 (en) Smart video conferencing system
JP4763312B2 (ja) 動画像データの符号化方法、復号化方法、これらを実行する端末装置、及び双方向対話型システム
CN101202994B (zh) 辅助用户健身的方法和装置
US20160275354A1 (en) System and method for video context-based composition and compression from normalized spatial resolution objects
US20180295278A1 (en) Shooting method and shooting system capable of realizing dynamic capturing of human faces based on mobile terminal
US11410377B2 (en) Lightweight view dependent rendering system for mobile devices
CN106851386B (zh) 基于Android系统的电视终端中增强现实的实现方法及装置
CN110809173B (zh) 基于智能手机ar增强现实的虚拟直播方法及系统
CN110430441A (zh) 一种云手机视频采集方法、系统、装置及存储介质
WO2020057353A1 (zh) 基于高速球的物体跟踪方法、监控服务器、视频监控系统
CN100336381C (zh) 捕获实时图像的方法
CN101227568B (zh) 视频图像的特效变换方法
CN105868747A (zh) 云计算系统
CN105959562A (zh) 获取全景拍摄数据的方法、装置以及便携式全景拍摄设备
JP7218786B2 (ja) 画像処理装置、画像処理方法およびプログラム
CN215734456U (zh) 摄像头以及显示装置
CN111083368A (zh) 一种基于云端的模拟物理云台全景视频展示系统
CN113542583A (zh) 基于TensorFlowLite的移动客户端智能跟随方法及装置
CN109218612B (zh) 一种追踪拍摄系统及拍摄方法
WO2022037215A1 (zh) 摄像头、显示设备和摄像头控制方法
CN112887653B (zh) 一种信息处理方法和信息处理装置
CN111526295B (zh) 音视频处理系统、采集方法、装置、设备及存储介质
CN208874652U (zh) 专业级超高清会议摄像机
CN109194918B (zh) 一种基于移动载体的拍摄系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20211022

WD01 Invention patent application deemed withdrawn after publication