CN110955879B - 设备控制方法、装置、计算机设备和存储介质 - Google Patents

设备控制方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110955879B
CN110955879B CN201911201112.2A CN201911201112A CN110955879B CN 110955879 B CN110955879 B CN 110955879B CN 201911201112 A CN201911201112 A CN 201911201112A CN 110955879 B CN110955879 B CN 110955879B
Authority
CN
China
Prior art keywords
training
resource transfer
target object
resource
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911201112.2A
Other languages
English (en)
Other versions
CN110955879A (zh
Inventor
郑尚镇
郭润增
王少鸣
耿志军
周俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911201112.2A priority Critical patent/CN110955879B/zh
Publication of CN110955879A publication Critical patent/CN110955879A/zh
Application granted granted Critical
Publication of CN110955879B publication Critical patent/CN110955879B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/085Payment architectures involving remote charge determination or related payment systems
    • G06Q20/0855Payment architectures involving remote charge determination or related payment systems involving a third party
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/10Payment architectures specially adapted for electronic funds transfer [EFT] systems; specially adapted for home banking systems
    • G06Q20/102Bill distribution or payments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/18Payment architectures involving self-service terminals [SST], vending machines, kiosks or multimedia terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4014Identity check for transactions
    • G06Q20/40145Biometric identity checks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0208Trade or exchange of goods or services in exchange for incentives or rewards
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07FCOIN-FREED OR LIKE APPARATUS
    • G07F7/00Mechanisms actuated by objects other than coins to free or to actuate vending, hiring, coin or paper currency dispensing or refunding apparatus
    • G07F7/08Mechanisms actuated by objects other than coins to free or to actuate vending, hiring, coin or paper currency dispensing or refunding apparatus by coded identity card or credit card or other personal identification means
    • G07F7/10Mechanisms actuated by objects other than coins to free or to actuate vending, hiring, coin or paper currency dispensing or refunding apparatus by coded identity card or credit card or other personal identification means together with a coded signal, e.g. in the form of personal identification information, like personal identification number [PIN] or biometric data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Abstract

本申请涉及一种设备控制方法、装置、计算机设备和存储介质,涉及人工智能。所述方法包括:获取目标对象对应的当前人脸图像;根据所述当前人脸图像确定所述目标对象的人脸相对于资源转移设备的当前位姿信息;将所述当前位姿信息输入到已训练的操作意图识别模型中,得到所述目标对象对所述资源转移设备的操作意图识别结果;根据所述操作意图识别结果控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。上述方法可以提高设备使用效率。

Description

设备控制方法、装置、计算机设备和存储介质
技术领域
本申请涉及设备控制领域,特别是涉及设备控制方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的飞速发展,售货机以及售票机等设备越来越普及。例如用户可以在自动售货机上购买货物。
目前,当用户需要使用设备的某个功能时,往往需要进行多次操作才能控制设备执行对应的功能。例如,当需要在设备上进行支付时,需要依次执行以下操作:点击要购买的货物、点击“确定”控件以生成订单以及点击“支付”按键进行支付,操作繁琐,导致设备使用效率低。
发明内容
基于此,有必要针对上述设备使用效率低的问题,提供一种设备控制方法、装置、计算机设备和存储介质。
一种设备控制方法,所述方法包括:获取目标对象对应的当前人脸图像;根据所述当前人脸图像确定所述目标对象的人脸相对于资源转移设备的当前位姿信息;将所述当前位姿信息输入到已训练的操作意图识别模型中,得到所述目标对象对所述资源转移设备的操作意图识别结果;根据所述操作意图识别结果控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
一种设备控制装置,所述装置包括:当前人脸图像获取模块,用于获取目标对象对应的当前人脸图像;当前位姿信息确定模块,用于根据所述当前人脸图像确定所述目标对象的人脸相对于资源转移设备的当前位姿信息;操作意图识别结果得到模块,用于将所述当前位姿信息输入到已训练的操作意图识别模型中,得到所述目标对象对所述资源转移设备的操作意图识别结果;控制模块,用于根据所述操作意图识别结果控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
在一些实施例中,所述控制模块用于:当所述操作意图识别结果为使用设备时,控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
在一些实施例中,所述控制模块用于:当所述操作意图识别结果为使用设备时,控制所述资源转移设备对应的身份认证设备获取所述目标对象的人脸特征,以根据所述人脸特征进行资源转移身份认证,得到所述目标对象的资源转移身份认证结果。
在一些实施例中,所述装置还包括:存储模块,用于存储所述目标对象的资源转移身份认证结果;资源转移模块,用于当接收到所述目标对象对应的资源转移指令时,获取存储的所述资源转移身份认证结果,根据所述资源转移身份认证结果对所述目标对象的资源账户中进行资源转移。
在一些实施例中,所述控制模块用于:当所述操作意图识别结果为使用设备时,控制所述资源转移设备展示候选虚拟资源信息;所述装置还包括:目标虚拟资源确定模块,用于将资源选择操作所指示选择的候选虚拟资源,作为所述目标对象对应的目标虚拟资源。
在一些实施例中,所述装置还包括:目标资源转移数值得到模块,用于获取所述目标对象对应的初始资源转移数值,根据所述目标虚拟资源以及所述初始资源转移数值进行资源计算,得到目标资源转移数值;转出模块,用于根据所述目标资源转移数值从所述目标对象的资源账户中转出对应数量的资源。
在一些实施例中,所述控制模块用于:获取所述目标对象对应的目标对象特征,根据所述目标对象特征确定所述目标对象对应的目标标签;控制所述资源转移设备展示所述目标标签对应的候选虚拟资源信息。
在一些实施例中,所述已训练的操作意图识别模型的训练模块包括:训练位姿信息获取单元,用于获取训练对象在多个采集时刻对应的训练位姿信息;训练标签确定单元,用于将在所述训练位姿信息的采集时刻之后第一时长内的设备使用结果作为所述训练位姿信息的训练标签;训练样本得到单元,用于将所述训练位姿信息以及对应的训练标签组成训练样本,得到所述训练对象在多个采集时刻对应的训练样本,所述训练样本组成训练样本集合;训练单元,用于根据所述训练样本集合进行模型训练,得到已训练的操作意图识别模型。
在一些实施例中,所述训练位姿信息获取单元用于:获取训练对象在多个采集时刻对应的训练位姿信息,同一训练对象的训练位姿信息对应的采集时刻组成的采集时刻序列中,相邻的采集时刻的间隔时长为所述第一时长,所述采集时刻序列按照时间顺序进行排序;所述训练单元用于:将当前训练对象对应的当前训练样本中的训练位姿信息输入到待训练的操作意图识别模型中,得到模型输出结果;计算所述模型输出结果与所述当前训练样本对应的标签的差异,得到差异计算结果;根据所述当前训练对象对应的各个训练样本的差异结算结果计算得到当前模型损失值;根据所述当前模型损失值对待训练的操作意图识别模型进行调整,得到已训练的操作意图识别模型。
在一些实施例中,所述当前位姿信息确定模块用于:确定所述当前人脸图像中目标对象对应的人脸特征点位置;根据所述人脸特征点位置计算所述目标对象的人脸在至少一个坐标方向上相对于所述资源转移设备的角度信息。
在一些实施例中,所述装置还包括:人脸区域确定模块,用于确定所述当前人脸图像中目标对象对应的人脸区域;尺寸信息计算模块,用于计算得到所述人脸区域对应的人脸尺寸信息;所述操作意图识别结果得到模块用于:将所述当前位姿信息以及所述人脸尺寸信息输入到已训练的操作意图识别模型中,得到所述目标对象对所述资源转移设备的操作意图识别结果。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述设备控制方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述设备控制方法的步骤。
上述设备控制方法、装置、计算机设备和存储介质,可通过获取人脸相对于资源转移设备的当前位姿信息,将当前位姿信息输入到已训练的操作意图识别模型中,得到目标对象对资源转移设备的操作意图识别结果,根据操作意图识别结果控制资源转移设备或者关联的设备执行对应的资源转移关联操作。由于位姿信息反映了人脸相对于资源转移设备的位置和姿态,因此根据人脸位姿信息以及操作意图识别模型能够准确得到用户对资源转移设备的操作意图,根据操作意图提前控制资源转移设备或者关联设备执行对应的资源转移关联操作,减少了用户操作时间或者操作步骤,提高了设备使用效率。
附图说明
图1为一些实施例中提供的设备控制方法的应用环境图;
图2为一些实施例中设备控制方法的流程图;
图3为一些实施例中确定姿态信息对应的示意图;
图4A为一些实施例中人脸偏航角的示意图;
图4B为一些实施例中人脸俯仰角的示意图;
图4C为一些实施例中人脸旋转角的示意图;
图5为一些实施例中设备控制方法的流程图;
图6为一些实施例中设备控制方法的流程图;
图7为一些实施例中已训练的操作意图识别模型的训练步骤的流程图;
图8所为一些实施例中模型训练的原理图;
图9为一些实施例中设备控制装置的结构框图;
图10为一些实施例中计算机设备的内部结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的机器学习等技术,具体通过如下实施例进行说明:
图1为一些实施例中提供的设备控制方法的应用环境图,如图1所示,在该应用环境中,包括资源转移设备110以及服务器120。资源转移设备例如可以是售货机,资源转移设备110上安装有图像采集设备102,可以包括2D(2-DIMENSIONA)图像采集设备以及3D(3-DIMENSIONA)图像采集设备。图像采集设备102可以放置拍摄资源转移设备周围的环境,当检测到人脸图像时,发送到服务器120中,服务器120执行本申请实施例提供的方法,以对售货机进行控制,例如当操作意图识别结果为用户使用设备时,则可以显示优惠券,以使得用户可以根据需要获取优惠券。
服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群,可以是提供云服务器、云数据库、云存储和CDN等基础云计算服务的云服务器。资源转移设备110可以是售货机、售票机或者收银机等任意可以进行资源转移的设备,但并不局限于此。资源转移设备110以及服务器120可以通过网络等通讯连接方式进行连接,本申请在此不做限制。可以理解,设备控制方法也可以是在资源转移设备中执行的。
如图2所示,在一些实施例中,提出了一种设备控制方法,本实施例主要以该方法应用于上述图1中的服务器120来举例说明。具体可以包括以下步骤:
步骤S202,获取目标对象对应的当前人脸图像。
具体地,目标对象可以是任意出现在资源转移设备周围的人。人脸图像是包括人脸的图像,该人脸图像中还可以包括其他事物,例如小猫等。当目标对象出现在资源转移设备对应的图像采集设备的摄像范围内时,则图像采集设备可以采集得到该目标对象的人脸图像。当前人脸图像是实时采集到的图像,可以是当前时刻采集到的人脸,例如图像采集设备可以实时将采集到的图像上传到服务器中。
在一些实施例中,可以获取所有实时采集的人脸图像,也可以是每隔预设时长获取人脸图像。例如,可以是从采集得到的人脸图像序列中,每隔预设张图像选择一张图像作为当前人脸图像。
在一些实施例中,可以获取预设位置范围内的人脸图像。例如,可以获取与资源转移设备的距离在2米之内的用户的人脸图像,这样既可以减少图像处理量,又可以保证得到操作意图结果的及时性以及准确性。
在一些实施例中,人脸图像包括2D图像以及3D图像。例如可以用2D摄像头采集得到2D人脸图像以及用3D摄像头采集得到3D人脸图像。
步骤S204,根据当前人脸图像确定目标对象的人脸相对于资源转移设备的当前位姿信息。
具体地,资源转移设备是可以进行资源转移的设备,例如售货机、自动点餐设备以及收银机。资源可以在互联网上进行转移,是电子化的资源。例如资源可以是货币或者游戏币中的至少一种,资源转移是指将资源从一方转移至另一方。例如,A用户在便利店购买获取了某个物品,需要进行支付,即需要将A账户的钱转到便利店商家的账户中。
位姿信息包括位置和姿态信息。位置可以用坐标值表示,也可以用距离表示。例如,人脸位置可以用人脸在以资源转移设备的位置为坐标原点的坐标系中的坐标值表示,也可以用人脸与资源转移设备的距离表示。人脸位置可以用其中的一个或多个特征点的位置表示,多个是指至少两个。例如可以获取人脸五官对应的各个特征点的坐标,用于标识人脸的位置。姿态信息可以根据人脸的俯仰角、偏航角以及旋转角的至少一个得到,俯仰角、偏航角以及旋转角可称为欧拉角。
其中偏航角(Yaw)用于表示人脸在水平方向上,人与资源转移设备的偏离程度。俯仰角(pitch)用于表示在竖直方向上,人与资源转移设备的偏离程度。旋转角(Roll)用于表示在左右方向上,人与资源转移设备的偏离程度。其中,偏航角、俯仰角以及旋转角的角度可以是以参考位置为参考计算的,计算人脸的当前位置与参考位置在各个方向上的夹角,作为当前人脸姿态数据。参考点为人脸正对资源转移设备的位置点。因此偏航角为当前人脸相对于正对资源转移设备的人脸在水平方向上的夹角。俯仰角为当前人脸相对于正对资源转移设备的人脸在竖直方向上的夹角。旋转角为当前人脸相对于正对资源转移设备的人脸在左右方向上的夹角。
在一些实施例中,由于摄像头一般安装在资源转移设备上,因此可以将摄像头所在的位置作为资源转移设备的位置,将人脸正对资源转移设备(正对摄像头)的位置点作为坐标原点,建立三维坐标系。如图3所示,将竖直方向的坐标轴作为Z轴,将指向人脸的坐标轴作为X轴,另一坐标轴作为Y轴。因此,可以将从正对资源转移设备的人脸绕着Y轴旋转的角度作为俯仰角。将从正对资源转移设备的人脸绕着Z轴旋转的角度作为偏航角。将从正对资源转移设备的人脸绕着X轴旋转的角度作为旋转角。
如图4A所示,为一些实施例中人脸偏航角的示意图。当人脸正对摄像头时,偏航角为0度,当人脸用右边侧脸对着摄像头时,偏航角可以为30度。如图4B所示,为一些实施例中人脸俯仰角的示意图。当人脸正对摄像头时,俯仰角为0度,当人脸往下望时,则俯仰角可以为30度。如图4C所示,为一些实施例中人脸旋转角的示意图。当人脸正对摄像头时,旋转角为0度,当向左歪脖子时,则旋转角可以为30度。
在一些实施例中,可以确定当前人脸图像中目标对象对应的人脸特征点位置;根据人脸特征点的位置计算目标对象的人脸在至少一个坐标方向上相对于资源转移设备的角度信息。
具体地,人脸特征点的数量可以根据需要设置,例如眼睛、鼻子以及嘴巴对应的特征点。可以获取当前人脸图像中多个特征点的目标位置,目标位置可以用三维坐标值表示。特征点的位置可以是通过人工智能模型识别得到的。例如可以将当前人脸图像输入到特征点识别模型中,识别得到当前人脸图像中的特征点。特征点识别模型可以是卷积神经网络模型。
坐标方向可以是X轴方向、Y轴方向以及Z轴方向。可以获取人脸正对着目标资源设备时,人脸对应的特征点位置,作为参考位置,可以用三维坐标值表示参考位置。然后计算从参考位置变换到目标位置时,对应的在X、Y以及Z轴上的角度,得到人脸相对于资源转移设备的角度信息。
在一些实施例中,角度可以存在正值以及负值。例如,对于旋转角,向左歪头对应的角度的值为正,向右歪头对应的角度的值为负。
在一些实施例中,位姿信息可以是具体的值,也可以是一个范围。例如在得到俯仰角后,可以获取该俯仰角对应的范围,作为俯仰角信息,该范围作为俯仰角特征。举个实际的例子,假设俯仰角为20度,对应的范围为18~25,则可以将该范围作为俯仰角信息,该俯仰角的范围可以用特征向量表示,该俯仰角的范围对应的特征向量可以在模型训练时训练得到,从而,多个数值相近的俯仰角对应相同的一个特征,以减少特征的数量。
步骤S206,将当前位姿信息输入到已训练的操作意图识别模型中,得到目标对象对资源转移设备的操作意图识别结果。
具体地,操作意图识别模型用于确定目标对象的操作意图,已训练的操作意图识别模型是已经预先训练得到的模型。在进行模型训练时,采用的是有监督的训练方法。可以将训练样本中的训练位姿信息输入到模型中,得到模型预测的设备使用结果,根据模型预测的设备使用结果与训练位姿信息对应的设备使用结果的差异计算得到损失值,利用梯度下降方法朝着损失值降低的方向调整模型参数,直至模型收敛,得到已训练的操作意图识别模型。模型收敛的条件可以包括模型的损失值小于预设值或者是训练次数达到预设次数中的至少一种。
操作意图识别模型的类型可以根据需要设置,例如可以是采用逻辑回归或者树回归等具备预测能力的回归模型,也可采用深度学习模型。
操作意图识别结果可以为使用设备或者不使用设备。例如,可以将当前位姿信息输入到已训练的操作意图识别模型中,输出使用设备的概率,当概率大于预设概率,例如0.7时,则操作意图识别结果为使用设备。当概率小于等于预设概率,例如0.7时,则操作意图识别结果为不使用设备。
在一些实施例中,还可以获取其他的信息作为特征输入到已训练的操作意图识别模型。例如可以确定当前人脸图像中目标对象对应的人脸区域;计算人脸区域对应的人脸尺寸信息。将当前位姿信息以及人脸尺寸信息输入到已训练的操作意图识别模型中,得到目标对象对资源转移设备的操作意图识别结果。
具体地,尺寸信息可以用高度信息、宽度信息或者面积信息的至少一种表示,面积表示了人脸在人脸图像中的范围。由于摄像头的位置一般是固定的,距离摄像头越近,则尺寸越大,因此尺寸可以反映人与资源转移设备的距离,将尺寸信息作为操作意图识别模型的输入,综合多种特征信息确定目标对象的设备使用意图。
步骤S208,根据操作意图识别结果控制资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
具体地,资源转移设备对应的关联设备是指在资源转移上,与资源转移设备存在关联的设备,例如可以是服务器120本身。也可以是专门用于进行人脸特征点的提取,以根据人脸特征进行身份识别的服务器,以在资源转移时可以直接获取身份认证结果。资源转移关联操作是与资源转移有关的操作,例如可以包括预先执行资源转移中的身份识别操作或者展示与资源转移相关的推送内容的至少一种。资源转移中的身份识别操作可以是基于人脸进行身份认证的操作。与资源转移相关的推送内容可以是商品信息或者资源中的至少一个。商品可以包括具体的物品、虚拟的物品以及服务的至少一种。例如推送的可是洗发水对应的推荐信息。推送内容中的资源可以是优惠券资源。优惠券可以是折扣优惠券也可以是满减优惠券。满减优惠券在初始资源转移数值超过预设值时,会减去一定数值的资源数量,使得最终的资源转移数值小于初始资源转移数值。
上述设备控制方法,可通过获取人脸相对于资源转移设备的当前位姿信息,将当前位姿信息输入到已训练的操作意图识别模型中,得到目标对象对资源转移设备的操作意图识别结果,根据操作意图识别结果控制资源转移设备或者关联的设备执行对应的资源转移关联操作。由于位姿信息反映了人脸相对于资源转移设备的位置和姿态,因此根据人脸位姿信息以及操作意图识别模型能够准确得到用户对资源转移设备的操作意图,根据操作意图提前控制资源转移设备或者关联设备执行对应的资源转移关联操作,减少了用户操作时间或者操作步骤,提高了设备使用效率。
在一些实施例中,可以是当操作意图识别结果为使用设备时,控制资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。当操作意图识别结果为不使用设备时,则跳过控制资源转移设备执行对应的资源转移关联操作的步骤,即不执行控制资源转移设备执行对应的资源转移关联操作的步骤。
在一些实施例中,当操作意图识别结果为使用设备时,控制资源转移设备执行对应的资源转移关联操作包括:当操作意图识别结果为使用设备时,控制资源转移设备对应的身份认证设备获取目标对象的人脸特征,以根据人脸特征进行资源转移身份认证,得到目标对象的资源转移身份认证结果。
具体地,资源转移设备对应的身份认证设备用于进行身份认证,资源转移设备对应的身份认证设备可以是服务器120,也可以是其他设备,例如可以是第三方支付平台对应的设备。人脸特征用于表示人脸的特性,例如人脸特征可以是特征点的坐标值以及特征点之间的相对位置关系。不同的人脸,对应的人脸特征是不同的,因此可以根据人脸特征进行身份识别。资源转移身份认证是指该身份认证是为了进行资源转移而执行的,得到的资源转移身份认证结果为用于资源转移的身份认证结果。身份认证结果可以是认证通过或者不通过。
服务器中可以预先存储了各个用户的人脸特征。当接收到目标对象的人脸特征时,可以与服务器中预先存储的人脸特征进行对比,如果存在匹配的人脸特征,则确认身份认证结果为通过,否则为不通过。当存在匹配的人脸特征时,可以将匹配的人脸特征对应的资源账户作为目标对象的资源账户。
在实施例中,如图5所示,得到目标对象的资源转移身份认证结果后,设备控制方法还可以包括以下步骤:
步骤S502,存储目标对象的资源转移身份认证结果。
步骤S504,当接收到目标对象对应的资源转移指令时,获取存储的资源转移身份认证结果,根据资源转移身份认证结果对目标对象的资源账户中进行资源转移。
具体地,资源账户是拥有目标对象的资源的账户。例如可以是银行账户,也可以是互联网平台中的账户。资源转移指令中可以携带转出的目标资源的转移数值以及资源接收方的接收方账户。因此可以根据资源转移身份认证结果,当资源转移身份认证结果为通过时,从目标对象的资源账户中转出对应数量的资源至接收方账户。
服务器可以预先存储进行人脸身份认证的结果。因此当接收到资源转移指令时,可以直接获取存储的该结果,因此节省了资源转移的时间。例如,如果在用户购买物品后,需要进行资源转移时,开启摄像头拍摄用户的人脸,基于用户的人脸特征进行人脸认证成功后,才进行资源转移,则用户购物并支付的流程时间长。而如果预先识别到用户需要使用资源转移设备进行支付,提前基于人脸进行身份认证,则在接收到资源转移指令时,可以直接确认身份认证通过,并可以获取目标对象的资源账户,从目标对象的资源账户转出资源,节省了设备使用时间,提高了设备使用效率。
在一些实施例中,当操作意图识别结果为使用设备时,控制资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作包括:当操作意图识别结果为使用设备时,控制资源转移设备展示候选虚拟资源信息。
具体地,虚拟资源可以存储在资源账户中,能够通过互联网进行流通。虚拟资源具有一定的价值,例如候选虚拟资源可以是优惠券或者红包。候选虚拟资源的数量或者类型的至少一个可以根据需要设置。候选虚拟资源信息是与候选虚拟资源有关的信息,例如可以包括候选虚拟资源的优惠方式、资源标识以及对应的物品的图片等。优惠方式可以根据需要设置,例如为“买一送一”或者“70%的折扣”。资源标识例如可以是“编号0001”。候选虚拟资源对应的物品是指该候选虚拟资源适用的物品,即购买时可以使用该候选虚拟资源进行支付的物品。
在一些实施例中,控制资源转移设备展示候选虚拟资源信息包括:获取目标对象对应的目标对象特征,根据目标对象特征确定目标对象对应的目标标签;控制资源转移设备展示目标标签对应的候选虚拟资源信息。
具体地,对象特征用于表示用户的特点。可以是头发特征、衣服特征或者表情特征中的至少一个。头发特征可以用头发的颜色或者头发的长短的至少一个等表示。衣服特征可以用衣服所属的类别表示。标签用于对用户进行分类。一个用户可以对应多个标签。例如标签可以是女、年轻、妈妈、时尚、男或者居家等标签。预先存储了标签与虚拟资源的对应关系。例如可以根据虚拟资源所对应的物品的类别对虚拟资源进行分类。预先存储了标签与虚拟资源的类别的对应关系,标签与虚拟资源的类别的对应关系可以根据经验确定。举个实际的例子,虚拟资源可以分为运动鞋类以及奶粉类的虚拟资源。运动鞋类对应的对象标签为年轻。奶粉类对应的标签为妈妈。因此,如果目标对象的标签为妈妈,则推送的优惠券为奶粉类优惠券。从而可以对不同类型的用户有针对性的展示优惠券信息,提高设备使用效率。
对象特征与对象标签的关系可以是通过人工智能模型得到的,例如可以预先训练根据对象特征识别对象标签的标签识别模型。将目标对象的图像输入特征提取模型中,提取得到对象特征,然后将对象特征输入到标签识别模型中,得到对象的标签。
在一些实施例中,如图6所示,设备控制方法还包括:
步骤S602,将资源选择操作所指示选择的候选虚拟资源,作为目标对象对应的目标虚拟资源。
具体地,目标对象对应的目标虚拟资源是指该目标对象可以使用该目标虚拟资源。资源选择操作可以是语音、手势或者触摸操作的至少一种。例如可以是发出“选择0001优惠券的”语音,服务器将编号为0001的优惠券作为目标对象拥有的资源。用户可以是在展示优惠券的位置进行触摸操作,服务器将该候选虚拟资源作为目标虚拟资源。
步骤S604,获取目标对象对应的初始资源转移数值,根据目标虚拟资源以及初始资源转移数值进行资源计算,得到目标资源转移数值。
具体地,初始资源转移数值是指未使用目标虚拟资源时,目标对象所要转移的资源的数量。可以利用目标虚拟资源进行资源抵扣,以减少要转移的资源转移量。资源计算的方式根据目标虚拟资源对应的计算规则确定。可以是进行减法运算,也可以是进行乘法运算。例如如果是满减优惠券,则可以将初始资源转移数值减去该优惠券代表的虚拟资源数值,得到目标资源数值。如果是折扣优惠券,则可以是将初始资源转移数值乘以该优惠券代表的折扣比例,计算得到折扣资源数值,将初始资源转移数值减去折扣资源数值,得到目标资源转移数值。
步骤S606,根据目标资源转移数值从目标对象的资源账户中转出对应数量的资源。
具体地,当得到资源转移指令时,可以从目标对象的资源账户中转出目标资源转移数值的资源。例如,假设目标对象的资源账户的余额为100元,目标资源转移数值为80元,则从该账户中转出80元。
本申请实施例中,通过在预测到用户将要使用资源转移设备,例如收银设备时,可以展示虚拟资源例如优惠券,因此用户可以根据需要选择虚拟资源,根据虚拟资源进行资源转移。节省了用户获取优惠券的操作,提高了资源转移效率。例如,当用户到商场的收银台进行支付时,往往很难确认手中的哪些物品是有优惠的。而通过本申请实施例提供的方法,可以及时为用户展示优惠券信息,使得用户可以根据手中的物品获取所要使用的优惠券。
在一些实施例中,可以利用人脸图像对目标对象进行身份识别,从而得到目标对象的资源账户,当接收到目标对象的资源选择操作时,将该目标虚拟资源转移到目标对象的资源账户中。当需要从目标对象的资源账户转出资源时,则可以根据目标虚拟资源确定目标资源转移数值,根据目标资源转移数值从目标对象的资源账户中转出对应数量的资源。这样,用户通过简单的资源选择操作,在无需通过输入用户账号和密码的情况下,便可直接将目标虚拟资源加入到用户的账户中,简单便捷。
在一些实施例中,在利用已训练的操作意图识别模型进行意图识别结果之前,还需要进行模型训练。如图7所示,已训练的操作意图识别模型的训练步骤包括:
步骤S702,获取训练对象在多个采集时刻对应的训练位姿信息。
具体地,训练对象为用于训练模型的位姿信息对应的对象。训练对象和目标对象一般情况下是不同的。例如,训练对象可以有几万个,可以利用多台售货机的摄像头拍摄得到对象的姿态,用于进行模型训练。而模型训练完毕后,则可以部署于服务器中,对服务器所管理的售货机进行设备控制。采集时刻是指采集该训练位姿对应的图像的时刻。训练对象的个数可以根据实际确定,例如可以是获取4万张图像,获取这4万张图像中的人脸的位姿信息,作为训练位姿信息。
步骤S704,将在训练位姿信息的采集时刻之后第一时长内的设备使用结果作为训练位姿信息的训练标签。
具体地,第一时长可以根据需要设置,例如可以为2~5秒。训练位姿信息对应的设备使用结果可以是使用设备或者没有使用设备。训练位姿信息对应的设备使用结果是真实的使用结果,例如可以拍摄训练图像,根据训练图像得到训练位姿,如果在训练图像的采集时刻之后的第一时长内用户使用了资源转移设备,则设备使用结果为是。如果第一时长内没有使用资源转移设备,则设备使用结果为否。设备使用结果可以用数值表示,例如如果使用了设备,则表示为1,没有使用则为0。
步骤S706,将训练位姿信息以及对应的训练标签组成训练样本,得到训练对象在多个采集时刻对应的训练样本,训练样本组成训练样本集合。
具体地,有监督的模型训练中,训练样本是由输入到模型中进行预测的信息以及标签组成的。训练位姿信息为输入到模型中进行预测的信息,因此可以将训练位姿信息以及对应的训练标签组成训练样本,组成训练样本集合。
步骤S708,根据训练样本集合进行模型训练,得到已训练的操作意图识别模型。
具体地,在根据训练样本集合进行模型训练时,可以将每个训练样本输入到还未训练完成的操作意图识别模型中,得到模型输出的预测结果。模型输出的训练结果可以为使用设备的概率,将模型输出的结果与训练样本的标签进行对比。根据模型输出的结果与训练样本的标签的差值得到模型损失值。朝着损失值变小的方向调整模型中的参数,可以调整多次,直至模型收敛。其中,每次需要调整模型参数时,可以是结合多个训练样本对应的模型输出的结果与标签的差值得到模型损失值。例如,可以分批次进行训练,将训练样本集合分为多批次,对于每个批次的训练样本,计算模型输出的结果与训练样本的标签的差值的平方和,作为模型损失值。
在一些实施例中,获取训练对象在多个采集时刻对应的训练位姿信息包括:获取训练对象在多个采集时刻对应的训练位姿信息,同一训练对象的训练位姿信息对应的采集时刻组成的采集时刻序列中,相邻的采集时刻的间隔时长为第一时长,采集时刻序列按照时间顺序进行排序。
在一些实施例中,根据训练样本集合进行模型训练,得到已训练的操作意图识别模型包括:将当前训练对象对应的当前训练样本中的训练位姿信息输入到待训练的操作意图识别模型中,得到模型输出结果;计算模型输出结果与当前训练样本对应的标签的差异,得到差异计算结果;根据当前训练对象对应的各个训练样本的差异结算结果计算得到当前模型损失值;根据当前模型损失值对待训练的操作意图识别模型进行调整,得到已训练的操作意图识别模型。
具体地,对于一个训练对象,可以获取其在多个采集时刻的位姿信息,作为训练位姿信息。其中,训练位姿信息对应的采集时刻序列中,采集时刻序列是按照时间进行排序的。采集时刻越早,则排序可以是越前。例如,第一时长可以为3秒,由于某一个用户在走向售货机的过程中,姿态是不断变化的。因此可以每隔3秒采集一次该用户的姿态信息。如果用户走向售货机到停止的时间为12秒,则可以采集5次位姿信息。
当前训练样本是指在模型训练过程中,其对应的训练位姿信息当前要输入到模型中进行预测的样本。当前训练对象是当前训练样本对应的训练对象。可以将模型输出结果与当前训练样本对应的标签进行相减,得到差异计算结果。例如假设模型输出结果为0.8,而当前训练样本对应的设备使用结果为使用,即标签值为1,差异计算结果为0.8-1=-0.2。对于当前训练对象,可以综合其对应的各个训练样本的差异计算结果得到当前训练对象对应的模型损失值,例如将差异计算结果的平方和作为当前模型损失值。朝着使当前模型损失值变小的方向调整模型的参数。可以理解,步骤当前模型损失值对待训练的操作意图识别模型进行调整,得到已训练的操作意图识别模型中,如果当前训练对象是最后一次训练时对应的对象,则可以直接得到已训练的操作意图识别模型。如果当前训练对象不是最后一次训练时对应的对象,则可以再获取另一个训练对象作为当前训练对象,继续进行模型训练,直至模型收敛,得到已训练的操作意图识别模型。
本申请实施例中,对于一个训练对象的训练样本,作为同一个批次的训练样本,即一个训练对象的训练样本作为一个训练批次,进行一次模型参数的调整。即每利用一个训练对象在多个时刻采集得到的训练样本进行训练,则计算一次模型损失值,根据该模型损失值进行模型参数的调整。由于是以训练对象对应的训练样本为一次模型参数调整的单位的,而且同一个训练对象的训练位姿信息的采集时刻的间隔时长均为第一时长,因此,对于同一个训练对象,不同时刻的训练位姿信息,对应的设备使用结果的时刻是不同的,从而提高了训练样本中训练标签的准确性,也相应的提高了模型的准确度。
例如,对于第3秒的训练位姿信息,其对应的设备使用结果是根据第3秒到第6秒之间,用户是否使用设备确定的,如果用户在此期间使用了设备,则设备使用结果为是。下一个训练位姿信息是第6秒的位姿信息,其对应的设备使用结果是根据第6秒到第9秒之间,用户是否使用设备确定的,从而对于同一个训练对象,不同时刻的训练位姿信息,对应的设备使用结果根据不同时间段内用户是否使用设备确定。
例如,如图8所示,为一些实施例中模型训练的原理图。X表示训练样本的位姿信息,需要输入到模型中进行预测。其中xindex,t代表t时刻下标为index的训练位姿信息,相当于索引值。由于训练位姿信息有多个,例如包括俯仰角、偏航角以及人脸面积等信息,因此可以为每种位姿信息分配一个index,在输入位姿信息到模型中时,携带index,以确认该位姿信息是哪种类型的位姿信息,例如是俯仰角还是偏航角。n表示一个样本中,位姿信息的个数,△t表示训练位姿信息对应的采集时刻的间隔时长。Y是训练样本标签组成的向量,可以将每批次的训练样本的标签组成标签向量。yt是指t-△t时刻的位姿信息对应的设备使用结果。如果是使用设备,则可以为1,没有使用设备,则为0。f是将位姿信息映射到用户是否使用资源转移终端的函数,即是采用的机器学习模型。即可以根据训练样本对模型f进行训练,得到已训练的模型。
例如,以逻辑回归模型为例,模型训练的过程主要是解以下公式,由于X和Y是已知数据,权重W是待求数据,因此可以根据X和Y得到权重W,因此可以输出函数y=g(x)。g表示激活函数,例如为Softmax函数。
Figure GDA0004066946640000171
得到已训练的操作意图识别模型后,在预测用户是否使用设备时,可以获取实时采集的位姿信息数据输入训练阶段获得的模型f中,输出使用设备的概率,当概率大于预设阈值,例如0.6时,则预测用户在△t时刻内将会使用设备。以逻辑回归为例,预测的过程相当于求解以下算式的值yt+△t
yt+Δt=g(W·Xt)=g([w0 w1 … wn]·[x0,t x1,t … xn,t])
以下以预测用户需要在商店购物时,是否使用自动收银设备对本申请实施例提供的方法进行说明。包括以下步骤:
1、获取目标对象对应的当前人脸图像。
具体地,可以利用自动收银设备上的摄像头采集经过的人的人脸图像,并实时上传到服务器中。
2、根据当前人脸图像确定目标对象的人脸相对于资源转移设备的当前位姿信息。
具体地,服务器可以根据人脸图像确定当前的人脸相对于自动收银设备的俯仰角、偏航角、旋转角以及坐标等信息。
3、将当前位姿信息输入到已训练的操作意图识别模型中,得到目标对象对资源转移设备的操作意图识别结果。
具体地,服务器中部署有操作意图识别模型,将当前位姿信息输入到该模型中,可以预测该用户是否会在第一时长内例如3秒内使用收银机进行自动结账。
4、当识别结果为用户使用设备时,获取该用户的人脸图像,基于人脸图像进行身份认证。
具体地,服务器中可以存储多个用户的人脸图像,因此可以获取该用户的人脸图像,与服务器中存储的多个用户的人脸图像进行匹配,当匹配得到对应的人脸图像时,将匹配的人脸图像对应的用户账户作为该用户的账户,身份认证通过。
5、当识别结果为用户使用设备时,控制资源转移设备展示候选虚拟资源信息。
具体地,步骤4和5可以是同步进行的。候选虚拟资源信息可以为优惠券,例如控制收银机设备的屏幕上显示多张优惠券信息。
6、将接收到的资源选择操作所指示选择的候选虚拟资源,作为目标对象对应的目标虚拟资源。
具体地,如果用户点击了其中的一个优惠券,则可以将该优惠券加入到用户的账户中,用户的账户可以是在步骤4中获取得到的。
7、获取目标对象对应的待转移的初始资源转移数值,根据目标虚拟资源以及初始资源转移数量进行资源计算,得到目标资源转移数值。
具体地,收银机的摄像头可以对用户手中的物品条码进行扫描,得到该物品的价格,作为初始资源转移数值,并根据用户的账户中的优惠券计算得到目标资源转移数值。例如,假设物品的价格为20元,优惠券为有20%的折扣,则目标资源转移数值为16元。
8、当接收到目标对象对应的资源转移指令时,获取存储的资源转移身份认证结果,根据资源转移身份认证结果从目标对象的资源账户中转出资源。
具体地,当用户点击收银机的“确认支付”控件时,收银设备向服务器发送资源转移指令,获取存储的步骤4中的身份认证结果,如果身份认证结果为通过,则从该用户的账户中转出16元。
如图9所示,在一个实施例中,提供了一种设备控制装置,该设备控制装置可以集成于上述的服务器120中,具体可以包括当前人脸图像获取模块902、当前位姿信息确定模块904、操作意图识别结果得到模块906以及控制模块908。
当前人脸图像获取模块902,用于获取目标对象对应的当前人脸图像。
当前位姿信息确定模块904,用于根据当前人脸图像确定目标对象的人脸相对于资源转移设备的当前位姿信息。
操作意图识别结果得到模块906,用于将当前位姿信息输入到已训练的操作意图识别模型中,得到目标对象对资源转移设备的操作意图识别结果。
控制模块908,用于根据操作意图识别结果控制资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
在一些实施例中,控制模块908用于:当操作意图识别结果为使用设备时,控制资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
在一些实施例中,控制模块908用于:当操作意图识别结果为使用设备时,控制资源转移设备对应的身份认证设备获取目标对象的人脸特征,以根据人脸特征进行资源转移身份认证,得到目标对象的资源转移身份认证结果。
在一些实施例中,设备控制装置还包括:
存储模块,用于存储目标对象的资源转移身份认证结果;
资源转移模块,用于当接收到目标对象对应的资源转移指令时,获取存储的资源转移身份认证结果,根据资源转移身份认证结果对目标对象的资源账户中进行资源转移。
在一些实施例中,控制模块908用于:
当操作意图识别结果为使用设备时,控制资源转移设备展示候选虚拟资源信息;
设备控制装置还包括:
目标虚拟资源确定模块,用于将资源选择操作所指示选择的候选虚拟资源,作为目标对象对应的目标虚拟资源。
在一些实施例中,设备控制装置还包括:
目标资源转移数值得到模块,用于获取目标对象对应的初始资源转移数值,根据目标虚拟资源以及初始资源转移数值进行资源计算,得到目标资源转移数值;
转出模块,用于根据目标资源转移数值从目标对象的资源账户中转出对应数量的资源。
在一些实施例中,控制模块908用于:
获取目标对象对应的目标对象特征,根据目标对象特征确定目标对象对应的目标标签;
控制资源转移设备展示目标标签对应的候选虚拟资源信息。
在一些实施例中,已训练的操作意图识别模型的训练模块包括:
训练位姿信息获取单元,用于获取训练对象在多个采集时刻对应的训练位姿信息;
训练标签确定单元,用于将在训练位姿信息的采集时刻之后第一时长内的设备使用结果作为训练位姿信息的训练标签;
训练样本得到单元,用于将训练位姿信息以及对应的训练标签组成训练样本,得到训练对象在多个采集时刻对应的训练样本,训练样本组成训练样本集合;
训练单元,用于根据训练样本集合进行模型训练,得到已训练的操作意图识别模型。
在一些实施例中,训练位姿信息获取单元用于:获取训练对象在多个采集时刻对应的训练位姿信息,同一训练对象的训练位姿信息对应的采集时刻组成的采集时刻序列中,相邻的采集时刻的间隔时长为第一时长,采集时刻序列按照时间顺序进行排序;训练单元用于:将当前训练对象对应的当前训练样本中的训练位姿信息输入到待训练的操作意图识别模型中,得到模型输出结果;计算模型输出结果与当前训练样本对应的标签的差异,得到差异计算结果;根据当前训练对象对应的各个训练样本的差异结算结果计算得到当前模型损失值;根据当前模型损失值对待训练的操作意图识别模型进行调整,得到已训练的操作意图识别模型。
在一些实施例中,当前位姿信息确定模块904用于:确定当前人脸图像中目标对象对应的人脸特征点位置;根据人脸特征点位置计算目标对象的人脸在至少一个坐标方向上相对于资源转移设备的角度信息。
在一些实施例中,设备控制装置还包括:人脸区域确定模块,用于确定当前人脸图像中目标对象对应的人脸区域;尺寸信息计算模块,用于计算得到人脸区域对应的人脸尺寸信息;操作意图识别结果得到模块906用于:将当前位姿信息以及人脸尺寸信息输入到已训练的操作意图识别模型中,得到目标对象对资源转移设备的操作意图识别结果。
图10示出了一些实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图10所示,该计算机设备包括通过系统总线连接的处理器、存储器以及网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现设备控制方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行设备控制方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一些实施例中,本申请提供的设备控制装置可以实现为一种计算机程序的形式,计算机程序可在如图10所示的计算机设备上运行。计算机设备的存储器中可存储组成该设备控制装置的各个程序模块,比如,当前人脸图像获取模块902、当前位姿信息确定模块904、操作意图识别结果得到模块906以及控制模块908。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的设备控制方法中的步骤。
例如,图10所示的计算机设备可以通过如图9所示的设备控制装置中当前人脸图像获取模块902,用于获取目标对象对应的当前人脸图像。通过当前位姿信息确定模块904,用于根据当前人脸图像确定目标对象的人脸相对于资源转移设备的当前位姿信息。通过操作意图识别结果得到模块906,用于将当前位姿信息输入到已训练的操作意图识别模型中,得到目标对象对资源转移设备的操作意图识别结果。通过控制模块908,用于根据操作意图识别结果控制资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
在一些实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述设备控制方法的步骤。此处设备控制方法的步骤可以是上述各个实施例的设备控制方法中的步骤。
在一些实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述设备控制方法的步骤。此处设备控制方法的步骤可以是上述各个实施例的设备控制方法中的步骤。
应该理解的是,虽然本申请各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (22)

1.一种设备控制方法,所述方法包括:
获取目标对象对应的当前人脸图像;
根据所述当前人脸图像确定所述目标对象的人脸相对于资源转移设备的当前位姿信息;
将所述当前位姿信息输入到已训练的操作意图识别模型中,得到所述目标对象对所述资源转移设备的操作意图识别结果;所述已训练的操作意图识别模型的训练步骤包括:获取训练对象在多个采集时刻对应的训练位姿信息;将在所述训练位姿信息的采集时刻之后第一时长内的设备使用结果作为所述训练位姿信息的训练标签;将所述训练位姿信息以及对应的训练标签组成训练样本,得到所述训练对象在多个采集时刻对应的训练样本,所述训练样本组成训练样本集合;根据所述训练样本集合进行模型训练,得到已训练的操作意图识别模型;
根据所述操作意图识别结果控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
2.根据权利要求1所述的方法,其特征在于,所述根据所述操作意图识别结果控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作包括:
当所述操作意图识别结果为使用设备时,控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
3.根据权利要求2所述的方法,其特征在于,所述当所述操作意图识别结果为使用设备时,控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作包括:
当所述操作意图识别结果为使用设备时,控制所述资源转移设备对应的身份认证设备获取所述目标对象的人脸特征,以根据所述人脸特征进行资源转移身份认证,得到所述目标对象的资源转移身份认证结果。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
存储所述目标对象的资源转移身份认证结果;
当接收到所述目标对象对应的资源转移指令时,获取存储的所述资源转移身份认证结果,根据所述资源转移身份认证结果对所述目标对象的资源账户中进行资源转移。
5.根据权利要求2所述的方法,其特征在于,所述当所述操作意图识别结果为使用设备时,控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作包括:
当所述操作意图识别结果为使用设备时,控制所述资源转移设备展示候选虚拟资源信息;
所述方法还包括:
将资源选择操作所指示选择的候选虚拟资源,作为所述目标对象对应的目标虚拟资源。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取所述目标对象对应的初始资源转移数值,根据所述目标虚拟资源以及所述初始资源转移数值进行资源计算,得到目标资源转移数值;
根据所述目标资源转移数值从所述目标对象的资源账户中转出对应数量的资源。
7.根据权利要求5所述的方法,其特征在于,所述控制所述资源转移设备展示候选虚拟资源信息包括:
获取所述目标对象对应的目标对象特征,根据所述目标对象特征确定所述目标对象对应的目标标签;
控制所述资源转移设备展示所述目标标签对应的候选虚拟资源信息。
8.根据权利要求1所述的方法,其特征在于,所述获取训练对象在多个采集时刻对应的训练位姿信息包括:
获取训练对象在多个采集时刻对应的训练位姿信息,同一训练对象的训练位姿信息对应的采集时刻组成的采集时刻序列中,相邻的采集时刻的间隔时长为所述第一时长,所述采集时刻序列按照时间顺序进行排序;
所述根据所述训练样本集合进行模型训练,得到已训练的操作意图识别模型包括:
将当前训练对象对应的当前训练样本中的训练位姿信息输入到待训练的操作意图识别模型中,得到模型输出结果;
计算所述模型输出结果与所述当前训练样本对应的标签的差异,得到差异计算结果;
根据所述当前训练对象对应的各个训练样本的差异结算结果计算得到当前模型损失值;
根据所述当前模型损失值对待训练的操作意图识别模型进行调整,得到已训练的操作意图识别模型。
9.根据权利要求1所述的方法,其特征在于,所述根据所述当前人脸图像确定所述目标对象的人脸相对于资源转移设备的当前位姿信息包括:
确定所述当前人脸图像中目标对象对应的人脸特征点位置;
根据所述人脸特征点位置计算所述目标对象的人脸在至少一个坐标方向上相对于所述资源转移设备的角度信息。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述当前人脸图像中目标对象对应的人脸区域;
计算得到所述人脸区域对应的人脸尺寸信息;
所述将所述当前位姿信息输入到已训练的操作意图识别模型中,得到所述目标对象对所述资源转移设备的操作意图识别结果包括:
将所述当前位姿信息以及所述人脸尺寸信息输入到已训练的操作意图识别模型中,得到所述目标对象对所述资源转移设备的操作意图识别结果。
11.一种设备控制装置,所述装置包括:
当前人脸图像获取模块,用于获取目标对象对应的当前人脸图像;
当前位姿信息确定模块,用于根据所述当前人脸图像确定所述目标对象的人脸相对于资源转移设备的当前位姿信息;
操作意图识别结果得到模块,用于将所述当前位姿信息输入到已训练的操作意图识别模型中,得到所述目标对象对所述资源转移设备的操作意图识别结果;所述已训练的操作意图识别模型的训练步骤包括:获取训练对象在多个采集时刻对应的训练位姿信息;将在所述训练位姿信息的采集时刻之后第一时长内的设备使用结果作为所述训练位姿信息的训练标签;将所述训练位姿信息以及对应的训练标签组成训练样本,得到所述训练对象在多个采集时刻对应的训练样本,所述训练样本组成训练样本集合;根据所述训练样本集合进行模型训练,得到已训练的操作意图识别模型;
控制模块,用于根据所述操作意图识别结果控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
12.根据权利要求11所述的装置,其特征在于,所述控制模块用于:
当所述操作意图识别结果为使用设备时,控制所述资源转移设备或者对应的关联设备的至少一个执行资源转移关联操作。
13.根据权利要求12所述的装置,其特征在于,所述控制模块用于:
当所述操作意图识别结果为使用设备时,控制所述资源转移设备对应的身份认证设备获取所述目标对象的人脸特征,以根据所述人脸特征进行资源转移身份认证,得到所述目标对象的资源转移身份认证结果。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
存储模块,用于存储所述目标对象的资源转移身份认证结果;
资源转移模块,用于当接收到所述目标对象对应的资源转移指令时,获取存储的所述资源转移身份认证结果,根据所述资源转移身份认证结果对所述目标对象的资源账户中进行资源转移。
15.根据权利要求12所述的装置,其特征在于,所述控制模块用于:
当所述操作意图识别结果为使用设备时,控制所述资源转移设备展示候选虚拟资源信息;
所述装置还包括:
目标虚拟资源确定模块,用于将资源选择操作所指示选择的候选虚拟资源,作为所述目标对象对应的目标虚拟资源。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
目标资源转移数值得到模块,用于获取所述目标对象对应的初始资源转移数值,根据所述目标虚拟资源以及所述初始资源转移数值进行资源计算,得到目标资源转移数值;
转出模块,用于根据所述目标资源转移数值从所述目标对象的资源账户中转出对应数量的资源。
17.根据权利要求15所述的装置,其特征在于,所述控制模块用于:
获取所述目标对象对应的目标对象特征,根据所述目标对象特征确定所述目标对象对应的目标标签;
控制所述资源转移设备展示所述目标标签对应的候选虚拟资源信息。
18.根据权利要求11所述的装置,其特征在于,所述装置还用于:
获取训练对象在多个采集时刻对应的训练位姿信息,同一训练对象的训练位姿信息对应的采集时刻组成的采集时刻序列中,相邻的采集时刻的间隔时长为所述第一时长,所述采集时刻序列按照时间顺序进行排序;
将当前训练对象对应的当前训练样本中的训练位姿信息输入到待训练的操作意图识别模型中,得到模型输出结果;
计算所述模型输出结果与所述当前训练样本对应的标签的差异,得到差异计算结果;
根据所述当前训练对象对应的各个训练样本的差异结算结果计算得到当前模型损失值;
根据所述当前模型损失值对待训练的操作意图识别模型进行调整,得到已训练的操作意图识别模型。
19.根据权利要求11所述的装置,其特征在于,所述当前位姿信息确定模块用于:
确定所述当前人脸图像中目标对象对应的人脸特征点位置;
根据所述人脸特征点位置计算所述目标对象的人脸在至少一个坐标方向上相对于所述资源转移设备的角度信息。
20.根据权利要求11所述的装置,其特征在于,所述装置还包括:
人脸区域确定模块,用于确定所述当前人脸图像中目标对象对应的人脸区域;
尺寸信息计算模块,用于计算得到所述人脸区域对应的人脸尺寸信息;
所述操作意图识别结果得到模块用于:
将所述当前位姿信息以及所述人脸尺寸信息输入到已训练的操作意图识别模型中,得到所述目标对象对所述资源转移设备的操作意图识别结果。
21.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至10中任一项权利要求所述设备控制方法的步骤。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至10中任一项权利要求所述设备控制方法的步骤。
CN201911201112.2A 2019-11-29 2019-11-29 设备控制方法、装置、计算机设备和存储介质 Active CN110955879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911201112.2A CN110955879B (zh) 2019-11-29 2019-11-29 设备控制方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911201112.2A CN110955879B (zh) 2019-11-29 2019-11-29 设备控制方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN110955879A CN110955879A (zh) 2020-04-03
CN110955879B true CN110955879B (zh) 2023-04-18

Family

ID=69979015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911201112.2A Active CN110955879B (zh) 2019-11-29 2019-11-29 设备控制方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110955879B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113885710B (zh) * 2021-11-02 2023-12-08 珠海格力电器股份有限公司 智能设备的控制方法、控制装置及智能系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462923A (zh) * 2014-12-31 2015-03-25 河南华辰智控技术有限公司 应用于移动通信设备的智能型虹膜身份识别系统
CN108335096A (zh) * 2018-01-18 2018-07-27 深圳市易停车库科技有限公司 基于人脸识别的停车费用支付方法及系统
CN110175514A (zh) * 2019-04-15 2019-08-27 阿里巴巴集团控股有限公司 一种刷脸支付提示方法、装置及设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014106219A1 (en) * 2012-12-31 2014-07-03 Burachas Giedrius Tomas User centric interface for interaction with visual display that recognizes user intentions
EP3062271A1 (en) * 2015-02-27 2016-08-31 Samsung Electronics Co., Ltd. Electronic device including electronic payment system and operating method thereof
CN106156108A (zh) * 2015-04-05 2016-11-23 腾讯科技(深圳)有限公司 一种虚拟资源的转移方法、装置和系统
CN105550634B (zh) * 2015-11-18 2019-05-03 广东微模式软件股份有限公司 基于Gabor特征与字典学习的人脸姿态识别方法
CN105653909B (zh) * 2016-01-26 2018-09-25 腾讯科技(深圳)有限公司 信息处理方法、第一终端、第二终端、服务器及系统
CN106254067B (zh) * 2016-08-08 2019-07-16 厦门日辰科技有限公司 操作意图识别方法及其系统
JP7064576B2 (ja) * 2017-04-28 2022-05-10 アノノス インコーポレイテッド 非集中型システムで集中型プライバシー制御を実施するためのシステムや方法
CN107247920A (zh) * 2017-05-05 2017-10-13 腾讯科技(深圳)有限公司 交互控制方法、装置和计算机可读存储介质
CN107679861B (zh) * 2017-08-30 2022-11-11 创新先进技术有限公司 资源转移方法、资金支付方法、装置及电子设备
CN107944380B (zh) * 2017-11-20 2022-11-29 腾讯科技(深圳)有限公司 身份识别方法、装置及存储设备
CN110163699A (zh) * 2018-02-11 2019-08-23 阿里巴巴集团控股有限公司 商品处理方法、系统及移动设备
CN109711827B (zh) * 2018-12-27 2021-06-25 武汉市天蝎科技有限公司 一种近眼显示设备的新零售支付方法及支付系统
CN109872160A (zh) * 2019-02-01 2019-06-11 广州逗号智能科技有限公司 电子支付方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462923A (zh) * 2014-12-31 2015-03-25 河南华辰智控技术有限公司 应用于移动通信设备的智能型虹膜身份识别系统
CN108335096A (zh) * 2018-01-18 2018-07-27 深圳市易停车库科技有限公司 基于人脸识别的停车费用支付方法及系统
CN110175514A (zh) * 2019-04-15 2019-08-27 阿里巴巴集团控股有限公司 一种刷脸支付提示方法、装置及设备

Also Published As

Publication number Publication date
CN110955879A (zh) 2020-04-03

Similar Documents

Publication Publication Date Title
US11497267B2 (en) Systems and methods for full body measurements extraction
US20210158023A1 (en) System and Method for Generating Image Landmarks
CN111310938A (zh) 基于半监督的横向联邦学习优化方法、设备及存储介质
CN108427927B (zh) 目标再识别方法和装置、电子设备、程序和存储介质
CN110245611B (zh) 图像识别方法、装置、计算机设备和存储介质
CN111476806B (zh) 图像处理方法、装置、计算机设备和存储介质
Hashmi et al. FashionFit: Analysis of mapping 3D pose and neural body fit for custom virtual try-on
CN109670546B (zh) 一种基于预设模板的商品匹配及数量回归识别算法
WO2020134102A1 (zh) 物品识别方法、装置、售货系统和存储介质
CN109858333A (zh) 图像处理方法、装置、电子设备及计算机可读介质
CN111784845A (zh) 基于人工智能的虚拟试穿方法、装置、服务器及存储介质
CN113722583A (zh) 推荐方法、推荐模型训练方法及相关产品
CN108805644A (zh) 贩售机的商品售卖方法以及贩售机
CN110955879B (zh) 设备控制方法、装置、计算机设备和存储介质
CN109242671A (zh) 一种基于多视角不完整数据的信贷违约预测方法及系统
CN111967924A (zh) 商品推荐方法、商品推荐装置、计算机设备和介质
CN110232588A (zh) 一种实体店管理方法以及实体店管理系统
CN112132868B (zh) 一种支付信息的确定方法、装置及设备
CN115409583A (zh) 一种平台账户处理方法、系统、计算机设备及介质
CN114219578A (zh) 无人服装售卖方法、装置、终端及存储介质
US20220043891A1 (en) System and method for processing copyright and profit distribution of clothes fashion design using blockchain
CN114066564A (zh) 服务推荐时间确定方法、装置、计算机设备、存储介质
Nair et al. Outfit recommendation–using image processing
CN115880740A (zh) 人脸活体检测方法、装置、计算机设备和存储介质
CN112528140A (zh) 信息推荐方法、装置、设备、系统及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40022455

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant