CN115454241A - 一种显示方法、装置、设备和存储介质 - Google Patents
一种显示方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN115454241A CN115454241A CN202211078515.4A CN202211078515A CN115454241A CN 115454241 A CN115454241 A CN 115454241A CN 202211078515 A CN202211078515 A CN 202211078515A CN 115454241 A CN115454241 A CN 115454241A
- Authority
- CN
- China
- Prior art keywords
- target object
- target
- interface
- image
- displaying
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000001815 facial effect Effects 0.000 claims abstract description 32
- 238000004590 computer program Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims 1
- 230000008569 process Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000013475 authorization Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000009529 body temperature measurement Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000001931 thermography Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J5/00—Radiation pyrometry, e.g. infrared or optical thermometry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/166—Detection; Localisation; Normalisation using acquisition arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种显示方法、装置、设备和存储介质。该方法包括:通过红外线传感器获取目标对象的温度信息;若所述目标对象的温度信息处于目标温度阈值范围内,则通过摄像头获取所述目标对象的面部图像;若所述目标对象的面部图像为目标对象的正面图像,则显示目标界面。本发明实施例通过红外线传感器获取目标对象的温度信息并识别目标对象的温度信息是否在目标温度阈值范围内,通过摄像头获取目标对象的面部图像并识别目标对象的面部图像是否为目标对象的正面图像,进而显示目标界面,可以使得目标界面的唤醒方式更加多元化,同时对目标对象的识别结果更加准确。
Description
技术领域
本发明涉及机器人技术领域,尤其涉及一种显示方法、装置、设备和存储介质。
背景技术
近年来,随着智能终端的普及和5G通信技术的发展,语音识别技术、语音合成技术以及人像合成技术在我国诸多行业具有广泛的应用。基于上述技术的数字人在智能客服、直播以及营销等场景下均有应用。但是目前应用的场景仅局限于手机端或电脑屏幕上,而且唤醒方式单一,主要通过靠声音中的关键词唤醒。
当前企业前台的屏幕用途较单一,多为播放企业宣传视频或图片,若来访客户有需求需要找到专业人员进行解答和处理。若专业人员无法进行产品讲解或流程查询还需要联系其他工作人员进行处理,从而造成占用企业人力资源进行重复性的知识讲解的问题。
发明内容
本发明提供了一种显示方法、装置、设备和存储介质,以解决现有技术中数字人唤醒方式单一的问题,可以使得唤醒方式更加多元化,同时对目标对象的识别结果更加准确。
根据本发明的一方面,提供了一种显示方法,该方法包括:
通过红外线传感器获取目标对象的温度信息;
若所述目标对象的温度信息处于目标温度阈值范围内,则通过摄像头获取所述目标对象的面部图像;
若所述目标对象的面部图像为目标对象的正面图像,则显示目标界面。
根据本发明的另一方面,提供了一种显示装置,该装置包括:
第一获取模块,用于通过红外线传感器获取目标对象的温度信息;
第二获取模块,用于若所述目标对象的温度信息处于目标温度阈值范围内,则通过摄像头获取所述目标对象的面部图像;
第一显示模块,用于若所述目标对象的面部图像为目标对象的正面图像,则显示目标界面。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的显示方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的显示方法。
本发明实施例的技术方案,通过红外线传感器获取目标对象的温度信息,若目标对象的温度信息处于目标温度阈值范围内,则通过摄像头获取目标对象的面部图像,若目标对象的面部图像为目标对象的正面图像,则显示目标界面,解决了现有技术中数字人唤醒方式单一的问题,可以使得目标界面的唤醒方式更加多元化,同时取得了对目标对象的识别结果更加准确的有益效果。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种显示方法的流程图;
图2是根据本发明实施例二提供的一种显示装置的结构示意图;
图3是实现本发明实施例的显示方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1是根据本发明实施例一提供的一种显示方法的流程图,本实施例可适用于显示情况,该方法可以由显示装置来执行,该显示装置可以采用硬件和/或软件的形式实现,该显示装置可集成在任何提供显示功能的电子设备中。如图1所示,该方法包括:
S101、通过红外线传感器获取目标对象的温度信息。
可以知道的是,红外线传感器是利用红外线来进行数据处理的一种传感器,常用于无接触温度测量,例如采用红外线传感器远距离测量人体表面温度的热像图。在本实施例中,红外线传感器可以是安装于企业前台的电子屏幕中,用于对电子屏幕前红外线传感器能够检测到的范围内的目标对象进行温度测量。
其中,目标对象可以是位于电子屏幕前红外线传感器能够检测到的范围内的人物、动物或者物体等,优选的,目标对象可以是位于电子屏幕前红外线传感器能够检测到的范围内的人物。
在本实施例中,温度信息可以是通过红外线传感器检测到的位于电子屏幕前红外线传感器能够检测到的范围内的目标对象的表面温度信息。
具体的,当红外线传感器检测到能够检测到的范围内存在目标对象,则开始统计目标对象的停留时长,若目标对象的停留时长小于时间阈值(其中,时间阈值可以是由用户根据实际情况预先设置的时间,本实施例对具体的时间阈值不进行限定,优选的,时间阈值例如可以是2秒),则认为目标对象是路过;若目标对象的停留时长大于或者等于时间阈值(其中,时间阈值可以是由用户根据实际情况预先设置的时间,本实施例对具体的时间阈值不进行限定,优选的,时间阈值例如可以是2秒),则获取目标对象的温度信息。需要注意的是,在本实施例中,通过红外线传感器获取目标对象的温度信息的操作是在用户的授权下进行的。
S102、若目标对象的温度信息处于目标温度阈值范围内,则通过摄像头获取目标对象的面部图像。
其中,目标温度阈值范围可以是由用户根据实际情况预先设置的温度范围,本实施例对具体的目标温度阈值范围不进行限定,优选的,目标温度阈值范围可以是人体的正常温度,例如36℃~37℃。
在本实施例中,摄像头可以是安装于企业前台的电子屏幕中,用于对电子屏幕前摄像头能够拍摄到的范围内的目标对象进行拍摄。
需要说明的是,面部图像可以是通过摄像头拍摄到的位于电子屏幕前摄像头能够拍摄到的范围内的目标对象的面部图像。在实际操作过程中,通过摄像头获取目标对象的面部图像时可以是连续拍摄多张照片,获取到的目标对象的面部图像可以是目标对象的正面图像,也可以是目标对象的侧面图像,具体的拍摄数量可以由用户根据实际需求进行设置,连续获取多张目标对象的照片的目的在于可以增加目标对象的识别准确率。
具体的,若红外线传感器获取到的目标对象的温度信息处于目标温度阈值范围内,即判断目标对象可以是人物,则启用安装于企业前台的电子屏幕中的摄像头,通过摄像头获取目标对象的面部图像。需要注意的是,在本实施例中,通过摄像头获取目标对象的面部图像的操作是在用户的授权下进行的。
S103、若目标对象的面部图像为目标对象的正面图像,则显示目标界面。
需要解释的是,目标对象的正面图像可以是目标对象为人物时正面的面部图像。
在本实施例中,目标界面可以是安装于企业前台的电子屏幕上显示数字人的界面。
具体的,将摄像头获取到的目标对象的面部图像输入预设的神经网络模型等面部图像识别模型中进行识别,若识别到目标对象的面部图像为目标对象的正面图像,则在安装于企业前台的电子屏幕上显示目标界面,即在显示安装于企业前台的电子屏幕上显示数字人。在实际操作过程中,在获取到的目标对象的面部图像为目标对象的正面图像时才显示目标界面,识别目标对象的正面图像可以保障目标对象的识别准确性,使得对目标对象的识别结果更加准确,提高识别效率。
本发明实施例的技术方案,通过红外线传感器获取目标对象的温度信息,若目标对象的温度信息处于目标温度阈值范围内,则通过摄像头获取目标对象的面部图像,若目标对象的面部图像为目标对象的正面图像,则显示目标界面,解决了现有技术中数字人唤醒方式单一的问题,可以使得目标界面的唤醒方式更加多元化,同时取得了对目标对象的识别结果更加准确的有益效果。
可选的,通过红外线传感器获取目标对象的温度信息,包括:
若通过红外线传感器检测到预设范围内存在目标对象,则获取目标对象的停留时间。
其中,预设范围可以是红外线传感器能够检测到的电子屏幕前的范围,也可以是由用户根据实际情况预先设置的红外线传感器的检测范围,本实施例对具体的预设范围不进行限定,优选的,预设范围例如可以是2米。
需要说明的是,停留时间可以是目标对象在预设范围内停留的时间。
具体的,若通过红外线传感器检测到预设范围内存在目标对象,则获取目标对象在预设范围内的停留时间。
若目标对象的停留时间大于时间阈值,则通过红外线传感器获取目标对象的温度信息。
其中,时间阈值可以是由用户根据实际情况预先设置的时间,本实施例对具体的时间阈值不进行限定,优选的,时间阈值例如可以是2秒。
具体的,若目标对象的停留时长小于时间阈值,则认为目标对象是路过,不启用安装于企业前台的电子屏幕中的摄像头获取目标对象的面部图像;若目标对象的停留时长大于或者等于时间阈值,则获取目标对象的温度信息,并识别目标对象的温度信息是否处于目标温度阈值范围内。
可选的,若目标对象的面部图像为目标对象的正面图像,则显示目标界面,包括:
将目标对象的正面图像与数据库中的面部图像进行对比。
在本实施例中,数据库中的面部图像可以是由用户预先录入的企业内部员工的面部图像。需要注意的是,在本实施例中,将企业内部员工的面部图像录入数据库中的操作是在所有企业内部员工的授权下进行的。
具体的,将摄像头获取到的目标对象的正面图像与数据库中预先录入的企业内部员工的面部图像进行对比。
若目标对象的正面图像与数据库中的面部图像之间的相似度值大于或者等于相似度阈值,则显示第一界面。
其中,相似度阈值可以是由用户根据实际情况预先设置的目标对象的正面图像与数据库中的面部图像之间的相似度值,本实施例对具体的相似度阈值不进行限定,优选的,相似度阈值例如可以是80%。
在本实施例中,第一界面可以是针对企业内部员工展示的界面。示例性的,第一界面可以包括问题回答、视频播放、地图查找、开门、发送信息、拨打电话、语音通话、视频通话以及流程查询等内容板块。
具体的,若目标对象的正面图像与数据库中的面部图像之间的相似度值大于或者等于相似度阈值,即识别到目标对象有可能是企业内部员工,则显示第一界面,即企业内部员工具有的访问权限的界面。
可选的,若目标对象的面部图像为目标对象的正面图像,则显示目标界面,包括:
若目标对象的正面图像与数据库中的面部图像之间的相似度值小于相似度阈值,则显示第二界面。
其中,第二界面和第一界面不同。
在本实施例中,第二界面可以是针对非企业内部员工例如外来访客等展示的界面。示例性的,第二界面可以包括企业宣传、问题回答、视频播放、地图查找、发送信息、拨打电话、语音通话、视频通话以及流程查询等内容板块。
具体的,若目标对象的正面图像与数据库中的面部图像之间的相似度值小于相似度阈值,即识别到目标对象有可能是非企业内部员工例如是外来访客等,则显示第二界面,即陌生人具有的访问权限的界面。
可选的,在显示第一界面或显示第二界面之后,还包括:
接收目标对象输入的语音指令。
需要说明的是,目标对象输入的语音指令可以是由目标对象通过说话的方式输入给安装于企业前台的电子屏幕上显示的数字人的指令。需要注意的是,数字人接收目标对象输入的语音指令的操作是在用户的授权下进行的。示例性的,目标对象输入的语音指令可以是开门、播放企业宣传片、查询地图上某地点的位置路线、给员工A发送信息、给员工A拨打电话或者查询某事项的流程等。
具体的,目标对象在和安装于企业前台的电子屏幕上显示的数字人的交互过程中,数字人通过声音感应器获取目标对象所说的话,将目标对象所说的内容实时转写为文本并将转写后的文本内容传给安装于企业前台的电子屏幕内部的NLP(Neuro-LinguisticProgramming,神经语言程序学)部件进行语义理解,从而获取目标对象输入的语音指令。
根据语音指令确定语音指令对应的目标操作,并执行目标操作。
需要解释的是,目标操作可以是目标对象输入的语音指令对应的操作。例如可以是,目标对象输入的语音指令可以是开门,则对应的目标操作可以是开门。
具体的,数字人通过将目标对象的正面图像与数据库中的面部图像进行对比后,若确定目标对象为企业内部员工,则根据目标对象输入的问题回答、视频播放、地图查找、开门、发送信息、拨打电话、语音通话、视频通话以及流程查询等语音指令确定语音指令对应的目标操作,并执行目标操作。
在实际操作过程中,目标对象在和安装于企业前台的电子屏幕上显示的数字人的交互时,数字人通过声音感应器获取目标对象所说的话,将目标对象所说的内容实时转写为文本并将转写后的文本内容传给NLP部件进行语义理解,从而获取目标对象输入的语音指令。若NLP部件返回的对应回答为文字内容,则通过调用TTS(Text To Speech,从文本到语音)技术将对应回答的内容转为音频,由数字人播报,同时在电子屏幕上显示出对应回答的内容。若NLP部件返回的对应回答为视频内容,则数字人的视频流和对应回答的视频可以同时在电子屏幕上进行播放,达到数字人进行视频介绍的功能;若NLP部件返回的对应回答为地图内容,则可以在电子屏幕上显示目标对象所查询的地图上某地点的位置路线,同时数字人播报查询的位置以及路线。
在实际操作过程中,若用户输入的语音指令为开门,则数字人驱动门锁,实现自动开门。其中,数字人被设置为与门锁相关联,当收到“开门”的语音指令并且识别到目标对象的正面图像为数据库中的面部图像时,则触发开门操作。
在实际操作过程中,若用户输入的语音指令为联络员工A,则数字人可以通过电话、视频或者多媒体消息等方式进行联络。示例性的,数字人通过电话进行联络的具体操作可以是,目标对象告诉数字人需要电话联络员工A时,数字人调用后台语音通话功能,建立数字人、目标对象、员工A的三方语音通话;数字人通过语音通知的具体操作可以是,数字人可通过IVR(Interactive Voice Response,互动式语音应答)外呼的方式呼叫员工A的电话号码,语音通知员工A要处理的事项;数字人通过视频进行联络的具体操作可以是,数字人可通过VoLTE(Voice over Long-TermEvolution,高清通话)向员工A发起视频通话,员工A接通后建立数字人、目标对象、员工A的三方视频通话;数字人通过文本进行联络的具体操作可以是,在事项处理流程中,数字人可以通过短信等渠道,向员工A发送文本消息进行通知。
在实际操作过程中,数字人可以支持对接第三方的OA(Office Automation,办公自动化)等系统,进行业务办理流程查询、流程进度查询以及流程催促等功能,可以复制企业内部流程智能化,提高流程处理效率。需要注意的是,数字人支持对接第三方的OA等系统的操作是在用户的授权下进行的。
在本实施例中,可以预先建立形象素材库,并录制真人说话动作等视频存入形象素材库(需要注意的是,录制真人说话动作等视频的操作是在用户的授权下进行的)。在数字人的训练过程中,对数字人输入文本后,可以从形象素材库中随机找出带有说话动作的语音文件,根据输入的文本进行分词后的拼音,在形象素材库中快速查找到对应的形象素材。训练完成后,数字人在“说话”时就可以有对应的口型动作,静止或者在“倾听”目标对象说话时进行点头、摇头或者微笑等动作,从而提升用户体验。
可选的,该显示方法还包括:
通过声音感应器获取目标对象的语音输入信息。
在本实施例中,声音感应器可以是安装于企业前台的电子屏幕中,用于对电子屏幕前声音感应器能够获取到声音的范围内的声音进行获取的声音传感器。
需要说明的是,语音输入信息可以是目标对象在安装于企业前台的电子屏幕中的声音感应器能够获取到声音的范围内所说的话。
具体的,通过声音感应器获取安装于企业前台的电子屏幕中的声音感应器能够获取到声音的范围内目标对象的语音输入信息。需要注意的是,通过声音感应器获取目标对象的语音输入信息的操作是在用户的授权下进行的。
识别语音输入信息。
具体的,通过声音感应器获取到目标对象的语音输入信息后,对语音输入信息进行识别。识别的具体过程可以是,数字人通过声音感应器获取目标对象的语音输入信息,将目标对象的语音输入信息的内容实时转写为文本并将转写后的文本内容传给NLP部件进行语义理解,从而完成对语音输入信息的识别。
若语音输入信息中含有预设关键词,则显示目标界面。
其中,预设关键词可以是由用户根据实际需要设置的可以使安装于企业前台的电子屏幕上显示目标界面的关键词,本实施例对具体的预设关键词不进行限定。示例性的,预设关键词可以是“你好小A”。
具体的,若识别到语音输入信息中含有预设关键词,则在安装于企业前台的电子屏幕上显示目标界面,即在显示安装于企业前台的电子屏幕上显示数字人;若未识别到语音输入信息中含有预设关键词,则不显示目标界面。
可选的,在若所述语音输入信息中含有预设关键词,则显示目标界面之后,还包括:
响应于用户触发拍摄功能的操作,通过摄像头获取目标对象的面部图像。
具体的,在识别到语音输入信息中含有预设关键词并显示目标界面之后,响应于用户触发拍摄功能的操作,通过摄像头获取目标对象的面部图像。之后将目标对象的正面图像与数据库中的面部图像进行对比,若目标对象的正面图像与数据库中的面部图像之间的相似度值大于或者等于相似度阈值,则显示第一界面;若目标对象的正面图像与数据库中的面部图像之间的相似度值小于相似度阈值,则显示第二界面。在显示第一界面或显示第二界面之后,接收目标对象输入的语音指令,根据语音指令确定语音指令对应的目标操作,并执行目标操作。
本发明实施例的技术方案,不仅可以通过语音输入信息中的预设关键词唤醒数字人,还可以通过红外线传感器和摄像头唤醒,解决了现有技术中数字人唤醒方式单一的问题,可以使得目标界面的唤醒方式更加多元化,同时取得了对目标对象的识别结果更加准确的有益效果;同时,解决了现有企业前台的屏幕用途单一、占用企业人力资源进行重复性的知识讲解的问题,可以在企业前台的电子屏幕上显示数字人作为员工,替代企业员工进行事项讲解、流程查询以及远程联络等操作,可大量节省人力资源。
实施例二
图2是根据本发明实施例二提供的一种显示装置的结构示意图。如图2所示,该装置包括:第一获取模块201、第二获取模块202和第一显示203。
其中,第一获取模块201,用于通过红外线传感器获取目标对象的温度信息;
第二获取模块202,用于若所述目标对象的温度信息处于目标温度阈值范围内,则通过摄像头获取所述目标对象的面部图像;
第一显示模块203,用于若所述目标对象的面部图像为目标对象的正面图像,则显示目标界面。
可选的,所述第一获取模块201包括:
第一获取单元,用于若通过红外线传感器检测到预设范围内存在目标对象,则获取所述目标对象的停留时间;
第二获取单元,用于若所述目标对象的停留时间大于时间阈值,则通过所述红外线传感器获取所述目标对象的温度信息。
可选的,所述第一显示模块203包括:
对比单元,用于将所述目标对象的正面图像与数据库中的面部图像进行对比;
第一显示单元,用于若所述目标对象的正面图像与数据库中的面部图像之间的相似度值大于或者等于相似度阈值,则显示第一界面。
可选的,所述第一显示模块203还包括:
第二显示单元,用于若所述目标对象的正面图像与数据库中的面部图像之间的相似度值小于所述相似度阈值,则显示第二界面,其中,所述第二界面和所述第一界面不同。
可选的,所述第一显示模块203还包括:
接收单元,用于在显示第一界面或显示第二界面之后,接收目标对象输入的语音指令;
处理单元,用于在显示第一界面或显示第二界面之后,根据所述语音指令确定所述语音指令对应的目标操作,并执行目标操作。
可选的,所述显示装置还包括:
第三获取模块,用于通过声音感应器获取目标对象的语音输入信息;
识别模块,用于识别所述语音输入信息;
第二显示模块,用于若所述语音输入信息中含有预设关键词,则显示目标界面。
可选的,所述显示装置还包括:
第四获取模块,用于在若所述语音输入信息中含有预设关键词,则显示目标界面之后,响应于用户触发拍摄功能的操作,通过摄像头获取所述目标对象的面部图像。
本发明实施例所提供的显示装置可执行本发明任意实施例所提供的显示方法,具备执行方法相应的功能模块和有益效果。
实施例三
图3示出了可以用来实施本发明的实施例的电子设备30的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图3所示,电子设备30包括至少一个处理器31,以及与至少一个处理器31通信连接的存储器,如只读存储器(ROM)32、随机访问存储器(RAM)33等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器31可以根据存储在只读存储器(ROM)32中的计算机程序或者从存储单元38加载到随机访问存储器(RAM)33中的计算机程序,来执行各种适当的动作和处理。在RAM 33中,还可存储电子设备30操作所需的各种程序和数据。处理器31、ROM 32以及RAM 33通过总线34彼此相连。输入/输出(I/O)接口35也连接至总线34。
电子设备30中的多个部件连接至I/O接口35,包括:输入单元36,例如键盘、鼠标等;输出单元37,例如各种类型的显示器、扬声器等;存储单元38,例如磁盘、光盘等;以及通信单元39,例如网卡、调制解调器、无线通信收发机等。通信单元39允许电子设备30通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器31可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器31的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器31执行上文所描述的各个方法和处理,例如显示方法:
通过红外线传感器获取目标对象的温度信息;
若所述目标对象的温度信息处于目标温度阈值范围内,则通过摄像头获取所述目标对象的面部图像;
若所述目标对象的面部图像为目标对象的正面图像,则显示目标界面。
在一些实施例中,显示方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元38。在一些实施例中,计算机程序的部分或者全部可以经由ROM32和/或通信单元39而被载入和/或安装到电子设备30上。当计算机程序加载到RAM 33并由处理器31执行时,可以执行上文描述的显示方法的一个或多个步骤。备选地,在其他实施例中,处理器31可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行显示方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种显示方法,其特征在于,包括:
通过红外线传感器获取目标对象的温度信息;
若所述目标对象的温度信息处于目标温度阈值范围内,则通过摄像头获取所述目标对象的面部图像;
若所述目标对象的面部图像为目标对象的正面图像,则显示目标界面。
2.根据权利要求1所述的方法,其特征在于,通过红外线传感器获取目标对象的温度信息,包括:
若通过红外线传感器检测到预设范围内存在目标对象,则获取所述目标对象的停留时间;
若所述目标对象的停留时间大于时间阈值,则通过所述红外线传感器获取所述目标对象的温度信息。
3.根据权利要求1所述的方法,其特征在于,若所述目标对象的面部图像为目标对象的正面图像,则显示目标界面,包括:
将所述目标对象的正面图像与数据库中的面部图像进行对比;
若所述目标对象的正面图像与数据库中的面部图像之间的相似度值大于或者等于相似度阈值,则显示第一界面。
4.根据权利要求3所述的方法,其特征在于,若所述目标对象的面部图像为目标对象的正面图像,则显示目标界面,包括:
若所述目标对象的正面图像与数据库中的面部图像之间的相似度值小于所述相似度阈值,则显示第二界面,其中,所述第二界面和所述第一界面不同。
5.根据权利要求3或4所述的方法,其特征在于,在显示第一界面或显示第二界面之后,还包括:
接收目标对象输入的语音指令;
根据所述语音指令确定所述语音指令对应的目标操作,并执行目标操作。
6.根据权利要求1所述的方法,其特征在于,还包括:
通过声音感应器获取目标对象的语音输入信息;
识别所述语音输入信息;
若所述语音输入信息中含有预设关键词,则显示目标界面。
7.根据权利要求6所述的方法,其特征在于,在若所述语音输入信息中含有预设关键词,则显示目标界面之后,还包括:
响应于用户触发拍摄功能的操作,通过摄像头获取所述目标对象的面部图像。
8.一种显示装置,其特征在于,包括:
第一获取模块,用于通过红外线传感器获取目标对象的温度信息;
第二获取模块,用于若所述目标对象的温度信息处于目标温度阈值范围内,则通过摄像头获取所述目标对象的面部图像;
第一显示模块,用于若所述目标对象的面部图像为目标对象的正面图像,则显示目标界面。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的显示方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的显示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211078515.4A CN115454241A (zh) | 2022-09-05 | 2022-09-05 | 一种显示方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211078515.4A CN115454241A (zh) | 2022-09-05 | 2022-09-05 | 一种显示方法、装置、设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115454241A true CN115454241A (zh) | 2022-12-09 |
Family
ID=84303504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211078515.4A Pending CN115454241A (zh) | 2022-09-05 | 2022-09-05 | 一种显示方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115454241A (zh) |
-
2022
- 2022-09-05 CN CN202211078515.4A patent/CN115454241A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109147770B (zh) | 声音识别特征的优化、动态注册方法、客户端和服务器 | |
US10284820B2 (en) | Covert monitoring and recording of audio and video in controlled-environment facilities | |
EP3617946B1 (en) | Context acquisition method and device based on voice interaction | |
CN108920640B (zh) | 基于语音交互的上下文获取方法及设备 | |
US11323566B2 (en) | Systems and methods for smart dialogue communication | |
CN104078045A (zh) | 一种识别的方法及电子设备 | |
CN106302933A (zh) | 通话语音信息处理方法及终端 | |
CN112235470B (zh) | 基于语音识别的来电客户跟进方法、装置及设备 | |
CN109241921A (zh) | 用于检测人脸关键点的方法和装置 | |
CN112669876A (zh) | 情绪识别方法、装置、计算机设备及存储介质 | |
US11019116B2 (en) | Conference system, conference server, and program based on voice data or illumination light | |
CN113241070B (zh) | 热词召回及更新方法、装置、存储介质和热词系统 | |
CN111210818B (zh) | 匹配情感极性的词语采集方法、装置、电子设备 | |
WO2020098669A1 (zh) | 一种表情输入的方法、装置、设备以及存储介质 | |
CN115454241A (zh) | 一种显示方法、装置、设备和存储介质 | |
CN110196900A (zh) | 用于终端的交互方法和装置 | |
CN110177284A (zh) | 信息展示方法、装置、电子设备及存储介质 | |
TWI782442B (zh) | 一種在線訪談的方法及系統 | |
CN115665363A (zh) | 一种视频会议方法、装置、设备和存储介质 | |
CN114724561A (zh) | 一种语音打断方法、装置、计算机设备及存储介质 | |
CN113901832A (zh) | 人机对话方法、装置、存储介质及电子设备 | |
CN110795178B (zh) | 应用签到方法、装置及电子设备 | |
WO2021167732A1 (en) | Implementing automatic chatting during video displaying | |
CN112632241A (zh) | 智能会话的方法、装置、设备和计算机可读介质 | |
CN113132927B (zh) | 一种来电处理方法、装置、设备和机器可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |