CN115032640B - 手势识别方法和终端设备 - Google Patents
手势识别方法和终端设备 Download PDFInfo
- Publication number
- CN115032640B CN115032640B CN202210947467.1A CN202210947467A CN115032640B CN 115032640 B CN115032640 B CN 115032640B CN 202210947467 A CN202210947467 A CN 202210947467A CN 115032640 B CN115032640 B CN 115032640B
- Authority
- CN
- China
- Prior art keywords
- tof
- tof sensor
- target object
- sensor
- terminal device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000003287 optical effect Effects 0.000 claims abstract description 19
- 238000013507 mapping Methods 0.000 claims abstract description 12
- 238000005192 partition Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 11
- 230000001976 improved effect Effects 0.000 abstract description 7
- 230000009286 beneficial effect Effects 0.000 abstract description 5
- 238000004891 communication Methods 0.000 description 35
- 230000006854 communication Effects 0.000 description 35
- 230000006870 function Effects 0.000 description 30
- 230000015654 memory Effects 0.000 description 29
- 238000007726 management method Methods 0.000 description 20
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 230000005236 sound signal Effects 0.000 description 12
- 238000010295 mobile communication Methods 0.000 description 11
- 210000000988 bone and bone Anatomy 0.000 description 10
- 238000001514 detection method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000013461 design Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 229920001621 AMOLED Polymers 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000005286 illumination Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000036772 blood pressure Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000010009 beating Methods 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003238 somatosensory effect Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S17/00—Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
- G01S17/02—Systems using the reflection of electromagnetic waves other than radio waves
- G01S17/06—Systems determining position data of a target
- G01S17/08—Systems determining position data of a target for measuring distance only
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Electromagnetism (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请实施例提供了一种手势识别方法和终端设备,有利于提高手势识别的使用场景,从而提高用户体验。该方法应用于包括显示屏和多个ToF传感器的终端设备,多个ToF传感器部署于显示屏下方,包括:终端设备控制多个ToF传感器中的第一ToF传感器进行检测;在第一ToF传感器检测到目标对象时,终端设备控制多个ToF传感器同步发射光信号;终端设备通过多个ToF传感器接收目标对象返回的光信号,获取目标对象在多个ToF传感器中的每个ToF传感器的飞行时间信息;终端设备基于飞行时间信息和标定信息,确定目标对象在每个ToF传感器的深度信息,标定信息用于表示每个ToF传感器在不同距离下的飞行时间与距离之间的映射关系;终端设备基于深度信息,进行手势识别。
Description
技术领域
本申请涉及终端技术领域,尤其涉及一种手势识别方法和终端设备。
背景技术
随着移动智能人机交互技术的发展,用户可以通过一些手势控制智能终端。目前,传统的手势识别方法是通过红绿蓝(red green blue,RGB)摄像头采集图像进行手势识别。由于RGB摄像头在暗光环境下无法采集图像,导致该方法应用场景较限制,此外,RGB摄像头采集的是二维图像,对于垂直于摄像头方向的手势,例如按压手势,缺乏检测维度。
为了解决上述问题,目前还存在一种手势识别方法,该方法通过结构光或单飞行时间(time of flight,ToF)传感器进行手势识别。终端设备可以通过结构光或单ToF传感器获取手势的三维(3 dimensions,3D)信息。但是,基于结构光或者单ToF传感器的手势识别方法,仍存在一些手势识别不精确甚至无法识别的情况,使用场景较限制,影响用户体验。
发明内容
本申请提供了一种手势识别方法和终端设备,有利于提高手势识别的使用场景,从而提高用户体验。
第一方面,提供了一种手势识别方法,应用于包括显示屏和多个ToF传感器的终端设备,该多个ToF传感器部署于该显示屏下方,该方法包括:该终端设备控制该多个ToF传感器中的第一ToF传感器进行检测;在该第一ToF传感器检测到目标对象时,该终端设备控制该多个ToF传感器同步发射光信号;该终端设备通过该多个ToF传感器接收该目标对象返回的光信号,获取该目标对象在该多个ToF传感器中的每个ToF传感器的飞行时间信息;该终端设备基于该飞行时间信息和标定信息,确定该目标对象在每个ToF传感器的深度信息,该标定信息用于表示每个ToF传感器在不同距离下的飞行时间与距离之间的映射关系;该终端设备基于该深度信息,进行手势识别。
本申请实施例的手势识别方法,通过将多ToF传感器组合,获取目标对象在该多个ToF传感器中的每个ToF传感器的飞行时间信息,基于该飞行时间信息和标定信息,获取每个ToF传感器的深度信息,基于该深度信息,进行手势识别,能够扩大视场,从而提高手势识别的精确度,扩大手势识别的应用场景,提高用户体验。
结合第一方面,在第一方面的某些实现方式中,该多个ToF传感器中的全部或部分ToF传感器沿平行于显示屏的方向倾斜放置。
应理解,显示屏下的全部ToF传感器或者显示屏下的部分传感器可以沿着x方向倾斜,也可以沿着y方向倾斜。
按照上述公式部署ToF传感器,能够满足与显示屏相距目标距离处视场的全覆盖,且最大化利用ToF传感器的视场。
结合第一方面,在第一方面的某些实现方式中,在该终端设备基于该飞行时间信息和标定信息,确定该目标对象在每个ToF传感器的深度信息之前,该方法还包括:该终端设备通过统计该多个ToF传感器在标定白板与该显示屏之间的不同距离下的统计直方图,获取该标定信息。
结合第一方面,在第一方面的某些实现方式中,该终端设备基于该深度信息,进行手势识别,包括:该终端设备以该多个ToF传感器中的第四ToF传感器的中心为原点、以该第四ToF传感器的感光面为xoy平面、以垂直于该感光面的方向为z轴,建立世界坐标系;该终端设备基于该深度信息,确定该多个ToF传感器中的每个ToF传感器的每个分区下,该目标对象在该世界坐标系中的坐标;该终端设备合并每个分区下相同的坐标元素,得到坐标元素集合;该终端设备基于该坐标元素集合,进行手势识别。
结合第一方面,在第一方面的某些实现方式中,该多个ToF传感器中的第五ToF传感器的第一分区下,该目标对象的坐标表示为:
其中,(m,n,l)为该第五ToF传感器的中心在该世界坐标系中的坐标,h为该深度信息,为该目标对象与该原点的连线在所述xoy平面的投影与x轴的夹角,为该目标对象与该原点的连线在该xoy平面的投影与y轴的夹角,为该目标对象与该原点的连线在该xoy平面的投影与z轴的夹角。
第二方面,提供了一种终端设备,包括:处理器、显示屏和多个ToF传感器,该多个ToF传感器部署于该显示屏下方;其中,该处理器用于:控制该多个ToF传感器中的第一ToF传感器进行检测,在该第一ToF传感器检测到目标对象时,控制该多个ToF传感器同步发射光信号,通过该多个ToF传感器接收该目标对象返回的光信号,获取该目标对象在该多个ToF传感器中的每个ToF传感器的飞行时间信息,基于该飞行时间信息和标定信息,确定该目标对象在每个ToF传感器的深度信息,该标定信息用于表示每个ToF传感器在不同距离下的飞行时间与距离之间的映射关系,以及,基于该深度信息,进行手势识别。
结合第二方面,在第二方面的某些实现方式中,该多个ToF传感器中的全部或部分ToF传感器沿平行于该显示屏的方向倾斜放置。
结合第二方面,在第二方面的某些实现方式中,该处理器还用于:通过统计该多个ToF传感器在标定白板在与该显示屏之间的不同距离下的统计直方图,获取该标定信息。
结合第二方面,在第二方面的某些实现方式中,该处理器用于:以该多个ToF传感器中的第四ToF传感器的中心为原点、以该第四ToF传感器的感光面为xoy平面、以垂直于该感光面的方向为z轴,建立世界坐标系,基于该深度信息,确定该多个ToF传感器中的每个ToF传感器的每个分区下,该目标对象在该世界坐标系中的坐标,合并每个分区下相同的坐标元素,得到坐标元素集合,基于该坐标元素集合,进行手势识别。
结合第二方面,在第二方面的某些实现方式中,该多个ToF传感器中的第五ToF传感器的第一分区下,该目标对象的坐标表示为:
其中,(m,n,l)为该第五ToF传感器的中心在该世界坐标系中的坐标,h为该深度信息,为该目标对象与该原点的连线在该xoy平面的投影与x轴的夹角,为该目标对象与该原点的连线在该xoy平面的投影与y轴的夹角,为该目标对象与该原点的连线在该xoy平面的投影与z轴的夹角。
第三方面,提供了另一种终端设备,包括处理器和存储器。该处理器用于读取存储器中存储的指令,以执行上述第一方面的任一种可能实现方式中的方法。
可选地,处理器为一个或多个,存储器为一个或多个。
可选地,存储器可以与处理器集成在一起,或者存储器与处理器分离设置。
在具体实现过程中,存储器可以为非瞬时性(non-transitory)存储器,例如只读存储器(read only memory,ROM),其可以与处理器集成在同一块芯片上,也可以分别设置在不同的芯片上,本申请实施例对存储器的类型以及存储器与处理器的设置方式不做限定。
上述第三方面中的终端设备可以是一个芯片,该处理器可以通过硬件来实现也可以通过软件来实现,当通过硬件实现时,该处理器可以是逻辑电路、集成电路等;当通过软件来实现时,该处理器可以是一个通用处理器,通过读取存储器中存储的软件代码来实现,该存储器可以集成在处理器中,可以位于该处理器之外,独立存在。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序(也可以称为代码,或指令)当其在计算机上运行时,使得计算机执行上述第一方面的任一种可能实现方式中的方法。
第五方面,提供了一种计算机程序产品,计算机程序产品包括:计算机程序(也可以称为代码,或指令),当计算机程序被运行时,使得计算机执行上述第一方面的任一种可能实现方式中的方法。
附图说明
图1是本申请实施例的终端设备的结构示意图;
图2是本申请实施例的终端设备的软件结构框图;
图3是本申请实施例的手势识别的场景示意图;
图4是单个ToF传感器的结构示意图;
图5是本申请实施例提供的一种屏下多个ToF传感器组合排列的示意图;
图6是本申请实施例提供的一种屏下多个ToF传感器组合排列的截面示意图;
图7是本申请实施例提供的另一种屏下多个ToF传感器组合排列的示意图;
图8是本申请实施例提供的另一种屏下多个ToF传感器组合排列的截面示意图;
图9是本申请实施例提供的屏下多个ToF传感器的旋转角度的示意图;
图10是本申请实施例提供的一种手势识别方法的示意性流程图;
图11是本申请实施例提供的深度标定方法的示意图;
图12是本申请实施例提供的深度标定方法中的时间频数统计直方图;
图13是本申请实施例提供的基于ToF传感器建立世界坐标系的示意图;
图14是本申请实施例提供的终端设备的示意性框图。
具体实施方式
下面将结合附图,对本申请中的技术方案进行描述。
为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
需要说明的是,本申请中,“示例性地”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性地”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性地”或者“例如”等词旨在以具体方式呈现相关概念。
此外,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a、b和c中的至少一项(个),可以表示:a,或b,或c,或a和b,或a和c,或b和c,或a、b和c,其中a,b,c可以是单个,也可以是多个。
为了能够更好地理解本申请实施例,下面对本申请实施例的终端设备的硬件结构进行介绍。
图1示出了终端设备100的结构示意图。
终端设备100可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本申请实施例示意的结构并不构成对终端设备100的具体限定。在本申请另一些实施例中,终端设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
I2C接口是一种双向同步串行总线,包括一根串行数据线(serial data line,SDA)和一根串行时钟线(derail clock line,SCL)。在一些实施例中,处理器110可以包含多组I2C总线。处理器110可以通过不同的I2C总线接口分别耦合触摸传感器180K,充电器,闪光灯,摄像头193等。例如:处理器110可以通过I2C接口耦合触摸传感器180K,使处理器110与触摸传感器180K通过I2C总线接口通信,实现终端设备100的触摸功能。
I2S接口可以用于音频通信。在一些实施例中,处理器110可以包含多组I2S总线。处理器110可以通过I2S总线与音频模块170耦合,实现处理器110与音频模块170之间的通信。在一些实施例中,音频模块170可以通过I2S接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。
PCM接口也可以用于音频通信,将模拟信号抽样,量化和编码。在一些实施例中,音频模块170与无线通信模块160可以通过PCM总线接口耦合。在一些实施例中,音频模块170也可以通过PCM接口向无线通信模块160传递音频信号,实现通过蓝牙耳机接听电话的功能。所述I2S接口和所述PCM接口都可以用于音频通信。
UART接口是一种通用串行数据总线,用于异步通信。该总线可以为双向通信总线。它将要传输的数据在串行通信与并行通信之间转换。在一些实施例中,UART接口通常被用于连接处理器110与无线通信模块160。例如:处理器110通过UART接口与无线通信模块160中的蓝牙模块通信,实现蓝牙功能。在一些实施例中,音频模块170可以通过UART接口向无线通信模块160传递音频信号,实现通过蓝牙耳机播放音乐的功能。
MIPI接口可以被用于连接处理器110与显示屏194,摄像头193等外围器件。MIPI接口包括摄像头串行接口(camera serial interface,CSI),显示屏串行接口(displayserial interface,DSI)等。在一些实施例中,处理器110和摄像头193通过CSI接口通信,实现终端设备100的拍摄功能。处理器110和显示屏194通过DSI接口通信,实现终端设备100的显示功能。
GPIO接口可以通过软件配置。GPIO接口可以被配置为控制信号,也可被配置为数据信号。在一些实施例中,GPIO接口可以用于连接处理器110与摄像头193,显示屏194,无线通信模块160,音频模块170,传感器模块180等。GPIO接口还可以被配置为I2C接口,I2S接口,UART接口,MIPI接口等。
USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为终端设备100充电,也可以用于终端设备100与外围设备之间传输数据。也可以用于连接耳机,通过耳机播放音频。该接口还可以用于连接其他终端设备,例如AR设备等。
可以理解的是,本申请实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对终端设备100的结构限定。在本申请另一些实施例中,终端设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过终端设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为终端设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
终端设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。终端设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在终端设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在终端设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,终端设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得终端设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC ,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
终端设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,终端设备100可以包括1个或N个显示屏194,N为大于1的正整数。
终端设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP 用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,终端设备100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当终端设备100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。终端设备100可以支持一种或多种视频编解码器。这样,终端设备100可以播放或录制多种编码格式的视频,例如:动态图像专家组(moving picture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network ,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现终端设备100的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展终端设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储终端设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行终端设备100的各种功能应用以及数据处理。
终端设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。终端设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当终端设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。终端设备100可以设置至少一个麦克风170C。在另一些实施例中,终端设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,终端设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动终端设备平台(open mobile terminal platform,OMTP)标准接口,美国蜂窝电信工业协会(cellular telecommunications industry association of the USA,CTIA)标准接口。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。终端设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,终端设备100根据压力传感器180A检测所述触摸操作强度。终端设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定终端设备100的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定终端设备100围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测终端设备100抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消终端设备100的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景。
气压传感器180C用于测量气压。在一些实施例中,终端设备100通过气压传感器180C测得的气压值计算海拔高度,辅助定位和导航。
磁传感器180D包括霍尔传感器。终端设备100可以利用磁传感器180D检测翻盖皮套的开合。在一些实施例中,当终端设备100是翻盖机时,终端设备100可以根据磁传感器180D检测翻盖的开合。进而根据检测到的皮套的开合状态或翻盖的开合状态,设置翻盖自动解锁等特性。
加速度传感器180E可检测终端设备100在各个方向上(一般为三轴)加速度的大小。当终端设备100静止时可检测出重力的大小及方向。还可以用于识别终端设备姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。终端设备100可以通过红外或激光测量距离。在一些实施例中,拍摄场景,终端设备100可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。终端设备100通过发光二极管向外发射红外光。终端设备100使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定终端设备100附近有物体。当检测到不充分的反射光时,终端设备100可以确定终端设备100附近没有物体。终端设备100可以利用接近光传感器180G检测用户手持终端设备100贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。终端设备100可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测终端设备100是否在口袋里,以防误触。
指纹传感器180H用于采集指纹。终端设备100可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。
温度传感器180J用于检测温度。在一些实施例中,终端设备100利用温度传感器180J检测的温度,执行温度处理策略。例如,当温度传感器180J上报的温度超过阈值,终端设备100执行降低位于温度传感器180J附近的处理器的性能,以便降低功耗实施热保护。在另一些实施例中,当温度低于另一阈值时,终端设备100对电池142加热,以避免低温导致终端设备100异常关机。在其他一些实施例中,当温度低于又一阈值时,终端设备100对电池142的输出电压执行升压,以避免低温导致的异常关机。
触摸传感器180K,也称“触控器件”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于终端设备100的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。终端设备100可以接收按键输入,产生与终端设备100的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和终端设备100的接触和分离。终端设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。终端设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,终端设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在终端设备100中,不能和终端设备100分离。终端设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。本申请实施例以分层架构的Android系统为例,示例性说明终端设备100的软件结构。
图2是本申请实施例的终端设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。如图2所示,应用程序包可以包括相机,图库,日历,通话,地图,导航,WLAN,蓝牙,音乐,视频,短信息等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。如图2所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供终端设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,终端设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如: MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图、图像渲染、合成和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层用于驱动硬件,使得硬件工作。内核层至少包含显示驱动,屏幕驱动、图像处理器(graphics processing unit,GPU)驱动、摄像头、以及传感器驱动等,本申请实施例对此不做限制。例如,屏幕驱动可以驱动屏幕亮屏或息屏。
本申请实施例涉及的终端设备为具有显示屏的设备,可以为手机、平板电脑、个人计算机(personal computer,PC)、智慧屏、人工智能(artificial intelligence,AI)音箱、耳机、车机设备以及智能手表等可穿戴终端设备,还可以是各种教学辅助工具(例如学习机、早教机)、智能玩具、便携式机器人、个人数字助理(personal digital assistant,PDA)、增强现实技术(augmented reality,AR)设备、虚拟现实(virtual reality,VR)设备等,也可以是具有移动办公功能的设备、具有智能家居功能的设备、具有影音娱乐功能的设备、支持智能出行的设备等。应理解,本申请的实施例对终端设备所采用的具体技术和具体设备形态不做限定。
下面,以终端设备为手机为例,先对本申请实施例所涉及的应用场景进行介绍。
图3是手势识别的场景示意图。在图3中,用户的手逐渐靠近手机的显示屏,手机可以通过距离传感器检测到用户的手,然后获取手势,进行手势识别,接着,手机可以将识别到的手势转换成指令,进而执行相应操作。例如,用户的手靠近手机的显示屏后,对着显示屏做出滑动翻页的手势,手机获取该手势并进行识别,然后执行翻页的操作。
目前,传统的手势识别方法是通过RGB摄像头采集图像进行手势识别,然而RGB摄像头在暗光环境下无法采集图像,导致该方法应用场景受到限制,此外,RGB摄像头采集的是二维图像,对于垂直于摄像头方向的手势,例如按压手势,缺乏检测维度。
为了解决上述问题,目前还存在一种手势识别方法,该方法通过结构光或单ToF传感器获取手势的3D信息,进行手势识别。单ToF传感器的结构示意图如图4所示,该传感器包括发射端和接收端。其中,发射端包括垂直腔面发射激光器(vertical-cavity surface-emitting laser,VCSEL)和扩散器;接收端包括单光子雪崩二极管(single photonavalanche diode,SPAD)探测器阵列和透镜组,SPAD探测器阵列将视场划分为多个区域。ToF传感器工作时,ToF传感器的发射端发射调制检测光束,该调制检测光束照射到目标对象后再返回,ToF传感器的接收端接收物体返回来的激光。ToF传感器可以通过获取发射端发出的调制检测光束从发射到返回被接收端接收所用的时间,即飞行时间t,再根据,计算目标对象距离显示屏的深度。其中,c表示光速,h表示目标对象距显示屏的深度。因此,基于上述ToF传感器的工作原理,设有ToF传感器的终端设备可以获取用户的手距离显示屏的深度,并根据目标对象距离显示屏的深度获取手势的3D信息。
但是,基于单ToF传感器的手势识别方法,视场(field of view,FoV)较小,仍存在一些手势识别不精确甚至无法识别的情况,使用场景较局限,影响用户体验。
为了解决上述手势识别不精确甚至无法识别的问题,本申请实施例提供了一种新的手势识别方法,通过在图4所示的单个ToF传感器的基础上,设置多个ToF传感器,与传统ToF传感器相比能够形成更大的FoV和照射区域(field of irradiation,FoI),有利于提高手势识别的使用场景,从而提高用户体验。
下面,将以图5至图8为例,介绍多个ToF传感器在显示屏下的摆放方式。需要注意的是,图中只是示例性地给出ToF传感器的个数和摆放方式,但实际中对ToF传感器的个数和摆放方式不做限定。
为了便于描述本申请实施例中ToF传感器的摆列方式,首先介绍本申请实施例中三维直角坐标系的建立。将手机正面垂直放置,以手机左下角为坐标原点o,平行于手机显示屏的短轴方向为x轴,平行于手机显示屏的长轴方向为y轴,垂直于手机显示屏的方向为z轴,建立三维直角坐标系。
图5示出了本申请实施例提供的一种屏下多个ToF传感器的排列方式。图5中给出的是4×4个ToF传感器以阵列的形式沿xoy平面正立放置在显示屏下的示意图。通过将多个ToF传感器放置在显示屏下,由于每个ToF传感器的视场和视场拼接,照射区域和照射区域拼接,因此与传统单个ToF传感器相比,该多个ToF传感器组合的排列方式可以形成更大的视场和照射面积。如图6所示,在xoz平面上,相比于单个ToF传感器视场,多个ToF传感器的视场拼接后形成的视场更大,有利于提高手势识别的使用场景,从而提高用户体验。
图7示出了本申请实施例提供的另一种屏下多个ToF传感器的排列方式。图7在上述图5所示的多ToF传感器组合排列方式的基础上,将ToF传感器沿x轴作了旋转设计,如图7所示,左边两列的各个ToF传感器沿x轴负方向旋转,右边两列的各个ToF传感器沿x轴正方向旋转。通过将ToF传感器沿x轴旋转,可以改变多ToF传感器组合的视场,达到视场拼接的作用。与图5的设计相比,图7的设计可以进一步形成更大的视场和照射面积。如图8所示,在xoz平面上,相比于图6,多个ToF传感器沿x轴旋转后形成的视场更大,有利于提高手势识别的使用场景,从而提高用户体验。
应理解,本申请实施例仅仅以x轴为例进行了说明,在其他可能的实现方式中,也可以设计将ToF传感器沿y轴旋转,或者,设计将ToF传感器沿x轴和y轴同时旋转,本申请实施例对此不作限定。
另外,上述示例将显示屏下的所有ToF传感器进行了旋转,在其他可能的实现方式中,沿x轴和/或y轴旋转的ToF传感器,可以是显示屏下的全部ToF传感器,也可以是显示屏下的部分ToF传感器,本申请实施例对旋转的ToF传感器的个数也不作限定。
为了满足与显示屏相距目标距离处视场的全覆盖,且最大化利用ToF传感器的FoV,基于上述图7和图8所示出的旋转方案,本申请还给出了ToF传感器的旋转角度的约束条件。
具体而言,ToF传感器的旋转角度受到该ToF传感器的临近ToF传感器的约束,以ToF传感器1(本文也称为第二ToF传感器)和ToF传感器2(本文也称为第三ToF传感器)为例,如图9所示,旋转后的ToF传感器1的倾斜角为,旋转后的ToF传感器2的倾斜角为,和满足如下公式:
下面,结合图10至图13,对本申请实施例的手势识别方法进行详细介绍。
图10是本申请实施例提供的一种手势识别方法1000的示意性流程图。该方法1000可以由上述终端设备(具体可以为上述图5至图8所示出的手机)执行,该终端设备的硬件结构如图1所示,该终端设备的软件结构如图2所示。该方法1000包括下列步骤:
S1001,终端设备控制多个ToF传感器中的第一ToF传感器进行检测。
具体地,第一ToF传感器可以以接近光传感器的方式工作,检测物体靠近。该第一ToF传感器可以是多个ToF传感器中的任意一个传感器,本申请实施例对此不作限定。
S1002,在第一ToF传感器检测到目标对象时,终端设备控制多个ToF传感器同步发射光信号。
具体地,在第一ToF传感器确认目标对象靠近时,终端设备可以开启多个ToF传感器工作,控制该多个ToF传感器的发射端同步发射激光。应理解,在本申请实施例中,目标对象即用户的手。
S1003,终端设备通过多个ToF传感器接收目标对象返回的光信号,获取目标对象在多个ToF传感器中的每个ToF传感器的飞行时间信息。
具体地,在多个ToF传感器同步发射光信号后,终端设备可以通过多个ToF传感器中的每个ToF传感器的接收端接收自己和其他ToF传感器的光信号,通过时间频数统计直方图获得目标对象在多个ToF传感器中的每个ToF传感器的飞行时间信息。
S1004,终端设备基于飞行时间信息和标定信息,确定目标对象在每个ToF传感器的深度信息。应理解,本申请实施例中的标定信息用于表示每个ToF传感器在不同距离下的飞行时间与距离之间的映射关系。
具体地,终端设备可以根据每个ToF传感器的飞行时间信息,在标定信息中查找,获得该飞行时间信息对应的距离,将这个距离作为每个ToF传感器的视场深度信息。
示例性地,假设上述映射关系表示为,其中,h为ToF传感器距显示屏的距离,即深度信息,x为ToF传感器的标号,t 1到t k为ToF传感器x的分区(m,n)在统计直方图中的飞行时间,m和n为ToF传感器x的分区标号。对于每个ToF传感器的每个分区,终端设备会获取到该分区对应的飞行时间信息,根据上述映射关系就可以查找得到每个ToF传感器的每个分区的深度信息h。
S1005,终端设备基于上述深度信息,进行手势识别。
具体地,终端设备可以将每个ToF传感器的深度数据进行融合,获取多个ToF传感器视场拼接后的大视场的深度信息,进而获得目标对象的手势。
可选地,终端设备可以基于大视场的深度信息而获取的手势,截取其中感兴趣的区域(areas of interest,AoI),进行手势识别。这样,能够提高手势识别的效率和准确度。
本申请实施例的手势识别方法,通过将多ToF传感器组合,获取目标对象在多个ToF传感器中的每个ToF传感器的各个分区的飞行时间信息,基于飞行时间信息和标定信息,获取每个ToF传感器每个分区的深度信息,基于深度信息,进行手势识别,能够扩大视场,从而提高手势识别的精确度,扩大手势识别的应用场景,提高用户体验。
作为一个可选的实施例,在终端设备基于飞行时间信息和标定信息确定目标对象在每个ToF传感器的深度信息之前,上述方法还包括:
终端设备通过统计多个ToF传感器在标定白板与显示屏之间的不同距离下的统计直方图,获取标定信息。
示例性地,图11是本申请实施例提供的深度标定方法的示意图。图11是在图5和图6所示的多个ToF传感器的排列方式下进行标定的。如图11所示,对于单个ToF传感器而言,该ToF传感器的一个分区接收到的激光可能包括其他ToF传感器的发射端发射的激光。例如,当白板在图11所示的位置时,A点会有ToF传感器1、ToF传感器2和ToF传感器3的发射端发射的三束激光,相应地,图11左边的ToF传感器1的一个分区接收到的激光除了ToF传感器1的发射端发射的激光外,还可能包括ToF传感器2和ToF传感器3的发射端发射的激光,因此,ToF传感器1的该分区会得到多个飞行时间,如图12所示,图12是一个ToF传感器的一个分区在A点的时间频数统计直方图,其中纵坐标表示光强I。
示例性地,在图12中,通过设置过滤阈值(图中虚线),滤掉统计直方图中虚线下方的光强噪声信号造成的计数。滤掉噪声后,以图中的相邻三个的直方图为一组时间,共分为三组时间,对每一组时间直方图作高斯平滑处理,可以得到每一组时间的一个高斯分布,因此可以得到A点的三个飞行时间,分别为t1、t2、t3。
应理解,该实施例中的三束激光和三个飞行时间仅用作说明,实际可能有多数激光,滤掉噪声后也可能有多个飞行时间,本申请不作限定。
示例性地,在深度标定过程中可以移动白板距显示屏的距离,获得各个ToF传感器的各分区在不同深度信息下的统计直方图,因此可构建上述映射关系,将该映射关系作为标定信息。例如,终端设备具有q个ToF传感器,该q个ToF传感器中的每个ToF传感器具有M×N个分区,采用上述标定方法,即可以得到映射关系。
结合图11和图12的标定信息与飞行时间信息,通过查找映射关系,可获得深度信息。终端设备可以基于深度信息,进行手势识别。
作为一个可选的实施例,终端设备基于深度信息,进行手势识别,包括:终端设备以多个ToF传感器中的第四ToF传感器的中心为原点、以第四ToF传感器的感光面为xoy平面、以垂直于该感光面的方向为z轴,建立世界坐标系;终端设备基于深度信息,确定多个ToF传感器中的每个ToF传感器的每个分区下,目标对象在世界坐标系中的坐标;终端设备合并每个分区下相同的坐标元素,得到坐标元素集合;终端设备基于所述坐标元素集合,进行手势识别。
应理解,上述第四ToF传感器可以是第一ToF传感器、第二ToF传感器、第三ToF传感器中的任一个,也可以是不同于第一ToF传感器、第二ToF传感器、第三ToF传感器的另一传感器,本申请实施例对此不作限定。
下面结合图13介绍本申请基于深度信息的深度融合方法。
图13为本申请实施例提供的基于ToF传感器建立世界坐标系的示意图。图13中的ToF传感器有4×4个SPAD,即被划分为4×4个分区,以该ToF传感器的中心为原点o,以该ToF传感器的SPAD阵列的感光面为xoy平面,垂直于该平面向上的方向为z轴,建立世界坐标系,如图13所示。图13中的ToF传感器的4×4个SPAD有固定的探测方位,即每个SPAD可以探测固定方向的信息,该方向信息由小孔成像决定,由于SPAD阵列较小,方位角可看成目标对象与坐标原点的连线与坐标系的夹角。对于图13的阴影区域的SPAD 1,目标对象A点在xoy平面上的投影为B点,目标对象A点在该世界坐标系中的坐标为:
其中,(m,n,l)为该ToF传感器的SPAD阵列的中心在世界坐标系中的坐标,目标对象A点到原点o的距离为深度信息h,为B点与原点o的连线与x轴的夹角,为B点与原点o的连线与y轴的夹角,为B点与原点o的连线与z轴的夹角。
对于多个ToF传感器中的每个ToF传感器的每个SPAD,按照上面的原理,均可计算得到目标对象在世界坐标系下的坐标,组成一个坐标集合,将坐标集合中的相同坐标元素合并,去除重复部分,可以得到一个新的坐标元素集合,终端设备可以基于该新的坐标元素集合进行手势识别。
可选地,上述深度信息融合过程中的“相同坐标元素”合并时存在误差,终端设备可以通过判断两个坐标在世界坐标系中的绝对距离是否小于预设阈值,来判断这两个坐标是否属于“相同坐标元素”,从而判断是否合并这两个坐标。若上述绝对距离小于或等于预设阈值,则终端设备确定这两个坐标属于“相同坐标元素”,则合并这两个坐标;若上述绝对距离大于预设阈值,则终端设备确定这两个坐标不属于“相同坐标元素”,则不合并这两个坐标。
应理解,上述规定阈值可以根据不同的使用场景和不同的摆放方式灵活设置。
作为一个可选的实施例,终端设备在融合后的信息中选取感兴趣的区域,进行手势识别,从而提高手势识别效率。上述感兴趣的区域用于表示目标对象所在区域。
上文结合图10至13,详细描述了本申请实施例的手势识别方法,下面将结合图14,详细描述本申请实施例的手势识别的终端设备。
图14示出了本申请实施例提供的手势识别终端设备1400,该终端设备1400包括:处理器1401、显示屏1402和多ToF传感器1403,多ToF传感器1403位于显示屏1402下方。其中,处理器1401用于:控制上述多个ToF传感器中的第一ToF传感器进行检测,在该第一ToF传感器检测到目标对象时,控制多个ToF传感器同步发射光信号,通过该多个ToF传感器接收目标对象返回的光信号,获取目标对象在多个ToF传感器中的每个ToF传感器的飞行时间信息,基于该飞行时间信息和标定信息,确定目标对象在每个ToF传感器的深度信息,该标定信息用于表示每个ToF传感器在不同距离下的飞行时间与距离之间的映射关系,以及,基于该深度信息,进行手势识别。
可选地,多个ToF传感器1403中的全部或部分ToF传感器沿平行于所述显示屏的方向倾斜放置。
可选地,处理器1401还用于:通过统计所述多个ToF传感器在标定白板与所述显示屏之间的不同距离下的统计直方图,获取所述标定信息。
可选地,处理器1401用于:以多个ToF传感器中的第四ToF传感器的中心为原点、以该第四ToF传感器的感光面为xoy平面、以垂直于该感光面的方向为z轴,建立世界坐标系,基于深度信息,确定上述多个ToF传感器中的每个ToF传感器的每个分区下,目标对象在世界坐标系中的坐标,合并每个分区下相同的坐标元素,得到坐标元素集合,基于该坐标元素集合,进行手势识别。
可选地,多个ToF传感器中的第五ToF传感器的第一分区下,目标对象的坐标表示为:
其中,(m,n,l)为上述第五ToF传感器的中心在上述世界坐标系中的坐标,h为深度信息,为目标对象与原点的连线在xoy平面的投影与x轴的夹角,为目标对象与原点的连线在xoy平面的投影与y轴的夹角,为目标对象与原点的连线在xoy平面的投影与z轴的夹角。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,该计算机程序用于实现上述实施例中与手势识别对应的方法。
本申请还提供了一种计算机程序产品,该计算机程序产品包括计算机程序(也可以称为代码,或指令),当该计算机程序在计算机上运行时,该计算机可以执行上述实施例所示的手势识别对应的方法。
在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器执行存储器中的指令,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。因此,本申请实施例的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种手势识别方法,其特征在于,应用于包括显示屏和多个ToF传感器的终端设备,所述多个ToF传感器部署于所述显示屏下方,所述方法包括:
所述终端设备控制所述多个ToF传感器中的第一ToF传感器进行检测;
在所述第一ToF传感器检测到目标对象时,所述终端设备控制所述多个ToF传感器同步发射光信号;
所述终端设备通过所述多个ToF传感器接收所述目标对象返回的光信号,获取所述目标对象在所述多个ToF传感器中的每个ToF传感器的飞行时间信息;
所述终端设备基于所述飞行时间信息和标定信息,确定所述目标对象在所述每个ToF传感器的深度信息,所述标定信息用于表示所述每个ToF传感器在不同距离下的飞行时间与距离之间的映射关系;
所述终端设备基于所述深度信息,进行手势识别;
所述多个ToF传感器中的全部或部分ToF传感器沿平行于所述显示屏的方向倾斜放置;
2.根据权利要求1所述的方法,其特征在于,在所述终端设备基于所述飞行时间信息和标定信息,确定所述目标对象在所述每个ToF传感器的深度信息之前,所述方法还包括:
所述终端设备通过统计所述多个ToF传感器在标定白板与所述显示屏之间的不同距离下的统计直方图,获取所述标定信息。
3.根据权利要求1至2中任一项所述的方法,其特征在于,所述终端设备基于所述深度信息,进行手势识别,包括:
所述终端设备以所述多个ToF传感器中的第四ToF传感器的中心为原点、以所述第四ToF传感器的感光面为xoy平面、以垂直于所述感光面的方向为z轴,建立世界坐标系;
所述终端设备基于所述深度信息,确定所述多个ToF传感器中的每个ToF传感器的每个分区下,所述目标对象在所述世界坐标系中的坐标;
所述终端设备合并所述每个分区下相同的坐标元素,得到坐标元素集合;
所述终端设备基于所述坐标元素集合,进行手势识别。
5.一种终端设备,其特征在于,包括:
处理器、显示屏和多个ToF传感器,所述多个ToF传感器部署于所述显示屏下方;
其中,所述处理器用于:控制所述多个ToF传感器中的第一ToF传感器进行检测,在所述第一ToF传感器检测到目标对象时,控制所述多个ToF传感器同步发射光信号,通过所述多个ToF传感器接收所述目标对象返回的光信号,获取所述目标对象在所述多个ToF传感器中的每个ToF传感器的飞行时间信息,基于所述飞行时间信息和标定信息,确定所述目标对象在所述每个ToF传感器的深度信息,所述标定信息用于表示所述每个ToF传感器在不同距离下的飞行时间与距离之间的映射关系,以及,基于所述深度信息,进行手势识别;
所述多个ToF传感器中的全部或部分ToF传感器沿平行于所述显示屏的方向倾斜放置;
6.根据权利要求5所述的终端设备,其特征在于,所述处理器还用于:
通过统计所述多个ToF传感器在标定白板与所述显示屏之间的不同距离下的统计直方图,获取所述标定信息。
7.根据权利要求5至6任一项所述的终端设备,其特征在于,所述处理器用于:
以所述多个ToF传感器中的第四ToF传感器的中心为原点、以所述第四ToF传感器的感光面为xoy平面、以垂直于所述感光面的方向为z轴,建立世界坐标系;
基于所述深度信息,确定所述多个ToF传感器中的每个ToF传感器的每个分区下,所述目标对象在所述世界坐标系中的坐标;
合并所述每个分区下相同的坐标元素,得到坐标元素集合;
基于所述坐标元素集合,进行手势识别。
9.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序包括用于实现如权利要求1至4中任一项所述的方法的指令。
10.一种计算机程序产品,其特征在于,所述计算机程序产品中包括计算机程序代码,当所述计算机程序代码在计算机上运行时,使得计算机实现如权利要求1至4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210947467.1A CN115032640B (zh) | 2022-08-09 | 2022-08-09 | 手势识别方法和终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210947467.1A CN115032640B (zh) | 2022-08-09 | 2022-08-09 | 手势识别方法和终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115032640A CN115032640A (zh) | 2022-09-09 |
CN115032640B true CN115032640B (zh) | 2023-01-17 |
Family
ID=83130346
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210947467.1A Active CN115032640B (zh) | 2022-08-09 | 2022-08-09 | 手势识别方法和终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115032640B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116736937A (zh) * | 2022-09-30 | 2023-09-12 | 荣耀终端有限公司 | 一种笔记本电脑及输入操作的获取方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101387931A (zh) * | 2008-10-14 | 2009-03-18 | 贺伟 | 一种红外线触摸屏多点识别方法 |
CN105867625A (zh) * | 2016-04-06 | 2016-08-17 | 四川东鼎里智信息技术有限责任公司 | 一种远距离手势控制方法 |
CN107291221A (zh) * | 2017-05-04 | 2017-10-24 | 浙江大学 | 基于自然手势的跨屏幕自适应精度调整方法及装置 |
CN110297251A (zh) * | 2019-06-27 | 2019-10-01 | 杭州一隅千象科技有限公司 | 多台tof实现的大幅面空间覆盖的方法及系统 |
CN114120362A (zh) * | 2021-11-23 | 2022-03-01 | 京东方科技集团股份有限公司 | 一种手势采集方法、装置、电子设备和可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101271372B (zh) * | 2008-05-06 | 2010-10-13 | 党韧 | 一种多点触摸屏 |
TWI464649B (zh) * | 2012-03-22 | 2014-12-11 | Quanta Comp Inc | 光學觸控系統 |
US10705191B2 (en) * | 2017-07-31 | 2020-07-07 | Stmicroelectronics, Inc. | Three-dimensional time-of-flight sensors for a transportation system |
-
2022
- 2022-08-09 CN CN202210947467.1A patent/CN115032640B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101387931A (zh) * | 2008-10-14 | 2009-03-18 | 贺伟 | 一种红外线触摸屏多点识别方法 |
CN105867625A (zh) * | 2016-04-06 | 2016-08-17 | 四川东鼎里智信息技术有限责任公司 | 一种远距离手势控制方法 |
CN107291221A (zh) * | 2017-05-04 | 2017-10-24 | 浙江大学 | 基于自然手势的跨屏幕自适应精度调整方法及装置 |
CN110297251A (zh) * | 2019-06-27 | 2019-10-01 | 杭州一隅千象科技有限公司 | 多台tof实现的大幅面空间覆盖的方法及系统 |
CN114120362A (zh) * | 2021-11-23 | 2022-03-01 | 京东方科技集团股份有限公司 | 一种手势采集方法、装置、电子设备和可读存储介质 |
Non-Patent Citations (1)
Title |
---|
Automatic static hand gesture recognition using ToF cameras;Serban Oprisescu等;《20th European Signal Processing Conference(EUSIPCO 2012)》;20120831;2748-2751 * |
Also Published As
Publication number | Publication date |
---|---|
CN115032640A (zh) | 2022-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112130742B (zh) | 一种移动终端的全屏显示方法及设备 | |
CN113645351B (zh) | 应用界面交互方法、电子设备和计算机可读存储介质 | |
CN110114747B (zh) | 一种通知处理方法及电子设备 | |
CN110559645B (zh) | 一种应用的运行方法及电子设备 | |
CN112383664B (zh) | 一种设备控制方法、第一终端设备、第二终端设备及计算机可读存储介质 | |
CN112087649B (zh) | 一种设备搜寻方法以及电子设备 | |
CN113542580B (zh) | 去除眼镜光斑的方法、装置及电子设备 | |
CN115589051B (zh) | 充电方法和终端设备 | |
CN114995715B (zh) | 悬浮球的控制方法和相关装置 | |
CN115619858A (zh) | 一种物体重建方法以及相关设备 | |
CN114089932A (zh) | 多屏显示方法、装置、终端设备及存储介质 | |
CN114461057A (zh) | Vr显示控制方法、电子设备及计算机可读存储介质 | |
CN115032640B (zh) | 手势识别方法和终端设备 | |
CN114222020B (zh) | 位置关系识别方法、设备及可读存储介质 | |
CN111249728B (zh) | 一种图像处理方法、装置及存储介质 | |
CN114090140A (zh) | 基于指向操作的设备之间的交互方法及电子设备 | |
CN114283195B (zh) | 生成动态图像的方法、电子设备及可读存储介质 | |
CN113380240B (zh) | 语音交互方法和电子设备 | |
CN113573045B (zh) | 杂光检测方法及杂光检测装置 | |
CN115641867A (zh) | 语音处理方法和终端设备 | |
CN114812381A (zh) | 电子设备的定位方法及电子设备 | |
WO2022222705A1 (zh) | 设备控制方法和电子设备 | |
WO2024041180A1 (zh) | 路径规划方法及装置 | |
CN115619628A (zh) | 图像处理方法和终端设备 | |
CN115906033A (zh) | 声纹认证应答方法、系统及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |