CN111399669B - 耳机的位姿变化识别方法、装置、无线耳机及存储介质 - Google Patents

耳机的位姿变化识别方法、装置、无线耳机及存储介质 Download PDF

Info

Publication number
CN111399669B
CN111399669B CN202010229643.9A CN202010229643A CN111399669B CN 111399669 B CN111399669 B CN 111399669B CN 202010229643 A CN202010229643 A CN 202010229643A CN 111399669 B CN111399669 B CN 111399669B
Authority
CN
China
Prior art keywords
earphone
voice
pose change
axis
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010229643.9A
Other languages
English (en)
Other versions
CN111399669A (zh
Inventor
尚家乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Inc
Original Assignee
Goertek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Inc filed Critical Goertek Inc
Priority to CN202010229643.9A priority Critical patent/CN111399669B/zh
Publication of CN111399669A publication Critical patent/CN111399669A/zh
Application granted granted Critical
Publication of CN111399669B publication Critical patent/CN111399669B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0346Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of the device orientation or free movement in a 3D space, e.g. 3D mice, 6-DOF [six degrees of freedom] pointers using gyroscopes, accelerometers or tilt-sensors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/44Program or device authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C23/00Non-electrical signal transmission systems, e.g. optical systems
    • G08C23/02Non-electrical signal transmission systems, e.g. optical systems using infrasonic, sonic or ultrasonic waves
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种耳机的位姿变化识别方法、装置、无线耳机及计算机可读存储介质,该方法包括:获取位姿变化识别指令;根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据;根据传感器数据,确定传感器数据对应的位姿变化与预设位姿变化的比较结果;其中,比较结果为识别通过或识别失败;本发明通过根据传感器数据,确定传感器数据对应的位姿变化与预设位姿变化的比较结果,能够利用耳机上的姿态传感器采集的传感器数据对耳机佩戴者当前的位姿变化进行预设位姿变化的识别认证,从而能够与耳机的语音控制结合相结合进行二次加密,提高耳机使用的安全性。

Description

耳机的位姿变化识别方法、装置、无线耳机及存储介质
技术领域
本发明涉及便携式收听设备技术领域,特别涉及一种耳机的位姿变化识别方法、装置、无线耳机及计算机可读存储介质。
背景技术
随着语音识别等技术的发展,通过如TWS耳机的耳机与手机的搭配,可以根据用户的语音完成快捷支付、语音助手操作等语音控制功能,但同时随着人工智能技术的发展,利用神经网络去合成、模拟人的语音特征,然后进行语音造假,从而盗刷用户资金或私自操控用户语音助手的现象越来越普遍。因此对于此类安全性要求较高的语音指令功能,需要一种二次加密方法,从而可以如网上银行的“加密狗”一样,将用户信息与语音指令进行绑定,保证语音控制功能的安全性。
因此,如何能够提供一种能够与耳机的语音控制结合的二次加密方法,提高耳机使用的安全性,是现今急需解决的问题。
发明内容
本发明的目的是提供一种耳机的位姿变化识别方法、装置、无线耳机及计算机可读存储介质,以利用耳机中的姿态传感器进行位置姿态(位姿)变化的识别,从而能够对耳机的语音控制进行二次加密,提高耳机使用的安全性。
为解决上述技术问题,本发明提供一种耳机的位姿变化识别方法,包括:
获取位姿变化识别指令;
根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据;
根据所述传感器数据,确定所述传感器数据对应的位姿变化与预设位姿变化的比较结果;其中,所述比较结果为识别通过或识别失败。
可选的,所述根据所述传感器数据,确定所述传感器数据对应的位姿变化与预设位姿变化的比较结果,包括:
根据所述传感器数据,计算所述预设时间段内的三轴的角度值数据;
根据每轴的角度值数据,确定每轴对应的二进制向量;
根据三轴各自对应的二进制向量,确定所述比较结果。
可选的,所述三轴的角度值数据,包括:X轴角度值数据、Y轴角度值数据和Z轴角度值数据时,根据每轴的角度值数据,确定每轴对应的二进制向量,包括:
根据所述X轴角度值数据,生成X轴采样点折线图;其中,所述X轴采样点折线图包括预设坐标系中的所述X轴角度值数据中目标采样点角度值的绝对值的连线,所述预设坐标系的横轴为采样时序,所述预设坐标系的纵轴为角度值的绝对值,所述目标采样点角度值为所述X轴角度值数据中绝对值处于X轴预设范围的采样点角度值;
根据预设二进制采样区间,通过所述X轴采样点折线图中每个二进制采样时刻的连线点值与X轴预设数值的比较,确定每个所述二进制采样时刻对应的二进制值,生成所述二进制值组成的X轴对应的二进制向量。
可选的,所述X轴预设数值为所述X轴预设范围的上限值与下限值之和的二分之一。
可选的,所述根据三轴各自对应的二进制向量,确定所述比较结果,包括:
根据三轴各自对应的二进制向量,生成一个位姿变化二进制向量;
将所述位姿变化二进制向量与所述预设位姿变化对应的预设二进制向量的进行二进制对比,得到二进制对比结果;
判断所述二进制对比结果是否处于预设置信区间;
若是,则确定所述比较结果为所述识别通过;
若否,则确定所述比较结果为所述识别失败。
可选的,所述姿态传感器具体为加速度传感器。
可选的,所述根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据,包括:
所述耳机根据终端发送的所述位姿变化识别指令,控制所述姿态传感器采集所述传感器数据,并控制所述耳机上的语音麦克风采集语音数据;其中,所述终端与所述耳机连接;
对应的,所述耳机的位姿变化识别方法,还包括:
所述耳机将所述比较结果和所述语音数据,发送到所述终端,以使所述终端根据所述比较结果和所述语音数据确定语音控制结果;其中,所述语音控制结果为控制执行或控制不执行。
可选的,所述根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据,包括:
终端根据在进入到语音支付场景和/或语音助手场景时,生成的所述位姿变化识别指令,控制所述耳机中的所述姿态传感器采集所述传感器数据,并控制所述耳机上的语音麦克风采集语音数据;其中,所述终端与所述耳机连接;
对应的,所述耳机的位姿变化识别方法,还包括:
所述终端根据所述比较结果和所述语音数据确定语音控制结果;其中,所述语音控制结果为控制执行或控制不执行。
可选的,所述终端根据所述比较结果和所述语音数据确定语音控制结果,包括:
所述终端根据所述语音数据,确定语音识别结果;其中,所述语音识别结果为语音识别成功或语音识别失败;
若所述语音识别结果为所述语音识别成功且所述比较结果为所述识别通过,则确定所述语音控制结果为所述控制执行,并执行所述语音数据对应的预设语音控制指令。
本发明还提供了一种耳机的位姿变化识别装置,包括:
指令获取模块,用于获取位姿变化识别指令;
采集模块,用于根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据;
识别模块,用于根据所述传感器数据,确定所述传感器数据对应的位姿变化与预设位姿变化的比较结果;其中,所述比较结果为识别通过或识别失败。
本发明还提供了一种无线耳机,包括:喇叭、麦克风、姿态传感器、存储器和处理器;其中,所述存储器,用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如上述所述的耳机的位姿变化识别方法的步骤。
本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的耳机的位姿变化识别方法的步骤。
本发明所提供的一种耳机的位姿变化识别方法,包括:获取位姿变化识别指令;根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据;根据传感器数据,确定传感器数据对应的位姿变化与预设位姿变化的比较结果;其中,比较结果为识别通过或识别失败;
可见,本发明通过根据传感器数据,确定传感器数据对应的位姿变化与预设位姿变化的比较结果,能够利用耳机上的姿态传感器采集的传感器数据对耳机佩戴者当前的位姿变化进行预设位姿变化的识别认证,从而能够与耳机的语音控制结合相结合进行二次加密,提高耳机使用的安全性。此外,本发明还提供了一种耳机的位姿变化识别装置、无线耳机及计算机可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的一种耳机的位姿变化识别方法的流程图;
图2为本发明实施例所提供的一种位姿变化的特征提取方法的流程示意图;
图3为本发明实施例所提供的另一种耳机的位姿变化识别方法的流程图;
图4为本发明实施例所提供的另一种耳机的位姿变化识别方法的流程示意图;
图5为本发明实施例所提供的一种采样点折线图的示意图;
图6为本发明实施例所提供的一种二进制向量合并方法的示意图;
图7为本发明实施例所提供的一种耳机的位姿变化识别装置的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例所提供的一种耳机的位姿变化识别方法的流程图。该方法可以包括:
S101:获取位姿变化识别指令。
需要说明的是,本实施例所提供的耳机的位姿变化识别方法,可以为耳机中如单片机的处理器利用该耳机中的姿态传感器采集的传感器数据,对该耳机的佩戴者(用户)的位姿变化进行识别的方法;也可以为与耳机连接的终端(如与TWS耳机蓝牙连接的智能手机)中的处理器利用该耳机中的姿态传感器采集的传感器数据,对该耳机的佩戴者(用户)的位姿变化进行识别的方法。本实施例对此不做任何限制。
其中,本步骤中的位姿变化识别指令可以为用于控制耳机或终端中的处理器进行位姿变化识别的指令。本实施例并不限定位姿变化识别指令的具体内容,只要处理器可以在获取位姿变化识别指令,并根据位姿变化识别指令进行接下来的位姿变化识别过程,本实施例对此不做任何限制。
具体的,对于本步骤中处理器获取位姿变化识别指令的具体方式,可以由设计人员根据实用场景和用户需求自行设置,如耳机中的处理器可以直接接收终端发送的位姿变化识别指令;例如终端在进入到需要进行位姿变化识别的语音控制场景(如语音支付场景和语音助手场景等)时,可以生成位姿变化识别指令并发送给连接的耳机的处理器。处理器也可以生成位姿变化识别指令;例如终端的处理器在进入到需要进行位姿变化识别的语音控制场景(如语音支付场景和语音助手场景等)时,可以生成位姿变化识别指令。
S102:根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据。
可以理解的是,本步骤的目的可以为处理器根据获取的位姿变化识别指令,控制耳机中的姿态传感器开始采集一定时间段(预设时间段)内的传感器数据,从而利用采集到的传感器数据进行该耳机的位姿变化识别,即该耳机的佩戴者的位姿变化识别。
具体的,本步骤可以为耳机的处理器根据获取的位姿变化识别指令,控制该耳机上的姿态传感器采集传感器数据;也可以为终端中的处理器根据获取的位姿变化识别指令,向耳机发送对应的控制指令,控制该耳机上的姿态传感器采集传感器数据。
其中,本步骤中的姿态传感器可以为耳机中设置的用于采集位置姿态变化数据(传感器数据)的传感器,如加速度传感器(三轴加速度计)、三轴陀螺仪和三轴电子罗盘等。对于本实施例中耳机中的姿态传感器的具体类型,可以由设计人员根据使用场景和用户需求自行设置,只要姿态传感器可以检测到耳机佩戴者的位置姿态变化对应的传感器数据,本实施例对此不做任何限制。
具体的,对于本步骤中处理器可以获取耳机上的姿态传感器采集预设时间段内的传感器数据,对于本步骤中姿态传感器采集的传感器数据的具体内容,可以由设计人员或用户根据实用场景和用户需求自行设置,如可以根据姿态传感器的具体类型对应进行设置,如图2所示,姿态传感器为加速度传感器(Gsensor)时,本步骤中耳机中的处理器在获取位姿变化识别指令后,可以控制打开Gsensor的FIFO(First Input First Output,先入先出队列)获取Gsensor的三轴(X轴、Y轴和Z轴)的加速度数据,在FIFO所采集的三轴的加速度数据达到设定阈值(即预设时间段)后,通过及寄存器读取操作,获取N组原始加速度值(即传感器数据),每组三个数据即为Gsensor三轴上对应采样时刻的加速度原始测量值。
需要说明的是,本实施例是以处理器利用耳机上的姿态传感器采集传感器数据进行位姿变化识别为例进行的展示。进一步的,为了将位姿变化识别与语音控制相结合,本实施例中终端或耳机中的处理器还可以利用耳机上的语音麦克风采集的声音数据进行语音识别,从而利用位姿变化识别的比较结果和语音识别结果得到最终的语音控制结果;或者本实施例中耳机中的处理器可以将得到位姿变化识别的比较结果和该耳机上的语音麦克风采集的声音数据发送给终端,使得终端可以利用该耳机发送的声音数据进行语音识别,并利用位姿变化识别的比较结果和语音识别结果得到最终的语音控制结果。
对应的,为了减少语音控制的数据采集所需要的时间,本步骤中处理器可以根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据,并控制耳机上的语音麦克风采集语音数据,使得传感器数据和语音数据可以在同一时间采集,即用户可以说出控制声音的同时进行相应的动作,如用户可以再说出“支付”的控制声音的同时进行“点头动作”。
S103:根据传感器数据,确定传感器数据对应的位姿变化与预设位姿变化的比较结果;其中,比较结果为识别通过或识别失败。
可以理解的是,本步骤中的预设位姿变化可以为预设设置的用户佩戴耳机时进行的物理位姿特征,如点头动作或摇头动作等。
具体的,本实施例是以处理器确定传感器数据对应的位姿变化与一个预设位姿变化的比较结果为例进行的展示;本实施例中处理器也可以确定传感器数据对应的位姿变化与多个预设位姿变化的比较结果,即本实施例中处理器在确定比较结果为识别通过时,还可以确定该比较结果对应的一个预设位姿变化。
需要说明的是,对于本步骤中处理器根据传感器数据,确定传感器数据对应的位姿变化与预设位姿变化的比较结果的具体方式,可以由设计人员根据实用场景和用户需求自行设置,如本实施例中可以通过二进制向量(二进制物理特征向量)的比较,确定传感器数据对应的位姿变化与预设位姿变化的比较结果,即处理器可以将传感器数据转换为对应的二进制向量,通过该二进制向量与预设位姿变化对应的二进制向量的比较,确定比较结果;对应的,本步骤可以包括根据传感器数据,计算预设时间段内的三轴的角度值数据;根据每轴的角度值数据,确定每轴对应的二进制向量;根据三轴各自对应的二进制向量,确定比较结果。本实施例中也可以通过如三轴的角度值数据直接比较,或如三进制向量的更高进制的比较,确定传感器数据对应的位姿变化与预设位姿变化的比较结果。本实施例对此不做任何限制。
具体的,本步骤之后还可以包括耳机中的处理器将确定的比较结果发送到与耳机连接的终端的步骤,如TWS耳机中的处理器可以将确定的比较结果和采集的语音数据分别发送到与其配对连接的智能手机,以使智能手机可以根据语音数据的语音识别结果和接收的比较结果,确定语音控制结果。
对应的,本步骤之后还可以包括终端或耳机中的处理器利用耳机中的语音麦克风采集的语音数据进行语音识别,得到语音识别结果;其中,语音识别结果为语音识别成功或语音识别失败;若语音识别结果为语音识别成功且比较结果为识别通过,则确定语音控制结果为控制执行,并控制终端执行语音数据对应的预设语音控制指令;其中,语音控制结果为控制执行或控制不执行。
本实施例中,本发明实施例通过根据传感器数据,确定传感器数据对应的位姿变化与预设位姿变化的比较结果,能够利用耳机上的姿态传感器采集的传感器数据对耳机佩戴者当前的位姿变化进行预设位姿变化的识别认证,从而能够与耳机的语音控制结合相结合进行二次加密,提高耳机使用的安全性。
请参考图3,图3为本发明实施例所提供的另一种耳机的位姿变化识别方法的流程图。该方法可以包括:
S201:终端在进入到语音支付场景和/或语音助手场景时,生成并向耳机发送位姿变化识别指令;其中,终端与耳机连接。
可以理解的是,本实施例的目的可以为在终端中现有的语音支付、语音助手等语音控制功能的基础上,通过如TWS耳机的耳机利用姿态传感器(如加速度传感器,图4中的Gsensor)进行的位姿变化识别,计算出用户在发出语音指令时的物理位姿特征,并以此特征对用户的语音控制功能进行二次加密。
也就是说,本步骤中终端在进入到语音支付场景和/或语音助手场景等语音指令使用的语音控制场景时,可以生成位姿变化识别指令,并通过将位姿变化识别指令发送到耳机,控制耳机进行位姿变化识别和采集语音指令对应语音数据。
S202:耳机接收位姿变化识别指令。
其中,本步骤与步骤S101相似,在此不再赘述。
S203:耳机根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据,并控制耳机上的语音麦克风采集语音数据。
其中,本步骤中的语音麦克风可以耳机上设置的用于采集用户发出的语音指令对应的语音数据的麦克风。
具体的,本实施例中并不限定语音麦克风采集的语音数据具体时间,如耳机的处理器可以根据位姿变化识别指令,控制耳机中的语音麦克风采集采集预设时间段内的语音数据,即姿态传感器和语音麦克风的数据采集同时开始和结束;耳机的处理器可以根据位姿变化识别指令,控制耳机中的语音麦克风采集采集预设语音时间段内的语音数据,即姿态传感器和语音麦克风的数据采集同时开始,不同时结束。
S204:耳机根据传感器数据,计算预设时间段内的三轴的角度值数据。
可以理解的是,本步骤的目的可以为耳机中的处理器根据姿态传感器采集预设时间段内的传感器数据,计算预设时间段内的三轴(X轴、Y轴和Z轴)的角度值数据,即每个采样时刻的三轴加速度对应的姿态传感器在X、Y、Z三轴上在用户进行加密动作(如点头动作)时的俯仰角、侧偏角和偏航角。
具体的,对于本步骤中耳机中的处理器根据传感器数据,计算预设时间段内的三轴的角度值数据的具体方式,可以由设计人员自行设置,如可以先对传感器数据进行预处理,得到待处理传感器数据;再利用待处理传感器数据,计算三轴的角度值数据,即姿态传感器在三轴上的角度变化对应的角度值的组合。如图2所示,姿态传感器为加速度传感器(Gsensor)时,处理器可以先对传感器数据(即加速度原始测量值)进行灵敏度系数计算、滤波和降噪等预处理操作,得到待处理传感器数据(滤波及降噪后的加速度值的组合);然后通过如下的角度计算,可以得到每个采样时刻的Gsensor在三轴上的角度值,从而得到三轴的角度值数据:
α1=arctan(Ax/squr(Ay*Ay+Az*Az))
β1=arctan(Ay/squr(Ax*Ax+Az*Az))
γ1=arctan(Az/squr(Ax*Ax+Ay*Ay))
其中,α1、β1和γ1可以分别代表Gsensor在X、Y、Z三轴上在用户进行加密动作时在采样时刻的俯仰角、侧偏角和偏航角;Ax为当前采样时刻X轴上的加速度分量、Ay为当前采样时刻Y轴上的加速度分量、Az为当前采样时刻Z轴上的加速度分量。
S205:耳机根据每轴的角度值数据,确定每轴对应的二进制向量。
可以理解的是,本步骤的目的可以为处理器利用X、Y、Z三轴中的每轴的角度值数据,获取每轴对应的二进制向量,即将每轴的角度值数据转换为对应的二进制向量。
具体的,对于本步骤中耳机的处理器根据每轴的角度值数据,确定每轴对应的二进制向量的具体方式,可以由设计人员自行设置,如以三轴的角度值数据中的X轴的角度值数据(X轴角度值数据)为例,处理器可以先根据X轴角度值数据,生成如图5所示的X轴采样点折线图;其中,X轴采样点折线图包括预设坐标系中的X轴角度值数据中目标采样点角度值的绝对值的连线,预设坐标系的横轴为采样时序,预设坐标系的纵轴为角度值的绝对值,目标采样点角度值为X轴角度值数据中绝对值处于X轴预设范围的采样点角度值;再根据预设二进制采样区间,通过X轴采样点折线图中每个二进制采样时刻的连线点值与X轴预设数值的比较,确定每个二进制采样时刻对应的二进制值,生成二进制值组成的X轴对应的二进制向量。如X轴采样点折线图中的连线在二进制采样时刻的纵坐标(即连线点值)大于X轴预设数值时,可以确定该二进制采样时刻对应的二进制值为1;X轴采样点折线图中的连线在二进制采样时刻的纵坐标(即连线点值)小于或等于X轴预设数值时,可以确定该二进制采样时刻对应的二进制值为0;从而利用全部二进制采样时刻对应的二进制值生成X轴对应的二进制向量。对应的,采用与上述相似的方法可以得到Y轴对应的二进制向量和Z轴对应的二进制向量。处理器也可以通过X轴角度值数据中每个采样点角度值的绝对值与预设数值直接对比的方式,确定每个每个采样点角度值对应的二进制值,并生成X轴对应的二进制向量。只要处理器可以利用每轴的角度值数据,确定每轴对应的二进制向量,本实施例对此不做任何限制。
对应的,如图5所示,X、Y、Z三轴的采样点折线图中的预设坐标系可以以各采样点的采样时刻的前后顺序(即采样时序)为横坐标,以各采样点的角度值的绝对值或角度值为纵坐标。X轴采样点折线图中的折线(连线)的连接点可以为X轴角度值数据中的目标采样点角度值,即目标采样点角度值的绝对值在X轴预设范围的上限值和下限值之间。根据预设二进制采样区间(如图5中的h),通过X轴采样点折线图中每个二进制采样时刻的连线点值(图5中虚线与折线的相交点的纵坐标)与X轴预设数值(如图5中的中值)的比较,确定每个二进制采样时刻对应的二进制值,如图5中大于中值则取1,小于或等于中值则取0,从而在三轴的采样点折线图上,可以分别得到一组二进制向量。
具体的,对于各轴对应的预设范围(如上述X轴预设范围)的具体范围设置,即上限值和下限值的设置,可以由设计人员自行选择,如X轴预设范围的上限值可以为X轴角度值数据中绝对值最大的采样点角度值的绝对值,X轴预设范围的下限值可以为X轴角度值数据中绝对值最小的采样点角度值的绝对值,本实施例对此不做任何限制。同样的,本实施例并不限定各轴对应的预设数值(如上述X轴预设数值)的具体取值,如X轴预设数值可以为图5所示的中值,即X轴预设范围的上限值与下限值之和的二分之一。
S206:耳机根据三轴各自对应的二进制向量,确定传感器数据对应的位姿变化与预设位姿变化的比较结果,并将比较结果发送到终端。
可以理解的是,本步骤的目的可以为处理器利用通过传感器数据得到的X、Y、Z三轴各自对应的二进制向量,确定传感器数据对应的位姿变化与预设位姿变化的比较结果,即X、Y、Z三轴对应的二进制向量所对应的位姿变化与预设位姿变化的比较结果,并将比较结果发送到终端,以使终端可以对应确定语音控制结果。
具体的,对于本步骤中根据三轴各自对应的二进制向量,确定传感器数据对应的位姿变化与预设位姿变化的比较结果的具体方式,可以由设计人员自行设置,如处理器可以根据三轴各自对应的二进制向量,生成一个位姿变化二进制向量;将位姿变化二进制向量与预设位姿变化对应的预设二进制向量的进行二进制对比,得到二进制对比结果;判断二进制对比结果是否处于预设置信区间;若是,则确定比较结果为识别通过;若否,则确定比较结果为识别失败。如图6所示,可以将X、Y、Z三轴对应的三组二进制向量按照X、Y、Z的顺序合并,得到最终的二进制物理特征向量(Gsensor位姿特征向量,即位姿变化二进制向量),即该特征向量通过二进制的形式对用户发出语音指令时进行的位姿运动特征进行了表达;通过将该特征向量与用户预先注册在耳机的存储设备(如闪存Flash)中的特征信息(预设二进制向量)进行二进制对比验证,结果满足用户或设计人员所设定的置信区间(预设置信区间),则确定比较结果为识别通过;否则确定比较结果为识别失败。处理器也可以将三轴各自对应的二进制向量分别与预设位姿变化对应的每轴的预设轴二进制向量进行进行二进制对比,利用得到的三轴各自对应的二进制对比结果,确定比较结果。本实施例对此不做任何限制。
对应的,如图4所示,本实施例所提供的方法还可以包括用户在首次使用耳机的位姿变化识别(即Gsensor加密)时,按照与步骤S203至S206相似的方式采集预设位姿变化对应的基准二进制特征向量(预设二进制向量),并存储到耳机的Flash。
S207:终端根据比较结果和语音数据确定语音控制结果;其中,语音控制结果为控制执行或控制不执行。
可以理解的是,本步骤的目的可以为终端中的处理器利用耳机发送的位姿变化识别的比较结果和语音识别所需的语音数据,确定语音控制结果。例如当用户进行语音支付时,发出语音“支付”的同时,进行自定义的幅度的“点头动作”,此时本实施例中用户所佩戴的耳机会基于耳机中的Gsensor计算并提取“点头动作”中的二进制特征信息,并将这个特征信息与用户预先注册存储在耳机FLASH中的特征信息进行比对验证,只有验证成功,语音支付操作才会在语音识别成功的基础上最终执行;使得如TWS耳机的耳机可以对当前热门的语音支付和语音助手等语音控制功能进行二次加密,使耳机变为私密操作的便携性加密令牌。
具体的,对于本步骤中终端根据比较结果和语音数据确定语音控制结果的具体方式,可以由设计人员自行设置,如终端可以根据接收的语音数据,确定语音识别结果;其中,语音识别结果为语音识别成功或语音识别失败;如图4所示,可以利用声纹识别算法进行语音数据对应人员的身份认证,若认证为用户本人的声波,则确定语音识别结果为识别通过;若语音识别结果为语音识别成功且比较结果为识别通过,则确定语音控制结果为控制执行,并执行语音数据对应的预设语音控制指令。
也就是说,在使用语音支付、语音助手等功能时,用户可首先在终端的APP端进行语音指令自定义设置,例如用户可以定义“支付”、“购买”等特定语义、特定方言的语音作为语音支付等语音控制场景的语音指令,用户在APP端选择自定义语音指令后,可通过TWS耳机的语音麦克风收录用户的自定义语音,然后通过蓝牙连接传输到APP端进行语音数据的特征提取操作,得出当前语音指令的声纹特征模型,最后通过判决打分算法识别测试语音数据与用户自定义语音指令的吻合度,并最终在语音支付和语音助手等语音控制场景下与耳机的位姿变化识别的进行结合使用。
本实施例中,本发明实施例将耳机的位姿变化识别与终端的语音识别相结合,利用耳机的位姿变化识别对终端的语音控制功能进行二次加密,提高了语音控制功能的安全性。
请参考图7,图7为本发明实施例所提供的一种耳机的位姿变化识别装置的结构框图。该装置可以包括:
指令获取模块10,用于获取位姿变化识别指令;
采集模块20,用于根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据;
识别模块30,用于根据传感器数据,确定传感器数据对应的位姿变化与预设位姿变化的比较结果;其中,比较结果为识别通过或识别失败。
可选的,识别模块30可以包括:
角度值计算子模块,用于根据传感器数据,计算预设时间段内的三轴的角度值数据;
二进制向量计算子模块,用于根据每轴的角度值数据,确定每轴对应的二进制向量;
比较子模块,用于根据三轴各自对应的二进制向量,确定比较结果。
可选的,三轴的角度值数据,包括:X轴角度值数据、Y轴角度值数据和Z轴角度值数据时,二进制向量计算子模块,可以包括:
折线图生成单元,用于根据X轴角度值数据,生成X轴采样点折线图;其中,X轴采样点折线图包括预设坐标系中的X轴角度值数据中目标采样点角度值的绝对值的连线,预设坐标系的横轴为采样时序,预设坐标系的纵轴为角度值的绝对值,目标采样点角度值为X轴角度值数据中绝对值处于X轴预设范围的采样点角度值;
二进制向量生成单元,用于根据预设二进制采样区间,通过X轴采样点折线图中每个二进制采样时刻的连线点值与X轴预设数值的比较,确定每个二进制采样时刻对应的二进制值,生成二进制值组成的X轴对应的二进制向量。
可选的,X轴预设数值为X轴预设范围的上限值与下限值之和的二分之一。
可选的,比较子模块,包括:
合并单元,用于根据三轴各自对应的二进制向量,生成一个位姿变化二进制向量;
合并单元,用于将位姿变化二进制向量与预设位姿变化对应的预设二进制向量的进行二进制对比,得到二进制对比结果;
判断单元,用于判断二进制对比结果是否处于预设置信区间;若是,则确定比较结果为识别通过;若否,则确定比较结果为识别失败。
可选的,姿态传感器具体为加速度传感器。
可选的,采集模块20具体用于根据终端发送的位姿变化识别指令,控制姿态传感器采集传感器数据,并控制耳机上的语音麦克风采集语音数据;其中,终端与耳机连接;
对应的,该装置还包括:
发送模块,用于将比较结果和语音数据,发送到终端,以使终端根据比较结果和语音数据确定语音控制结果;其中,语音控制结果为控制执行或控制不执行。
可选的,采集模块20具体用于根据在进入到语音支付场景和/或语音助手场景时,生成的位姿变化识别指令,控制耳机中的姿态传感器采集传感器数据,并控制耳机上的语音麦克风采集语音数据;
对应的,该装置还包括:
语音控制确定模块,用于根据比较结果和语音数据确定语音控制结果;其中,语音控制结果为控制执行或控制不执行。
可选的,语音控制确定模块,包括:
语音识别子模块,用于根据语音数据,确定语音识别结果;其中,语音识别结果为语音识别成功或语音识别失败;
确定子模块,用于若语音识别结果为语音识别成功且比较结果为识别通过,则确定语音控制结果为控制执行,并执行语音数据对应的预设语音控制指令。
本实施例中,本发明实施例通过识别模块30根据传感器数据,确定传感器数据对应的位姿变化与预设位姿变化的比较结果,能够利用耳机上的姿态传感器采集的传感器数据对耳机佩戴者当前的位姿变化进行预设位姿变化的识别认证,从而能够与耳机的语音控制结合相结合进行二次加密,提高耳机使用的安全性。
本发明实施例还提供了一种无线耳机,包括:喇叭、麦克风、姿态传感器、存储器和处理器;其中,存储器,用于存储计算机程序,处理器用于执行计算机程序时实现如上述实施例所提供的耳机的位姿变化识别方法的步骤。
此外,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述实施例所提供的耳机的位姿变化识别方法的步骤。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、无线耳机及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种耳机的位姿变化识别方法、装置、无线耳机及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (12)

1.一种耳机的位姿变化识别方法,其特征在于,包括:
获取位姿变化识别指令;其中,所述位姿变化识别指令为需要进行位姿变化识别的语音控制场景时生成的;
根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据;
根据所述传感器数据,确定所述传感器数据对应的位姿变化与预设位姿变化的比较结果,以使终端根据语音数据的语音识别结果和接收的比较结果,确定语音控制结果;其中,所述比较结果为识别通过或识别失败。
2.根据权利要求1所述的耳机的位姿变化识别方法,其特征在于,所述根据所述传感器数据,确定所述传感器数据对应的位姿变化与预设位姿变化的比较结果,包括:
根据所述传感器数据,计算所述预设时间段内的三轴的角度值数据;
根据每轴的角度值数据,确定每轴对应的二进制向量;
根据三轴各自对应的二进制向量,确定所述比较结果。
3.根据权利要求2所述的耳机的位姿变化识别方法,其特征在于,所述三轴的角度值数据,包括:X轴角度值数据、Y轴角度值数据和Z轴角度值数据时,根据每轴的角度值数据,确定每轴对应的二进制向量,包括:
根据所述X轴角度值数据,生成X轴采样点折线图;其中,所述X轴采样点折线图包括预设坐标系中的所述X轴角度值数据中目标采样点角度值的绝对值的连线,所述预设坐标系的横轴为采样时序,所述预设坐标系的纵轴为角度值的绝对值,所述目标采样点角度值为所述X轴角度值数据中绝对值处于X轴预设范围的采样点角度值;
根据预设二进制采样区间,通过所述X轴采样点折线图中每个二进制采样时刻的连线点值与X轴预设数值的比较,确定每个所述二进制采样时刻对应的二进制值,生成所述二进制值组成的X轴对应的二进制向量。
4.根据权利要求3所述的位姿变化识别方法,其特征在于,所述X轴预设数值为所述X轴预设范围的上限值与下限值之和的二分之一。
5.根据权利要求2所述的耳机的位姿变化识别方法,其特征在于,所述根据三轴各自对应的二进制向量,确定所述比较结果,包括:
根据三轴各自对应的二进制向量,生成一个位姿变化二进制向量;
将所述位姿变化二进制向量与所述预设位姿变化对应的预设二进制向量的进行二进制对比,得到二进制对比结果;
判断所述二进制对比结果是否处于预设置信区间;
若是,则确定所述比较结果为所述识别通过;
若否,则确定所述比较结果为所述识别失败。
6.根据权利要求1所述的耳机的位姿变化识别方法,其特征在于,所述姿态传感器具体为加速度传感器。
7.根据权利要求1至6任一项所述的耳机的位姿变化识别方法,其特征在于,所述根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据,包括:
所述耳机根据终端发送的所述位姿变化识别指令,控制所述姿态传感器采集所述传感器数据,并控制所述耳机上的语音麦克风采集语音数据;其中,所述终端与所述耳机连接;
对应的,所述耳机的位姿变化识别方法,还包括:
所述耳机将所述比较结果和所述语音数据,发送到所述终端,以使所述终端根据所述比较结果和所述语音数据确定语音控制结果;其中,所述语音控制结果为控制执行或控制不执行。
8.根据权利要求1至6任一项所述的耳机的位姿变化识别方法,其特征在于,所述根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据,包括:
终端根据在进入到语音支付场景和/或语音助手场景时,生成的所述位姿变化识别指令,控制所述耳机中的所述姿态传感器采集所述传感器数据,并控制所述耳机上的语音麦克风采集语音数据;其中,所述终端与所述耳机连接;
对应的,所述耳机的位姿变化识别方法,还包括:
所述终端根据所述比较结果和所述语音数据确定语音控制结果;其中,所述语音控制结果为控制执行或控制不执行。
9.根据权利要求8所述的耳机的位姿变化识别方法,其特征在于,所述终端根据所述比较结果和所述语音数据确定语音控制结果,包括:
所述终端根据所述语音数据,确定语音识别结果;其中,所述语音识别结果为语音识别成功或语音识别失败;
若所述语音识别结果为所述语音识别成功且所述比较结果为所述识别通过,则确定所述语音控制结果为所述控制执行,并执行所述语音数据对应的预设语音控制指令。
10.一种耳机的位姿变化识别装置,其特征在于,包括:
指令获取模块,用于获取位姿变化识别指令;其中,所述位姿变化识别指令为需要进行位姿变化识别的语音控制场景时生成的;
采集模块,用于根据位姿变化识别指令,控制耳机上的姿态传感器采集预设时间段内的传感器数据;
识别模块,用于根据所述传感器数据,确定所述传感器数据对应的位姿变化与预设位姿变化的比较结果,以使终端根据语音数据的语音识别结果和接收的比较结果,确定语音控制结果;其中,所述比较结果为识别通过或识别失败。
11.一种无线耳机,其特征在于,包括:喇叭、麦克风、姿态传感器、存储器和处理器;其中,所述存储器,用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如权利要求1至7任一项所述的耳机的位姿变化识别方法的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的耳机的位姿变化识别方法的步骤。
CN202010229643.9A 2020-03-27 2020-03-27 耳机的位姿变化识别方法、装置、无线耳机及存储介质 Active CN111399669B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010229643.9A CN111399669B (zh) 2020-03-27 2020-03-27 耳机的位姿变化识别方法、装置、无线耳机及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010229643.9A CN111399669B (zh) 2020-03-27 2020-03-27 耳机的位姿变化识别方法、装置、无线耳机及存储介质

Publications (2)

Publication Number Publication Date
CN111399669A CN111399669A (zh) 2020-07-10
CN111399669B true CN111399669B (zh) 2023-08-18

Family

ID=71434649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010229643.9A Active CN111399669B (zh) 2020-03-27 2020-03-27 耳机的位姿变化识别方法、装置、无线耳机及存储介质

Country Status (1)

Country Link
CN (1) CN111399669B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112580077B (zh) * 2020-12-21 2023-01-24 歌尔科技有限公司 一种信息处理方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108966087A (zh) * 2018-07-26 2018-12-07 歌尔科技有限公司 一种无线耳机的佩戴情况检测方法、装置及无线耳机
CN109243445A (zh) * 2018-09-30 2019-01-18 Oppo广东移动通信有限公司 语音控制方法、装置、电子设备以及存储介质
CN109387205A (zh) * 2018-11-30 2019-02-26 歌尔科技有限公司 获取姿态角变化幅度方法、设备及存储介质
CN110620970A (zh) * 2019-10-29 2019-12-27 歌尔科技有限公司 一种耳机触控方法、装置、无线耳机及tws耳机

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102184549B (zh) * 2011-04-29 2012-10-10 闫文闻 一种运动参数确定方法、装置和运动辅助设备
JP6533590B2 (ja) * 2015-10-14 2019-06-19 アルプスアルパイン株式会社 ウェアラブル装置とその姿勢測定方法及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108966087A (zh) * 2018-07-26 2018-12-07 歌尔科技有限公司 一种无线耳机的佩戴情况检测方法、装置及无线耳机
CN109243445A (zh) * 2018-09-30 2019-01-18 Oppo广东移动通信有限公司 语音控制方法、装置、电子设备以及存储介质
CN109387205A (zh) * 2018-11-30 2019-02-26 歌尔科技有限公司 获取姿态角变化幅度方法、设备及存储介质
CN110620970A (zh) * 2019-10-29 2019-12-27 歌尔科技有限公司 一种耳机触控方法、装置、无线耳机及tws耳机

Also Published As

Publication number Publication date
CN111399669A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
US10789343B2 (en) Identity authentication method and apparatus
KR102608470B1 (ko) 데이터 인식 장치 및 방법과 트레이닝 장치 및 방법
TWI687879B (zh) 伺服器、客戶端、用戶核身方法及系統
CN109326058B (zh) 基于智慧柜员机的身份核查方法、装置、终端及可读介质
US20170046508A1 (en) Biometric authentication using gesture
Alsaadi Study on most popular behavioral biometrics, advantages, disadvantages and recent applications: A review
CN104361276A (zh) 一种多模态生物特征身份认证方法及系统
EP3595242B1 (en) Method and device for identity authentication
CN111079791A (zh) 人脸识别方法、设备及计算机可读存储介质
CN109670444B (zh) 姿态检测模型的生成、姿态检测方法、装置、设备及介质
CN115457664A (zh) 一种活体人脸检测方法及装置
CN105429969A (zh) 一种用户身份验证方法与设备
WO2020124994A1 (zh) 活体检测方法、装置、电子设备及存储介质
WO2020124993A1 (zh) 活体检测方法、装置、电子设备及存储介质
CN111399669B (zh) 耳机的位姿变化识别方法、装置、无线耳机及存储介质
KR101884090B1 (ko) 서명 인증 장치 및 방법
WO2021218659A1 (zh) 人脸识别
CN108847941A (zh) 身份认证方法、装置、终端及存储介质
CN108710788A (zh) 一种安全认证方法、装置、终端及存储介质
CN107545163B (zh) 解锁控制方法及相关产品
CN106921500B (zh) 一种移动设备的身份认证方法及装置
CN113643707A (zh) 一种身份验证方法、装置和电子设备
CN111314299A (zh) 身份验证方法、装置及系统
KR102514036B1 (ko) 전자 장치 및 그 제어 방법
CN109614804B (zh) 一种双模态生物特征加密方法、设备及存储设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant