CN107193526A - 一种语音播放的方法及终端 - Google Patents

一种语音播放的方法及终端 Download PDF

Info

Publication number
CN107193526A
CN107193526A CN201710301526.7A CN201710301526A CN107193526A CN 107193526 A CN107193526 A CN 107193526A CN 201710301526 A CN201710301526 A CN 201710301526A CN 107193526 A CN107193526 A CN 107193526A
Authority
CN
China
Prior art keywords
screen touch
feature
ear line
shape graph
target signature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201710301526.7A
Other languages
English (en)
Inventor
张隆州
唐冰冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jinli Communication Equipment Co Ltd
Original Assignee
Shenzhen Jinli Communication Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jinli Communication Equipment Co Ltd filed Critical Shenzhen Jinli Communication Equipment Co Ltd
Priority to CN201710301526.7A priority Critical patent/CN107193526A/zh
Publication of CN107193526A publication Critical patent/CN107193526A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/041Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means
    • G06F3/044Digitisers, e.g. for touch screens or touch pads, characterised by the transducing means by capacitive means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering

Abstract

本发明实施例公开了一种语音播放的方法,包括:检测终端与物体的距离,并判断所述距离是否小于或者等于距离阈值;若所述距离小于或者等于所述距离阈值,则选择听筒播放模式;采集屏幕触摸按压形状图;识别所述屏幕触摸按压形状图中是否存在目标特征;若是,则播放所述语音。另外本发明实施例还公开了一种终端。实施本发明实施例,能够实现对语音进行有效地播放,从而让用户及时、准确地获取到语音内容,提高了用户体验度。

Description

一种语音播放的方法及终端
技术领域
本发明涉及终端技术领域,尤其涉及一种语音播放的方法及终端。
背景技术
目前,随着通信技术的发展,微信等即时通讯软件非常流行。即时通讯软件已经改变了大众的生活和工作的方式,很多人的日常生活已经离不开微信、QQ等即时通讯软件。而在即时通讯软件的功能中,语音消息的功能深受用户的喜爱。
但是语音消息的功能在体验方面还有不足之处,其中语音消息的播放是一个用户关注的热点。语音消息通常都是采用播放器模式进行播放的,如果涉及到个人隐私等原因,由于用户并不希望被外人所知,所以会切换到听筒模式去进行播放。但是在语音消息过短的时候,例如:2秒、3秒,部分用户将手机靠近准备听语音消息的时候,可能该语音消息已经播放完毕了,这时就需要用户重新点击播放,又存在操作不便的问题。
总之,现有技术方案不能对语音消息进行有效地播放,用户不能及时、准确地获取到语音内容,存在用户体验低的问题。
发明内容
本发明实施例公开了一种语音播放的方法及终端,能够实现对语音进行有效地播放,从而让用户及时、准确地获取到语音内容,提高了用户体验度。
本发明实施例第一方面公开了一种语音播放的方法,包括:检测终端与物体的距离,并判断所述距离是否小于或者等于距离阈值;若所述距离小于或者等于所述距离阈值,则选择听筒播放模式;采集屏幕触摸按压形状图;识别所述屏幕触摸按压形状图中是否存在目标特征;若是,则播放所述语音。
本发明实施例第二方面公开了一种终端,包括:
检测单元,用于检测终端与物体的距离,并判断所述距离是否小于或者等于距离阈值;选择单元,用于当所述检测单元确定所述距离小于或者等于所述距离阈值,选择听筒播放模式;采集单元,用于采集屏幕触摸按压形状图;识别单元,用于识别所述屏幕触摸按压形状图中是否存在目标特征;播放单元,用于当所述识别单元确定所述屏幕触摸按压形状图中存在所述目标特征,播放所述语音。
在本发明实施例中,首先检测终端与物体的距离,判断该距离是否小于或者距离阈值;若该距离小于或者等于所述距离阈值,则选择听筒播放模式;然后采集屏幕触摸按压形状图,识别屏幕触摸按压形状图中是否存在目标特征;若是,则播放语音。可以看出,本发明实施例结合距离检测和特征识别的方式,来触发终端在听筒播放模式下的实时语音播放,能够实现对语音进行有效地播放,从而让用户及时、准确地获取到语音内容,提高了用户体验度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种用户接听语音的技术场景的示意图;
图2是本发明实施例公开的一种语音播放的方法的流程示意图;
图3是本发明实施例公开的一种识别屏幕触摸按压形状图中耳纹特征的方法的流程示意;
图4是本发明实施例公开的另一种识别屏幕触摸按压形状图中耳纹特征的方法的流程示意;
图5是本发明实施例公开的一种图像预处理方法的流程示意图;
图6是本发明实施例公开的一种终端的结构示意图;
图7是本发明实施例公开的一种终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种语音播放的方法及终端,能够实现对语音消息进行有效地播放,从而让用户及时、准确地获取到消息内容,提高了用户体验度。以下分别进行详细说明。
请参阅图1,图1是本发明实施例公开的一种用户接听语音的技术场景的示意图。如图1所示,在该技术场景中,用户用手机贴着自己的耳朵接听语音,耳朵是会接触到手机屏幕,会在接触屏幕的位置上产生一个或大或小的触摸按压的形状,即耳纹,该耳纹具体如图1右边所示。当然,在实际应用场景中,根据用户的握持方式不同,手指、脸颊等也会在屏幕上留下不同形状的触摸按压形状。
请参阅图2,图2是本发明实施例公开的一种语音播放的方法的流程示意图。如图2所示,该语音播放的方法可以包括以下步骤:
S201、终端接收用户的请求,该请求用于指示终端播放语音。
上述步骤S201中终端可以是手机,平板电脑、掌上电脑、笔记本电脑、移动互联网设备以及可穿戴设备等(如智能手表、智能手环等),或者是其它能够建立通信连接,并能够实现数据存储的终端设备。
上述步骤S201中语音可以为终端通过即时通讯软件接收的语音消息。当然,在实际应用场景中,该语音也可以为电话录音、音频数据等其他形式的语音数据。可选的,该语音可以是终端实时接收到的,也可以是终端保存在本地的语音数据。
作为一种可选的实施方式,终端接收用户的请求,该请求用于指示终端播放语音,具体实现方式包括:用户通过点击终端的屏幕发出选择播放语音的请求,终端接收用户的请求,该请求用于指示终端播放该语音。举例来说:在微信中,用户在希望播放某个语音消息时,会在选定某个语音消息之后,做出点击终端屏幕的操作,这一操作就会触发向终端发出播放该语音的请求。
可选的,在用户选择播放语音的过程中,终端可以提示用户选择播放模式,该播放方式包括:播放器播放模式、听筒播放模式,其中本发明实施例中终端可以配置快捷的播放模式选择操作,例如:在微信中,微信语音的触摸条向右滑是选择播放器播放模式,向左滑是听筒播放模式。需要说明的是,终端选择播放模式之后,并不是立刻进行语音播放,系统为语音播放有预设的延迟时间,例如:2秒。但是操作各异的用户来说,有些用户动作快,很快地就做好听筒模式下收听语音消息的准备时,需要等待;有些用户动作较慢的,可能也还没做好收听语音消息的准备动作时,该语音就已经播放完了,这就降低了用户体验。
所以在本发明实施例中,终端接收用户的语音播放请求之后,通过采集终端的触摸按压形状图,并结合距离检测和耳纹识别的方式,来触发终端在听筒播放模式下的实时语音播放。
S202、检测终端与物体的距离,并判断该距离是否小于或者等于距离阈值。
上述步骤S202中物体可以是用户准备接听语音时,靠近终端的物体。
作为一种可选的实施方式,所述终端包括:距离传感器,所述终端检测听筒与物体的距离,具体实现方式包括:所述终端利用距离传感器检测听筒与物体的距离。
S203、若终端与物体的距离小于或者等于距离阈值,则选择听筒播放模式。
在本发明实施例中,根据终端与物体的距离确定语音的播放模式,若终端与物体的距离小于或者等于距离阈值,则选择听筒播放模式;若终端与物体的距离大于距离阈值,则选择播放器播放模式。
作为一种可选的实施方式,若终端与物体的距离小于或者等于距离阈值,则选择听筒播放模式之后,根据上述距离确定延迟播放语音的时间,如果在上述的延迟播放所述语音的时间内执行步骤S204至S205,最终识别到耳朵的特征,则触发播放;如果在上述的延迟播放所述语音的时间内执行步骤S204至S205,最终没有识别到耳朵的特征,则可以是按照延迟播放语音的时间来触发播放。通过实施本发明实施例,在用户不直接将终端接触到耳朵,或者露出耳朵来接听语音的情况下,可以避免用户无法准确接听语音内容的问题,提高用户的体验度。
S204、采集屏幕触摸按压形状图。
上述步骤S203中屏幕触摸按压形状图可以为用户做准备接听语音操作时,耳朵、脸颊、手指等等触摸按压终端屏幕留下的形状图,具体可以参考图1中右边图形所示。
作为一种可选的实施方式,上述终端的屏幕可以为电容屏,上述终端采集屏幕触摸按压形状图,包括:终端通过上述电容屏采集所述屏幕触摸按压形状图。
电容技术触摸面板CTP(Capacity Touch Panel)是利用人体的电流感应进行工作的。电容屏是一块四层复合玻璃屏,玻璃屏的内表面和夹层各涂一层纳米铟锡金属氧化物(Indium Tin Oxide,ITO),最外层是只有0.0015mm厚的矽土玻璃保护层,夹层ITO涂层为工作面,四个角引出四个电极,内层ITO为屏层以保证工作环境。
其中电容屏的工作原理是:当耳朵触摸电容屏时,由于人体电场,用户耳朵的部分区域和工作面形成一个耦合电容,因为工作面上连接有高频信号,于是耳朵吸收走一个很小的电流,这个电流分别从屏的四个角上的电极中流出,且理论上流经四个电极的电流与手指头到四角的距离成比例,控制器通过对四个电流比例的精密计算,得出位置,将这些触摸到的位置集合起来,从而得到了与屏幕的耳纹的图像。
S205、识别屏幕触摸按压形状图中是否存在目标特征。
作为一种可选的实施方式,上述目标特征包括耳纹特征;识别所述屏幕触摸按压形状图中是否存在目标特征,包括:
从屏幕触摸按压形状图中提取第一特征组,该第一特征组包括至少一个轮廓特征;将第一特征组的形状特征与预先采集的耳纹特征进行匹配;若匹配成功,则确认屏幕触摸按压形状图中存在目标特征。
可选的,其中将第一特征组的形状特征与预先采集的耳纹特征进行匹配,具体实现方式可以是:查询预先采集的耳纹特征中包含第一特征组的形状特征的数量;若所述数量大于数量阈值,则确定屏幕触摸按压形状图中包含目标特征。需要注意的是,在实际应用中,上述目标特征还可以包括其他特征。
在上述具体实现方式中,由于用户接听语音时,按压耳朵的程度不同,所以屏幕按压形状图不一定为按压完整的耳朵生成的按压图像,所以只需要能够匹配上预先采集的耳纹特征中部分的特征,即可判断屏幕触摸按压形状图中包含耳朵的特征。所以,可以将特征点的数量阈值可以配置为较低的数值,例如:1个、2个等,当然,在实际应用中,该数量阈值可以由算法人员根据实际情况进行配置,此处不做具体限定。
作为一种可选的实施方式,耳纹特征包括目标对象的耳纹特征;上述识别屏幕触摸按压形状图中是否存在耳纹特征,包括:
从屏幕触摸按压形状图中提取第一特征组,该第一特征组包括至少一个轮廓特征;将第一特征组的形状特征与预先采集的耳纹特征进行匹配;若匹配成功,则将第一特征组中的耳纹特征与预先配置的目标对象的耳朵特征进行匹配;若匹配成功,则确认屏幕触摸按压形状图中存在耳纹特征。
在该种实施方式中,先确定屏幕触摸按压形状图存在耳纹特征,然后确定该耳纹特征为目标对象的耳纹特征,可以进行身份验证,加强语音播放的安全性。
可选的,在本发明实施例中,预先采集的耳纹特征具体是通过以下步骤实现的:预先采集耳纹按压图像;对耳纹按压图像进行预处理,所述预处理包括平滑处理、二值化,锐化以及细化中的至少一种;提取耳纹按压图像中的耳纹特征作为预先采集的耳纹特征。
可选的,在本发明实施例中,从屏幕触摸按压形状图中提取第一特征组,具体实现方式可以包括:对屏幕触摸按压形状图进行预处理,该预处理包括平滑处理、二值化、锐化以及细化中的至少一种;从所述预处理之后的屏幕触摸按压形状图像提取第一特征组。
在上述具体实现方式中,该第一特征点组包括当次的耳纹按压图像中的特征点或者特征轮廓。需要说明的是,虽然在本发明实施例中,可能使用了术语“第一”、“第二”等等来描述各个特征点组,但是这些特征点组不应当受这些术语限制,使用这些术语仅仅是为了只是为了将一个特征组与另一个特征点组进行区分。第一特征组可以包括至少一个特征轮廓,“第一”和“第二”不做具体数量的限定。
S206、若屏幕触摸按压形状图中存在目标特征,则播放语音。
作为一种可选的实施方式,若屏幕触摸按压形状图中存在目标特征,则播放语音,其工作原理是:若听筒与物体的距离小于距离阈值,当该物体为耳朵时,则说明用户已经靠近听筒,但是由于有可能靠近终端的是手指、头发等其他部位,若只在听筒与物体的距离小于距离阈值情况下,终端立即通过听筒播放语音,则无法保护用户语音播放的私密性,也会给周边的其他人造成干扰,所以在听筒与物体的距离小于或者等于距离阈值的情况,同时需要识别屏幕触摸按压形状图中是否存在目标特征,当屏幕触摸按压形状图中存在目标特征,再触发播放语音。可以看出,本发明实施例能够准确判断出用户接听语音的意图,精准触发语音播放的时间点,从而让用户及时、准确地获取到消息内容,提高了语音播放的安全性,提高了用户体验度。
在图2所描述的方法中,接收用户指示终端播放语音的请求,检测终端与物体的距离,判断该距离是否小于或者等于距离阈值,若该距例小于等于距离阈值,则选择听筒播放模式然后终端采集屏幕触摸按压形状图,识别屏幕触摸按压形状图中是否存在目标特征;若是,则播放语音。可以看出,本发明实施例结合距离检测和耳纹识别的方式,来触发终端在听筒播放模式下的实时语音播放,能够实现对语音进行有效地、安全地播放,从而让用户及时、准确地获取到语音内容,提高了用户体验度。
请参阅图3,图3是本发明实施例公开的一种识别屏幕触摸按压形状图中目标特征的方法的流程示意。如图3所示的方法,可以应用于上述图2所示的步骤S205中,该识别屏幕触摸按压形状图的目标特征的方法可以包括以下步骤:
S301、从屏幕触摸按压形状图中提取第一特征组,该第一特征组包括至少一个轮廓特征。
上述步骤S301中第一特征组包括至少一个轮廓特征,需要说明的是,虽然在本发明实施例中,可能使用了术语“第一”、“第二”等等来描述各个特征点组,但是这些特征点组不应当受这些术语限制,使用这些术语仅仅是为了只是为了将一个特征组与另一个特征点组进行区分。另外,第一”和“第二”不做具体数量的限定。
S302、将第一特征组的形状特征与预先采集的耳纹特征进行匹配。
作为一种可选的实施方式,将第一特征组的形状特征与预先采集的耳纹特征进行匹配,具体实现方式可以包括:
查询预先采集的耳纹特征中包含第一特征组的形状特征的数量;若所述数量大于数量阈值,则确定屏幕触摸按压形状图中包含目标特征。
在上述具体实现方式中,由于用户接听语音时,按压耳朵的程度不同,所以屏幕按压形状图不一定为按压完整的耳朵生成的按压图像,所以只需要能够匹配上预先采集的耳纹特征中部分的特征,即可判断屏幕触摸按压形状图中包含耳朵的特征。所以,可以将特征点的数量阈值可以配置为较低的数值,例如:1个、2个等,当然,在实际应用中,该数量阈值可以由算法人员根据实际情况进行配置,此处不做具体限定。
举例来说,若设定特征点数量阈值为2个,而终端查询耳朵按压形状数据库中包含第一特征点组中特征点的数量为3个,则终端判断屏幕触摸按压形状图中包含耳朵的特征。
作为一种可选的实施方式,获取上述预先采集的耳纹特征,具体实现方式可以包括:预先采集耳纹按压图像;对耳纹按压图像进行预处理,所述预处理包括平滑处理、二值化,锐化以及细化中的至少一种;提取耳纹按压图像中的耳纹特征作为预先采集的耳纹特征。
S303、若匹配成功,则确认屏幕触摸按压形状图中存在目标特征。
在图3所描述的方法中,从屏幕触摸按压形状图中提取第一特征组,该第一特征组包括至少一个轮廓特征;然后将第一特征组的形状特征与预先采集的耳纹特征进行匹配;若匹配成功,则确认屏幕触摸按压形状图中存在目标特征。可以看出,本发明实施例能够准确、有效地识别屏幕触摸按压形状图中的目标特征,为语音播放的方法提供了耳纹识别的技术基础。
请参阅图4,图4是本发明实施例公开的另一种识别屏幕触摸按压形状图中目标特征的方法的流程示意。如图4所示的方法,可以应用于上述图2所示的步骤S205中,该方法可以包括以下步骤:
S401、从屏幕触摸按压形状图中提取第一特征组,该第一特征组包括至少一个轮廓特征。
上述步骤S401中第一特征组的定义和解释与图3中相同。
S402、将第一特征组的形状特征与预先采集的耳纹特征进行匹配。
可选的,上述将第一特征组的形状特征与预先采集的耳纹特征进行匹配,其具体实现方式与图3中相同。
S403、若匹配成功,则将第一特征组中的耳纹特征与预先配置的目标对象的耳朵特征进行匹配。
作为一种可选的实施方式,所述预先配置的目标对象的耳朵特征包含K个唯一标记特征,所述K为正整数;将第一特征组中的耳纹特征与预先配置的目标对象的耳朵特征进行匹配,具体实现方式可以包括:
将第一特征组中的耳纹特征与预先配置的目标对象的耳朵特征进行匹配,得到M个目标特征,所述M为大于1的整数;查询M个目标特征中包含唯一标记特征的数量K,判断K是否超过预设的唯一标记特征的数量阈值,K为小于等于M的正整数;若是,则确定匹配成功。
举例来说:预配置的用户的耳朵特征中包括3个唯一标记特征,若将第一特征组中的耳纹特征与预先配置的用户的耳朵特征进行匹配,得到4个相同的目标特征,该4个目标特征中包括3个唯一标记特征,若预设的唯一标记特征的数量阈值为2个,则确定匹配成功,即确定该耳朵特征为该用户的耳朵特征。
S404、若匹配成功,则确认屏幕触摸按压形状图中存在目标特征。
上述步骤S404中,该目标特征包括目标对象的耳纹特征,该目标对象具体可以是终端的特定用户。
在图4所述描述的方法中,先确定屏幕触摸按压形状图存在目标特征,然后确定该目标特征为目标对象的耳纹特征,可以进行身份验证,加强语音播放的安全性。
请参阅图5,图5是本发明实施例公开的一种图像预处理方法的流程示意图,可以用于图2、图3或图4的识别屏幕触摸按压形状图中目标特征步骤中,执行对于对耳纹按压图像进行预处理,或者对屏幕触摸按压形状图进行预处理。需要理解的是,在本发明实施例中,对耳纹按压图像进行预处理,或者对屏幕触摸按压形状图进行预处理,可以只执行图5的图像预处理方法中的任意一个或者多个的步骤,本发明实施例仅以图5中所描述的图像预处理方法的流程作为示例性说明,不做具体限定。如图5所示,该图像预处理方法可以包括以下步骤:
S501、对图像进行极值中值滤波处理,得到滤波图像。
可选的,上述图像可以是任意支持进行数字化处理的图像,在本发明实施例中,具体可以是图2、图3或图4中的耳纹按压图像或者屏幕触摸按压形状图。
上述步骤中极值中值滤波处理是为了对图像的细节进行保护,最大的保护图像的真实性。由于本发明实施例需要识别屏幕按压形状图中是否存在耳朵特征,需要再进行特征提取之前,需要对图像中的细节特征进行保护。
本发明实施例中,采用极值中值滤波的方式对对图像进行处理,具体操作是:设定矩阵[Xij]表示已数字化的图像,其中i,j表示点的位置,W[Xij]表示以点(i,j)为中心对图像中的点Xij做窗口操作,然后对窗口W[Xij]内的所有点取中值。
S502、对滤波图像平滑处理,得到噪点较低的平滑图像。
上述步骤S503中平滑处理是指对于图像的突出图像的宽大区域、低频成分、主干部分或抑制图像噪声和干扰高频成分进行处理,目的是使图像亮度平缓渐变,减小突变梯度,改善图像质量。图像平滑的方法包括:插值方法,线性平滑方法,卷积法等等。可选的,在本发明实施例中,采用对图像进行线性平滑方法操作,设定N个像素点的线性平均滑动窗口,N为大于1的正整数,对线性平均滑动窗口内的所有像素点按照线性平均滤波的方法进行处理,得到第三图像。经过平滑处理之后,该图像的噪点得到降低。
S503、对平滑图像进行锐化处理,得到边缘清晰的锐化图像。
上述步骤S503中锐化(image sharpening),用于补偿图像的轮廓,增强图像的边缘及灰度跳变的部分,使图像变得清晰,亦分空域处理和频域处理两类。这是因为图像平滑往往使图像中的边界、轮廓变得模糊,利用图像锐化技术,使图像的边缘变的清晰。
S504、对锐化图像进行二值化处理,得到黑白效果的二值化图像。
作为一种可选的实施方式,对上述锐化图像进行二值化处理,得到二值化图像,具体实现方式包括:预设一个像素阈值T,判断上述锐化图像的每个像素点的像素是否超过像素阈值T,若像素超过像素阈值T,则将该像素点的灰度值设置为255,若像素不超过像素阈值T,则将该像素点的灰度值设置为0,最终输出二值化图像只有黑和白的视觉效果。该种方法可以简化后期的处理,提高图像处理的速度。
S505、对二值化图像进行细化处理,得到包含图像骨架的细化图像。
可选的,对二值化图像进行细化处理,包括:对二值化图像的点进行层层去除,获得图像的形状,直到得到图像的骨架,该骨架可以为图像的中轴,最终将细化后包含图像骨架的图像确定为细化图像。
作为一种可选的实施方式,对二值化图像进行细化处理具体可采用BurningAlgorithm,即使用迭代的方法去处图像的边界,使用扫描线来获取边界,或者Zhang并行快速细化算法进行实现。
在图5所描述的方法中,通过对图像进行极值中值滤波、平滑处理、锐化、二值化、细化的预处理,最终获得干净、无噪声的图像,该图像包括图像的骨架,能够实现对图像进行预处理操作,以便于后续对图像进行特征提取。
请参阅图6,图6是本发明实施例公开的一种终端的结构示意图,可以用于执行本发明实施例公开的语音播放的方法。如图6所示,该终端600可以包括:
距离检测单元601,用于检测终端与物体的距离,并判断所述距离是否小于或者等于距离阈值;
选择单元602,用于当所述检测单元601确定所述距离小于或者等于所述距离阈值,选择听筒播放模式;
采集单元603,用于采集屏幕触摸按压形状图;
特征识别单元604,用于识别所述屏幕触摸按压形状图中是否存在目标特征;
播放单元605,用于当所述识别单元604确定所述屏幕触摸按压形状图中存在所述目标特征,播放所述语音。
可选的,上述终端中,所述目标特征包括耳纹特征;所述特征识别单元604具体用于:
从所述屏幕触摸按压形状图中提取第一特征组,所述第一特征组包括至少一个轮廓特征;
将所述第一特征组的形状特征与预先采集的耳纹特征进行匹配;
若匹配成功,则确认所述屏幕触摸按压形状图中存在目标特征。
可选的,上述终端中,所述目标特征包括耳纹特征;所述特征识别单元604具体用于:
从所述屏幕触摸按压形状图中提取第一特征组,所述第一特征组包括至少一个轮廓特征;
将所述第一特征组的形状特征与预先采集的耳纹特征进行匹配;
若匹配成功,则将所述第一特征组中的耳纹特征与预先配置的目标对象的耳朵特征进行匹配;
若匹配成功,则确认所述屏幕触摸按压形状图中存在目标特征。
可选的,上述终端还包括:
所述采集单元603,还用于预先采集耳纹按压图像;
所述识别单元604,还用于对所述耳纹按压图像进行预处理,所述预处理包括平滑处理、二值化,锐化以及细化中的至少一种,并提取所述耳纹按压图像中的耳纹特征作为预先采集的耳纹特征。
可选的,上述终端中所述特征识别单元604还具体用于:
对所述屏幕触摸按压形状图进行预处理,所述预处理包括平滑处理、二值化,锐化以及细化中的至少一种;
从所述预处理之后的屏幕触摸按压形状图像提取第一特征组。
具体地,本发明实施例中介绍的终端可以实施本发明结合图2、图3、图4或图5介绍的方法实施例中的部分或全部流程。
本发明所有实施例中的单元或子单元,可以通过通用集成电路,例如CPU,或通过ASIC(Application Specific Integrated Circuit,专用集成电路)来实现。
图7为本申请提供的一种终端的结构示意图,该终端700包括至少一个处理器701,至少一个存储器702以及至少一个通信接口703。所述处理器701、所述存储器702和所述通信接口703通过所述通信总线连接并完成相互间的通信。
处理器701可以是通用中央处理器(CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制以上方案程序执行的集成电路。
通信接口703,用于与其他设备或通信网络通信,如以太网,无线接入网(RAN),无线局域网(Wireless Local Area Networks,WLAN)等。
存储器702可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过总线与处理器相连接。存储器也可以和处理器集成在一起。
其中,所述存储器702用于存储执行以上方案的应用程序代码,所述处理器701用于调用所述存储器702中存储的应用程序代码执行如下操作:
检测终端与物体的距离,并判断所述距离是否小于或者等于距离阈值;若所述距离小于或者等于所述距离阈值,则选择听筒播放模式;采集屏幕触摸按压形状图;识别所述屏幕触摸按压形状图中是否存在目标特征;若是,则播放所述语音。
可选的,所述目标特征包括耳纹特征;所述识别所述屏幕触摸按压形状图中是否存在目标特征,包括如下操作:从所述屏幕触摸按压形状图中提取第一特征组,所述第一特征组包括至少一个轮廓特征;将所述第一特征组的形状特征与预先采集的耳纹特征进行匹配;若匹配成功,则确认所述屏幕触摸按压形状图中存在目标特征。
可选的,所述目标特征包括目标对象的耳纹特征;所述识别所述屏幕触摸按压形状图中是否存在目标特征,包括如下操作:从所述屏幕触摸按压形状图中提取第一特征组,所述第一特征组包括至少一个轮廓特征;将所述第一特征组的形状特征与预先采集的耳纹特征进行匹配;若匹配成功,则将所述第一特征组中的耳纹特征与预先配置的目标对象的耳朵特征进行匹配;若匹配成功,则确认所述屏幕触摸按压形状图中存在目标特征。
可选的,从所述屏幕触摸按压形状图中提取第一特征组具体包括如下操作:对所述屏幕触摸按压形状图进行预处理,所述预处理包括平滑处理、二值化,锐化以及细化中的至少一种;从所述预处理之后的屏幕触摸按压形状图像提取第一特征组。
可选的,所述处理器701还用于调用所述存储器702中存储的应用程序代码执行如下操作:
预先采集耳纹按压图像;对所述耳纹按压图像进行预处理,所述预处理包括平滑处理、二值化,锐化以及细化中的至少一种;提取所述耳纹按压图像中的耳纹特征作为预先采集的耳纹特征。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例用户终端中的单元可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,简称RAM)等。
以上对本发明实施例公开的一种语音播放的方法及终端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种语音播放的方法,其特征在于,包括:
检测终端与物体的距离,并判断所述距离是否小于或者等于距离阈值;
若所述距离小于或者等于所述距离阈值,则选择听筒播放模式;
采集屏幕触摸按压形状图;
识别所述屏幕触摸按压形状图中是否存在目标特征;
若是,则播放所述语音。
2.根据权利要求1所述的方法,其特征在于,所述目标特征包括耳纹特征;所述识别所述屏幕触摸按压形状图中是否存在目标特征,包括:
从所述屏幕触摸按压形状图中提取第一特征组,所述第一特征组包括至少一个轮廓特征;
将所述第一特征组的形状特征与预先采集的耳纹特征进行匹配;
若匹配成功,则确认所述屏幕触摸按压形状图中存在目标特征。
3.根据权利要求1所述的方法,其特征在于,所述目标特征包括目标对象的耳纹特征;所述识别所述屏幕触摸按压形状图中是否存在目标特征,包括:
从所述屏幕触摸按压形状图中提取第一特征组,所述第一特征组包括至少一个轮廓特征;
将所述第一特征组的形状特征与预先采集的耳纹特征进行匹配;
若匹配成功,则将所述第一特征组中的耳纹特征与预先配置的目标对象的耳朵特征进行匹配;
若匹配成功,则确认所述屏幕触摸按压形状图中存在目标特征。
4.根据权利要求2或3所述的方法,其特征在于,还包括:
预先采集耳纹按压图像;
对所述耳纹按压图像进行预处理,所述预处理包括平滑处理、二值化,锐化以及细化中的至少一种;
提取所述耳纹按压图像中的耳纹特征作为预先采集的耳纹特征。
5.根据权利要求2或3所述的方法,其特征在于,所述从所述屏幕触摸按压形状图中提取第一特征组,包括:
对所述屏幕触摸按压形状图进行预处理,所述预处理包括平滑处理、二值化,锐化以及细化中的至少一种;
从所述预处理之后的屏幕触摸按压形状图像提取第一特征组。
6.一种终端,其特征在于,包括:
距离检测单元,用于检测终端与物体的距离,并判断所述距离是否小于或者等于距离阈值;
选择单元,用于当所述检测单元确定所述距离小于或者等于所述距离阈值,选择听筒播放模式;
采集单元,用于采集屏幕触摸按压形状图;
特征识别单元,用于识别所述屏幕触摸按压形状图中是否存在目标特征;
播放单元,用于当所述识别单元确定所述屏幕触摸按压形状图中存在所述目标特征,播放所述语音。
7.根据权利要求6所述的终端,其特征在于,所述目标特征包括耳纹特征;所述特征识别单元具体用于:
从所述屏幕触摸按压形状图中提取第一特征组,所述第一特征组包括至少一个轮廓特征;
将所述第一特征组的形状特征与预先采集的耳纹特征进行匹配;
若匹配成功,则确认所述屏幕触摸按压形状图中存在目标特征。
8.根据权利要求6所述的终端,其特征在于,所述目标特征包括目标对象的耳纹特征;所述特征识别单元具体用于:
从所述屏幕触摸按压形状图中提取第一特征组,所述第一特征组包括至少一个轮廓特征;
将所述第一特征组的形状特征与预先采集的耳纹特征进行匹配;
若匹配成功,则将所述第一特征组中的耳纹特征与预先配置的目标对象的耳朵特征进行匹配;
若匹配成功,则确认所述屏幕触摸按压形状图中存在目标特征。
9.根据权利要求6或7所述的终端,其特征在于,所述终端还包括:
所述采集单元,还用于预先采集耳纹按压图像;
所述特征识别单元,还用于对所述耳纹按压图像进行预处理,所述预处理包括平滑处理、二值化,锐化以及细化中的至少一种,并提取所述耳纹按压图像中的耳纹特征作为预先采集的耳纹特征。
10.根据权利要求6或7所述的终端,其特征在于,所述特征识别单元具体用于:
对所述屏幕触摸按压形状图进行预处理,所述预处理包括平滑处理、二值化,锐化以及细化中的至少一种;
从所述预处理之后的屏幕触摸按压形状图像提取第一特征组。
CN201710301526.7A 2017-05-02 2017-05-02 一种语音播放的方法及终端 Withdrawn CN107193526A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710301526.7A CN107193526A (zh) 2017-05-02 2017-05-02 一种语音播放的方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710301526.7A CN107193526A (zh) 2017-05-02 2017-05-02 一种语音播放的方法及终端

Publications (1)

Publication Number Publication Date
CN107193526A true CN107193526A (zh) 2017-09-22

Family

ID=59873096

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710301526.7A Withdrawn CN107193526A (zh) 2017-05-02 2017-05-02 一种语音播放的方法及终端

Country Status (1)

Country Link
CN (1) CN107193526A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108391013A (zh) * 2018-03-19 2018-08-10 广东欧珀移动通信有限公司 语音数据的播放方法、终端和计算机可读存储介质
CN108762711A (zh) * 2018-05-17 2018-11-06 Oppo广东移动通信有限公司 屏幕发声的方法、装置、电子装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103985394A (zh) * 2014-04-18 2014-08-13 青岛尚慧信息技术有限公司 一种音频文件的播放方法
CN105139254A (zh) * 2015-08-11 2015-12-09 中山大学 一种基于耳纹识别银行远程身份认证的方法及系统
CN105791548A (zh) * 2016-02-25 2016-07-20 努比亚技术有限公司 语音信息播报装置和方法
CN106599101A (zh) * 2016-11-29 2017-04-26 上海斐讯数据通信技术有限公司 一种自动播放音视频文件的系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103985394A (zh) * 2014-04-18 2014-08-13 青岛尚慧信息技术有限公司 一种音频文件的播放方法
CN105139254A (zh) * 2015-08-11 2015-12-09 中山大学 一种基于耳纹识别银行远程身份认证的方法及系统
CN105791548A (zh) * 2016-02-25 2016-07-20 努比亚技术有限公司 语音信息播报装置和方法
CN106599101A (zh) * 2016-11-29 2017-04-26 上海斐讯数据通信技术有限公司 一种自动播放音视频文件的系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108391013A (zh) * 2018-03-19 2018-08-10 广东欧珀移动通信有限公司 语音数据的播放方法、终端和计算机可读存储介质
CN108762711A (zh) * 2018-05-17 2018-11-06 Oppo广东移动通信有限公司 屏幕发声的方法、装置、电子装置及存储介质

Similar Documents

Publication Publication Date Title
WO2017174010A1 (zh) 一种指纹解锁的方法及终端
CN110139033B (zh) 拍照控制方法及相关产品
JP5651776B2 (ja) ユーザタッチ操作モード適応方法および装置
CN110706179B (zh) 一种图像处理方法及电子设备
CN111464716B (zh) 一种证件扫描方法、装置、设备及存储介质
US20170185765A1 (en) Fingerprint authentication method and system, and terminal supporting fingerprint authentication
WO2019020014A1 (zh) 解锁控制方法及相关产品
CN107463818B (zh) 解锁控制方法及相关产品
JP7141335B2 (ja) 指紋画像を形成する方法及び指紋感知システム
CN110263667B (zh) 图像数据处理方法、装置以及电子设备
CN107451454B (zh) 解锁控制方法及相关产品
CN107480488B (zh) 解锁控制方法及相关产品
CN107506708B (zh) 解锁控制方法及相关产品
CN110245607B (zh) 眼球追踪方法及相关产品
CN107169427B (zh) 一种适用于心理学的面部识别方法及装置
CN106203326A (zh) 一种图像处理方法、装置及移动终端
CN104902143A (zh) 一种基于分辨率的图像去噪方法及装置
CN110427108A (zh) 基于眼球追踪的拍照方法及相关产品
CN107193526A (zh) 一种语音播放的方法及终端
US20170091522A1 (en) Electronic device generating finger images at a progressively slower capture rate and related methods
JP2019503545A (ja) ユーザの生体測定を分析するための方法および指紋感知システム
CN107277224A (zh) 一种语音播放的方法及终端
CN104219371A (zh) 使用唇语识别技术进行电话拨号的方法和装置
WO2018121552A1 (zh) 基于掌纹数据的业务处理方法、装置、程序及介质
CN105335853A (zh) 一种基于掌纹识别的移动终端支付方法、系统及移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20170922