CN102542280B - 针对同一内容的不同唇语口型的识别方法及系统 - Google Patents

针对同一内容的不同唇语口型的识别方法及系统 Download PDF

Info

Publication number
CN102542280B
CN102542280B CN201010605749.0A CN201010605749A CN102542280B CN 102542280 B CN102542280 B CN 102542280B CN 201010605749 A CN201010605749 A CN 201010605749A CN 102542280 B CN102542280 B CN 102542280B
Authority
CN
China
Prior art keywords
lip reading
mouth
speaks
shape
content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201010605749.0A
Other languages
English (en)
Other versions
CN102542280A (zh
Inventor
马宇尘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Liangming Technology Development Co Ltd
Original Assignee
Shanghai Liangming Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Liangming Technology Development Co Ltd filed Critical Shanghai Liangming Technology Development Co Ltd
Priority to CN201010605749.0A priority Critical patent/CN102542280B/zh
Publication of CN102542280A publication Critical patent/CN102542280A/zh
Application granted granted Critical
Publication of CN102542280B publication Critical patent/CN102542280B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种针对同一内容的不同唇语口型的识别方法和系统,属于计算机软件技术领域。该方法包括:采集用户输入的用以建立唇语目标信息的唇语内容;将采集的唇语内容,和该内容所对应的具有梯度关系的参照唇语口型列表相比对;判断采集的唇语内容,和前述的参照唇语口型列表中所对应的内容是否符合;根据判定结果向用户输出结果信息。本发明的优点在于,对于用户输出的针对于同一内容的大小不同的唇语口型,能够进行有效的识别。

Description

针对同一内容的不同唇语口型的识别方法及系统
技术领域
本发明属于计算机、软件技术领域。
背景技术
计算机发展至今,经历了键盘操作方式、鼠标操作方式、进入了自然人机交互阶段。在这种背景下,通过唇语进行人机交互,将是一种非常快捷有效的途径。
对于同一唇语内容,说话人往往会发出不同大小口型的唇语,如何将这些不同大小口型的唇语所对应的内容,进行有效识别,对于唇语的应用具有十分重要的意义。
发明内容
本发明的目的是提供一种针对同一内容的不同唇语口型的识别方法和系统,利用本发明,当用户对于同一内容,所采用的唇语口型不同时,系统都能够识别出该内容。
一种针对同一内容的不同唇语口型的识别方法,该方法包括以下步骤:
步骤1,采集用户输入的用以建立唇语目标信息的唇语内容;
步骤2,将采集的唇语内容,和该内容所对应的具有梯度关系的参照唇语口型列表相比对;
步骤3,判断采集的唇语内容,和前述的参照唇语口型列表中所对应的内容是否符合;
步骤4,根据判定结果向用户输出结果信息。
优选的,步骤1中用户唇语内容的采集方式,可以通过图像拍摄或录制进行采集。
对于唇语信息采集开始的触发方式有:
方式1,通过用户直接打开唇语采集功能的相应选项;
方式2,通过唇语信息所对应的相应功能启动时,即触发唇语信息的采集;
方式3,通过用户触发相应的功能按钮或者快捷键,触发唇语信息的采集。
对于唇语信息采集结束的触发方式有:
方式1,采集用户完成唇语输入的输入信号,并通过该输入信号,来作为结束本次的唇语数据采集操作的触发信息。
方式2,该次唇语内容采集完成的信号,即作为结束该次唇语采集的触发信息。
步骤2中所述的具有梯度关系的参照唇语口型列表,是指相对于同一唇语内容,表达出该唇语内容的唇语口型会大小不同,那么在系统中保存这些从小到大的唇语口型,作为判断采集的唇语内容的参照对象,即为所述的具有梯度关系的参照唇语口型列表。
因此,在所述步骤2之前,还包括具有梯度关系的参照唇语口型列表的建立,可以通过以下方式进行建立:
方式1,采用系统默认的参照唇语口型列表;
方式2,由用户重新建立参照唇语口型列表。
对于方式2的具体步骤为:
2-1,打开参照唇语口型列表建立窗口;
2-2,选择唇语口型重新建立功能;
2-3,对应于每条唇语信息,用户采集自己的一系列唇语口型,唇语口型为从小到大的梯度关系;
2-4,将采集的具有梯度关系的唇语口型进行保存,建立参照唇语口型列表。
所述的步骤2具体包括:
将采集的唇语内容,和该内容所对应的具有梯度关系的参照唇语口型列表,逐个进行比对,算出各差异度。
对于所述差异度的算法,具体包括以下步骤:
(1),将参照唇语口型列表中具有梯度关系的从小到大的口型,每种口型大小通过具体数值进行表示。例如最小口型为数值1,最大口型为数值10,中间口型为1到10之间的数字;
(2),根据参照唇语口型所对应的具体数值,判断采集的唇语口型大小,给出其所对应的数值;
(3),计算采集的唇语口型对应的数值,与参照唇语口型对应的数值之间的差值,即为差异度。
所述的步骤3具体包括:
(1)将前述步骤中计算出的各差异度进行比较,获得最小差异度的数值;
(2)将最小差异度与设置的阈值进行比较,所属的阈值可以是系统默认的阈值,也可以由用户自己进行设置。
如果最小差异度在阈值范围内,则采集的唇语内容,和参照唇语口型列表中所对应的内容相符合;
如果最小差异度超过阈值范围,则采集的唇语内容,和参照唇语口型列表中所对应的内容不符合。
所述的步骤4,具体包括:
如果采集的唇语内容,和参照唇语口型列表中所对应的内容相符合,则直接输出该唇语内容所对应的信息;
如果采集的唇语内容,和参照唇语口型列表中所对应的内容不符合,则向用户输出提示信息。
在所述的步骤4之后还包括:
对于采集的唇语内容,和参照唇语口型列表中所对应的内容不符合的情形,用户可以将本次采集的口型信息,保存到参照唇语口型列表中。这样当下次采集同样口型的信息时,即可识别出该唇语口型,并输出所对应的信息内容。
一种针对同一内容的不同唇语口型的识别系统,其特征在于,该系统包括:
唇语信息采集模块,用以采集用户输入的用以建立唇语目标信息的唇语内容;
唇语信息分析模块,用以将采集的唇语内容,和该内容所对应的具有梯度关系的参照唇语口型列表相比对;
唇语信息判定模块,用以判断采集的唇语内容,和前述的参照唇语口型列表中所对应的内容是否符合;
唇语信息输出模块,用以根据判定结果向用户输出结果信息。
上述所述的一种针对同一内容的不同唇语口型的识别系统,其特征在于,该系统还包括:
唇语信息数据库,用以存储采集的唇语信息,以及参照唇语口型列表中的信息。
附图说明
图1-1展示的是具体实施例中描述的采集唇语口型的示意图。
图1-2展示的是具体实施例中描述的与采集的唇语口型对应的参照唇语口型列表的示意图。
图2是本发明所描述方法的流程图。
图3是本发明所描述系统的结构示意图。
具体实施例
针对于本发明主要功能的描述:
用户在通过唇语进行人机交互时,对于同一唇语内容,不同的用户其口型大小是不同的,即使同一用户,在不同时间说的同一唇语,其口型大小也是不同的。本发明所提供的方法及系统,就是能够实现,将同一唇语内容所对应的大小不同的唇语口型进行有效的识别。
首先对本发明的一个具体实施例进行描述。
参图1-1和图1-2所示,分别展示的是采集的唇语口型,及其所对应的参照唇语口型列表的示意图。
如图1-1所示,用户010输出的唇语内容为数字7,其输出的唇语口型020,即为数字7的唇语口型,系统中的唇语采集模块首先采集唇语口型020。
如图1-2所示,为参照唇语口型列表数据库中存储的,唇语内容为数字7所对应的口型大小不同的唇语口型,分别有:小口型021、中口型022、大口型023。
根据口型大小,系统可以将小口型021设置为具体数值1,中口型022设置为具体数值5、大口型023设置为具体数值10。对已采集的口型020,经判断发现其口形大小介于小口型021和中口型022之间,那么可以设置其口型大小的数值为3。通过计算,可以得到采集的口型,和参照唇语口型的差异度分别为:7、2、2,因此最小差异度为2。
如果系统设置的阈值范围为小于等于3,则差异度在阈值范围内,即可以直接输出唇语口型对应的内容为数字7;
如果系统设置的阈值范围为小于等于1,则差异度超过阈值范围,因此会向用户输出无效唇语口型的提示信息。
结合前面的描述,参照着图2所示,对本发明所实现的方法做进一步的描述:
步骤1,采集用户输入的用以建立唇语目标信息的唇语内容;
对于步骤1中所述的唇语信息的采集方式,可以通过图像的拍摄或录制进行采集。结合图1-1所示,在该步骤中,及对用户发出的数字7的唇语口型020进行采集。
对于唇语信息采集开始的触发方式有:
方式1,通过用户直接打开唇语采集功能的相应选项;
方式2,通过唇语信息所对应的相应功能启动时,即触发唇语信息的采集;
方式3,通过用户触发相应的功能按钮或者快捷键,触发唇语信息的采集。如快捷键为键盘的Q键,那么通过触发Q按键,即开始采集唇语信息。
对于唇语信息采集结束的触发方式有:
方式1,采集用户完成唇语输入的对应信号,并通过该完成唇语的信号,来作为结束本次的唇语数据采集操作的触发信息。
如,当唇语输入完成之后,用户所设定的完成唇语的信号,是输入按键“Alt”。于是,在用户输入了该按键之后,就可以代表着本次的唇语输入结束。当然,前述的对应信号,还可以是其它的各种能够输入的信息形式。
方式2,该次唇语内容采集完成的信号,即作为结束该次唇语采集的触发信息。例如,系统采集到用户输出地唇语口型020,唇语采集即结束。
步骤2,将采集的唇语内容,和该内容所对应的具有梯度关系的参照唇语口型列表相比对;
如图1-2所示,参照唇语口型列表中,具有梯度关系的口型分别为:小口型021、中口型022、大口型023。当然,并不局限于这三种口型,也可有介于小口型和中口型之间的口型大小。
所述的参照唇语口型列表中的口型内容,可以采用系统默认的唇语口型列表;也可以采用由用户自己重新建立的参照唇语口型列表。
对于用户重新建立的参照唇语口型列表,其实现过程为:
首先,用户需要进入参照唇语口型列表的建立窗口;
然后,用户输入自己针对于同一内容的大小不同的口型,并进行保存;例如,如图1-2所示,用户输入小口型021、中口型022、大口型023。
最后,用户可以对自己输入的口型大小设置成相对应的具体数值。例如,如图1-2所示,用户将小口型021设置为具体数值1,中口型022设置为具体数值5、大口型023设置为具体数值10。
用户采集到唇语口型020后,将其与小口型021、中口型022、大口型023分别进行比较,发现其口型大小在021和022之间,那么系统即将口型020所对应的数值设为1和5之间,如设为3。通过计算数值差异,得到020与参照唇语口型的各差异度。
步骤3,判断采集的唇语内容,和前述的参照唇语口型列表中所对应的内容是否符合;
通过设置阈值,判断前一步骤所述的差异度是否在阈值范围内,来判断采集的唇语内容和所对应的参照唇语口型列表是否符合。
步骤4,根据判定结果向用户输出结果信息。
如果差异度在阈值范围内,则直接输出唇语口型对应的内容;
如果差异度超过阈值范围,则向用户输出无效唇语口型的提示信息。
对于输出无效唇语口型的情形,用户可以保存此次采集的唇语口型,并将设置在参照唇语口型列表中。例如,如图1-1和图1-2所示,如果采集的唇语口型020为无效唇语口型,那么用户可以将唇语口型020保存到参照唇语口型列表中,它的口型大小在021和022之间。这样在下次采集到和020相似的口型时,即会被识别为有效的口型。
前面所描述的方法,结合着图3所示,还对应着配套的系统300,对该系统的结构包括:
唇语信息采集模块310,用以采集用户输入的用以建立唇语目标信息的唇语内容;
唇语信息分析模块320,用以将采集的唇语内容,和该内容所对应的具有梯度关系的参照唇语口型列表相比对;
唇语信息判定模块330,用以判断采集的唇语内容,和前述的参照唇语口型列表中所对应的内容是否符合;
唇语信息输出模块340,用以根据判定结果向用户输出结果信息。
唇语信息数据库350,用以存储采集的唇语信息,以及参照唇语口型列表中的信息。
以上是对本发明的描述而非限定,基于本发明思想的其它实施方式,均在本发明的保护范围之中。

Claims (12)

1.一种针对同一内容的不同唇语口型的识别方法,其特征在于,该方法包括:
步骤1,采集用户输入的用以建立唇语目标信息的唇语内容的唇语口型;
步骤2,将采集的唇语内容,和该内容所对应的具有梯度关系的参照唇语口型列表相比对;
步骤3,判断采集的唇语内容,和前述的参照唇语口型列表中所对应的内容是否符合;
步骤4,根据判定结果向用户输出结果信息。
2.根据权利要求1所述的针对同一内容的不同唇语口型的识别方法,其特征在于,所述步骤1 的采集功能,通过如下之一的方式进行触发:
方式1,通过用户直接打开唇语采集功能的相应选项;
方式2,通过唇语信息所对应的相应功能启动时,即触发唇语信息的采集;
方式3,通过用户触发相应的功能按钮或者快捷键,触发唇语信息的采集。
3.根据权利要求1所述的针对同一内容的不同唇语口型的识别方法,其特征在于,所述步骤1 中采集用户唇语信息时,判断采集结束的触发方式,为如下形式之一:
方式1,采集用户完成唇语输入的输入信号,并通过该输入信号,来作为结束本次的唇语数据采集操作的触发信息;
方式2,该次唇语内容采集完成的信号,即作为结束该次唇语采集的触发信息。
4.根据权利要求1所述的针对同一内容的不同唇语口型的识别方法,其特征在于,具有梯度关系的参照唇语口型列表的建立,为如下形式之一:
方式1,采用系统默认的参照唇语口型列表;
方式2,由用户重新建立参照唇语口型列表。
5.根据权利要求4所述的针对同一内容的不同唇语口型的识别方法,其特征在于,用户重新建立参照唇语口型列表的具体步骤是:
2-1,打开参照唇语口型列表建立窗口;
2-2,选择唇语口型重新建立功能;
2-3,对应于每条唇语信息,用户采集自己的一系列唇语口型,唇语口型为从小到大的梯度关系;
2-4,将采集的具有梯度关系的唇语口型进行保存,建立参照唇语口型列表。
6.根据权利要求1或4 所述的针对同一内容的不同唇语口型的识别方法,其特征在于,参照唇语口型列表中具有梯度关系的口型大小可以通过具体数值进行表示。
7.根据权利要求1 所述的针对同一内容的不同唇语口型的识别方法,其特征在于:通过获得采集的唇语内容和参照唇语口型的差异度进行比对。
8.根据权利要求7 所述的针对同一内容的不同唇语口型的识别方法,其特征在于:采集的唇语内容和参照唇语口型,通过不同口型大小对应的数值,来计算差异度。
9.根据权利要求1 所述的针对同一内容的不同唇语口型的识别方法,其特征在于,所述的步骤3,其判定的具体方法是,通过将采集的唇语内容和参照唇语口型的差异度,与设定的阈值范围进行比较来判断:
如果最小差异度在阈值范围内,则采集的唇语内容,和参照唇语口型列表中所对应的内容相符合;
如果最小差异度超过阈值范围,则采集的唇语内容,和参照唇语口型列表中所对应的内容不符合。
10.根据权利要求1 所述的针对同一内容的不同唇语口型的识别方法,其特征在于,所述步骤4 的具体输出方法为:
如果采集的唇语内容,和参照唇语口型列表中所对应的内容相符合,则直接输出该唇语内容所对应的信息;
如果采集的唇语内容,和参照唇语口型列表中所对应的内容不符合,则向用户输出提示信息。
11.根据权利要求1 所述的针对同一内容的不同唇语口型的识别方法,其特征在于,在所述的步骤4 之后还包括:
对于采集的唇语内容,和参照唇语口型列表中所对应的内容不符合的情形,用户可以将本次采集的口型信息,保存到参照唇语口型列表中。
12.一种实施权利要求1所述方法的针对同一内容的不同唇语口型的识别系统,其特征在于,该系统包括:
唇语信息采集模块,用以采集用户输入的用以建立唇语目标信息的唇语内容;
唇语信息分析模块,用以将采集的唇语内容,和该内容所对应的具有梯度关系的参照唇语口型列表相比对;
唇语信息判定模块,用以判断采集的唇语内容,和前述的参照唇语口型列表中所对应的内容是否符合;
唇语信息输出模块,用以根据判定结果向用户输出结果信息;
唇语信息数据库,用以存储采集的唇语信息,以及参照唇语口型列表中的信息。
CN201010605749.0A 2010-12-26 2010-12-26 针对同一内容的不同唇语口型的识别方法及系统 Active CN102542280B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010605749.0A CN102542280B (zh) 2010-12-26 2010-12-26 针对同一内容的不同唇语口型的识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010605749.0A CN102542280B (zh) 2010-12-26 2010-12-26 针对同一内容的不同唇语口型的识别方法及系统

Publications (2)

Publication Number Publication Date
CN102542280A CN102542280A (zh) 2012-07-04
CN102542280B true CN102542280B (zh) 2016-09-28

Family

ID=46349132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010605749.0A Active CN102542280B (zh) 2010-12-26 2010-12-26 针对同一内容的不同唇语口型的识别方法及系统

Country Status (1)

Country Link
CN (1) CN102542280B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106203235B (zh) * 2015-04-30 2020-06-30 腾讯科技(深圳)有限公司 活体鉴别方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1556496A (zh) * 2003-12-31 2004-12-22 天津大学 唇形识别发声器
CN101046959A (zh) * 2007-04-26 2007-10-03 上海交通大学 基于唇语特征的身份认证方法
CN101101752A (zh) * 2007-07-19 2008-01-09 华中科技大学 基于视觉特征的单音节语言唇读识别系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1556496A (zh) * 2003-12-31 2004-12-22 天津大学 唇形识别发声器
CN101046959A (zh) * 2007-04-26 2007-10-03 上海交通大学 基于唇语特征的身份认证方法
CN101101752A (zh) * 2007-07-19 2008-01-09 华中科技大学 基于视觉特征的单音节语言唇读识别系统

Also Published As

Publication number Publication date
CN102542280A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN101853133B (zh) 一种自动识别手势的方法及移动终端
CN103093316B (zh) 一种账单生成方法及装置
CN103136471B (zh) 一种恶意Android应用程序检测方法和系统
CN106778457A (zh) 可提高指纹识别率的指纹识别方法及系统
CN103903213B (zh) 一种拍摄方法和电子设备
CN104850433A (zh) 一种移动终端应用启动方法及移动终端
CN105989836A (zh) 一种语音采集方法、装置及终端设备
CN106228068A (zh) 基于混合特征的Android恶意代码检测方法
CN106596394A (zh) 一种检测头发的方法、终端及梳子
CN106651338A (zh) 一种支付处理的方法及终端
WO2021104097A1 (zh) 表情包生成方法、装置及终端设备
CN105205380A (zh) 一种移动终端的解锁方法及装置
CN105045391A (zh) 智能手表手势输入方法及智能手表
CN105472178A (zh) 脑电波控制语音通话的方法及其系统
CN107731226A (zh) 基于语音识别的控制方法、装置及电子设备
CN107958154A (zh) 一种恶意软件检测装置及方法
CN107622773A (zh) 一种音频特征提取方法与装置、电子设备
CN108053822A (zh) 一种语音信号处理方法、装置、终端设备及介质
CN105825870A (zh) 一种语音指令数据获取方法及装置
CN110147535A (zh) 相似文本生成方法、装置、设备及存储介质
CN106814908A (zh) 一种触摸屏的指令获取方法及装置
CN102542280B (zh) 针对同一内容的不同唇语口型的识别方法及系统
CN207096984U (zh) 一种化学发光免疫分析仪检验数据查询装置
CN106155707A (zh) 信息处理方法及电子设备
CN107463689A (zh) 运动特征数据库的生成方法、运动状态识别方法及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant