CN104461057A - 基于唇形图像识别的文字输入方法 - Google Patents

基于唇形图像识别的文字输入方法 Download PDF

Info

Publication number
CN104461057A
CN104461057A CN201410829519.0A CN201410829519A CN104461057A CN 104461057 A CN104461057 A CN 104461057A CN 201410829519 A CN201410829519 A CN 201410829519A CN 104461057 A CN104461057 A CN 104461057A
Authority
CN
China
Prior art keywords
lip
lip shape
character input
word
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410829519.0A
Other languages
English (en)
Inventor
陈拥权
李建中
郑荣稳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ANHUI COSWIT INFORMATION TECHNOLOGY Co Ltd
Original Assignee
ANHUI COSWIT INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ANHUI COSWIT INFORMATION TECHNOLOGY Co Ltd filed Critical ANHUI COSWIT INFORMATION TECHNOLOGY Co Ltd
Priority to CN201410829519.0A priority Critical patent/CN104461057A/zh
Publication of CN104461057A publication Critical patent/CN104461057A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships

Abstract

本发明提供一种基于唇形图像识别的文字输入方法。其基本原理是,由计算机对摄像机拍摄的目标人员唇部图像进行自动分析,提取唇形的特征值,再将提取的特征值与唇形模型库中的唇形模型进行匹配,然后由计算机根据匹配的唇形模型对应的文字、语义数据库完成文字的输入。该技术方案为生产车间现场口头生产指令的传递,提供了一种有效的解决方案。

Description

基于唇形图像识别的文字输入方法
技术领域
本发明涉及人机交互技术领域,具体涉及一种基于唇形图像识别的文字输入方法。
背景技术
在很多生产车间,生产环境中存在较大噪音,这严重的阻碍了现场口头生产指令的下达。在刑侦工作中,一些场合也需要根据视频录像来推测嫌疑人的说话内容,这就需要根据唇形来推测获得相应的文字内容。
为实现上述目的,本发明提供一种基于唇形图像识别的文字输入方法,用于提升生产现场口头生产指令的下达效率、提高刑侦效率。
发明内容
针对上述问题,本发明通过采集唇部视频图像并利用视频处理技术对唇形特征值进行自动测量并与唇形模型进行匹配的方式,提供一种基于唇形图像识别的文字输入方法,从而提升生产现场口头生产指令的下达效率。
本发明提供的具体技术方案是:
一种基于唇形图像识别的文字输入方法,其特征在于,该方法包括以下步骤:
视频图像采集,通过摄像头采集目标人员的唇部视频图像;
视频分析,由计算机根据图像分析技术对所述唇部视频图像进行分析,获得唇形的特征值;
唇形模型匹配,将所述唇形的特征值与唇形模型库中的唇形模型进行匹配,得到唇形模型对应的文字;
语义数据库修正,利用通用语义数据库对由所述唇形模型对应的文字组成的语句进行修正;
文字输入,完成修正后语句文字的输入。
所述唇形模型库中的每个唇形模型,分别对应与之相应的文字。
有益效果:本发明提供的一种基于唇形图像识别的文字输入方法,由计算机对唇部图像进行自动分析、提取唇形的特征值、将唇形特征值与唇形模型进行匹配,并利用语义数据库进行修正、完成文字的输入。该技术方案为生产车间现场口头生产指令的传递,提供了一种有效的解决方案。
附图说明
图1所示是本发明工作流程图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1所示,用摄像机获取目标人员的唇部视频图像,然后由计算机唇部图像进行自动分析,提取唇形的特征值;再由计算机将提取的唇形特征值与唇形模型库中的唇形模型进行匹配。在唇形模型库中,每个唇形分别对应有相应的文字。找到相匹配的唇形模型后,由计算机根据匹配的唇形模型对应的文字完成文字的初步输入。因为同音字的存在,初步输入的文字组成的语句,并不能直接作为最终结果,而是由计算机利用通用语义数据库对初步输入的语句进行修正,完成修正后作为最终结果输出。
作为对本实施例的进一步优化,电脑输入的文字,在车间电子显示屏上进行显示,以方便现场人员及时获得相关生产指令。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种基于唇形图像识别的文字输入方法,其特征在于,该方法包括以下步骤:
视频图像采集,通过摄像头采集目标人员的唇部视频图像;
视频分析,由计算机根据图像分析技术对所述唇部视频图像进行分析,获得唇形的特征值;
唇形模型匹配,将所述唇形的特征值与唇形模型库中的唇形模型进行匹配,得到唇形模型对应的文字;
语义数据库修正,利用通用语义数据库对由所述唇形模型对应的文字组成的语句进行修正;
文字输入,完成修正后语句文字的输入。
2.如权利要求1所述的方法,其特征在于,所述唇形模型库中的每个唇形模型,分别对应与之相应的文字。
CN201410829519.0A 2014-12-26 2014-12-26 基于唇形图像识别的文字输入方法 Pending CN104461057A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410829519.0A CN104461057A (zh) 2014-12-26 2014-12-26 基于唇形图像识别的文字输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410829519.0A CN104461057A (zh) 2014-12-26 2014-12-26 基于唇形图像识别的文字输入方法

Publications (1)

Publication Number Publication Date
CN104461057A true CN104461057A (zh) 2015-03-25

Family

ID=52907246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410829519.0A Pending CN104461057A (zh) 2014-12-26 2014-12-26 基于唇形图像识别的文字输入方法

Country Status (1)

Country Link
CN (1) CN104461057A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106940798A (zh) * 2017-03-08 2017-07-11 深圳市金立通信设备有限公司 一种文字识别的修正方法以及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100211918A1 (en) * 2009-02-17 2010-08-19 Microsoft Corporation Web Cam Based User Interaction
CN102117115A (zh) * 2009-12-31 2011-07-06 上海量科电子科技有限公司 一种利用唇语进行文字输入选择的系统及实现方法
CN103092329A (zh) * 2011-10-31 2013-05-08 南开大学 一种基于唇读技术的唇语输入方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100211918A1 (en) * 2009-02-17 2010-08-19 Microsoft Corporation Web Cam Based User Interaction
CN102117115A (zh) * 2009-12-31 2011-07-06 上海量科电子科技有限公司 一种利用唇语进行文字输入选择的系统及实现方法
CN103092329A (zh) * 2011-10-31 2013-05-08 南开大学 一种基于唇读技术的唇语输入方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖庆阳等: "基于语义约束的口型序列识别方法", 《计算机应用与软件》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106940798A (zh) * 2017-03-08 2017-07-11 深圳市金立通信设备有限公司 一种文字识别的修正方法以及终端

Similar Documents

Publication Publication Date Title
CN103065356B (zh) 一种海洋石油设施三维模型的建立方法
CN101881999B (zh) 甲骨文视频输入系统及实现方法
EP2560111A3 (en) Systems and methods for facilitating the gathering of open source intelligence
CN102902771A (zh) 一种图片搜索方法、装置及服务器
CN105677716A (zh) 一种计算机数据采集处理分析系统
PL405872A1 (pl) Sposób, program i system konwersji modeli danych systemu zasilania
US20180173681A1 (en) System and method for generating content pertaining to real property assets
CN110766805A (zh) 火力发电厂交互式三维及vr仿真交底系统
WO2017156864A1 (zh) 图像识别方法、装置、设备及非易失性计算机存储介质
CN104484041A (zh) 一种基于深度学习的唇形图像识别文字输入方法
CN110210025A (zh) 一种基于文本提取的转换方法
CN104461057A (zh) 基于唇形图像识别的文字输入方法
Gao et al. Research on Image Classification and Retrieval Using Deep Learning with Attention Mechanism on Diaspora Chinese Architectural Heritage in Jiangmen, China
CN101770574A (zh) 一种人眼定位与脸型识别方法
CN104111942B (zh) 维吾尔医药古籍资源网络检索平台
CN104484042A (zh) 一种基于机器学习的唇形图像识别文字输入方法
CN208477524U (zh) 一种图形化的案件梳理系统
CN104036151B (zh) 人脸属性值计算方法和系统
CN104461011A (zh) 一种基于唇形图像识别的文字输入方法
CN109145098B (zh) 基于知识图谱的中华文化元素信息搜索方法
Cho et al. A study on the possibility of 2D design drawing implementation by revit architecture
CN104484657A (zh) 一种基于云端唇形模型库的唇形图像识别文字输入方法
CN104537347A (zh) 一种基于云端分析和模型匹配的唇形识别文字输入方法
CN106528644A (zh) 一种遥感数据的检索方法及装置
Xia et al. Local spatial binary pattern: A new feature descriptor for content-based image retrieval

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150325