CN104461057A - 基于唇形图像识别的文字输入方法 - Google Patents
基于唇形图像识别的文字输入方法 Download PDFInfo
- Publication number
- CN104461057A CN104461057A CN201410829519.0A CN201410829519A CN104461057A CN 104461057 A CN104461057 A CN 104461057A CN 201410829519 A CN201410829519 A CN 201410829519A CN 104461057 A CN104461057 A CN 104461057A
- Authority
- CN
- China
- Prior art keywords
- lip
- lip shape
- character input
- word
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
Abstract
本发明提供一种基于唇形图像识别的文字输入方法。其基本原理是,由计算机对摄像机拍摄的目标人员唇部图像进行自动分析,提取唇形的特征值,再将提取的特征值与唇形模型库中的唇形模型进行匹配,然后由计算机根据匹配的唇形模型对应的文字、语义数据库完成文字的输入。该技术方案为生产车间现场口头生产指令的传递,提供了一种有效的解决方案。
Description
技术领域
本发明涉及人机交互技术领域,具体涉及一种基于唇形图像识别的文字输入方法。
背景技术
在很多生产车间,生产环境中存在较大噪音,这严重的阻碍了现场口头生产指令的下达。在刑侦工作中,一些场合也需要根据视频录像来推测嫌疑人的说话内容,这就需要根据唇形来推测获得相应的文字内容。
为实现上述目的,本发明提供一种基于唇形图像识别的文字输入方法,用于提升生产现场口头生产指令的下达效率、提高刑侦效率。
发明内容
针对上述问题,本发明通过采集唇部视频图像并利用视频处理技术对唇形特征值进行自动测量并与唇形模型进行匹配的方式,提供一种基于唇形图像识别的文字输入方法,从而提升生产现场口头生产指令的下达效率。
本发明提供的具体技术方案是:
一种基于唇形图像识别的文字输入方法,其特征在于,该方法包括以下步骤:
视频图像采集,通过摄像头采集目标人员的唇部视频图像;
视频分析,由计算机根据图像分析技术对所述唇部视频图像进行分析,获得唇形的特征值;
唇形模型匹配,将所述唇形的特征值与唇形模型库中的唇形模型进行匹配,得到唇形模型对应的文字;
语义数据库修正,利用通用语义数据库对由所述唇形模型对应的文字组成的语句进行修正;
文字输入,完成修正后语句文字的输入。
所述唇形模型库中的每个唇形模型,分别对应与之相应的文字。
有益效果:本发明提供的一种基于唇形图像识别的文字输入方法,由计算机对唇部图像进行自动分析、提取唇形的特征值、将唇形特征值与唇形模型进行匹配,并利用语义数据库进行修正、完成文字的输入。该技术方案为生产车间现场口头生产指令的传递,提供了一种有效的解决方案。
附图说明
图1所示是本发明工作流程图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1所示,用摄像机获取目标人员的唇部视频图像,然后由计算机唇部图像进行自动分析,提取唇形的特征值;再由计算机将提取的唇形特征值与唇形模型库中的唇形模型进行匹配。在唇形模型库中,每个唇形分别对应有相应的文字。找到相匹配的唇形模型后,由计算机根据匹配的唇形模型对应的文字完成文字的初步输入。因为同音字的存在,初步输入的文字组成的语句,并不能直接作为最终结果,而是由计算机利用通用语义数据库对初步输入的语句进行修正,完成修正后作为最终结果输出。
作为对本实施例的进一步优化,电脑输入的文字,在车间电子显示屏上进行显示,以方便现场人员及时获得相关生产指令。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (2)
1.一种基于唇形图像识别的文字输入方法,其特征在于,该方法包括以下步骤:
视频图像采集,通过摄像头采集目标人员的唇部视频图像;
视频分析,由计算机根据图像分析技术对所述唇部视频图像进行分析,获得唇形的特征值;
唇形模型匹配,将所述唇形的特征值与唇形模型库中的唇形模型进行匹配,得到唇形模型对应的文字;
语义数据库修正,利用通用语义数据库对由所述唇形模型对应的文字组成的语句进行修正;
文字输入,完成修正后语句文字的输入。
2.如权利要求1所述的方法,其特征在于,所述唇形模型库中的每个唇形模型,分别对应与之相应的文字。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410829519.0A CN104461057A (zh) | 2014-12-26 | 2014-12-26 | 基于唇形图像识别的文字输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410829519.0A CN104461057A (zh) | 2014-12-26 | 2014-12-26 | 基于唇形图像识别的文字输入方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104461057A true CN104461057A (zh) | 2015-03-25 |
Family
ID=52907246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410829519.0A Pending CN104461057A (zh) | 2014-12-26 | 2014-12-26 | 基于唇形图像识别的文字输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104461057A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106940798A (zh) * | 2017-03-08 | 2017-07-11 | 深圳市金立通信设备有限公司 | 一种文字识别的修正方法以及终端 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100211918A1 (en) * | 2009-02-17 | 2010-08-19 | Microsoft Corporation | Web Cam Based User Interaction |
CN102117115A (zh) * | 2009-12-31 | 2011-07-06 | 上海量科电子科技有限公司 | 一种利用唇语进行文字输入选择的系统及实现方法 |
CN103092329A (zh) * | 2011-10-31 | 2013-05-08 | 南开大学 | 一种基于唇读技术的唇语输入方法 |
-
2014
- 2014-12-26 CN CN201410829519.0A patent/CN104461057A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100211918A1 (en) * | 2009-02-17 | 2010-08-19 | Microsoft Corporation | Web Cam Based User Interaction |
CN102117115A (zh) * | 2009-12-31 | 2011-07-06 | 上海量科电子科技有限公司 | 一种利用唇语进行文字输入选择的系统及实现方法 |
CN103092329A (zh) * | 2011-10-31 | 2013-05-08 | 南开大学 | 一种基于唇读技术的唇语输入方法 |
Non-Patent Citations (1)
Title |
---|
肖庆阳等: "基于语义约束的口型序列识别方法", 《计算机应用与软件》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106940798A (zh) * | 2017-03-08 | 2017-07-11 | 深圳市金立通信设备有限公司 | 一种文字识别的修正方法以及终端 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103065356B (zh) | 一种海洋石油设施三维模型的建立方法 | |
CN101881999B (zh) | 甲骨文视频输入系统及实现方法 | |
EP2560111A3 (en) | Systems and methods for facilitating the gathering of open source intelligence | |
CN102902771A (zh) | 一种图片搜索方法、装置及服务器 | |
CN105677716A (zh) | 一种计算机数据采集处理分析系统 | |
PL405872A1 (pl) | Sposób, program i system konwersji modeli danych systemu zasilania | |
US20180173681A1 (en) | System and method for generating content pertaining to real property assets | |
CN110766805A (zh) | 火力发电厂交互式三维及vr仿真交底系统 | |
WO2017156864A1 (zh) | 图像识别方法、装置、设备及非易失性计算机存储介质 | |
CN104484041A (zh) | 一种基于深度学习的唇形图像识别文字输入方法 | |
CN110210025A (zh) | 一种基于文本提取的转换方法 | |
CN104461057A (zh) | 基于唇形图像识别的文字输入方法 | |
Gao et al. | Research on Image Classification and Retrieval Using Deep Learning with Attention Mechanism on Diaspora Chinese Architectural Heritage in Jiangmen, China | |
CN101770574A (zh) | 一种人眼定位与脸型识别方法 | |
CN104111942B (zh) | 维吾尔医药古籍资源网络检索平台 | |
CN104484042A (zh) | 一种基于机器学习的唇形图像识别文字输入方法 | |
CN208477524U (zh) | 一种图形化的案件梳理系统 | |
CN104036151B (zh) | 人脸属性值计算方法和系统 | |
CN104461011A (zh) | 一种基于唇形图像识别的文字输入方法 | |
CN109145098B (zh) | 基于知识图谱的中华文化元素信息搜索方法 | |
Cho et al. | A study on the possibility of 2D design drawing implementation by revit architecture | |
CN104484657A (zh) | 一种基于云端唇形模型库的唇形图像识别文字输入方法 | |
CN104537347A (zh) | 一种基于云端分析和模型匹配的唇形识别文字输入方法 | |
CN106528644A (zh) | 一种遥感数据的检索方法及装置 | |
Xia et al. | Local spatial binary pattern: A new feature descriptor for content-based image retrieval |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150325 |