CN104537347A - 一种基于云端分析和模型匹配的唇形识别文字输入方法 - Google Patents
一种基于云端分析和模型匹配的唇形识别文字输入方法 Download PDFInfo
- Publication number
- CN104537347A CN104537347A CN201410828308.5A CN201410828308A CN104537347A CN 104537347 A CN104537347 A CN 104537347A CN 201410828308 A CN201410828308 A CN 201410828308A CN 104537347 A CN104537347 A CN 104537347A
- Authority
- CN
- China
- Prior art keywords
- lip
- lip shape
- model
- cloud server
- input method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/002—Specific input/output arrangements not covered by G06F3/01 - G06F3/16
- G06F3/005—Input arrangements through a video camera
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2203/00—Indexing scheme relating to G06F3/00 - G06F3/048
- G06F2203/01—Indexing scheme relating to G06F3/01
- G06F2203/011—Emotion or mood input determined on the basis of sensed human body parameters such as pulse, heart rate or beat, temperature of skin, facial expressions, iris, voice pitch, brain activity patterns
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明针对生产车间等噪音环境下人们语言交流困难的现状,提供一种基于云端分析和模型匹配的唇形识别文字输入方法。其基本原理是:通过网络,由现场计算机将摄像机拍摄的目标人员唇部图像上传至云端服务器,由云端服务器对唇部图像进行自动分析、提取唇形的特征值、并与云端唇形模型库中的唇形模型进行匹配,获得匹配唇形模型后,将匹配唇形模型对应的文字反馈给现场计算机,由完成文字的输入。该技术方案为生产车间现场口头生产指令的传递,提供了一种有效的解决方案,并减轻了现场计算机的图像分析与唇形模型匹配工作压力。
Description
技术领域
本发明涉及人机交互技术领域,具体涉及一种基于云端分析和模型匹配的唇形识别文字输入方法。
背景技术
在很多生产车间,生产环境中存在较大噪音,这严重的阻碍了现场口头生产指令的下达。
为解决上述问题,本发明提供一种基于云端分析和模型匹配的唇形识别文字输入方法,用于提升生产现场口头生产指令的下达效率,并减轻了现场计算机的图像分析与唇形模型匹配工作压力。
发明内容
针对上述问题,本发明通过将采集的唇部视频图像上传至云端,并由云端服务器利用视频处理技术对唇形特征值进行自动测量、唇形模型匹配的方式,提供一种基于云端分析和模型匹配的唇形识别文字输入方法,从而提升生产现场口头生产指令的下达效率,并减轻了现场计算机的图像分析与唇形模型匹配工作压力。
本发明提供的具体技术方案是:
一种基于云端分析和模型匹配的唇形识别文字输入方法,其特征在于,该方法包括以下步骤:
视频图像采集,通过摄像头采集目标人员的唇部视频图像;
视频图像上传,由现场计算机通过网络将视频图像上传至云端服务器;
视频分析,由云端服务器根据图像分析技术对所述唇部视频图像进行分析,获得唇形的特征值;
唇形模型匹配,由云端服务器将所述唇形的特征值与唇形模型库中的唇形模型进行匹配;
文字反馈,云端服务器通过网络将匹配唇形模型对应的文字反馈至现场计算机;
文字输入,现场计算机完成文字的输入。
优选地:所述唇形模型库中的每个唇形模型分别对应与之相应的文字。
有益效果:本发明提供的一种基于云端分析和模型匹配的唇形识别文字输入方法,由现场计算机对唇部图像进行自动分析、提取唇形的特征值,由云端服务器将唇形特征值与唇形模型进行匹配与文字反馈、完成文字的输入。该技术方案为生产车间现场口头生产指令的传递,提供了一种有效的解决方案,并减轻了现场计算机的图像分析与唇形模型匹配工作压力。
附图说明
图1所示是本发明工作流程图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
如图1所示,首先,用摄像机获取目标人员的唇部视频图像,然后由现场计算机将唇部图像上传至云端服务器;再由云端服务器根据图像分析技术对所述唇部视频图像进行分析,获得唇形的特征值,并进行唇形模型匹配。在唇形模型库中,每个唇形分别对应有相应的文字。云端服务器找到相匹配的唇形模型后,将匹配唇形模型对应的文字反馈给现场计算机,由现场计算机完成文字的输入。
作为对本实施例的进一步优化,电脑输入的文字,在车间电子显示屏上进行显示,以方便现场人员及时获得相关生产指令。
需要说明的是,以上具体实施方式,是用于帮助理解本发明的方法及其核心思想;对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (2)
1.一种基于云端分析和模型匹配的唇形识别文字输入方法,其特征在于,该方法包括以下步骤:
视频图像采集,通过摄像头采集目标人员的唇部视频图像;
视频图像上传,由现场计算机通过网络将视频图像上传至云端服务器;
视频分析,由云端服务器根据图像分析技术对所述唇部视频图像进行分析,获得唇形的特征值;
唇形模型匹配,由云端服务器将所述唇形的特征值与唇形模型库中的唇形模型进行匹配;
文字反馈,云端服务器通过网络将匹配唇形模型对应的文字反馈至现场计算机;
文字输入,现场计算机完成文字的输入。
2.如权利要求1所述的方法,其特征在于,所述唇形模型库中的每个唇形模型分别对应与之相应的文字。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410828308.5A CN104537347A (zh) | 2014-12-25 | 2014-12-25 | 一种基于云端分析和模型匹配的唇形识别文字输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410828308.5A CN104537347A (zh) | 2014-12-25 | 2014-12-25 | 一种基于云端分析和模型匹配的唇形识别文字输入方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104537347A true CN104537347A (zh) | 2015-04-22 |
Family
ID=52852867
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410828308.5A Pending CN104537347A (zh) | 2014-12-25 | 2014-12-25 | 一种基于云端分析和模型匹配的唇形识别文字输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104537347A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1737822A (zh) * | 2004-05-20 | 2006-02-22 | 微软公司 | 用于照相机获得的文件的低分辨率光学字符识别 |
US20110052066A1 (en) * | 2001-10-15 | 2011-03-03 | Silverbrook Research Pty Ltd | Handwritten Character Recognition |
CN103092329A (zh) * | 2011-10-31 | 2013-05-08 | 南开大学 | 一种基于唇读技术的唇语输入方法 |
-
2014
- 2014-12-25 CN CN201410828308.5A patent/CN104537347A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110052066A1 (en) * | 2001-10-15 | 2011-03-03 | Silverbrook Research Pty Ltd | Handwritten Character Recognition |
CN1737822A (zh) * | 2004-05-20 | 2006-02-22 | 微软公司 | 用于照相机获得的文件的低分辨率光学字符识别 |
CN103092329A (zh) * | 2011-10-31 | 2013-05-08 | 南开大学 | 一种基于唇读技术的唇语输入方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104484656A (zh) | 基于深度学习的唇语识别唇形模型库构建方法 | |
US10970796B2 (en) | System and method for hybrid processing of construction site images | |
CN104504088A (zh) | 一种用于唇语识别的唇形模型库构建方法 | |
CN104537358A (zh) | 基于深度学习的唇语识别唇形训练数据库的生成方法 | |
WO2015183957A8 (en) | Platform for constructing and consuming realm and object feature clouds | |
CN102810135A (zh) | 一种药品处方辅助处理系统 | |
EP2383699A3 (en) | Method for estimating a pose of an articulated object model | |
JP2017224156A5 (zh) | ||
MX2016011229A (es) | Metodo automatico para interpretacion estructural tridimensional de imagenes de pozo adquiridas en pozos horizontales y muy inclinados. | |
IL235565B (en) | Position-based optical character recognition | |
CN102567716A (zh) | 一种人脸合成系统及实现方法 | |
CN107392098A (zh) | 一种基于人体骨架信息的动作完成度识别方法 | |
WO2019157199A3 (en) | Medical claim database relationship processing | |
CN105677716A (zh) | 一种计算机数据采集处理分析系统 | |
CN104504138A (zh) | 一种基于人的信息聚合方法和装置 | |
CN103593650A (zh) | 一种基于表情识别系统生成艺术图像的方法 | |
JP2014229115A5 (zh) | ||
CN111581699A (zh) | 一种欧式建筑的快速出加工图及提料的bim技术应用方法 | |
CN110766805A (zh) | 火力发电厂交互式三维及vr仿真交底系统 | |
NZ630397A (en) | Image recognition of vehicle parts | |
CN111191503A (zh) | 一种行人属性识别方法、装置、存储介质及终端 | |
EP2535787A3 (en) | 3D free-form gesture recognition system for character input | |
WO2022094290A3 (en) | Systems and methods for processing remote sensing data | |
CN104598935A (zh) | 一种基于增量子空间学习算法的人脸识别方法 | |
CN104484041A (zh) | 一种基于深度学习的唇形图像识别文字输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150422 |
|
WD01 | Invention patent application deemed withdrawn after publication |