CN112183530A - 一种计量表读数识别系统 - Google Patents
一种计量表读数识别系统 Download PDFInfo
- Publication number
- CN112183530A CN112183530A CN202011019637.7A CN202011019637A CN112183530A CN 112183530 A CN112183530 A CN 112183530A CN 202011019637 A CN202011019637 A CN 202011019637A CN 112183530 A CN112183530 A CN 112183530A
- Authority
- CN
- China
- Prior art keywords
- picture
- reading
- module
- meter
- dial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/02—Recognising information on displays, dials, clocks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Electromagnetism (AREA)
- Toxicology (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及一种计量表读数识别系统,包括API接口、区域提取模块、读数识别模块和条形码识别模块,API接口与区域提取模块连接,API接口将接收到的待识别图片发送到区域提取模块,区域提取模块分别连接读数识别模块和条形码识别模块,区域提取模块设有表盘区域截取子模块,表盘区域截取子模块根据预设的边界变量缩放截取窗口后对待识别图片中的表盘区域图片进行截取。与现有技术相比,本发明具有有效避免识别率降低、减少抄表员的工作难度、提高计量表字轮读数的定位精确度和读数识别的准确性等优点。
Description
技术领域
本发明涉及一种读数识别系统,尤其是涉及一种计量表读数识别系统。
背景技术
计量表抄读是水燃行业抄表收费所必需的过程,抄表员人工读取用户家里水表或者燃气表表盘上的读数,通过手持抄表终端将读数记录到营业收费系统中,系统根据本月和上月的读数差换算成用水量并计费。由于抄表过程全部由抄表员人为操作,耗费了大量的人工成本,同时也可能出现抄错、读错、填错、“人情表”、未到场估表等情况,导致结算结果和实际相差很大,给水司造成经济上的损失。现有的技术方案存在以下问题:
现有方案一:对抄表人员进行前期培训和绩效考核。企业对抄表员进行前期上工培训,明确抄读的要求;如遇到用户不在家或者表计堆没等情况,需要培训如何进行合理的估表。同时要求抄表员在抄表后拍摄水表照片,以降低认为抄读错误的可能性。然而上述的前期培训无法完全避免抄错、读错、填错的问题;也无法杜绝“人情表”或者未到场估表的问题发生,只能在发现有类似问题发生后,对抄表人员进行处罚或者扣除绩效。因此还是需要通过技术手段来保证表计抄读的准确性。
现有方案二:在计量表抄读时,需要同时拍摄一张计量表的照片,和读数一起保存。在营业收费系统中,需要有专人对读数和图片进行一一校对,当发现读数和照片不一致的情况下以图片为准,调整读数或到现场进行复核。由于每个月抄表数量多,使得人工无法对每块表计的读数进行复核,只能对有明显问题的或者采用随机抽查的方法来复核,这也直接导致了人工成本上升,且无法做到读数的准确可靠。
现有方案三:采用用户自报的方式。可以与微信、支付宝等平台对接,采用公众号或者小程序的方式提供给用户,用户绑定后可以自行拍照并提交表计读数。通过用户自报的方式虽然可以节约人工的现场抄表成本,但是也无法保证用户自报读数的准确性,有可能存在欺瞒读数、使用往期图片等情况存在,也需要通过表计读数的自动识别等技术手段来加以限制。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种计量表读数识别系统,通过机器学习的方法识别表盘区域,并能自动识别表计字轮区域的读数和条形码编号,有效补足了传统方案中表计读数抄读人工成本高、不准确、不可靠的问题,满足多种应用场景的需求。
本发明的目的可以通过以下技术方案来实现:
一种计量表读数识别系统,包括API接口、区域提取模块、读数识别模块和条形码识别模块,所述API接口与区域提取模块连接,API接口将接收到的待识别图片发送到区域提取模块,所述区域提取模块分别连接读数识别模块和条形码识别模块,所述区域提取模块设有表盘区域截取子模块,所述表盘区域截取子模块根据预设的边界变量缩放截取窗口后对所述待识别图片中的表盘区域图片进行截取。
一种计量表读数识别系统,还包括文件系统,所述文件系统分别与API接口、区域提取模块连接。
所述API接口的输入端与PC端、移动端和小程序端连接。
所述表盘区域截取子模块将像素化的待识别图片作为输入。
所述区域提取模块设有表盘区域识别子模块,所述表盘区域识别子模块获取表盘区域图片的位置信息发送至表盘区域截取子模块。
进一步地,所述表盘区域识别子模块基于机器学习算法,采用MobileNet模型。
进一步地,所述表盘区域图片的位置信息包括表盘区域图片的坐标和偏转角度,所述坐标包括表盘区域图片对应的矩形的左上角坐标和右下角坐标,所述偏转角度为对应的矩形与水平线之间的偏离角度。
表盘区域截取子模块根据偏转角度将待识别图片转正。
所述读数识别模块使用机器学习算法,采用基于注意力机制的CNN+LSTM模型。
进一步地,所述CNN+LSTM模型从表盘区域图片中提取特征,通过注意力机制确定字轮读数所在的位置,并通过LSTM识别出字轮读数对应的计量表数值。
进一步地,所述字轮读数的末位未旋转到一半时,LSTM输出相邻两个数字中较小的数字作为计量表数值的末位,否则输出相邻两个数字中较大的数字作为计量表数值的末位。
所述待识别图片包括同一设备的多个角度的照片时,将所述照片进行拼接后输入到读数识别模块,拼接方式具体为横向拼接。
所述条形码识别模块根据参数设置同时识别表盘区域中的条形码编码。
与现有技术相比,本发明具有以下有益效果:
1.本发明的表盘区域截取子模块通过预设的边界增量缩放了对待识别图片中表盘区域图片的截取窗口,使每次裁剪出来的表盘图片存在略微差异,在工况不佳的拍摄环境下,有效避免了识别率降低的问题。
2.本发明将表盘区域提取和字轮读数识别两个部分分离,分别对表盘提取和读数识别的过程进行优化,根据偏转角度对待识别图片进行调整,能够适应多种角度拍摄的计量表图片,降低了拍摄要求,减少了抄表员的工作难度。
3.本发明支持同一设备的多个角度的照片,进行横向拼接后输入到读数识别模块,提高了计量表字轮读数的定位精确度和读数识别的准确性。
4.本发明在一次性识别过程中通过读数识别模块和条形码识别模块同时获得计量表的字轮读数和条形码,减少了移动端的等待时间和流量开销。
附图说明
图1为本发明的结构示意图;
图2为本发明实施例一中实时识别模式的流程示意图;
图3为本发明实施例二中批量识别模式的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例一
如图1所示,一种计量表读数识别系统,包括API接口、区域提取模块、读数识别模块和条形码识别模块,API接口与区域提取模块连接,API接口将接收到的待识别图片发送到区域提取模块,区域提取模块分别连接读数识别模块和条形码识别模块,区域提取模块设有表盘区域截取子模块,表盘区域截取子模块根据预设的边界变量缩放截取窗口后对待识别图片中的表盘区域图片进行截取。
一种计量表读数识别系统,还包括文件系统,文件系统分别与API接口、区域提取模块连接。
API接口的输入端与PC端、移动端和小程序端连接。
表盘区域截取子模块将像素化的待识别图片作为输入,本实施例中待识别图片的尺寸为224*224。
区域提取模块设有表盘区域识别子模块,表盘区域识别子模块获取表盘区域图片的位置信息发送至表盘区域截取子模块。
表盘区域识别子模块基于机器学习算法,采用MobileNet模型。
表盘区域图片的位置信息包括表盘区域图片的坐标和偏转角度,坐标包括表盘区域图片对应的矩形的左上角坐标和右下角坐标,偏转角度为对应的矩形与水平线之间的偏离角度。
表盘区域截取子模块根据偏转角度将待识别图片转正。
表盘区域图片输入到读数识别模块时被格式化为150*150像素的图片。
读数识别模块使用机器学习算法,采用基于注意力机制的CNN+LSTM模型。
CNN+LSTM模型从表盘区域图片中提取特征,通过注意力机制确定字轮读数所在的位置,并通过LSTM识别出字轮读数对应的计量表数值。
字轮读数的末位未旋转到一半时,LSTM输出相邻两个数字中较小的数字作为计量表数值的末位,否则输出相邻两个数字中较大的数字作为计量表数值的末位。
待识别图片包括同一设备的多个角度的照片时,将照片进行拼接后输入到读数识别模块,拼接方式具体为横向拼接。
条形码识别模块根据参数设置同时识别表盘区域中的条形码编码。
如图2所示,本实施例中,计量表读数识别系统设于NVIDIA GPU显卡的服务器,安装有CentOS 7.3版本的操作系统,通过实时识别模式从待识别图片提取出计量表数值,具体步骤如下所示:
步骤S11:API接口获取上传的待识别图片,发送至区域提取模块;
步骤S12:区域提取模块识别计量表表盘所在区域,并截取表盘区域图片;
步骤S13:读数识别模块判断表盘区域图片中是否存在表盘,若是转至步骤S14,否则转至步骤S17;
步骤S14:读数识别模块根据表盘区域图片中的表盘识别出计量表数值,并输出到调用端;
步骤S15:读数识别模块判断表盘区域图片中是否存在需要进行识别的条形码,若是转至步骤S16,否则转至步骤S17;
步骤S16:读数识别模块根据表盘区域图片中的表盘识别出条形码编码,并输出到调用端;
步骤S17:识别完成。
实施例二
如图3所示,本实施例中,计量表读数识别系统设于台式服务器上,通过批量识别模式从待识别图片提取出计量表数值,具体步骤如下所示:
步骤S21:服务器将需要识别的图片压缩为zip文件,通过API接口上传至区域提取模块;
步骤S22:区域提取模块将zip文件解压缩并获取待识别图片列表;
步骤S23:区域提取模块判断待识别图片列表是否存在未识别的图片,若是转至步骤S24,否则转至步骤30;
步骤S24:区域提取模块识别计量表表盘所在区域,并截取表盘区域图片;
步骤S25:读数识别模块判断表盘区域图片中是否存在表盘,若是转至步骤S26,否则转至步骤S29;
步骤S26:读数识别模块根据表盘区域图片中的表盘识别出计量表数值;
步骤S27:读数识别模块判断表盘区域图片中是否存在需要进行识别的条形码,若是转至步骤S28,否则转至步骤S29;
步骤S28:读数识别模块根据表盘区域图片中的表盘识别出条形码编码;
步骤S29:读数识别模块将计量表数值和条形码编码的识别结果记录到csv文件中,转至步骤S23;
步骤S30:识别完成。
批量识别模式下,台式服务器向API接口发起批量识别请求,并获取结果请求编码,根据请求编码定时向API询问识别进度,如果未识别完成则返回识别百分比,当识别完成后获取csv文件的下载地址,台式服务器根据csv文件的下载地址请求csv文件。
实施例三
本实施例中,计量表读数识别系统设于拥有上网功能的移动端,移动端采集计量表图片,通过API接口上传到计量表读数识别系统,具体步骤同实施例一。移动端获取识别结果后将读数在在自身显示功能件上进行显示。
实施例四
本实施例中,计量表读数识别系统嵌套于移动端上的应用程序中,从移动端的应用程序中获取计量表图片,通过API接口上传到计量表读数识别系统,具体步骤同实施例一,将识别结果显示在移动端的应用程序中。
此外,需要说明的是,本说明书中所描述的具体实施例子,所取名称可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所做的举例说明。凡依据本发明构思的构造、特征及原理所做的等效变化或者简单变化,均包括于本发明的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实例做各种各样的修改或补充或采用类似的方法,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (10)
1.一种计量表读数识别系统,其特征在于,包括API接口、区域提取模块、读数识别模块和条形码识别模块,所述API接口与区域提取模块连接,API接口将接收到的待识别图片发送到区域提取模块,所述区域提取模块分别连接读数识别模块和条形码识别模块,所述区域提取模块设有表盘区域截取子模块,所述表盘区域截取子模块根据预设的边界变量缩放截取窗口后对所述待识别图片中的表盘区域图片进行截取。
2.根据权利要求1所述的一种计量表读数识别系统,其特征在于,还包括文件系统,所述文件系统分别与API接口、区域提取模块连接。
3.根据权利要求1所述的一种计量表读数识别系统,其特征在于,所述API接口的输入端与PC端、移动端和小程序端连接。
4.根据权利要求1所述的一种计量表读数识别系统,其特征在于,所述区域提取模块设有表盘区域识别子模块,所述表盘区域识别子模块获取表盘区域图片的位置信息发送至表盘区域截取子模块。
5.根据权利要求4所述的一种计量表读数识别系统,其特征在于,所述表盘区域识别子模块基于机器学习算法,采用MobileNet模型。
6.根据权利要求4所述的一种计量表读数识别系统,其特征在于,所述表盘区域图片的位置信息包括表盘区域图片的坐标和偏转角度。
7.根据权利要求1所述的一种计量表读数识别系统,其特征在于,所述读数识别模块使用机器学习算法,采用基于注意力机制的CNN+LSTM模型。
8.根据权利要求7所述的一种计量表读数识别系统,其特征在于,所述CNN+LSTM模型从表盘区域图片中提取特征,通过注意力机制确定字轮读数所在的位置,并通过LSTM识别出字轮读数对应的计量表数值。
9.根据权利要求8所述的一种计量表读数识别系统,其特征在于,所述字轮读数的末位未旋转到一半时,LSTM输出相邻两个数字中较小的数字作为计量表数值的末位,否则输出相邻两个数字中较大的数字作为计量表数值的末位。
10.根据权利要求1所述的一种计量表读数识别系统,其特征在于,所述待识别图片包括同一设备的多个角度的照片时,将所述照片进行横向拼接后输入到读数识别模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011019637.7A CN112183530A (zh) | 2020-09-24 | 2020-09-24 | 一种计量表读数识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011019637.7A CN112183530A (zh) | 2020-09-24 | 2020-09-24 | 一种计量表读数识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112183530A true CN112183530A (zh) | 2021-01-05 |
Family
ID=73944708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011019637.7A Pending CN112183530A (zh) | 2020-09-24 | 2020-09-24 | 一种计量表读数识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112183530A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955694A (zh) * | 2014-04-09 | 2014-07-30 | 广州邦讯信息系统有限公司 | 图像识别抄表系统及方法 |
CN108304842A (zh) * | 2018-02-01 | 2018-07-20 | 重庆中陆承大科技有限公司 | 水表读数识别方法、装置及电子设备 |
CN109214378A (zh) * | 2018-08-16 | 2019-01-15 | 新智数字科技有限公司 | 一种基于神经网络整体识别计量表读数的方法和系统 |
CN110287960A (zh) * | 2019-07-02 | 2019-09-27 | 中国科学院信息工程研究所 | 自然场景图像中曲线文字的检测识别方法 |
CN110298339A (zh) * | 2019-06-27 | 2019-10-01 | 北京史河科技有限公司 | 一种仪表表盘识别方法、装置及计算机存储介质 |
CN110659636A (zh) * | 2019-09-20 | 2020-01-07 | 随锐科技集团股份有限公司 | 基于深度学习的指针式仪表读数识别方法 |
CN110837834A (zh) * | 2019-09-30 | 2020-02-25 | 杭州朗阳科技有限公司 | 一种数字仪表读数方法及系统 |
-
2020
- 2020-09-24 CN CN202011019637.7A patent/CN112183530A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103955694A (zh) * | 2014-04-09 | 2014-07-30 | 广州邦讯信息系统有限公司 | 图像识别抄表系统及方法 |
CN108304842A (zh) * | 2018-02-01 | 2018-07-20 | 重庆中陆承大科技有限公司 | 水表读数识别方法、装置及电子设备 |
CN109214378A (zh) * | 2018-08-16 | 2019-01-15 | 新智数字科技有限公司 | 一种基于神经网络整体识别计量表读数的方法和系统 |
CN110298339A (zh) * | 2019-06-27 | 2019-10-01 | 北京史河科技有限公司 | 一种仪表表盘识别方法、装置及计算机存储介质 |
CN110287960A (zh) * | 2019-07-02 | 2019-09-27 | 中国科学院信息工程研究所 | 自然场景图像中曲线文字的检测识别方法 |
CN110659636A (zh) * | 2019-09-20 | 2020-01-07 | 随锐科技集团股份有限公司 | 基于深度学习的指针式仪表读数识别方法 |
CN110837834A (zh) * | 2019-09-30 | 2020-02-25 | 杭州朗阳科技有限公司 | 一种数字仪表读数方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021000577A1 (zh) | 一种刷脸支付方法和装置 | |
CN103050025A (zh) | 一种移动终端的学习方法及其学习系统 | |
CN105718927A (zh) | 基于转轮式自来水表的智能抄表方法和系统 | |
CN103945006A (zh) | 混凝土振捣质量监控反馈数据实时图形数字化通讯方法 | |
CN110070491A (zh) | 银行卡图片矫正方法、装置、设备及存储介质 | |
CN106530219A (zh) | 图像拼接方法及装置 | |
KR101930394B1 (ko) | 시공자의 견적서와 공시단가를 비교하여 투명한 견적 서비스를 제공하는 방법 | |
CN103986820A (zh) | 移动终端进行天气信息显示的方法、相关模块和系统 | |
CN112183530A (zh) | 一种计量表读数识别系统 | |
CN111951089A (zh) | 房屋盘点方法及装置 | |
CN109857499B (zh) | 基于windows系统收银软件屏幕金额获取的通用方法 | |
CN111552603A (zh) | 移动支付机具测试方法及测试系统 | |
CN112130731A (zh) | 数据处理方法、装置及电子设备 | |
JP2002290318A (ja) | データ通信作業支援方法及びデータ通信装置 | |
CN106447330B (zh) | 一种现场支付系统及方法 | |
CN106875162B (zh) | 数据抓取方法、数据抓取装置、软收银对接接口及终端 | |
RU2654131C1 (ru) | Способ и устройство для обработки данных заявки на выдачу карты | |
CN109427085A (zh) | 一种图像数据的处理、渲染方法、服务器及客户端 | |
KR20150099906A (ko) | 자동 채점 방법 | |
JP2002291068A (ja) | データ通信作業支援方法及びデータ通信装置 | |
CN111866855B (zh) | 一种智能终端初始化激活方法 | |
CN111600995A (zh) | 移动设备以及对移动设备的游戏用户界面进行纠偏的方法 | |
CN112732733A (zh) | 数据核对处理方法及装置 | |
CN112102481A (zh) | 一种交互模拟场景的构建方法、装置、计算机设备及存储介质 | |
CN109753303A (zh) | 视角补偿方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210105 |