CN111062256A - 一种数据提取、录入方法及装置 - Google Patents
一种数据提取、录入方法及装置 Download PDFInfo
- Publication number
- CN111062256A CN111062256A CN201911136982.6A CN201911136982A CN111062256A CN 111062256 A CN111062256 A CN 111062256A CN 201911136982 A CN201911136982 A CN 201911136982A CN 111062256 A CN111062256 A CN 111062256A
- Authority
- CN
- China
- Prior art keywords
- data
- picture
- confirmed
- common
- pictures
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000013075 data extraction Methods 0.000 title claims abstract description 37
- 238000013479 data entry Methods 0.000 title claims abstract description 33
- 238000012790 confirmation Methods 0.000 claims abstract description 36
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 239000012535 impurity Substances 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 abstract description 13
- 230000003993 interaction Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 19
- 238000012545 processing Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012015 optical character recognition Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 238000005192 partition Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012358 sourcing Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2178—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
本发明公开了一种数据提取、录入方法及装置,所述录入方法包括以下步骤:获取当前待识别的图片,并对图片进行识别得到初始数据,从初始数据中选择合理和准确的数据作为待确认数据,对待确认数据进行呈现以供确认,获取到确认信号后,将待确认数据作为最终数据,对所述最终数据进行录入。本发明还公开了一种数据提取方法及装置、数据录入装置,本发明在用户与智能服务系统的交互过程中,通过图片分析获取长串数据,并自动录入,给用户提供方便快捷的输入;同时本发明通过分析和对比,对输入数据进行合理性和合法性的检测,可以有效降低出错概率,给用户提供准确高效的数据录入功能,提升了用户的体验。
Description
技术领域
本发明涉及智能服务系统领域,特别是涉及一种数据提取、录入方法及装置。
背景技术
随着当前通信领域的不断发展,智能服务系统成为网络服务运营商提供在线服务的一种主流服务方式。当前行业中的智能服务系统在线服务过程中获取数据主要是通过语音输入(智能语音系统),即用户根据个人数据进行主观答复。
但是,发明人在实现本发明时发现:当采用这种答复方式时,如果遇到长串数据的输入,如身份证、银行卡号等就会使得用户比较烦躁,而且遇到比较粗心的用户,可能需要重复输入,使用户失去耐心。
发明内容
本发明要解决的技术问题是提供一种数据提取、录入方法及装置,用以解决相关技术数据录入不方便,出错率高的问题。
为解决上述技术问题,一方面,本发明提供一种数据提取方法,所述方法包括以下步骤:
获取当前待识别的图片;
对所述图片进行识别,得到初始数据;
从所述初始数据中选择合理和准确的数据作为待确认数据;
对所述待确认数据进行呈现以供确认;
获取到确认信号,将所述待确认数据作为最终数据。
可选地,所述对所述图片进行识别包括:
对所述图片进行图层识别,缩小所述图片的范围,得到目标图片区域;
去除所述目标图片区域的杂质,得到整洁的数据界面;
对所述整洁数据界面内的数据进行提取。
可选地,所述杂质包括:
所述目标图片区域中的所述数据周围的影响所述数据提取的色彩因素和/或数据界面。
可选地,所述对所述整洁数据界面内的数据进行提取之后,还包括:
初步判断含有字母的所述数据的数据类型;
将所述数据类型与所述数据进行匹配;
若匹配,则将所述数据作为合法数据;
将所述合法数据作为所述初始数据。
可选地,若不匹配,则再次识读所述图片,以得到所述合法数据。
可选地,所述从所述初始数据中选择合理的数据作为待确认数据包括:
选择满足预先存储的长串数据函数的规则的所述初始数据作为待确认数据。
可选地,所述从所述初始数据中选择准确的数据作为待确认数据包括:
选择满足与常用的数字、字符图片模板的所述初始数据作为待确认数据。
可选地,所述从所述初始数据中选择合理和准确的数据作为待确认数据包括:
确认满足预先存储的长串数据函数的规则的所述初始数据的数据类型;
获取所述数据类型所对应的常用的数字模板和/或字符图片模板;
选择满足与常用的数字、字符图片模板的所述初始数据作为待确认数据。
可选地,所述获取到确认信号,将所述待确认数据作为最终数据之后,还包括:
获取所述图片的复用次数,将所述复用次数加1;
根据所述复用次数,确定所述图片的优先级;
将所述优先级满足预设规则的所述图片作为常用图片;
将所述优先级满足预设规则的所述图片所对应的待确认数据作为与所述常用图片所对应的待确认数据。
可选地,所述获取当前待识别的图片之后,所述对所述待确认数据进行呈现以供确认之前,还包括:
将所述图片与预先存储的常用图片进行对比,判断是否为相同图片;
若判断为相同图片,对与所述常用图片所对应的待确认数据进行呈现以供确认。
可选地,所述获取当前待识别的图片之前,还包括:
通过用户接口,定制常用图片及与所述常用图片所对应的待确认数据;
预先存储所述常用图片及与所述常用图片所对应的待确认数据。
进一步的,本发明还提供了一种数据录入方法,包括:
获取如上述任一项所述的最终数据;
将所述最终数据进行录入。
进一步的,本发明还提供了一种数据提取装置,包括:
图片采集单元,用于获取当前待识别的图片;
图片分析单元,用于对所述图片进行识别,得到初始数据;
智能检测单元,用于从所述初始数据中选择合理和准确的数据作为待确认数据;
数据呈现单元,用于对所述待确认数据进行呈现以供确认;
数据确认单元,获取到确认信号后,将所述待确认数据作为最终数据。
可选地,数据提取装置还包括:
快速判断单元,用于在所述获取当前待识别的图片之后,所述对所述待确认数据进行呈现以供确认之前,将所述图片与预先存储的常用图片进行对比,判断是否为相同图片;
所述数据确认单元,还用于若判断为相同图片,则确认与所述常用图片所对应的待确认数据,得到最终数据。
进一步的,本发明还提供了一种数据录入装置,包括:
获取单元,用于获取如上述任一项所述的最终数据;
录入单元,用于将所述最终数据进行录入。
本发明有益效果如下:
本发明在用户与智能服务系统的交互过程中,通过获取当前待识别的图片,并对图片进行识别得到初始数据,从初始数据中选择合理和准确的数据作为待确认数据,对待确认数据进行呈现以供确认,获取到确认信号后,将待确认数据作为最终数据。通过识别图片以提取长串数据,进一步可以实现自动录入,给用户提供方便快捷的输入;同时本发明通过分析和对比,对输入数据进行合理性和合法性的检测,可以有效降低出错概率,给用户提供准确高效的数据录入功能,提升了用户的体验。
附图说明
图1是本发明实施例一中一种数据提取装置的结构示意图;
图2是本发明实施例二中一种数据录入装置的结构示意图;
图3是本发明实施例二中另一种数据录入装置的结构示意图;
图4是本发明实施例三中一种数据提取方法的流程图;
图5是本发明实施例三中一种用户界面示意图;
图6是本发明实施例四中一种数据录入方法的流程图;
图7是本发明实施例四中数据录入单元的工作示意图;
图8是本发明实施例四中再一种数据录入方法的流程图。
具体实施方式
为了解决相关技术数据录入不方便,出错率高的问题,本发明提供了一种数据提取、录入方法及装置,以下结合附图以及下述各个实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。
实施例1
本发明实施例的一种数据提取装置100如图1所示,包括图片采集单元11、图片分析单元12、智能检测单元13、数据呈现单元14、数据确认单元15。在一些实施例中,数据提取装置还包括快速判断单元16。其中,图片分析单元12分别与图片采集单元11和智能检测单元13连接,数据呈现单元14分别与智能检测单元13和数据确认单元15连接,快速判断单元16分别与图片采集单元11和数据呈现单元14连接。
图片采集单元11用于与用户交互,获取需要输入数据的图片,也即用户获取当前待识别的图片。图片采集单元11入口,可以根据用户常用的场景设置摄像机侧键调用,或者菜单键调用,从而启动系统获取图片进行分析。对于手持终端,该智能装置也可以在设置菜单(不限于)中提供设置项,提供用户选择。
图片分析单元12用于对获取到的图片进行识别,得到初始数据。图片分析单元12包括分区截取子单元121、杂质去除子单元122、数据提取子单元123。在一些实施例中,图片分析单元12还包括合法性判断子单元124。其中杂质去除子单元122分别与分区截取子单元121和数据提取子单元123连接,合法性判断子单元124与数据提取子单元123连接。分区截取子单元121用于对获取到的图片进行分区截取和图层识别,缩小图片范围,得到目标图片区域;杂质去除子单元122用于去除缩小范围后的目标图片区域的杂质,得到整洁的数据界面。也可以理解,杂质去除子单元122用于去除缩小范围后的目标图片区域数据周围的杂质,得到整洁的数据界面;其中,杂质包括目标图片区域中的数据周围的影响数据提取的色彩因素和/或数据界面。数据提取子单元123用于对整洁数据界面内的数据进行提取。进而可以得到初始数据;合法性判断子单元124用于对含有字母的长串数据,判断所述数据是否合法。具体的,通过初步判断含有字母的数据的数据类型,将数据类型与数据进行匹配,若匹配,则将数据作为合法数据;将合法数据作为初始数据。在一些实施例中,合法性判断子单元124还用于若不匹配,则再次识读所述图片,以得到所述合法数据。
智能检测单元13用于对所述初始数据进行分析和对比,得到待确认数据。智能检测单元13通过内部实现,对初始数据的合理性、初始数据的准确性进行检测,达到系统要求的精确度,需要说明的是,该精度根据系统对应的客户群确定。
智能检测单元13包括合理性判断子单元131和准确性判断子单元132,其中合理性判断子单元131与准确性判断子单元132连接。合理性判断子单元131用于将所述初始数据与预先存储的长串数据进行对比,检测所述初始数据的合理性,选择满足预先存储的长串数据函数的规则的初始数据作为待确认数据;准确性判断子单元132用于将所述初始数据与常用的数字、字符图片模板进行对比,检测所述初始数据的准确性,选择满足与常用的数字、字符图片模板的初始数据作为待确认数据。
在一些实施例中,通过合理性判断子单元131确认满足预先存储的长串数据函数的规则的初始数据的数据类型,进而再通过准确性判断子单元132获取数据类型所对应的常用的数字模板和/或字符图片模板;选择满足与常用的数字、字符图片模板的初始数据作为待确认数据。
数据呈现单元14用于对待确认数据进行呈现以供确认。数据呈现单元14提供用户接口,提示用户是否需要确认输入,还是需要重新获取数据;可以请用户进行确认输入或者放弃重新输入的选项,用户根据获取的数据进行是否录入的选择,数据呈现单元14可以选择语音提示用户或者提示框提示。
数据确认单元15用于获取到确认信号,将所述待确认数据作为最终数据。
快速判断单元16用于在获取当前待识别的图片之后,所述对所述待确认数据进行呈现以供确认之前,将获取当前待识别的图片与预先存储的常用图片进行对比,判断是否为相同图片。快速判断单元16实现了模板记录的功能,将已经分析过模板进行保存,需要说明的是,是否设计用户接口,可以根据终端情况确定,当用户进入图片采集单元11时,若是判断为相同图片,则可以直接进入数据呈现单元14将常用图片所对应的带确认数据进行呈现,进而通过数据确认单元15进行数据确认,得到最终数据。这样可以做到一次分析多次复用的效果,提升系统性能。
快速判断单元16包括模板设置子单元161、模板存储子单元162和相同图片判断子单元163,其中模板存储子单元162分别与模板设置子单元161和相同图片判断子单元163连接。模板设置子单元161用于设置常用图片及常用图片所对应的待确认数据;模板存储子单元162用于存储常用图片及常用图片所对应的待确认数据;相同图片判断子单元163用于将获取当前待识别的图片与预先存储的常用图片进行对比,判断是否为相同图片。
模板设置子单元161可以采用图片复用计数器、优先级确定模块和模板提取模块,其中优先级确定模块分别与图片复用计数器和模板提取模块连接。图片复用计数器用于获取到确认信号,将所述待确认数据作为最终数据之后,获取图片的复用次数,将图片复用次数加1;优先级确定模块用于根据所述图片复用次数,确定图片的优先级;模板提取模块用于提取优先级满足预设规则的图片作为常用图片,提取优先级满足预设规则的图片所对应的待确认数据作为与常用图片所对应的待确认数据。模板设置子单元161还可以采用用户接口,通过所述用户接口定制常用图片及与常用图片所对应的待确认数据。本实施例中,模板设置子单元161可以单独采用图片复用计数器、优先级确定模块和模板提取模块,也可以单独采用用户接口,还可以图片复用计数器、优先级确定模块和模板提取模块与用户接口两者相结合。
在一些实施例中,模板存储子单元162还包括加密模块,用于在存储与常用图片所对应的待确认数据时,对存储的与常用图片所对应的待确认数据进行加密。
实施例2
本发明实施例的一种数据录入装置200,如图2所示,该装置包括上述实施例所述的获取单元21和录入单元22。
其中,获取单元21用于获取上述实施例中所述的最终数据,录入单元22用于将该最终数据进行录入。
在一些实施例中,如图3所示,数据录入装置200包括上述实施例所述的数据提取装置100和录入单元22。
实施例3
当采用实施例1所述的数据提取装置时,本发明实施例的一种数据提取方法的流程如图4所示,首先获取当前待识别的图片;然后对获取到的图片进行识别,得到初始数据;再对所述初始数据进行分析和对比,从中选取合理和准确的数据作为待确认数据;再对所述待确认数据进行呈现,在获取到确认信号后,将该待确认数据作为最终数据。本实施例的方法具体包括以下步骤:
步骤S401,获取需要输入数据的图片,换句话说,也即获取当前待识别的图片。本实施例中,可以从图库中获取图片,也可以调用照相机,通过拍照获取图片。若是需要调用摄像头拍照可以考虑,但是不限于:不支持硬件调用的终端摄像头的终端,可以在终端通话界面上选择设置软件菜单;对于支持终端硬件调用摄像头的终端,直接使用终端的摄像头键设置接口进入智能系统相应的图片分析单元。其中本发明的一种用户界面图5所示,通过与该用户界面的交互录入图片。
步骤S402,对获取到的图片进行图层识别,缩小图片范围,得到目标图片区域。本实施例中,具体包括:在OCR(Optical Character Recognition,光学字符识别)引擎或者其他图片分析引擎的基础上调用已有的函数接口,进行图层识别,缩小图片范围,该方法可以借鉴业界当前已经成熟图片识别方法,在此不做具体方法的要求。
以OCR为例,OCR是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。即:对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。因此,从该技术引擎的定义来说,该技术应用于智能移动设备的时候需要二次定制化开发,而这个二次开发可以在该引擎原理的基础上。简单来说,OCR引擎完成的是一个从影像到结果输出的过程,这个过程需要经过影像输入和初步处理、文字特征识别抽取、对比识别、人工校正后输出最后结果。影像输入和初步处理,影像输入方式成熟多样,可根据终端类型进行定制,影响初步处理需要结果的问题较多,如:从得到一个影像(如对彩色图片处理,需要考虑进行二次定制化开发),到独立出一个个文字影像的过程中,都属于影像前处理,包含影像的正规化、去除噪声、影像校正等处理方式。当前的图片处理已经比较成熟,需要进行技术攻关的主要是在文件前处理方面,如影像处理将图片、表格、文字区域分离,甚至可以细化到文字的断句,断字,完成该步骤后,进行文档特征提取,这一步步骤可以说是OCR的核心部分,因为使用什么特征模板、如何抽取,如何判断,直接影像识别率的高低,一般有两种方式:统计法和结构识别法,特征提取完成,进行对比识别,这一部分因为是概率性获得识别结果,因此,可以充分发挥数据运算理论,根据不同的特征,选择不同的数据距离函数,提高对比正确率。最后的人工校正模块可以根据需求方的要求来确定。该识别引擎首先是在PC侧发展起来的,因此,若是在移动智能终端借用该引擎进行图片识别,则可以结合当前的计算机发展技术,进行进一步的技术细化和函数的修改,以满足智能终端的需求。
步骤S403,去除目标图片区域的杂质,得到整洁的数据界面。本实施例中,具体包括去除缩小范围后的图片区域的数据周围的杂质,将数据周围的影响数据清晰度的各种色彩因素、数据界面进行调整。其中杂质包括:目标图片区域中的数据周围影响数据提取的色彩因素和/或数据界面。
步骤S404,对整洁数据界面内的数据进行提取,得到初始数据。在对整洁的数据界面内的数据进行提取之后,还包括:初步判断含有字母的数据的数据类型,将该数据类型与数据进行匹配,若匹配,则将数据作为合法数据,将该合法数据作为初始数据,例如:对含有字母的长串数据,判断所述数据是否合法,当所述数据合法时,所述数据为初始数据;当所述数据不合法时,重新对获取到的图片进行图层识别。如部分人的身份证号中有长串数据,系统经过确认判断该号码和身份证号码匹配,则进行再次匹配,确定该身份证号码的合法性。
将所述初始数据传输到智能检测单元,本实施例中采用专门的数据传输单元进行传输,使用该单元进行传输,主要采用分布式的思想,考虑到在一个单元处理的问题太多会造成系统的不稳定,因此,以该单元作为接口进行数据传输。
步骤S405,选择满足预先存储的长串数据函数的规则的初始数据作为待确认数据。具体的,与预先存储的长串数据函数进行对比,检测所述初始数据的合理性。本实施例中,具体包括在系统中预存一些常用的长串数据的函数,使用函数进行数据比对计算,确认用户进行的图片分析过程中的数据类型、如身份证号、银行卡号、二维码数据等等。
步骤S406,选择满足与常用的数字、字符图片模板的初始数据作为待确认数据。具体的,与常用的数字、字符图片模板进行对比,检测所述初始数据的准确性。本实施例中,可以使用,但不限于如下方法:对常用的数字、字符进行图片模板库的建立,每张图片模板库模板对应一个或者一组对应的数字或者字符,在进行数据准确性检测的时候可以直接调用对应的数据模板快速进行对比。
在一些实施例中,可以通过确认满足预先存储的长串数据函数的规则的初始数据的数据类型,获取数据类型所对应的常用的数字模板和/或字符图片模板,选择满足与常用的数字、字符图片模板的所述初始数据作为待确认数据。
步骤S407,对待确认数据进行呈现以供确认。本实施例中,将检测后的数据传递到用户界面,一方面,在用户界面给出用户提示是否需要确认输入,另外一方面,但是不限于,对于分析得到的有效数据,提供一种记忆装置,在用户二次需要使用的时候,直接进入用户确认即可。提示用户确认输入的实现方式可以多元化,如:语音播报提示,提示框提示等,根据终端的硬件情况确定即可。
步骤S408,获取到确认信号,将待确认数据作为最终数据。
在一些实施例中,在步骤S401之后,S407之前还包括步骤S409,将获取的图片与预先存储的常用图片进行对比,判断是否为相同图片;当为相同图片时,对与常用图片所对应的待确认数据进行呈现以供确认,转步骤S407;当为不同图片时,转步骤S402。
如采用步骤S409,应预先存储常用图片及与常用图片所对应的待确认数据。预先存储常用图片及与常用图片所对应的待确认数据的过程可以采用以下两种方式的一种或两种方式相结合:
1.通过用户接口,定制常用图片及与常用图片所对应的待确认数据。具体为提供用户接口,用户个性化定制各种常用数据图片和与常用图片所对应的待确认数据,在系统中形成一个常用记录表,供用户选择。
2.系统采用优先级准则,在用户进行图片数据获取分析后,也即获取到确认信号,将所述待确认数据作为最终数据之后,每分析一次同样的图片,获取该图片的复用次数,将该图片的复用次数加1,根据所述图片复用次数,确定图片的优先级;将优先级满足预设规则的图片作为常用图片,将优先级满足预设规则的图片所对应的待确认数据作为与常用图片所对应的待确认数据。在一些实施例中,保存优先级和使用次数最频繁的一组数据作为模板提供给用户。
在一些实施例中,在存储与常用图片所对应的待确认数据时,还包括对存储的与常用图片所对应的待确认数据进行加密。因为这里的记忆功能涉及到相关的用户信息的安全功能,可以选择一些加密算法有效保护用户的数据,如将用户的身份证和银行卡号信息使用密码保护,或者也可以和SIM卡绑定,当系统检测到用户测试机更换SIM卡的时候,清除用户数据(用户选项),这里方法不限,可以给用户提供可选方式,也可以直接进行系统保护。
实施例4
当采用实施例2所述的数据录入装置时,本发明实施例的一种数据录入方法的流程如图6所示,首先获取上述任一实施例所述的最终数据,然后将该最终数据进行录入。本实施例的方法具体包括以下步骤:
S601:获取最终数据;
S602:将最终数据进行录入。
在一些实施例中,数据录入的过程具体包括:
1.获取当前的最终数据,该过程对用户透明化;
2:使用函数栈的形式,将获取的最终数据依次从后向前将最终数据放入函数栈中,为自动录入做数据准备;
3:从函数栈依次获取最终数据,调用键盘,逐个填写最终数据,若是最终数据中包含其他字母,灵活调用相应的输入法键盘。,需要说明的是,支持字母的前提是终端支持在在线询问过程中调入字母键盘,灵活处理即可。
4:输入完成弹出提示,请用户确认。
在一些实施例中,在进行第3步和第4步时,数据呈现单元14的示意图如图7所示。
参见图8,下面通过一个具体的实施例,对本实施例所提供的数据录入方法做进一步说明。
S801:用户需要从图片中获取长串数字或者字符。
S802:判定图片来源方式;需要说明的是,图片来源方式可以通过用户来选择。以下提供两种可选的图片来源方式S803和S804,通过任意一种方式都可以作为图片来源。
S803:拍照获取图片。通过调用照相机,进行拍照,照相机提供对应的接口将拍好的照片传递下去。
S804:用户从图库中选择已有的图片,由图库传递下去。
S805:数据分区截取处理机制——处理原图片获取数据分区,缩小数据分析范围,得到目标图片区域。例如,按照数据源特征进行提取。需要说明的是,该步骤的原图片为通过步骤S803和/或步骤S804获取的图片。
S806:数据片区杂质去除,需要说明的是,该技术不限于现有技术要求,可以根据数据分析的需要使用成熟技术。数据片区可以理解为目标图片区域的数据周围的杂质。
S807:数据提取,获取初始数据。
S808:数据合理性检测,进行数据比对,获取合理的初始数据。例如,将身份证、银行卡号等数据的位数比对和其他数据技术。
S809:数据准确性对比,从上述S808中的合理的初始数据进一步筛选出合理且准确的初始数据,将其作为待确认数据。
S810:通过对应接口将精确的数据传递到用户界面,也即将待确认数据呈现以供确认。
S811:判断待确认数据是否正确,访问用户是否选择数据自动录入。也即,获取用户的确认信号,若,获取到确认信号,则将该待确认数据作为最终数据,则执行S812,否则,则执行S801。
S812:将最终数据依次从后向前自动录入数据栈。
S813:从数据栈将最终数据自动输入相应的用户接口界面,提示用户录入完成,是否选择下一步或者重新录入其他信息。
S814:提示用户录入完成,请用户选择下一步操作。若是,则执行步骤S815,若否,则执行步骤S801。
S815:数据录入完成。
在一些实施例中,步骤S802之后和步骤S811之前,还包括步骤S816。
S816:若图片已经分析过,也即该图片与预先存储的常用图片进行对比,判断为相同图片,且有分析模板存在,也即,存储有与常用图片所对应的待确认数据,直接转到用户确认数据步骤,也即直接转到步骤S811。需要说明的是,在一些实施例中,用户可以选择存储3-6个模板,
在一些实施例中,从用户拍照完成或者获取图片或模板后,到获取到数据请用户确认输入这一过程需要全程对用户进行透明化,因此,需要给出用户明确提示和说明,让用户不会感到等待时间太长。
本发明可以用在但不限于以下系统:银行智能语音系统,如身份证号、银行卡号录入等,增加用户满意度;运营商客户服务智能语音系统,如身份证号、充值卡卡号等数据信息的输入,通过拍照获取到图片信息,然后由系统进行分析,获取到确定的数据进行自动录入;二维码数据录入系统,如二维码上条形数据的录入,二维码中的长长的浏览器网址信息,或者其他的商品码信息需要自动录入等。
本发明在用户与智能服务系统的交互过程中,通过图片分析获取长串数据,并自动录入,给用户提供方便快捷的输入;同时本发明通过分析和对比,对输入数据进行合理性和合法性的检测,可以有效降低出错概率,给用户提供准确高效的数据录入功能,提升了用户的体验,用户不需要再担心重复输入冗长的数据,还担心输入错误需要二次输入。
尽管为示例目的,已经公开了本发明的优选实施例,本领域的技术人员将意识到各种改进、增加和取代也是可能的,因此,本发明的范围应当不限于上述实施例。
Claims (15)
1.一种数据提取方法,其特征在于,包括:
获取当前待识别的图片;
对所述图片进行识别,得到初始数据;
从所述初始数据中选择合理和准确的数据作为待确认数据;
对所述待确认数据进行呈现以供确认;
获取到确认信号,将所述待确认数据作为最终数据。
2.如权利要求1所述的数据提取方法,其特征在于,所述对所述图片进行识别包括:
对所述图片进行图层识别,缩小所述图片的范围,得到目标图片区域;
去除所述目标图片区域的杂质,得到整洁的数据界面;
对所述整洁数据界面内的数据进行提取。
3.如权利要求2所述的数据提取方法,其特征在于,所述杂质包括:
所述目标图片区域中的所述数据周围的影响所述数据提取的色彩因素和/或数据界面。
4.如权利要求2所述的数据提取方法,其特征在于,所述对所述整洁数据界面内的数据进行提取之后,还包括:
初步判断含有字母的所述数据的数据类型;
将所述数据类型与所述数据进行匹配;
若匹配,则将所述数据作为合法数据;
将所述合法数据作为所述初始数据。
5.如权利要求4所述的数据提取方法,其特征在于,
若不匹配,则再次识读所述图片,以得到所述合法数据。
6.如权利要求1所述的数据提取方法,其特征在于,所述从所述初始数据中选择合理的数据作为待确认数据包括:
选择满足预先存储的长串数据函数的规则的所述初始数据作为待确认数据。
7.如权利要求1所述的数据提取方法,其特征在于,所述从所述初始数据中选择准确的数据作为待确认数据包括:
选择满足与常用的数字、字符图片模板的所述初始数据作为待确认数据。
8.如权利要求1所述的数据提取方法,其特征在于,所述从所述初始数据中选择合理和准确的数据作为待确认数据包括:
确认满足预先存储的长串数据函数的规则的所述初始数据的数据类型;
获取所述数据类型所对应的常用的数字模板和/或字符图片模板;
选择满足与常用的数字、字符图片模板的所述初始数据作为待确认数据。
9.如权利要求1所述的数据提取方法,其特征在于,所述获取到确认信号,将所述待确认数据作为最终数据之后,还包括:
获取所述图片的复用次数,将所述复用次数加1;
根据所述复用次数,确定所述图片的优先级;
将所述优先级满足预设规则的所述图片作为常用图片;
将所述优先级满足预设规则的所述图片所对应的待确认数据作为与所述常用图片所对应的待确认数据。
10.如权利要求1至9任一项所述的数据提取方法,其特征在于,所述获取当前待识别的图片之后,所述对所述待确认数据进行呈现以供确认之前,还包括:
将所述图片与预先存储的所述常用图片进行对比,判断是否为相同图片;
若判断为相同图片,对与所述常用图片所对应的待确认数据进行呈现以供确认。
11.如权利要求10所述的数据提取方法,其特征在于,所述获取当前待识别的图片之前,还包括:
通过用户接口,定制常用图片及与所述常用图片所对应的待确认数据;
预先存储所述常用图片及与所述常用图片所对应的待确认数据。
12.一种数据录入方法,其特征在于,包括:
获取如权利要求1-11任一项所述的最终数据;
将所述最终数据进行录入。
13.一种数据提取装置,其特征在于,包括:
图片采集单元,用于获取当前待识别的图片;
图片分析单元,用于对所述图片进行识别,得到初始数据;
智能检测单元,用于从所述初始数据中选择合理和准确的数据作为待确认数据;
数据呈现单元,用于对所述待确认数据进行呈现以供确认;
数据确认单元,获取到确认信号后,将所述待确认数据作为最终数据。
14.如权利要求13所述的数据提取装置,其特征在于,还包括:
快速判断单元,用于在所述获取当前待识别的图片之后,所述对所述待确认数据进行呈现以供确认之前,将所述图片与预先存储的常用图片进行对比,判断是否为相同图片;
所述数据确认单元,还用于若判断为相同图片,则确认与所述常用图片所对应的待确认数据,得到最终数据。
15.一种数据录入装置,其特征在于,包括:
获取单元,用于获取如权利要求1-11任一项所述的最终数据;
录入单元,用于将所述最终数据进行录入。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911136982.6A CN111062256B (zh) | 2013-12-03 | 2013-12-03 | 一种数据提取、录入方法及装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310645735.5A CN104679800A (zh) | 2013-12-03 | 2013-12-03 | 一种数据录入方法及装置 |
CN201911136982.6A CN111062256B (zh) | 2013-12-03 | 2013-12-03 | 一种数据提取、录入方法及装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310645735.5A Division CN104679800A (zh) | 2013-12-03 | 2013-12-03 | 一种数据录入方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111062256A true CN111062256A (zh) | 2020-04-24 |
CN111062256B CN111062256B (zh) | 2024-03-01 |
Family
ID=51897753
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310645735.5A Pending CN104679800A (zh) | 2013-12-03 | 2013-12-03 | 一种数据录入方法及装置 |
CN201911136982.6A Active CN111062256B (zh) | 2013-12-03 | 2013-12-03 | 一种数据提取、录入方法及装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310645735.5A Pending CN104679800A (zh) | 2013-12-03 | 2013-12-03 | 一种数据录入方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (2) | CN104679800A (zh) |
WO (1) | WO2014183694A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105976660A (zh) * | 2016-06-12 | 2016-09-28 | 河南职业技术学院 | 一种会计教学系统 |
CN106547891A (zh) * | 2016-10-28 | 2017-03-29 | 浙江大学 | 针对掌上显示设备的图片化文本信息的快速可视化方法 |
CN107491815A (zh) * | 2017-07-03 | 2017-12-19 | 西安交通大学 | 基于云服务平台的电力设备运维数据采集录入系统及方法 |
CN109902670A (zh) * | 2017-12-08 | 2019-06-18 | 亿度慧达教育科技(北京)有限公司 | 数据录入方法及系统 |
CN108595700A (zh) * | 2018-05-09 | 2018-09-28 | 广州市冰海网络技术有限公司 | 一种数据录入智能检测方法 |
CN110308898A (zh) * | 2019-07-06 | 2019-10-08 | 朱洪俊 | 一种提供导出打印的礼簿软件系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101515325A (zh) * | 2009-04-08 | 2009-08-26 | 北京邮电大学 | 基于字符切分和颜色聚类的数字视频中的字符提取方法 |
CN101739441A (zh) * | 2009-12-01 | 2010-06-16 | 中国建设银行股份有限公司 | 一种图像信息录入的方法以及系统 |
CN102479249A (zh) * | 2010-11-26 | 2012-05-30 | 中国科学院声学研究所 | 一种嵌入式浏览器内存缓存数据的淘汰方法 |
CN102654874A (zh) * | 2011-03-02 | 2012-09-05 | 顾菊林 | 单据数据管理方法及系统 |
US20120265759A1 (en) * | 2011-04-15 | 2012-10-18 | Xerox Corporation | File processing of native file formats |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1217290C (zh) * | 2003-07-07 | 2005-08-31 | 西安理工大学 | 二维条码身份证件防伪系统自动识读方法 |
CN100362525C (zh) * | 2005-06-06 | 2008-01-16 | 英华达(上海)电子有限公司 | 手机中使用图像识别进行名片信息的采集与录入的方法 |
CN100562092C (zh) * | 2007-06-25 | 2009-11-18 | 中兴通讯股份有限公司 | 基于可视电话通话的图片信息录入方法和系统 |
CN102054182A (zh) * | 2009-11-06 | 2011-05-11 | 山东新北洋信息技术股份有限公司 | 一种制票方法及制票装置 |
US20120087537A1 (en) * | 2010-10-12 | 2012-04-12 | Lisong Liu | System and methods for reading and managing business card information |
US8488916B2 (en) * | 2011-07-22 | 2013-07-16 | David S Terman | Knowledge acquisition nexus for facilitating concept capture and promoting time on task |
CN102622592B (zh) * | 2012-01-19 | 2015-04-22 | 北京友录在线科技发展有限公司 | 一种基于云技术的名片识别方法 |
-
2013
- 2013-12-03 CN CN201310645735.5A patent/CN104679800A/zh active Pending
- 2013-12-03 CN CN201911136982.6A patent/CN111062256B/zh active Active
-
2014
- 2014-05-22 WO PCT/CN2014/078175 patent/WO2014183694A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101515325A (zh) * | 2009-04-08 | 2009-08-26 | 北京邮电大学 | 基于字符切分和颜色聚类的数字视频中的字符提取方法 |
CN101739441A (zh) * | 2009-12-01 | 2010-06-16 | 中国建设银行股份有限公司 | 一种图像信息录入的方法以及系统 |
CN102479249A (zh) * | 2010-11-26 | 2012-05-30 | 中国科学院声学研究所 | 一种嵌入式浏览器内存缓存数据的淘汰方法 |
CN102654874A (zh) * | 2011-03-02 | 2012-09-05 | 顾菊林 | 单据数据管理方法及系统 |
US20120265759A1 (en) * | 2011-04-15 | 2012-10-18 | Xerox Corporation | File processing of native file formats |
Also Published As
Publication number | Publication date |
---|---|
CN111062256B (zh) | 2024-03-01 |
WO2014183694A1 (zh) | 2014-11-20 |
CN104679800A (zh) | 2015-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062256B (zh) | 一种数据提取、录入方法及装置 | |
US10089490B2 (en) | Business card management server, business card image acquiring apparatus, business card management method, business card image acquiring method, and storage medium | |
WO2017059700A1 (zh) | 一种身份验证方法及装置 | |
CN109388319B (zh) | 一种截图方法、截图装置、存储介质及终端设备 | |
KR101675728B1 (ko) | 정보처리기기를 이용한 사용자 인증 처리 방법 및 장치 | |
JP6163239B1 (ja) | 認証システム | |
US20190258838A1 (en) | Systems and Methods for Point of Sale Age Verification | |
KR100784968B1 (ko) | 휴대 단말기 및 그의 심카드별 데이터 구분 표시 방법 | |
WO2018106018A1 (ko) | 개인정보 저장소와 연동된 스마트 문서입력 시스템 및 그 방법 | |
CN112509586A (zh) | 电话信道声纹识别方法及装置 | |
CN110334590B (zh) | 图像采集引导方法以及装置 | |
KR100705164B1 (ko) | 휴대 단말기를 이용한 사용자 등록 시스템 및 방법 | |
JP5559440B1 (ja) | 通信開通システムおよび通信開通方法ならびに通信開通プログラム | |
CN111047358A (zh) | 基于人脸识别的会员信息查询方法及系统 | |
CN113709740A (zh) | 一种在授权登录页面显示账号信息的方法及系统 | |
CN110134920A (zh) | 绘文字兼容显示方法、装置、终端及计算机可读存储介质 | |
CN111192584A (zh) | 单据核销方法及系统 | |
EP3867846A1 (en) | Systems and methods for point of sale age verification | |
RU2721412C1 (ru) | Способ удалённой регистрации пользователя мобильной связи посредством устройства мобильной связи, снабжённого модулем съёмки и сенсорным экраном | |
CN108600084A (zh) | 信息传输方法、装置、存储介质及移动终端 | |
RU2736576C1 (ru) | Способ удалённой регистрации пользователя мобильной связи посредством устройства мобильной связи, снабжённого модулем съёмки и сенсорным экраном | |
RU188800U1 (ru) | Средство идентификации абонента в сети оператора связи | |
JP4150651B2 (ja) | 支援情報提供方法、支援情報提供プログラム及び情報提供管理システム | |
CN112579944A (zh) | 一种页面跳转处理方法、装置以及电子设备 | |
RU2732992C1 (ru) | Способ удалённой регистрации пользователя мобильной связи посредством устройства мобильной связи, снабжённого модулем съёмки и сенсорным экраном |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |