CN108664617A - 基于图像识别与检索的快速营销服务方法 - Google Patents

基于图像识别与检索的快速营销服务方法 Download PDF

Info

Publication number
CN108664617A
CN108664617A CN201810453984.7A CN201810453984A CN108664617A CN 108664617 A CN108664617 A CN 108664617A CN 201810453984 A CN201810453984 A CN 201810453984A CN 108664617 A CN108664617 A CN 108664617A
Authority
CN
China
Prior art keywords
image
retrieval
text
information
quick
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810453984.7A
Other languages
English (en)
Inventor
覃煜
王红斌
张敏
罗思敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Ke Teng Information Technology Co Ltd
Guangzhou Power Supply Bureau Co Ltd
Original Assignee
Guangzhou Ke Teng Information Technology Co Ltd
Guangzhou Power Supply Bureau Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Ke Teng Information Technology Co Ltd, Guangzhou Power Supply Bureau Co Ltd filed Critical Guangzhou Ke Teng Information Technology Co Ltd
Priority to CN201810453984.7A priority Critical patent/CN108664617A/zh
Publication of CN108664617A publication Critical patent/CN108664617A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Multimedia (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图像识别与检索的快速营销服务方法,该方法基于电力系统快速营销服务系统中客户资料的图像数据进行图像的分析与信息的检索;进行图像分析是通过采集服务对象的图像信息,并对图像信息进行分析识别提取检索条件,图像分析包括图像预处理、文本定位以及文本识别步骤;然后依据检索条件在电力系统快速营销服务系统的客户资料数据库中进行信息检索。本发明通过图像自动识别与检索技术,能够实现从图像数据中自动地提取信息,并实现相关信息的自动核对与快速查新,提高了资料核查效率,缩短了查询时间,提高了工作效率,减少了业务周转时间带来的经济损失,提高了快速营销的服务质量、精细化管理能力以及客户满意度。

Description

基于图像识别与检索的快速营销服务方法
技术领域
本发明涉及电力系统技术领域,特别是一种电力系统的快速营销服务方法。
背景技术
电力系统是我国经济建设和人民生活的基础和保障,电力系统的稳固发展可以更好地满足我国经济建设的开展,保证人民生活水平的提升。
电力系统营销指的是在电力市场的发展过程中,电力企业在经济环境的变化下,以用电客户为核心,保证电力用户充分地获得稳定、持续、安全、可靠的电力产品和细致的服务。电力营销管理是供电企业管理工作的重要组成部分,是电力从生产到消费的最后环节,并使电力生产成果最终得到体现,直接关系到供电企业的经济效益和社会效益。供电企业营销管理部门是沟通电力系统和用户的桥梁,是电力企业的窗口,其工作质量关系到电力系统的形象。电力营销管理具有三个重要的特征:一是电力系统营销管理必须使用最先进的管理手段;其次是我国的电力营销管理必须具备最完善的电力营销管理制度;最后电力系统营销必须具有最一流的营销服务。
然而,现有的营销服务系统大多是通过传统的文档保存方式和文字查询的方式来查询电费档案与客户资料,费时费力,工作效率低下。如果想从图像中提取信息来进行档案与资料的查询,就会大大提高工作效率;但是,就目前的系统而言需要的人力成本高,耗费时间长,不利于企业创新,无法适应图像数据线性增长的要求。
发明内容
本发明需要解决的技术问题是提供一种应用于电力系统的快速营销服务方法,能够实现从图像数据中自动地提取信息,并实现相关信息的自动核对与快速查新,提高快速营销的服务质量和精细化管理能力。
为解决上述技术问题,本发明所采取的技术方案如下。
一种基于图像识别与检索的快速营销服务方法,该方法基于电力系统快速营销服务系统中客户资料的图像数据进行图像的分析与信息的检索,主要包括以下步骤:
A.进行图像分析,通过采集服务对象的图像信息,并对图像信息进行分析识别提取检索条件;
B.依据检索条件在电力系统快速营销服务系统的客户资料数据库中进行信息检索。
上述基于图像识别与检索的快速营销服务方法,步骤A包括图像预处理、文本定位以及文本识别步骤。
上述基于图像识别与检索的快速营销服务方法,步骤A中所述图像预处理主要包括以下内容:
A11.灰度化处理;将基于GRB模型的彩色图转换为只由灰度值表示的灰度文本图像;
A12.图像去噪;采用中值滤波方法对灰度文本图像进行去噪处理,滤除文本行间字段的字符边缘;
A13.图像二值化处理;采用结合White算法以及灰度分布比例的自适应二值化算法将灰度文本图像转换为二值图。
上述基于图像识别与检索的快速营销服务方法,骤A中所述文本定位主要包括以下内容:
A21.文本粗定位;采用基于形态学的文本检测方法提高二值图中相关度不高的字符、笔画、标点的联系程度,得到候选文本图;
A22.文本图像筛选;在候选文本图中选取证件号码为检索文本图像。
上述基于图像识别与检索的快速营销服务方法,步骤A中所述文本识别的方法为:采用基于深度神经网络的文字识别方法将以图像形式文字信息存在的检索文本图像转换为以字符形式文字信息存在的检索字段作为检索条件。
由于采用了以上技术方案,本发明所取得技术进步如下。
本发明通过图像自动识别与检索技术,能够实现从图像数据中自动地提取信息,并实现相关信息的自动核对与快速查新,提高了资料核查效率,缩短了查询时间,提高了工作效率,减少了业务周转时间带来的经济损失,提高了快速营销的服务质量、精细化管理能力以及客户满意度。
附图说明
图1为本发明的流程图。
具体实施方式
下面将结合附图和具体实施例对本发明进行进一步详细说明。
一种基于图像识别与检索的快速营销服务方法,该方法基于电力系统快速营销服务系统中客户资料的图像数据进行图像的分析与信息的检索,其流如图1所示,主要包括以下步骤。
A.进行图像分析,通过采集服务对象的图像信息,并对图像信息进行分析识别提取检索条件。本步骤主要包括图像预处理、文本定位以及文本识别步骤。
其中,图像预处理主要是通过对图像数据进行预处理,来降低数据在生成、传输、接受时产生的噪声,增强有用信号强度,具体方法如下。
A11.灰度化处理;灰度化过程本质即是将彩色图转换为只由灰度值表示的灰度图,应用于本发明中个,即是将基于GRB模型的彩色图转换为只由灰度值表示的灰度文本图像。
一般的图片数据是基于GRB模型,分别代表红、绿、蓝三种颜色的分量,值域为[0,255],根据三种分量取值的不同,可以组合出不同的颜色。储存一张M×N尺寸的彩色图片需要一个M×N×3的三维矩阵,第三维用于储存颜色分量。当三个颜色分量的值相等时,只需一个M×N的矩阵表示,此时颜色分量的值称为灰度值,也叫亮度值。灰度化的方法主要有最大值法、平均值法和加权平均值法。本发明中个优选采用平均值法。
A12.图像去噪;采用中值滤波方法对灰度文本图像进行去噪处理,滤除文本行间字段的字符边缘。
图像在获取、传输和分析等过程中会受到内部或外部的干扰,干扰因素会妨碍人类和机器对图片进行感知,众多干扰因素统称为噪声。常见的图像去噪方法有均值滤波、中值滤波、小波滤波和维纳滤波法,由于不同的噪声对不同类型图像分析会造成不同的影响,针对文本图像,其噪声产生原因主要由光照不均匀产生,通常出现在文本行间字段的字符边缘,因此本发明中优选采用中值滤波法进行图像去噪。
A13.图像二值化处理。
二值化处理是按照阈值T和一定的规则g(x,y)将灰度图中每一像素的值转化为0或1的过程,处理后的图片称为二值图,只有黑和白两种颜色。
本发明中,采用结合White算法以及灰度分布比例的自适应二值化算法将灰度文本图像转换为二值图。局部窗口的选取方法与White算法基本相同,由于无需对窗内每个像素计算平均方差,所以算法所需的时间消耗更少,适用于实时查询。Thresh为窗口内二值化阈值,mean为窗口内平均灰度值,k、a分别为常数(本文k=0.9,a=0.2),mp是亮度中等像素值比例,即一个窗内像素值在[64,191]的像素占总像素的比例。
上述自适应算法对非均匀光照条件下的图像二值化有较好效果,既能提高执行速率又能保证准确率。
由于图像数据包含众多信息,很难从图像中直接识别文字,需要通过一些特定手段在图像中检测出含有文字的区域,因此本发明中增加了文本定位的步骤。文本定位的作用就是检测并筛选出最可能的文本区域,本发明中,主要包括文本粗定位和文本图像的筛选。
A21.文本粗定位。
文本的粗定位是采用基于形态学的文本检测方法,该方法的关键是选取合适的结构元素和参数对图像进行膨胀、腐蚀、开操作等形态学处理手段,提高二值图中相关度不高的字符、笔画、标点的联系程度,得到候选文本图。
客户图像资料多为证件、图纸、图片等,经过预处理后得到的图像背景复杂度相对较低,将基于形态学的文本检测方法应用于背景与文本区分度较高的图像中进行文本定位,能同时兼顾高准确率与快速的检测速度。
A22.文本图像筛选;在候选文本图中选取证件号码为检索文本图像。
文本粗定位并不是一步到位,通过文本检测得到的图像为文本候选图像,里面包含的信息未必是所需要的信息。因此,需要对文本候选图像的信息区域进行筛选。本发明中,信息的检索使用证件号码为检索条件,而证件的号码在图像中的分布具有连续性和固定性,号码候选区域一般为细长的矩形图形,长宽比稳定在一定范围内,并且该区域的子元素数量也稳定在一个范围。以身份证为例,含身份证号码文本候选区域长宽比一般为:8.7至12.8;子元素数量,即身份证号码位数一般为18位。
通过文本图像筛选后,得到检索文本图像,然后通过文本识别,将以图像形式文字信息存在的检索文本图像转换为以字符形式文字信息存在的检索字段作为检索条件。
本发明中,文本识别采用基于深度神经网络的文字识别方法进行信息转换。深度神经网络主要由输入层、采样层、全连接层和输出层组成,其特点是局部连接以及权值共享,可以通过大量的训练数据训练出特定分类功能的神经网络;可根据实际需要更改层数和卷积核的数量和大小。
卷积神经网络能很好实现端到端的识别。主要过程分为训练与工作两部分。训练过程是利用大量数据反复进行前向传播的特征预测以及反向传播的权值更新的优化过程,目的是迭代出一组能使损失函数达到最小的权值,即神经网络的参数;工作过程是图片通过卷积层和采样层处理后特征变得明显,再根据概率决定图片最终的归类。
B.然后,依据检索条件在电力系统快速营销服务系统的客户资料数据库中进行信息检索,即可获得客户资料,为实现快速为客户提供服务提供了可靠保证。

Claims (5)

1.基于图像识别与检索的快速营销服务方法,其特征在于,该方法基于电力系统快速营销服务系统中客户资料的图像数据进行图像的分析与信息的检索,主要包括以下步骤:
A.进行图像分析,通过采集服务对象的图像信息,并对图像信息进行分析识别提取检索条件;
B.依据检索条件在电力系统快速营销服务系统的客户资料数据库中进行信息检索。
2.根据权利要求1所述的基于图像识别与检索的快速营销服务方法,其特征在于,步骤A包括图像预处理、文本定位以及文本识别步骤。
3.根据权利要求2所述的基于图像识别与检索的快速营销服务方法,其特征在于,步骤A中所述图像预处理主要包括以下内容:
A11.灰度化处理;将基于GRB模型的彩色图转换为只由灰度值表示的灰度文本图像;
A12.图像去噪;采用中值滤波方法对灰度文本图像进行去噪处理,滤除文本行间字段的字符边缘;
A13.图像二值化处理;采用结合White算法以及灰度分布比例的自适应二值化算法将灰度文本图像转换为二值图。
4.根据权利要求2所述的基于图像识别与检索的快速营销服务方法,其特征在于,步骤A中所述文本定位主要包括以下内容:
A21.文本粗定位;采用基于形态学的文本检测方法提高二值图中相关度不高的字符、笔画、标点的联系程度,得到候选文本图;
A22.文本图像筛选;在候选文本图中选取证件号码为检索文本图像。
5.根据权利要求4所述的基于图像识别与检索的快速营销服务方法,其特征在于,步骤A中所述文本识别的方法为:采用基于深度神经网络的文字识别方法将以图像形式文字信息存在的检索文本图像转换为以字符形式文字信息存在的检索字段作为检索条件。
CN201810453984.7A 2018-05-14 2018-05-14 基于图像识别与检索的快速营销服务方法 Pending CN108664617A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810453984.7A CN108664617A (zh) 2018-05-14 2018-05-14 基于图像识别与检索的快速营销服务方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810453984.7A CN108664617A (zh) 2018-05-14 2018-05-14 基于图像识别与检索的快速营销服务方法

Publications (1)

Publication Number Publication Date
CN108664617A true CN108664617A (zh) 2018-10-16

Family

ID=63779475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810453984.7A Pending CN108664617A (zh) 2018-05-14 2018-05-14 基于图像识别与检索的快速营销服务方法

Country Status (1)

Country Link
CN (1) CN108664617A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800287A (zh) * 2021-04-15 2021-05-14 杭州欧若数网科技有限公司 基于图数据库的全文索引方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102207966A (zh) * 2011-06-01 2011-10-05 华南理工大学 基于对象标签的视频内容快速检索方法
CN102332096A (zh) * 2011-10-17 2012-01-25 中国科学院自动化研究所 一种视频字幕文本提取和识别的方法
CN102779140A (zh) * 2011-05-13 2012-11-14 富士通株式会社 一种关键词获取方法及装置
CN104933068A (zh) * 2014-03-19 2015-09-23 阿里巴巴集团控股有限公司 一种信息搜索的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779140A (zh) * 2011-05-13 2012-11-14 富士通株式会社 一种关键词获取方法及装置
CN102207966A (zh) * 2011-06-01 2011-10-05 华南理工大学 基于对象标签的视频内容快速检索方法
CN102332096A (zh) * 2011-10-17 2012-01-25 中国科学院自动化研究所 一种视频字幕文本提取和识别的方法
CN104933068A (zh) * 2014-03-19 2015-09-23 阿里巴巴集团控股有限公司 一种信息搜索的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800287A (zh) * 2021-04-15 2021-05-14 杭州欧若数网科技有限公司 基于图数据库的全文索引方法和系统
CN112800287B (zh) * 2021-04-15 2021-07-09 杭州欧若数网科技有限公司 基于图数据库的全文索引方法和系统

Similar Documents

Publication Publication Date Title
He et al. A fully convolutional neural network for wood defect location and identification
Paris et al. A topological approach to hierarchical segmentation using mean shift
CN110675368B (zh) 一种融合图像分割与分类的细胞图像语义分割方法
CN109102037A (zh) 中文模型训练、中文图像识别方法、装置、设备及介质
CN110033000A (zh) 一种票据图像的文本检测与识别方法
WO2018049084A1 (en) Methods and systems for human imperceptible computerized color transfer
US20200134382A1 (en) Neural network training utilizing specialized loss functions
CN104463195A (zh) 基于模板匹配的印刷体数字识别方法
CN103593670A (zh) 一种基于在线序列极限学习机的铜板带表面缺陷检测方法
CN103914708A (zh) 基于机器视觉的食品品种检测方法及系统
Wang et al. A hybrid method for the segmentation of a ferrograph image using marker-controlled watershed and grey clustering
CN111127360A (zh) 一种基于自动编码器的灰度图像迁移学习方法
Choe et al. The Real‐Time Mobile Application for Classifying of Endangered Parrot Species Using the CNN Models Based on Transfer Learning
CN108376257B (zh) 一种燃气表不完整码字识别方法
CN115082776A (zh) 一种基于图像识别的电能表自动检测系统及方法
CN115830585A (zh) 一种基于图像增强的港口集装箱号识别方法
CN114170418A (zh) 一种以图搜图的汽车线束连接器多特征融合图像检索方法
Biswas et al. A global-to-local approach to binarization of degraded document images
CN112330562B (zh) 一种异构遥感图像变换方法及系统
CN108664617A (zh) 基于图像识别与检索的快速营销服务方法
CN108154116A (zh) 一种图像识别方法及系统
Yao et al. Invoice detection and recognition system based on deep learning
CN103871084B (zh) 蓝印花布图案识别方法
US11715288B2 (en) Optical character recognition using specialized confidence functions
CN111754459B (zh) 基于统计深度特征的染色伪造图像检测方法及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181016

RJ01 Rejection of invention patent application after publication