CN110598684A - 识别图片中电话号码的方法、系统、终端设备及存储介质 - Google Patents

识别图片中电话号码的方法、系统、终端设备及存储介质 Download PDF

Info

Publication number
CN110598684A
CN110598684A CN201910657437.5A CN201910657437A CN110598684A CN 110598684 A CN110598684 A CN 110598684A CN 201910657437 A CN201910657437 A CN 201910657437A CN 110598684 A CN110598684 A CN 110598684A
Authority
CN
China
Prior art keywords
image
gaussian mixture
pixel
function
telephone number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910657437.5A
Other languages
English (en)
Other versions
CN110598684B (zh
Inventor
杨絮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN201910657437.5A priority Critical patent/CN110598684B/zh
Publication of CN110598684A publication Critical patent/CN110598684A/zh
Application granted granted Critical
Publication of CN110598684B publication Critical patent/CN110598684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种识别图片中电话号码的方法、系统、终端设备及存储介质,该方法包括:获取待处理的图像;对所述待处理的图像进行边缘提取,得到边缘像素点集;根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理,识别所述图像中的内容。本发明提供的技术方案利用建立的高斯混合模型分割图像,将数字信息分割出来,通过识别得到图片中的电话号码,大大减少了在使用手机过程中因为手机无法自动识别图片中的电话号码给用户带来的不便。

Description

识别图片中电话号码的方法、系统、终端设备及存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种识别图片中电话号码的方法、系统、终端设备及存储介质。
背景技术
在生活中我们经常会遇到这种情况:我们在向别人询问另一个人的联系方式时,对方往往会直接给我们发来一张截图,这种情况下,我们一般的解决方式有两种,一种是靠记忆将电话号码记下来,再在拨号盘中输入进行拨号,另一种是将电话号码写在纸上,再在拨号盘上输入进行拨号。
但是,这两种方法在记忆力不好或者当前条件不允许的情况下都很不方便。
因此,需要提供一种识别图片中电话号码的方法、系统、终端设备及存储介质来解决现有技术的不足。
发明内容
为了解决现有技术中的问题,本发明提供了一种识别图片中电话号码的方法、系统、终端设备及存储介质。
本申请提供了一种识别图片中电话号码的方法,包括:
获取包含有电话号码的图像;
对所述图像进行边缘提取,得到边缘像素点集;
根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理,分割出所述图像中的内容;
识别所述分割出的内容,得到图像中的数字信息。
进一步地,所述高斯混合模型的建立,包括:
根据像素点的概率密度函数建立高斯混合目标函数;
根据期望最大化算法计算所述高斯混合目标函数中的目标参数。
进一步地,所述高斯混合目标函数,如下式所示:
其中,xi为像素点,i=1,2,...,N;Π={π12,...,πK},πj为像素xi的先验概率;Θj为第j个成分分布的参数;Θ={Θj,j=1,2,...,K}为所有参数的集合;σj和μj为参数。
进一步地,根据期望最大化算法计算所述高斯混合目标函数中的目标参数,包括:
步骤一、根据期望最大化算法初始化所述目标参数;
步骤二、根据所述目标参数计算贝叶斯后验概率中后验概率的值;
步骤三、根据高斯混合模型的对数似然函数计算更新后的目标参数;
步骤四、判断所述对数似然函数是否收敛;
步骤五、若所述对数似然函数未收敛,则返回步骤二;否则,根据所述贝叶斯后验概率对所述像素点进行标记分类。
进一步地,所述贝叶斯后验概率如下式所示:
其中,为xi的贝叶斯后验概率;t为迭代的次数。
进一步地,高斯混合模型的对数似然函数,如下式所示:
进一步地,所述根据高斯混合模型的对数似然函数计算更新后的目标参数,包括:
对所述对数似然函数中的目标参数求偏导等于零时值,得到更新后的目标参数,所述更新后的目标参数如下式所示:
其中,为更新后的目标参数;t+1为迭代的次数。
进一步地,所述高斯混合模型的建立,还包括:
通过先验概率和边缘检测对所述高斯混合目标函数进行约束优化。
进一步地,所述先验概率如下式所示:
其中,πij为先验概率分布函数;ξ(xi)为像素xi的权重函数;Zi为归一化因子;h(i,q)表示像素i和像素q间的像素值差;σg是函数的宽度参数;xi和xq分别是像素i和像素q的像素值。
进一步地,根据先验概率对所述高斯混合目标函数进行约束后得到的高斯混合目标函数,如下式所示:
本申请还提供了一种识别图片中电话号码的系统,包括:
获取模块,用于获取待处理的图像;
提取模块,用于对所述待处理的图像进行边缘提取,得到边缘像素点集;
分割模块,用于根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理,分割出所述图像中的内容;
识别模块,用于识别所述分割出的内容,得到图像中的数字信息。
本申请还提供了一种终端设备,所述终端设备包括存储器和处理器;所述存储器存储有应用程序的管控计算机程序,所述处理器执行所述计算机程序,以实现上述任意一项所述的识别图片中电话号码的方法。
本申请还提供了一种存储介质,所述存储介质存储有应用程序的管控计算机程序,所述计算机程序可被至少一个处理器执行,以实现上述任意一项所述的识别图片中电话号码的方法。
本发明的技术方案与最接近的现有技术相比具有如下优点:
本发明提供的技术方案首先获取包含有电话号码的图像,然后对该图像进行边缘提取,得到边缘像素点集,根据预先建立的高斯混合模型对上述边缘像素点集进行聚类处理,分割出图像中的内容,最后识别分割出的内容,得到图像中的数字信息。本发明提供的技术方案利用建立的高斯混合模型分割图像,将数字信息分割出来,通过识别得到图片中的电话号码,大大减少了在使用手机过程中因为手机无法自动识别图片中的电话号码给用户带来的不便。
附图说明
图1是本发明实施例中识别图片中电话号码的方法流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明中各步骤的执行主体可以是终端。该终端可以是诸如手机、平板电脑、掌上电脑、可穿戴设备、智能手环等终端设备。
如图1所述,本发明提供了一种识别图片中电话号码的方法,该方法可以包括以下步骤:
获取包含有电话号码的图像;
对所述图像进行边缘提取,得到边缘像素点集;
根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理,分割出所述图像中的内容;
识别所述分割出的内容,得到图像中的数字信息。
在本申请实施例中,首先获取包含有电话号码的图像,然后对该图像进行边缘提取,得到边缘像素点集,根据预先建立的高斯混合模型对上述边缘像素点集进行聚类处理,分割出图像中的内容,最后识别分割出的内容,得到图像中的数字信息。本发明提供的技术方案利用建立的高斯混合模型分割图像,将数字信息分割出来,通过识别得到图片中的电话号码,大大减少了在使用手机过程中因为手机无法自动识别图片中的电话号码给用户带来的不便。
在本申请一些实施例中,对所述图像进行边缘提取,得到边缘像素点集,具体包括:
检测上述获取到的包含有电话号码的图像,对上述图像进行边缘提取,得到与上述图片对应的边缘像素点集。其中,边缘提取可以是本领域技术人员公知的边缘提取方法,在此不再赘述。
在本申请一些实施例中,高斯混合模型的建立,具体包括:
根据像素点的概率密度函数建立高斯混合目标函数;
根据期望最大化算法计算所述高斯混合目标函数中的目标参数。
也就是,先建立一个目标函数,然后对目标函数中的目标参数进行优化,得到高斯混合模型的建立。
建立模型的目的是通过像素的聚类对图像进行分割,即把每一个像素标签化,找出感兴趣的那一类标签对应的像素。
具体地,模型建立的过程如下所示:
其中,xi为像素点,i=1,2,...,N;Π={π12,...,πK},πj为像素xi的先验概率;Θj为第j个成分分布的参数;Θ={Θj,j=1,2,...,K}为所有参数的集合;σj和μj为参数;为xi的贝叶斯后验概率;σj、μj和πj为目标参数;为更新后的目标参数;πij为先验概率分布函数;ξ(xi)为像素xi的权重函数;Zi为归一化因子;h(i,q)表示像素i和像素q间的像素值差;σg是函数的宽度参数;xi和xq分别是像素i和像素q的像素值;Ω12,...,ΩK表示K个标记,每个标记对应一个高斯模型,K个标记对应K个高斯模型;t及t+1分别为迭代的次数。
P(xij)(j=1,2,...,K)是每个标记对应的概率密度函数,其函数为:
则像素集服从有限混合分布,像素集对应的模型就是有限混合模型。其中Π={π12,...,πK},πj为像素xi属于标记Ωj的成分分布混合的先验概率。Θj为第j个成分分布的参数,Θ={Θj,j=1,2,...,K}是所有参数的集合。对于先验概率πij而言,需满足:
若每个成分分布都是服从高斯分布,那么其所对应的模型就是高斯混合模型。
其中Θj={μjj}。像素样本之间具有统计独立性0≤πij≤1,则对于像素X=(x1,x2,...,xN)的联合条件密度为:
这是参数{Π,Θ}关于X的似然函数。由于对数函数具有单调性,对上式(3)取对数得到高斯混合模型的对数似然函数:
其中,Θ={Θj,j=1,2,...,K}。
接下来可以使用期望最大化算法(EM算法)对上面的对数似然函数进行参数的估计以实现最大化对数似然函数,从而得到分割结果。
EM算法是一种求参数的极大似然估计的迭代算法,是一种较为简单而且实用的算法,该算法可以从不完全的数据集中去求解模型的参数。该方法处理不完全数据效果良好,被广泛的应用于处理截断数据、污染数据及缺失数据等。EM算法通过最大后验概率(MAP)或者极大似然估计(ML)方法去拟合有限的混合模型时,极大的简化为E步和M步两步,较为方便的估计出参数。
EM算法的E步是将计算完全数据的对数似然函数的期望转化为求xi来自第j个高斯分量的贝叶斯后验概率:
上式表示xi来自于Ωj的贝叶斯后验概率。
M步是求取模型参数的极大似然估计,并对参数进行更新:
将(4)式分别对参数μjjj求偏导数,并令其等于0得到:
其中,t及t+1分别代表迭代的次数,总结高斯混合模型的EM算法如下:
第1步:初始化参数{Θ,Π}={μjjj}。
第2步(E步):通过初始化的参数值计算(5)的后验概率的值。
第3步(M步):通过(6)、(7)、(8)式更新参数μjjj
第4步:计算对数似然函数(4),检测该函数或者参数是否收敛,若没有收敛则返回第2步。
EM算法执行完之后,使用(5)式对图像中的每个像素进行类标记分配。
然后对模型进行扩展和优化。具体就是加入两个约束。一个是基于空间邻域关系的先验概率约束,另一个是Canny边缘检测约束。然后用此模型对图像上所有像素点进行遍历。这两个约束的具体说明如下:
通过对像素的邻域信息进行考虑,将像素的邻域信息引入到高斯混合模型的先验概率分布中,对先验概率进行约束,进而提出高斯核函数的先验概率约束的高斯混合模型,图像中的像素,若它们的距离越是接近,那么它们的先验概率分布就可能越相似甚至相同。基于此,我们将高斯核函数,高斯径向基函数作为对像素先验概率分布的空间约束引入到高斯混合模型中对先验概率分布进行约束,并根据扩展的高斯混合模型引入每个像素属于每个类别的权重函数一起对先验概率分布进行约束。
在这个模型中,首先定义一个表示像素xi属于Ωj类的权重的函数:
这里,i和q属于邻域像素点,σ取值为10。将高斯核函数作为对像素概率分布的空间约束引入到高斯混合模型中对先验概率分布进行约束,先验概率分布为:
其中:
是归一化因子,h(i,q)表示像素i和像素q之间的像素值之差。h是像素i到像素q的相对像素值之差的高斯函数,即为两个像素点的相似性,高斯核函数表述如下:
其中,σg是函数的宽度参数,控制了相邻像素之间的径向作用范围,xi和xq别是像素i和像素q的像素值。在这个模型里σg取值为10,从式3到公式18可以看出当距离||xi-xq||增加时,函数h会减小。如果两个像素之间的像素距离越近,那么这两个像素属于同一类别的概率就越大;而两个像素之间的像素距离越远,那么这两个像素属于同一类别的概率就越小。
那么,结合原有高斯模型,高斯混合模型中xi的密度函数为:
结合式(2)、(9)、(10)、(11)以及(12)得:
由于用混合高斯模型所提取的目标轮廓不明显,为了得到更清晰的边缘,避免感兴趣的目标边缘被平滑掉,我们需要在能量函数中引入边缘惩罚,这样就能很好地保持区域的边缘信息。边缘惩罚的引入能够减少边缘模糊从而更加精确的定位边缘。
由于对数函数是单调递增的函数,我们可以考虑求后验概率的负对数为:
当后验概率取得最大值时,能量函数最小。
其中,当分割对象确定时,均为为定值,所以只需要求其他两项的最小值。所以通常能量函数可以表示为:
E={E1(xij,Θ)+E2j)} (15)
第一项为数据项,第二项为平滑度约束项。用Ω12,...,ΩK表示K个标记,Ω为所有标签的集合,在EM算法中,要使总的后验能量最小化:
对于给定xi和Ωj,似然能量为:
先验能量函数E2j)的形式为:
其中VCj)是区域能量,C是所有可能区域的集合。
在图像域中,我们假设一个像素具有最多4个邻域像素点:其邻域中的像素。那么这个区域的能量就是在邻近的像素对上定义的:
这里,s和t是邻域像素的标记对。其中,
我们用迭代算法来解(15):
1、首先,我们有一个初始估计Ω0,它来自EM算法的前一个循环。
2、当1≤i≤N时,
3、重复步骤2,直到E1(xij)+E2j)收敛或达到最大值k。
现在希望分割保留由边缘检测算法获得的边缘,例如Canny边缘检测,Prewitt边缘检测或Sobel轮廓检测等。假设我们有一个二元边缘图zi,其中如果第i个像素在边缘上,则zi=1,如果不是,则zi=0。然后我们修改(20)为:
最后加入高斯核函数和加入边缘约束的高斯混合模型中每个像素属于每个类别的权重函数一起对像素的先验概率进行约束,提出一种基于高斯核函数和边缘检测的先验概率约束的高斯混合模型。
通过上述模型就可以将图像中包含电话号码的信息分割出来,然后识别分割出来的内容,得到图像中的数字信息,也就是图片中的电话号码。其中识别图像中分割出来的内容是通过本领域技术人员公知的识别方法进行识别,此处不再赘述。
基于相同的发明构思本发明还提供了一种识别图片中电话号码的系统,该系统包括:
获取模块,用于获取待处理的图像;
提取模块,用于对所述待处理的图像进行边缘提取,得到边缘像素点集;
分割模块,用于根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理,分割出所述图像中的内容;
识别模块,用于识别所述分割出的内容,得到图像中的数字信息。
本发明还提供了一种终端设备,所述终端设备包括存储器和处理器;所述存储器存储有应用程序的管控计算机程序,所述处理器执行所述计算机程序,以实现上述任意一项所述方法的步骤。
例如,所述处理器执行所述计算机程序,以实现如下步骤:
获取包含有电话号码的图像;
对所述图像进行边缘提取,得到边缘像素点集;
根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理,分割出所述图像中的内容;
识别所述分割出的内容,得到图像中的数字信息。
在本申请实施例中,首先获取包含有电话号码的图像,然后对该图像进行边缘提取,得到边缘像素点集,根据预先建立的高斯混合模型对上述边缘像素点集进行聚类处理,分割出图像中的内容,最后识别分割出的内容,得到图像中的数字信息。本发明提供的技术方案利用建立的高斯混合模型分割图像,将数字信息分割出来,通过识别得到图片中的电话号码,大大减少了在使用手机过程中因为手机无法自动识别图片中的电话号码给用户带来的不便。
在本申请一些实施例中,对所述图像进行边缘提取,得到边缘像素点集,具体包括:
检测上述获取到的包含有电话号码的图像,对上述图像进行边缘提取,得到与上述图片对应的边缘像素点集。其中,边缘提取可以是本领域技术人员公知的边缘提取方法,在此不再赘述。
在本申请一些实施例中,高斯混合模型的建立,具体包括:
根据像素点的概率密度函数建立高斯混合目标函数;
根据期望最大化算法计算所述高斯混合目标函数中的目标参数。
也就是,先建立一个目标函数,然后对目标函数中的目标参数进行优化,得到高斯混合模型的建立。
建立模型的目的是通过像素的聚类对图像进行分割,即把每一个像素标签化,找出感兴趣的那一类标签对应的像素。
本发明还提供了一种存储介质,所述存储介质存储有应用程序的管控计算机程序,所述计算机程序可被至少一个处理器执行,以实现上述任意一项的识别图片中电话号码的方法步骤。
本发明实施例在具体实现时,可以参阅上述实施例,具有相同的技术效果。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (13)

1.一种识别图片中电话号码的方法,其特征在于,包括:
获取包含有电话号码的图像;
对所述图像进行边缘提取,得到边缘像素点集;
根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理,分割出所述图像中的内容;
识别所述分割出的内容,得到图像中的数字信息。
2.根据权利要求1所述的一种识别图片中电话号码的方法,其特征在于,所述高斯混合模型的建立,包括:
根据像素点的概率密度函数建立高斯混合目标函数;
根据期望最大化算法计算所述高斯混合目标函数中的目标参数。
3.根据权利要求2所述的一种识别图片中电话号码的方法,其特征在于,所述高斯混合目标函数,如下式所示:
其中,xi为像素点,i=1,2,...,N;Π={π12,...,πK},πj为像素xi的先验概率;Θj为第j个成分分布的参数;Θ={Θj,j=1,2,...,K}为所有参数的集合;σj和μj为参数。
4.根据权利要求3所述的一种识别图片中电话号码的方法,其特征在于,根据期望最大化算法计算所述高斯混合目标函数中的目标参数,包括:
步骤一、根据期望最大化算法初始化所述目标参数;
步骤二、根据所述目标参数计算贝叶斯后验概率中后验概率的值;
步骤三、根据高斯混合模型的对数似然函数计算更新后的目标参数;
步骤四、判断所述对数似然函数是否收敛;
步骤五、若所述对数似然函数未收敛,则返回步骤二;否则,根据所述贝叶斯后验概率对所述像素点进行标记分类。
5.根据权利要求4所述的一种识别图片中电话号码的方法,其特征在于,所述贝叶斯后验概率如下式所示:
其中,为xi的贝叶斯后验概率;t为迭代的次数。
6.根据权利要求5所述的一种识别图片中电话号码的方法,其特征在于,高斯混合模型的对数似然函数,如下式所示:
7.根据权利要求6所述的一种识别图片中电话号码的方法,其特征在于,所述根据高斯混合模型的对数似然函数计算更新后的目标参数,包括:
对所述对数似然函数中的目标参数求偏导等于零时值,得到更新后的目标参数,所述更新后的目标参数如下式所示:
其中,为更新后的目标参数;t+1为迭代的次数。
8.根据权利要求2所述的一种识别图片中电话号码的方法,其特征在于,所述高斯混合模型的建立,还包括:
通过先验概率和边缘检测对所述高斯混合目标函数进行约束优化。
9.根据权利要求8所述的一种识别图片中电话号码的方法,其特征在于,所述先验概率如下式所示:
其中,πij为先验概率分布函数;ξ(xi)为像素xi的权重函数;Zi为归一化因子;h(i,q)表示像素i和像素q间的像素值差;σg是函数的宽度参数;xi和xq分别是像素i和像素q的像素值。
10.根据权利要求9所述的一种识别图片中电话号码的方法,其特征在于,根据先验概率对所述高斯混合目标函数进行约束后得到的高斯混合目标函数,如下式所示:
11.一种识别图片中电话号码的系统,其特征在于,包括:
获取模块,用于获取待处理的图像;
提取模块,用于对所述待处理的图像进行边缘提取,得到边缘像素点集;
分割模块,用于根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理,分割出所述图像中的内容;
识别模块,用于识别所述分割出的内容,得到图像中的数字信息。
12.一种终端设备,其特征在于,所述终端设备包括存储器和处理器;所述存储器存储有应用程序的管控计算机程序,所述处理器执行所述计算机程序,以实现权利要求1-10中任意一项所述的识别图片中电话号码的方法。
13.一种存储介质,其特征在于,所述存储介质存储有应用程序的管控计算机程序,所述计算机程序可被至少一个处理器执行,以实现如权利要求1-10中任意一项所述的识别图片中电话号码的方法。
CN201910657437.5A 2019-07-19 2019-07-19 识别图像中电话号码的方法、系统、终端设备及存储介质 Active CN110598684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910657437.5A CN110598684B (zh) 2019-07-19 2019-07-19 识别图像中电话号码的方法、系统、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910657437.5A CN110598684B (zh) 2019-07-19 2019-07-19 识别图像中电话号码的方法、系统、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN110598684A true CN110598684A (zh) 2019-12-20
CN110598684B CN110598684B (zh) 2021-10-15

Family

ID=68853017

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910657437.5A Active CN110598684B (zh) 2019-07-19 2019-07-19 识别图像中电话号码的方法、系统、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN110598684B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583274A (zh) * 2020-04-30 2020-08-25 贝壳技术有限公司 图像分割方法、装置、计算机可读存储介质及电子设备
CN113243891A (zh) * 2021-05-31 2021-08-13 平安科技(深圳)有限公司 轻度认知障碍识别方法、装置、计算机设备及存储介质
CN113657385A (zh) * 2021-10-20 2021-11-16 山东摄云信息技术有限公司 一种电子计量装置的数据检测方法、装置及电子设备
CN115953774A (zh) * 2023-03-08 2023-04-11 济宁安泰矿山设备制造有限公司 基于机器视觉的报警器显示数码识别方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070122039A1 (en) * 2005-11-29 2007-05-31 Microsoft Corporation Segmentation of objects by minimizing global-local variational energy
CN101639760A (zh) * 2009-08-27 2010-02-03 上海合合信息科技发展有限公司 联系信息输入方法及系统
CN101976265A (zh) * 2010-11-17 2011-02-16 上海合合信息科技发展有限公司 自动判断电话号码并添加联系人的方法
CN102360496A (zh) * 2011-10-19 2012-02-22 西安电子科技大学 基于gmm参数迁移聚类的sar图像分割方法
CN102637298A (zh) * 2011-12-31 2012-08-15 辽宁师范大学 基于高斯混合模型与支持向量机的彩色图像分割方法
CN102761668A (zh) * 2012-07-13 2012-10-31 青岛海信传媒网络技术有限公司 基于图片中的电话号码信息拨打电话的方法及装置
CN103595861A (zh) * 2013-10-23 2014-02-19 南京邮电大学 一种终端识别电话号码自动拨号或发送短信的方法
CN104915664A (zh) * 2015-05-22 2015-09-16 腾讯科技(深圳)有限公司 联系对象标识获取方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070122039A1 (en) * 2005-11-29 2007-05-31 Microsoft Corporation Segmentation of objects by minimizing global-local variational energy
CN101639760A (zh) * 2009-08-27 2010-02-03 上海合合信息科技发展有限公司 联系信息输入方法及系统
CN101976265A (zh) * 2010-11-17 2011-02-16 上海合合信息科技发展有限公司 自动判断电话号码并添加联系人的方法
CN102360496A (zh) * 2011-10-19 2012-02-22 西安电子科技大学 基于gmm参数迁移聚类的sar图像分割方法
CN102637298A (zh) * 2011-12-31 2012-08-15 辽宁师范大学 基于高斯混合模型与支持向量机的彩色图像分割方法
CN102761668A (zh) * 2012-07-13 2012-10-31 青岛海信传媒网络技术有限公司 基于图片中的电话号码信息拨打电话的方法及装置
CN103595861A (zh) * 2013-10-23 2014-02-19 南京邮电大学 一种终端识别电话号码自动拨号或发送短信的方法
CN104915664A (zh) * 2015-05-22 2015-09-16 腾讯科技(深圳)有限公司 联系对象标识获取方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋艳涛等: "基于图像片马尔科夫随机场的脑MR图像分割算法", 《自动化学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583274A (zh) * 2020-04-30 2020-08-25 贝壳技术有限公司 图像分割方法、装置、计算机可读存储介质及电子设备
CN113243891A (zh) * 2021-05-31 2021-08-13 平安科技(深圳)有限公司 轻度认知障碍识别方法、装置、计算机设备及存储介质
CN113657385A (zh) * 2021-10-20 2021-11-16 山东摄云信息技术有限公司 一种电子计量装置的数据检测方法、装置及电子设备
CN115953774A (zh) * 2023-03-08 2023-04-11 济宁安泰矿山设备制造有限公司 基于机器视觉的报警器显示数码识别方法

Also Published As

Publication number Publication date
CN110598684B (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
CN110598684B (zh) 识别图像中电话号码的方法、系统、终端设备及存储介质
CN109543714B (zh) 数据特征的获取方法、装置、电子设备及存储介质
Chaki et al. A comprehensive survey on image binarization techniques
CN108830780B (zh) 图像处理方法及装置、电子设备、存储介质
CN110059596B (zh) 一种图像识别方法、装置、介质和电子设备
CN108985190B (zh) 目标识别方法和装置、电子设备、存储介质
US8396303B2 (en) Method, apparatus and computer program product for providing pattern detection with unknown noise levels
CN112561080A (zh) 样本筛选方法、样本筛选装置及终端设备
CN111931859B (zh) 一种多标签图像识别方法和装置
Wang et al. Morphological background detection and illumination normalization of text image with poor lighting
CN110349161B (zh) 图像分割方法、装置、电子设备、及存储介质
CN112614110B (zh) 评估图像质量的方法、装置及终端设备
CN110942090A (zh) 模型训练、图像处理方法、装置、电子设备及存储介质
Brekhna et al. Robustness analysis of superpixel algorithms to image blur, additive Gaussian noise, and impulse noise
CN113920382B (zh) 基于类一致性结构化学习的跨域图像分类方法和相关装置
Frantc et al. Machine learning approach for objective inpainting quality assessment
Han et al. Segmenting images with complex textures by using hybrid algorithm
CN114255381A (zh) 图像识别模型的训练方法、图像识别方法、装置及介质
Ashir Multilevel thresholding for image segmentation using mean gradient
CN113313179A (zh) 一种基于l2p范数鲁棒最小二乘法的噪声图像分类方法
Rao et al. An enhanced video inpainting technique with grey wolf optimization for object removal application
Wang et al. 1D barcode region detection based on the Hough transform and support vector machine
Zhao et al. Blur feature extraction plus automatic KNN matting: a novel two stage blur region detection method for local motion blurred images
CN111695526B (zh) 网络模型生成方法、行人重识别方法及装置
CN111966851B (zh) 基于少量样本的图像识别方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant