CN110598684A

CN110598684A - 识别图片中电话号码的方法、系统、终端设备及存储介质

Info

Publication number: CN110598684A
Application number: CN201910657437.5A
Authority: CN
Inventors: 杨絮
Original assignee: Gree Electric Appliances Inc of Zhuhai
Current assignee: Gree Electric Appliances Inc of Zhuhai
Priority date: 2019-07-19
Filing date: 2019-07-19
Publication date: 2019-12-20
Anticipated expiration: 2039-07-19
Also published as: CN110598684B

Abstract

本发明涉及一种识别图片中电话号码的方法、系统、终端设备及存储介质，该方法包括：获取待处理的图像；对所述待处理的图像进行边缘提取，得到边缘像素点集；根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理，识别所述图像中的内容。本发明提供的技术方案利用建立的高斯混合模型分割图像，将数字信息分割出来，通过识别得到图片中的电话号码，大大减少了在使用手机过程中因为手机无法自动识别图片中的电话号码给用户带来的不便。

Description

识别图片中电话号码的方法、系统、终端设备及存储介质

技术领域

本发明涉及图像处理技术领域，尤其涉及一种识别图片中电话号码的方法、系统、终端设备及存储介质。

背景技术

在生活中我们经常会遇到这种情况：我们在向别人询问另一个人的联系方式时，对方往往会直接给我们发来一张截图，这种情况下，我们一般的解决方式有两种，一种是靠记忆将电话号码记下来，再在拨号盘中输入进行拨号，另一种是将电话号码写在纸上，再在拨号盘上输入进行拨号。

但是，这两种方法在记忆力不好或者当前条件不允许的情况下都很不方便。

因此，需要提供一种识别图片中电话号码的方法、系统、终端设备及存储介质来解决现有技术的不足。

发明内容

为了解决现有技术中的问题，本发明提供了一种识别图片中电话号码的方法、系统、终端设备及存储介质。

本申请提供了一种识别图片中电话号码的方法，包括：

获取包含有电话号码的图像；

对所述图像进行边缘提取，得到边缘像素点集；

根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理，分割出所述图像中的内容；

识别所述分割出的内容，得到图像中的数字信息。

进一步地，所述高斯混合模型的建立，包括：

根据像素点的概率密度函数建立高斯混合目标函数；

根据期望最大化算法计算所述高斯混合目标函数中的目标参数。

进一步地，所述高斯混合目标函数，如下式所示：

其中，x_i为像素点，i＝1,2,...,N；Π＝{π₁,π₂,...,π_K}，π_j为像素x_i的先验概率；Θ_j为第j个成分分布的参数；Θ＝{Θ_j,j＝1,2,...,K}为所有参数的集合；σ_j和μ_j为参数。

进一步地，根据期望最大化算法计算所述高斯混合目标函数中的目标参数，包括：

步骤一、根据期望最大化算法初始化所述目标参数；

步骤二、根据所述目标参数计算贝叶斯后验概率中后验概率的值；

步骤三、根据高斯混合模型的对数似然函数计算更新后的目标参数；

步骤四、判断所述对数似然函数是否收敛；

步骤五、若所述对数似然函数未收敛，则返回步骤二；否则，根据所述贝叶斯后验概率对所述像素点进行标记分类。

进一步地，所述贝叶斯后验概率如下式所示：

其中，为x_i的贝叶斯后验概率；t为迭代的次数。

进一步地，高斯混合模型的对数似然函数，如下式所示：

进一步地，所述根据高斯混合模型的对数似然函数计算更新后的目标参数，包括：

对所述对数似然函数中的目标参数求偏导等于零时值，得到更新后的目标参数，所述更新后的目标参数如下式所示：

其中，为更新后的目标参数；t+1为迭代的次数。

进一步地，所述高斯混合模型的建立，还包括：

通过先验概率和边缘检测对所述高斯混合目标函数进行约束优化。

进一步地，所述先验概率如下式所示：

其中，π_ij为先验概率分布函数；ξ(x_i)为像素x_i的权重函数；Z_i为归一化因子；h(i,q)表示像素i和像素q间的像素值差；σ_g是函数的宽度参数；x_i和x_q分别是像素i和像素q的像素值。

进一步地，根据先验概率对所述高斯混合目标函数进行约束后得到的高斯混合目标函数，如下式所示：

本申请还提供了一种识别图片中电话号码的系统，包括：

获取模块，用于获取待处理的图像；

提取模块，用于对所述待处理的图像进行边缘提取，得到边缘像素点集；

分割模块，用于根据预先建立的高斯混合模型对所述边缘像素点集进行聚类处理，分割出所述图像中的内容；

识别模块，用于识别所述分割出的内容，得到图像中的数字信息。

本申请还提供了一种终端设备，所述终端设备包括存储器和处理器；所述存储器存储有应用程序的管控计算机程序，所述处理器执行所述计算机程序，以实现上述任意一项所述的识别图片中电话号码的方法。

本申请还提供了一种存储介质，所述存储介质存储有应用程序的管控计算机程序，所述计算机程序可被至少一个处理器执行，以实现上述任意一项所述的识别图片中电话号码的方法。

本发明的技术方案与最接近的现有技术相比具有如下优点：

本发明提供的技术方案首先获取包含有电话号码的图像，然后对该图像进行边缘提取，得到边缘像素点集，根据预先建立的高斯混合模型对上述边缘像素点集进行聚类处理，分割出图像中的内容，最后识别分割出的内容，得到图像中的数字信息。本发明提供的技术方案利用建立的高斯混合模型分割图像，将数字信息分割出来，通过识别得到图片中的电话号码，大大减少了在使用手机过程中因为手机无法自动识别图片中的电话号码给用户带来的不便。

附图说明

图1是本发明实施例中识别图片中电话号码的方法流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明中各步骤的执行主体可以是终端。该终端可以是诸如手机、平板电脑、掌上电脑、可穿戴设备、智能手环等终端设备。

如图1所述，本发明提供了一种识别图片中电话号码的方法，该方法可以包括以下步骤：

获取包含有电话号码的图像；

对所述图像进行边缘提取，得到边缘像素点集；

识别所述分割出的内容，得到图像中的数字信息。

在本申请实施例中，首先获取包含有电话号码的图像，然后对该图像进行边缘提取，得到边缘像素点集，根据预先建立的高斯混合模型对上述边缘像素点集进行聚类处理，分割出图像中的内容，最后识别分割出的内容，得到图像中的数字信息。本发明提供的技术方案利用建立的高斯混合模型分割图像，将数字信息分割出来，通过识别得到图片中的电话号码，大大减少了在使用手机过程中因为手机无法自动识别图片中的电话号码给用户带来的不便。

在本申请一些实施例中，对所述图像进行边缘提取，得到边缘像素点集，具体包括：

检测上述获取到的包含有电话号码的图像，对上述图像进行边缘提取，得到与上述图片对应的边缘像素点集。其中，边缘提取可以是本领域技术人员公知的边缘提取方法，在此不再赘述。

在本申请一些实施例中，高斯混合模型的建立，具体包括：

根据像素点的概率密度函数建立高斯混合目标函数；

也就是，先建立一个目标函数，然后对目标函数中的目标参数进行优化，得到高斯混合模型的建立。

建立模型的目的是通过像素的聚类对图像进行分割，即把每一个像素标签化，找出感兴趣的那一类标签对应的像素。

具体地，模型建立的过程如下所示：

其中，x_i为像素点，i＝1,2,...,N；Π＝{π₁,π₂,...,π_K}，π_j为像素x_i的先验概率；Θ_j为第j个成分分布的参数；Θ＝{Θ_j,j＝1,2,...,K}为所有参数的集合；σ_j和μ_j为参数；为x_i的贝叶斯后验概率；σ_j、μ_j和π_j为目标参数；为更新后的目标参数；π_ij为先验概率分布函数；ξ(x_i)为像素x_i的权重函数；Z_i为归一化因子；h(i,q)表示像素i和像素q间的像素值差；σ_g是函数的宽度参数；x_i和x_q分别是像素i和像素q的像素值；Ω₁,Ω₂,...,Ω_K表示K个标记，每个标记对应一个高斯模型，K个标记对应K个高斯模型；t及t+1分别为迭代的次数。

P(x_i|Θ_j)(j＝1,2,...,K)是每个标记对应的概率密度函数，其函数为：

则像素集服从有限混合分布，像素集对应的模型就是有限混合模型。其中Π＝{π₁,π₂,...,π_K}，π_j为像素x_i属于标记Ω_j的成分分布混合的先验概率。Θ_j为第j个成分分布的参数，Θ＝{Θ_j,j＝1,2,...,K}是所有参数的集合。对于先验概率π_ij而言，需满足：

若每个成分分布都是服从高斯分布，那么其所对应的模型就是高斯混合模型。

其中Θ_j＝{μ_j,σ_j}。像素样本之间具有统计独立性0≤π_ij≤1，则对于像素X＝(x₁,x₂,...,x_N)的联合条件密度为：

这是参数{Π,Θ}关于X的似然函数。由于对数函数具有单调性，对上式(3)取对数得到高斯混合模型的对数似然函数：

其中，Θ＝{Θ_j,j＝1,2,...,K}。

接下来可以使用期望最大化算法(EM算法)对上面的对数似然函数进行参数的估计以实现最大化对数似然函数，从而得到分割结果。

EM算法是一种求参数的极大似然估计的迭代算法，是一种较为简单而且实用的算法，该算法可以从不完全的数据集中去求解模型的参数。该方法处理不完全数据效果良好，被广泛的应用于处理截断数据、污染数据及缺失数据等。EM算法通过最大后验概率(MAP)或者极大似然估计(ML)方法去拟合有限的混合模型时，极大的简化为E步和M步两步，较为方便的估计出参数。

EM算法的E步是将计算完全数据的对数似然函数的期望转化为求x_i来自第j个高斯分量的贝叶斯后验概率：

上式表示x_i来自于Ω_j的贝叶斯后验概率。

M步是求取模型参数的极大似然估计，并对参数进行更新：

将(4)式分别对参数μ_j,σ_j,π_j求偏导数，并令其等于0得到：

其中，t及t+1分别代表迭代的次数，总结高斯混合模型的EM算法如下:

第1步：初始化参数{Θ,Π}＝{μ_j,σ_j,π_j}。

第2步(E步)：通过初始化的参数值计算(5)的后验概率的值。

第3步(M步)：通过(6)、(7)、(8)式更新参数μ_j,σ_j,π_j。

第4步：计算对数似然函数(4)，检测该函数或者参数是否收敛，若没有收敛则返回第2步。

EM算法执行完之后，使用(5)式对图像中的每个像素进行类标记分配。

然后对模型进行扩展和优化。具体就是加入两个约束。一个是基于空间邻域关系的先验概率约束，另一个是Canny边缘检测约束。然后用此模型对图像上所有像素点进行遍历。这两个约束的具体说明如下：

通过对像素的邻域信息进行考虑，将像素的邻域信息引入到高斯混合模型的先验概率分布中，对先验概率进行约束，进而提出高斯核函数的先验概率约束的高斯混合模型，图像中的像素，若它们的距离越是接近，那么它们的先验概率分布就可能越相似甚至相同。基于此，我们将高斯核函数，高斯径向基函数作为对像素先验概率分布的空间约束引入到高斯混合模型中对先验概率分布进行约束，并根据扩展的高斯混合模型引入每个像素属于每个类别的权重函数一起对先验概率分布进行约束。

在这个模型中，首先定义一个表示像素x_i属于Ω_j类的权重的函数：

这里，i和q属于邻域像素点，σ取值为10。将高斯核函数作为对像素概率分布的空间约束引入到高斯混合模型中对先验概率分布进行约束，先验概率分布为：

其中：

是归一化因子，h(i,q)表示像素i和像素q之间的像素值之差。h是像素i到像素q的相对像素值之差的高斯函数，即为两个像素点的相似性，高斯核函数表述如下：

其中，σ_g是函数的宽度参数，控制了相邻像素之间的径向作用范围，x_i和x_q别是像素i和像素q的像素值。在这个模型里σ_g取值为10，从式3到公式18可以看出当距离||x_i-x_q||增加时，函数h会减小。如果两个像素之间的像素距离越近，那么这两个像素属于同一类别的概率就越大；而两个像素之间的像素距离越远，那么这两个像素属于同一类别的概率就越小。

那么，结合原有高斯模型，高斯混合模型中x_i的密度函数为：

结合式(2)、(9)、(10)、(11)以及(12)得：

由于用混合高斯模型所提取的目标轮廓不明显，为了得到更清晰的边缘，避免感兴趣的目标边缘被平滑掉，我们需要在能量函数中引入边缘惩罚，这样就能很好地保持区域的边缘信息。边缘惩罚的引入能够减少边缘模糊从而更加精确的定位边缘。

由于对数函数是单调递增的函数，我们可以考虑求后验概率的负对数为：

当后验概率取得最大值时，能量函数最小。

其中，当分割对象确定时，和均为为定值，所以只需要求其他两项的最小值。所以通常能量函数可以表示为：

E＝{E₁(x_i|Ω_j,Θ)+E₂(Ω_j)} (15)

第一项为数据项，第二项为平滑度约束项。用Ω₁,Ω₂,...,Ω_K表示K个标记，Ω为所有标签的集合，在EM算法中，要使总的后验能量最小化：

对于给定x_i和Ω_j，似然能量为：

先验能量函数E₂(Ω_j)的形式为：

其中V_C(Ω_j)是区域能量，C是所有可能区域的集合。

在图像域中，我们假设一个像素具有最多4个邻域像素点：其邻域中的像素。那么这个区域的能量就是在邻近的像素对上定义的：

这里，s和t是邻域像素的标记对。其中，

我们用迭代算法来解(15)：

1、首先，我们有一个初始估计Ω⁰，它来自EM算法的前一个循环。

2、当1≤i≤N时，

3、重复步骤2，直到E₁(x_i|Ω_j)+E₂(Ω_j)收敛或达到最大值k。

现在希望分割保留由边缘检测算法获得的边缘，例如Canny边缘检测，Prewitt边缘检测或Sobel轮廓检测等。假设我们有一个二元边缘图z_i，其中如果第i个像素在边缘上，则z_i＝1，如果不是，则z_i＝0。然后我们修改(20)为：

最后加入高斯核函数和加入边缘约束的高斯混合模型中每个像素属于每个类别的权重函数一起对像素的先验概率进行约束，提出一种基于高斯核函数和边缘检测的先验概率约束的高斯混合模型。

通过上述模型就可以将图像中包含电话号码的信息分割出来，然后识别分割出来的内容，得到图像中的数字信息，也就是图片中的电话号码。其中识别图像中分割出来的内容是通过本领域技术人员公知的识别方法进行识别，此处不再赘述。

基于相同的发明构思本发明还提供了一种识别图片中电话号码的系统，该系统包括：

获取模块，用于获取待处理的图像；

本发明还提供了一种终端设备，所述终端设备包括存储器和处理器；所述存储器存储有应用程序的管控计算机程序，所述处理器执行所述计算机程序，以实现上述任意一项所述方法的步骤。

例如，所述处理器执行所述计算机程序，以实现如下步骤：

获取包含有电话号码的图像；

对所述图像进行边缘提取，得到边缘像素点集；

识别所述分割出的内容，得到图像中的数字信息。

在本申请一些实施例中，高斯混合模型的建立，具体包括：

根据像素点的概率密度函数建立高斯混合目标函数；

本发明还提供了一种存储介质，所述存储介质存储有应用程序的管控计算机程序，所述计算机程序可被至少一个处理器执行，以实现上述任意一项的识别图片中电话号码的方法步骤。

本发明实施例在具体实现时，可以参阅上述实施例，具有相同的技术效果。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

可以理解的是，本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现，处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits，ASIC)、数字信号处理器(Digital Signal Processing，DSP)、数字信号处理设备(DSP Device，DSPD)、可编程逻辑设备(Programmable LogicDevice，PLD)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现，可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种识别图片中电话号码的方法，其特征在于，包括：

获取包含有电话号码的图像；

对所述图像进行边缘提取，得到边缘像素点集；

识别所述分割出的内容，得到图像中的数字信息。

2.根据权利要求1所述的一种识别图片中电话号码的方法，其特征在于，所述高斯混合模型的建立，包括：

根据像素点的概率密度函数建立高斯混合目标函数；

3.根据权利要求2所述的一种识别图片中电话号码的方法，其特征在于，所述高斯混合目标函数，如下式所示：

4.根据权利要求3所述的一种识别图片中电话号码的方法，其特征在于，根据期望最大化算法计算所述高斯混合目标函数中的目标参数，包括：

步骤一、根据期望最大化算法初始化所述目标参数；

步骤四、判断所述对数似然函数是否收敛；

5.根据权利要求4所述的一种识别图片中电话号码的方法，其特征在于，所述贝叶斯后验概率如下式所示：

其中，为x_i的贝叶斯后验概率；t为迭代的次数。

6.根据权利要求5所述的一种识别图片中电话号码的方法，其特征在于，高斯混合模型的对数似然函数，如下式所示：

7.根据权利要求6所述的一种识别图片中电话号码的方法，其特征在于，所述根据高斯混合模型的对数似然函数计算更新后的目标参数，包括：

其中，为更新后的目标参数；t+1为迭代的次数。

8.根据权利要求2所述的一种识别图片中电话号码的方法，其特征在于，所述高斯混合模型的建立，还包括：

9.根据权利要求8所述的一种识别图片中电话号码的方法，其特征在于，所述先验概率如下式所示：

10.根据权利要求9所述的一种识别图片中电话号码的方法，其特征在于，根据先验概率对所述高斯混合目标函数进行约束后得到的高斯混合目标函数，如下式所示：

11.一种识别图片中电话号码的系统，其特征在于，包括：

获取模块，用于获取待处理的图像；

12.一种终端设备，其特征在于，所述终端设备包括存储器和处理器；所述存储器存储有应用程序的管控计算机程序，所述处理器执行所述计算机程序，以实现权利要求1-10中任意一项所述的识别图片中电话号码的方法。

13.一种存储介质，其特征在于，所述存储介质存储有应用程序的管控计算机程序，所述计算机程序可被至少一个处理器执行，以实现如权利要求1-10中任意一项所述的识别图片中电话号码的方法。