CN111652130B

CN111652130B - 一种非特定字体的数字、符号和字母组的识别方法

Info

Publication number: CN111652130B
Application number: CN202010491654.4A
Authority: CN
Inventors: 唐志展
Original assignee: Shanghai Richvoice Information Technology Co ltd
Current assignee: Shanghai Richvoice Information Technology Co ltd
Priority date: 2020-06-02
Filing date: 2020-06-02
Publication date: 2023-09-15
Anticipated expiration: 2040-06-02
Also published as: CN111652130A

Abstract

本发明提出一种非特定字体的数字、符号和字母组的识别方法，包括以下步骤：信息采集模块、图形分析模块、图形采样模块、图形预测模块、模型比对模块、字符比对模块、模型更新模块。本发明提供的非特定字体的数字、符号和字母组的识别方法，通过工业作业中使用的PDA的扫描头或摄像头，采集非特定字体的数字、符号、字母及其组合并在PDA中进行识别，解决当前工业环境使用的所有PDA可以无须联网就通过自身的条码扫描头能够快速且准确的采集各种字体的一组数字、符号、字母或其组合。

Description

一种非特定字体的数字、符号和字母组的识别方法

技术领域

本发明属于工业环境信息采集识别技术领域，具体涉及一种基于需求响应的非特定字体的数字、符号和字母组的识别方法、装置和存储介质。

背景技术

当前工业环境中，需要采集作为商品或部件的编号的各种字体的一组数字、符号、字母或它们的组合(但不是条码)的信息上传到管理和追溯系统中。在通过工业作业中使用的智能终端(以下称PDA)的扫描头或摄像头，采集数字、符号、字母及其组合并进行识别的领域，目前市场上有三种技术：

一、“基恩士(KEYENCE)”品牌的工业PDA可通过条码扫描头采集识别非特定字体的数字、符号、字母及其组合；

二、其余品牌工业PDA设备的条码扫描头可以采集识别一种叫OCR字体的一组数字、符号、字母或它们的组合。

三、通过工业PDA条码扫描头采集需要识别的各种字体的数字、符号、字母及其组合，上传互联网的云端服务器中，通过服务器中的图形识别引擎+AI大数据图形分析然后输出结果。

上述现有技术具有以下的缺点和不足：

“基恩士(KEYENCE)”品牌将技术罐装到芯片中，再将该芯片植入到设备中，如果要获得该采集识别功能只能购买硬件PDA，而其他广泛的各种品牌PDA无法使用该功能。

另外，对于“基恩士(KEYENCE)”设备本身来说，由于是通过封装硬件芯片来实现的功能，因此也无法在当前设备上进行升级和优化，只能报废旧版本设备再购买新一代产品，这造成了巨大浪费。

其余品牌工业PDA设备的条码扫描头只能采集识别一种叫OCR字体的一组数字、符号、字母或它们的组合，无法识别其他各种字体的上述组合，在实际应用中可用范围十分狭窄。

而通过工业PDA条码扫描头采集需要识别的各种非特定字体的数字、符号、字母及其组合，上传互联网的云端服务器并通过服务器中的图形识别引擎+AI大数据图形分析来输出识别结果的技术，这种识别方法的缺陷是工作时需连接互联网，依赖互联网及云服务器，需要借助人工智能大数据AI技术，在无网环境不能工作，网络信号不稳定直接影响系统工作性能。

发明内容

本发明是为了解决上述问题而进行的，提供了一种非特定字体的数字、符号和字母组的识别方法，通过工业作业中使用的PDA的扫描头或摄像头，采集非特定字体的数字、符号、字母及其组合并在PDA中进行识别，解决当前工业环境使用的所有PDA可以无须联网就通过自身的条码扫描头能够快速且准确的采集各种字体的一组数字、符号、字母或其组合(非条码)。

为实现上述目的，本发明提出一种基于需求响应的非特定字体的数字、符号和字母组的识别方法，具有这样的特征，包括以下步骤：

信息采集：对标签样本进行拍照，得到图片信息；

图形矫正：根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正，得到矫正图形；

图形采样：对所述图片信息进行采样消除光线干扰，得到采样图形；

图形预测：根据所述采样图形运算图形趋势，得到预测图形；

模型比对：选定所述预测图形中的每个所述字符，根据所述字符的有效信息得到字体初判类型，并根据所述字体初判类型在已有样本模型中比对，得到每个所述字符的包含与各所述样本模型比对结果的序列结果集，在各所述序列结果集中，各所述比对结果按照置信度从高到低进行排序；

字符比对：分别选取置信度最高所述对比结果的作为个所述字符的返回结果；

模型更新：由所述预测图形生成图片样本，将所述返回结果作为所述图片样本的参数，根据所述图片样本和所述参数更新所述已有样本模型集合。

另外，本发明提供的非特定字体的数字、符号和字母组的识别方法，还具有这样的特征，所述图形矫正步骤中，所述关键信息包括线条、每个字符的相对比例，所述第一预设显示效果规则为通过垂直角度采集图片得到的显示效果。

另外，本发明提供的非特定字体的数字、符号和字母组的识别方法，还具有这样的特征，所述模型比对步骤中，还具有以下步骤：

文字选定：定位并选定所述所述预测图形中的每个所述字符；

文字形态预处理：根据各所述字符的所述有效信息进行预处理矫正，得到各矫正后字符；

字体比对：根据所述矫正后文字字符的特征数据在所述已有样本模型中比对，得到每个所述字符的包含与各所述样本模型比对结果的序列结果集。

另外，本发明提供的非特定字体的数字、符号和字母组的识别方法，还具有这样的特征，所述有效信息包括各所述字符的笔画信息、旋转角度信息，所述预处理包括根据所述笔画信息判断所述字符是否为反白，如为反白则进行色相矫正，根据所述旋转角度判断各所述字符是否有旋转角度，如有旋转角度则进行旋转矫正。

另外，本发明提供的非特定字体的数字、符号和字母组的识别方法，还具有这样的特征，所述字体比对步骤前，还具有以下步骤：

字体类型初判：根据各所述矫正后字符的字形状态、笔画粗细状态，以及转折笔画的特征判断得到字体初判类型，去除所述已有样本模型集合中低于预设置信度的所述字体初判类性的样本模型。

另外，本发明提供的非特定字体的数字、符号和字母组的识别方法，还具有这样的特征，所述字符比对步骤中，在进行置信度排序之前，还具有以下步骤：

规则匹配预过滤：将所述序列结果集中的各比对结果与预设字符串内容规则进行匹配，并去除不符合所述预设字符串内容规则的各所述比对结果。

另外，本发明提供的非特定字体的数字、符号和字母组的识别方法，还具有这样的特征，所述模型更新步骤包括：

图片样本保存：根据所述图片样本和所述参数，得到原始图片、文字区域、文字内容，将所述图片样本作为新已有样本模型保存在所述已有样本模型集合中；

加权评分计算：在本次识别过程中，根据所述已有样本模型的特征数据与所述图片样本的特征数据匹配成功且输出正确结果的识别成功率，对所述图片样本进行加权评分计算，按照由高到低排列；

样本模型调整：根据所述已有样本模型的特征数据与所述图片样本的特征数据匹配成功的累计命中率，将所述累计命中率低的已有样本模型移出已有样本模型集合，放入备用区域；

模型重新生成：将更新后的所述已有样本模型集合生成索引。

此外，为实现上述目的，本发明还提供了一种电子装置，具有这样的特征，该电子装置包括：存储器、处理器，所述存储器上存储有非特定字体的数字、符号和字母组的识别程序，所述非特定字体的数字、符号和字母组的识别程序被所述处理器执行时实现以下步骤：

信息采集模块：对标签样本进行拍照，得到图片信息；

图形矫正模块：根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正，得到矫正图形；

图形采样模块：对所述图片信息进行采样消除光线干扰，得到采样图形；图形预测模块：根据所述采样图形运算图形趋势，得到预测图形；

模型比对模块：选定所述预测图形中的每个所述字符，根据所述字符的有效信息得到字体初判类型，并根据所述字体初判类型在已有样本模型中比对，得到每个所述字符的包含与各所述样本模型比对结果的序列结果集，在各所述序列结果集中，各所述比对结果按照置信度从高到低进行排序；字符比对模块：分别选取置信度最高所述对比结果的作为个所述字符的返回结果；

模型更新模块：由所述预测图形生成图片样本，将所述返回结果作为所述图片样本的参数，根据所述图片样本和所述参数更新所述已有样本模型集合。

此外，为实现上述目的，本发明还提供了一种计算机可读存储介质，具有这样的特征，所述计算机可读存储介质上存储有所述非特定字体的数字、符号和字母组的识别程序，所述非特定字体的数字、符号和字母组的识别程序被处理器执行时实现如上述任意一项所述的非特定字体的数字、符号和字母组的识别方法的步骤。

发明作用和效果

本发明所涉及的非特定字体的数字、符号和字母组的识别方法、装置和存储介质，能够快速且准确的采集各种字体的一组数字、符号、字母或它们的组合，在生产不同环节上需要采集这些信息上传到管理和追溯系统中，从而提供高作效率及信息采集的准确率。同时，不同于通过芯片硬件固定在硬件设备上的技术，本发明可以使所有工业PDA通过其条码扫描头都实现识别功能，而且便于通过网络实现及时的后续技术升级；而对于只能扫描识别OCR字体的工业PDA来说，通过搭载本发明中的程序，可以使其通过扫描头都能够快速且准确的采集非条码的各种字体的数字、符号、字母及其组合。并且，不同于联网云端服务器，并依赖人工智能AI的识别技术，本发明实现了本地识别，工作时无须连接互联网，无须依赖云服务器的AI功能，在无网环境也能工作，降低了对应用现场的基础设施要求。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。

图1是本发明电子装置一实施例的示意图。

图2是本发明的非特定字体的数字、符号和字母组的识别程序一实施例的程序模块图。

图3是本发明的非特定字体的数字、符号和字母组的识别程序一实施例的识别效果图一。

图4是本发明的非特定字体的数字、符号和字母组的识别程序一实施例的识别效果图二。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

以下参照附图及实施例对本发明所涉及的一种非特定字体的数字、符号和字母组的识别方法作详细的描述。以下结合附图对本发明的原理和特征进行描述，所举实例只用于解释本发明，并非用于限定本发明的范围。

图1是本发明电子装置一实施例的示意图；

本发明提供一种电子装置1。参照图1所示，为本发明电子装置1较佳实施例的示意图。

在本实施例中，该电子装置1包括存储器11、处理器12，网络接口13及通信总线。其中，通信总线用于实现这些组件之间的连接通信。

网络接口13可以包括标准的有线接口、无线接口(如WI-FI接口)。

存储器11包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器等的非易失性存储介质。在一些实施例中，所述可读存储介质可以是所述电子装置1的内部存储单元，例如该电子装置1的硬盘。在另一些实施例中，所述可读存储介质也可以是所述电子装置1的外部存储设备，例如所述电子装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。

在本实施例中，所述存储器11的可读存储介质通常用于存储安装于所述电子装置1的非特定字体的数字、符号和字母组的识别程序10等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)，微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行非特定字体的数字、符号和字母组的识别程序10等。

图1仅示出了具有组件11-13以及非特定字体的数字、符号和字母组的识别程序10的电子装置1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选的，该电子装置1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。

可选地，该电子装置1还可以包括显示器，在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode，OLED)触摸器等。显示器用于显示在电子装置中处理的信息以及用于显示可视化的用户界面。

图2示本发明的非特定字体的数字、符号和字母组的识别程序一实施例的程序模块图。

在图1所示的装置实施例中，作为一种计算机存储介质的存储器11中包括非特定字体的数字、符号和字母组的识别程序10，处理器12执行存储器11中存储的非特定字体的数字、符号和字母组的识别程序10时包括以下模块：信息采集模块110、图形分析模块120、图形采样模块130、图形预测模块140、模型比对模块150、字符比对模块160、模型更新模块170。

如图2所示，在本实施例中，非特定字体的数字、符号和字母组的识别程序10可以包括并执行：

信息采集模块110：对标签样本进行拍照，得到图片信息。

在一些实施例中，采用工业PDA扫描头对标签样本进行拍照，得到图片信息，并将图片信息缓存到扫描头内存。所述工业PDA扫描头没有特别限制，可以是市售的工业PDA，可直接购买使用。

图形矫正模块120：根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正，得到矫正图形。

具体而言，图片采集时，由于所述工业PDA扫描头平面与标签会不可避免存在倾斜角度，因此图片会产生一定程度的变形，需对图片进行矫正。所述图形矫正模块中，矫正依据所述关键信息包括线条、每个字符的相对比例。具体而言，可通过采集图片上的每个字符的相对比例数据，来判断所述图片书否存在变形。还可根据采集线条的数据来进行图形矫正。

在本发明中，图片处理调用了开源模块OpenCV。OpenCV是基于BSD许可(开源)发行的跨平台计算机视觉库，可以运行在Linux、Windows、Android和Mac OS操作系统上。由一系列C函数和少量C++类构成，同时提供了Python、Ruby、MATLAB等语言的接口，可实现图像处理和计算机视觉方面的很多通用算法。OpenCV可对图片进行调整亮度、对比度、翻转、拉伸等处理。

所述第一预设显示效果规则为通过垂直角度采集图片得到的显示效果。在本发明中，以通过垂直角度采集图片得到的显示效果为规则，对所述图片进行矫正，得到矫正图形。

另外，所述图形矫正模块中，还需要确认清晰度对比度在预设范围内，在一些实施例中，清晰度对比度的确认由所述OpenCV进行自动处理。

图形采样模块130：对所述矫正图形进行采样消除光线干扰，得到采样图形。

具体而言，由于光线会对图片产生较大干扰，需要对图片信息进行采样，以消除光线干扰。在一些实施例中，消除光线干扰由所述OpenCV进行自动处理。

图形预测模块140：根据所述采样图形运算图形趋势，得到预测图形；

在一些实施例中，消除了光线干扰后，则重新绘制形成预测图形。在一些实施例中，根据所述采样图形运算图形趋势，得到预测图形由所述OpenCV进行自动处理。

模型比对模块150：选定所述预测图形中的每个所述字符，根据所述字符的有效信息得到字体初判类型，并根据所述字体初判类型在已有样本模型中比对，得到每个字符的包含与各所述样本模型比对结果的序列结果集，在各所述序列结果集中，各所述比对结果按照置信度从高到低进行排序。

所述置信度也称为可靠度，或置信水平、置信系数，即在抽样对总体参数作出估计时，由于样本的随机性，其结论总是不确定的。因此，采用一种概率的陈述方法，也就是数理统计中的区间估计法，即估计值与总体参数在一定允许的误差范围以内，其相应的概率有多大，这个相应的概率称作置信度。本发明中，置信度的计算由工业PDA内自带的识别引擎在样本与模型匹配时产生。

如图3、4所示，对于所述预测图形中的字符串，每个字符都会包含与各所述样本模型比对结果的序列结果集。在一些实施例中，该序列中结果字符(与各所述样本模型比对结果)按置信度高低排序。如，字符“7”的序列结果集包括7(置信度99)、T(置信度50)、L(置信度20)；所述字符“9”的序列结果集包括9(置信度99)、6(置信度40)、0(置信度10)。

另外，由于文字或字符通常不是标准状态，而具有反色或是旋转的情况，为了控制对比模型的数据量不至于过大，并保证查找匹配的效率，需要对各所述字符进行进一步矫正，因此所述模型比对模块150中，还具有以下步骤：

具体而言，所述有效信息包括各所述字符的笔画信息、旋转角度信息，

所述预处理包括根据所述笔画信息判断所述字符是否为反白，如为反白则进行色相矫正，根据所述旋转角度判断各所述字符是否有旋转角度，如有旋转角度则进行旋转矫正。

各所述矫正后字符即包括经所述色相矫正、角度矫正中的一种或两种后的字符。所述矫正后文字具有非反白状态以及无旋转角度状态。

另外，所述特征数据是对数据的表达，可根据数据、应用、模型、方法等方面来量特征是否是合适的表达。通常而言，特征是富有信息量的、有区分性的和独立的。特征有很多种特性和分类：可以是线性或非线性的；可以是固定、自适应的。在本发明中，所述特征可包括字符的字形状态、笔画粗细状态，以及转折笔画等。

另外，为了初步判断各所述字符的字体类型，以去除字形相差悬殊的字体，缩小后续在已有样本模型中的查找范围，所述字体比对步骤前，还具有以下步骤：

具体而言，当字符的特征在模型的特定字体部分，所得到的置信度普遍低于预设置信度，可以认定为所识别的字符不符合当前字体的特征。所述预设置信度作为一个参数，可预先在配置文件中设定，通常设置为90。字符比对模块160：分别选取置信度最高所述对比结果的作为个所述字符的返回结果。

如图3、4所示，在一些实施例中，所述字符“7”的返回结果为具有最高置信度的7，所述字符“9”的返回结果为具有最高置信度的9。

另外当对该类标签做过字符串内容规则的设置时，须进行字符串规则过滤处理，因此所述字符比对模块150中，在进行置信度排序之前，还具有以下步骤：

具体而言，当各比对结果与预设字符串内容规则进行匹配符合时，则保留当前各比对结果，若不符合所述预设字符串内容规则，则滤除当前比对结果，将符合所述预设字符串内容规则的各所述比对结果进行后续置信度排序。

模型更新模块170：由所述预测图形生成图片样本，将所述返回结果作为所述图片样本的参数，根据所述图片样本和所述参数更新所述已有样本模型集合。

具体而言，当上述标签识别成功后，需对现有样本模型集合进行更新，以不断更新提高识别率和识别速度。具体而言，所述模型更新模块包括以下步骤：

加权评分计算：在本次识别过程中，根据所述已有样本模型的特征数据与所述图片样本的特征数据匹配成功且输出正确结果的识别成功率，对所述图片样本进行加权评分计算，按照由高到低排列，作为后续进行识别时优先匹配的顺序。

更具体而言，在图片样本的特征数据识别过程中，识别内容被确认即识别成功，若识别错误，则需返回错误的位数(如第2位)及对应此位置的正确字符。在一些实施例中，所述识别成功率和加权评分的计算由语识-MDR服务端软件V2.0自动完成。

样本模型调整：根据所述已有样本模型的特征数据与所述图片样本的特征数据匹配成功的累计命中率，将所述累计命中率低的已有样本模型移出已有样本模型集合，放入备用区域。

更具体而言，所述累计命中率之只统计图片样本特征数据是否被匹配到，而不关注输出结果是否正确。每次识别结束后，都需要对已有样本模型集合中参与识别的已有样本模型进行累计命中率计算。由于每次识别过程中都会采集到图片样本，在之后的识别时会对新加入的样本也进行内部检测并记录其命中率。在一些实施例中，所述累计命中率的计算由语识-MDR服务端软件V2.0自动完成。

模型重新生成：将更新后的所述已有样本模型集合生成索引。所述索引将便于提高查找匹配的速度。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有非特定字体的数字、符号和字母组的识别程序，所述非特定字体的数字、符号和字母组的识别程序被处理器执行时实现如下操作：

信息采集：对标签样本进行拍照，得到图片信息；

本发明之计算机可读存储介质的具体实施方式与上述非特定字体的数字、符号和字母组的识别方法的具体实施方式大致相同，在此不再赘述。

实施例的作用与效果

根据本实施例所涉及的所涉及的非特定字体的数字、符号和字母组的识别方法、装置和存储介质，能能够快速且准确的采集各种字体的一组数字、符号、字母或它们的组合，在生产不同环节上需要采集这些信息上传到管理和追溯系统中，从而提供高作效率及信息采集的准确率。同时，不同于通过芯片硬件固定在硬件设备上的技术，本实施例可以使所有工业PDA通过其条码扫描头都实现识别功能，而且便于通过网络实现及时的后续技术升级；而对于只能扫描识别OCR字体的工业PDA来说，通过搭载本实施例中的程序，可以使其通过扫描头都能够快速且准确的采集非条码的各种字体的数字、符号、字母及其组合。并且，不同于联网云端服务器，并依赖人工智能AI的识别技术，本实施例实现了本地识别，工作时无须连接互联网，无须依赖云服务器的AI功能，在无网环境也能工作，降低了对应用现场的基础设施要求。

上述实施方式为本发明的优选案例，并不用来限制本发明的保护范围。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种非特定字体的数字、符号和字母组的识别方法，其特征在于，包括以下步骤：

信息采集：对标签样本进行拍照，得到图片信息；

图形矫正：根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正，得到矫正图形，所述关键信息包括线条、每个字符的相对比例，所述第一预设显示效果规则为通过垂直角度采集图片得到的显示效果，矫正的具体图片处理操作通过调用开源模块OpenCV进行；

模型更新：由所述预测图形生成图片样本，将所述返回结果作为所述图片样本的参数，根据所述图片样本和所述参数更新所述已有样本模型集合，其中，所述模型更新步骤包括：

2.根据权利要求1所述的非特定字体的数字、符号和字母组的识别方法，其特征在于，所述模型比对步骤中，还具有以下步骤：

3.根据权利要求2所述的非特定字体的数字、符号和字母组的识别方法，其特征在于，所述有效信息包括各所述字符的笔画信息、旋转角度信息，

4.根据权利要求3所述的非特定字体的数字、符号和字母组的识别方法，其特征在于，所述字体比对步骤前，还具有以下步骤：

5.根据权利要求4所述的非特定字体的数字、符号和字母组的识别方法，其特征在于，所述字符比对步骤中，在进行置信度排序之前，还具有以下步骤：

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有所述非特定字体的数字、符号和字母组的识别程序，所述非特定字体的数字、符号和字母组的识别程序被处理器执行时实现如权利要求1至5中任意一项所述的识别非特定字体的数字及符号和字母组方法的步骤。