CN112559751A

CN112559751A - 一种基于单片机的动态字库优化方法

Info

Publication number: CN112559751A
Application number: CN202011537216.3A
Authority: CN
Inventors: 靳宁远; 张天乐; 陈元龙; 郑英杰; 孙永奎
Original assignee: Southwest Jiaotong University
Current assignee: Southwest Jiaotong University
Priority date: 2020-12-23
Filing date: 2020-12-23
Publication date: 2021-03-26

Abstract

本发明提供了一种基于单片机的动态字库优化方法，涉及单片机技术领域，其包括通过串口将单片机与上位机连接，用户通过上位机开发系统的人机交互界面输入需要展示的目标字符并上传保存至上位机中；上位机调用自带的点阵库对目标字符进行编码形成第一编码，并保存第一编码；采用分类算法，以第一编码为训练数据，修正上位机中的原有数据模型得到新数据模型，通过新数据模型得到代码指令和信息编码；单片机下载并调用代码指令和信息编码，根据信息编码对LED点阵实现控制。解决了现有技术中单片机在实现LED点阵控制中过度依赖特定字库芯片造成成本高昂、使用不灵活、信息处理效率低的问题。

Description

一种基于单片机的动态字库优化方法

技术领域

本发明涉及单片机技术领域，特别是涉及一种基于单片机的动态字库优化方法。

背景技术

在单片机产品的应用中，汉字信息处理十分重要，但是目前由于单片机的成本问题，内部Flash存储器容量受限，而中文字库常用达到6000以上，字库数据庞大，因此当使用单片机实现LED的点阵控制来显示汉字和图案时，传统方法是借助特定的字库芯片。单片机在配套的字库芯片中读取需要的字库代码，再通过字库代码实现LED点阵控制显示。

虽然传统方法能够实现汉字和图案显示，但这类方法过于依赖特定的字库芯片，无法实现所有汉字和特殊图案的显示，用户不能增加和修改汉字信息，缺乏灵活性，并且取模工作量大，字库代码生成慢，消耗单片机内存过多，检索和传输效率低，除此之外，由于配置了字库芯片，单片机的成本也会增高。

发明内容

针对现有技术中的上述问题，本发明提供了一种基于单片机的动态字库优化方法，解决了现有技术中单片机在实现LED点阵控制中过度依赖特定字库芯片造成成本高昂、使用不灵活、信息处理效率低的问题。

为了达到上述发明目的，本发明采用的技术方案如下：

提供一种基于单片机的动态字库优化方法，其包括：

S1，通过串口将单片机与上位机连接，用户通过上位机开发系统的人机交互界面输入需要展示的目标字符并上传保存至上位机中；

S2，上位机调用自带的点阵库对目标字符进行编码形成第一编码，并保存第一编码；

S3，采用分类算法，以第一编码为训练数据，修正上位机中的原有数据模型得到新数据模型，通过新数据模型得到代码指令和信息编码；

S4，单片机下载并调用代码指令和信息编码，根据信息编码对LED点阵实现控制。

本发明的有益效果为：

1、有效利用上位机的信息处理功能，信息处理更快捷，传输效率更高，且不占用单片机的内存，减少了单片机内存损耗。

2、能够很好地处理传统方法中信息显示受限于特定字库芯片的问题，此类方法，使得任何型号类别的单片机均可灵活展示信息。

3、自动化处理水平高，动态字库实时更新、优化，可省去单片机中字库芯片的配置，降低单片机成本，节省PCB空间。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

传统方法中：对于用户所需要使用单片机显示的文字信息，先由用户上传至上位机中，上位机再对单片机输送命令，单片机接收命令后，调动字库芯片读取相关的字库代码，再在单片机中处理，命令控制LED点阵汉字图案显示。

本方案中的基于单片机的动态字库优化方法包括：

S1，通过USB串口将单片机与上位机连接，用户通过上位机开发系统的人机交互界面输入需要展示的目标字符并上传保存至上位机中，比如用户输入的是“学校”两个字。

上位机对目标字符进行编码的方法具体为：

S21，将收入的汉字、字母和符号构成的字符集分成94个区且每个区有94个位，每个位有一个字符，通过字符所处的区和位对字符进行编码形成区位码。

S22，把换算成十六进制的区位码加上2020H得到国标码，国标码加上8080H得到上位机内码，上位机内码为存储每个字符点阵信息的地址，上位机内码为第一编码。

在GB2312国家标准中包括有6763个常用汉字和682个非汉字字符，并为每个字符规定了标准代码，以便在不同的计算机系统之间进行汉字文本交换。GB2312字符集构成一个94行、94列的二维表，行号称为区号，列号称为位号，每一个汉字或符号在码表中的位置用它所在的区号和位号来表示。例如，“学”字的区号为49，位号为07，它的区位码即为4907，用2个字节的二进制数表示为：00110001 00000111。区位码无法用于汉字通信，因为它可能与通信使用的控制码(00H～1FH)(即0～31)发生冲突，所以规定将每个汉字的区号和位号必须分别加上32(即二进制数00100000)，经过这样的处理而得的代码称为国标交换码，简称交换码，因此，“学”字的国标交换码计算为：0101000100100111，用十六进制数表示即为5127H。

由于文本中通常混合使用汉字和西文字符，汉字信息如果不予以特别标识，就会与单字节的ASCII码混淆。解决方法之一是将一个汉字看成是两个扩展ASCII码，使表示GB2312汉字的两个字节的最高位都为1。这种高位为1的双字节汉字编码即为GB2312汉字的机内码，简称为内码。因此，“学”字的机内码为：11010001 10100111，用16进制表示即为D1A7H。

每个字符的计算机内码作为存储该字符点阵信息的地址，得到内码后直接到该地址读取该字符的点阵数据便可显示到LED点阵屏上。需要显示汉字时只需要知道汉字的计算机内码就可得到汉字的存储地址，从而可以得到汉字的点阵信息用来显示。

S3，采用分类算法，以第一编码为训练数据，修正上位机中的原有数据模型得到新数据模型，通过新数据模型得到代码指令和信息编码。

修正上位机中的原有数据模型之前需识别出原有数据模型，具体方法为：

上位机中存储有若干携带有对应专业关键字序列的数据模型，比如“学校”对应与教育专业的数据模型，在教育专业的数据模型中存储了大量跟教育相关的关键字库，比如“学生”、“教师”等，关键字库保存为XML格式的文件，是根据该专业内使用频率进行了收录。关键字库文件中的关键字分为三种类型：单一关键字、复合关键字、数组关键字。单一关键字为一般为专业术语，复合关键字为描述不同但含义相同的两个或者多个单一关键字的组合，这些关键字之间互为同义关键字，数组关键字为带有下标的关键字。

上位机中设置有关键字分析模块，用来分析新输入的字符包含的关键字，形成关键字序列，将该关键字序列遍历所有数据模型并与数据模型中存储的关键字序列进行比较并进行匹配度计算，建立计算结果序列，保存计算结果，计算结果序列只记录匹配度大于零的结果，遍历完所有数据模型后，判断是否有多个匹配结果，如果是，则需过滤多匹配结果，筛选出匹配度最高的数据模型作为识别出的原有数据模型。

具体地，直接比较两个关键字序列，若完全相同，则实现两个关键字序列的完全匹配，匹配度为100％，当数关键字序列实现完全匹配时，则不再与其他数据模型中的关键字序列进行匹配；若两个有不同，则选取匹配度最高的记录。

分类算法采用BP神经网络算法，构建神经网络模型，神经网络模型包括三层：一个输入层，其神经元的个数和训练文档特征向量分量的个数相同；一个输出层，其神经元的个数与训练文档的类别数相同；一个隐藏层，其神经元的个数根据经验和实验进行选定。

其修正上位机中的原有数据模型得到新数据模型的具体方法为：

S31，初始化网络各层权值和参数；

S32，输入第一编码和期望输出；

S33，计算网络实际输出及隐层单元状态；

S34，计算误差；

S35，调整权值和阈值；

S36，判断误差是否达到期望，达到则训练成功，记录网络参数，否则转至S37；

S37，判断是否达到最大迭代次数，是则训练失败，否则转至S32。

通过修正后的数据模型能够通过第一编码的输入而输出能够让单片机准确显示信息的代码指令和信息编码。

Claims

1.一种基于单片机的动态字库优化方法，其特征在于，包括：

2.根据权利要求1所述的基于单片机的动态字库优化方法，其特征在于，所述步骤S2中上位机对目标字符进行编码的方法为：

S21，将收入的汉字、字母和符号构成的字符集分成94个区且每个区有94个位，每个位有一个字符，通过字符所处的区和位对字符进行编码形成区位码；

3.根据权利要求1所述的基于单片机的动态字库优化方法，其特征在于，所述步骤S3中修正上位机中的原有数据模型之前需识别出原有数据模型，具体方法为：

上位机中存储有若干携带有对应专业关键字序列的数据模型，将目标字符遍历所有数据模型并与数据模型中的关键字序列进行比较，选取匹配度最高的数据模型作为识别出的原有数据模型。

4.根据权利要求3所述的基于单片机的动态字库优化方法，其特征在于，遍历所有数据模型，将目标字符与数据模型中的每一个关键字序列进行匹配度计算，建立计算结果序列，保存计算结果，计算结果序列只记录匹配度大于零的结果，然后从结果序列中智能筛选出匹配度最大的数据模型。

5.根据权利要求1所述的基于单片机的动态字库优化方法，其特征在于，所述步骤S3中的分类算法采用BP神经网络算法，其修正上位机中的原有数据模型得到新数据模型的具体方法为：

S31，初始化网络各层权值和参数；

S32，输入第一编码和期望输出；

S33，计算网络实际输出及隐层单元状态；

S34，计算误差；

S35，调整权值和阈值；