CN112559751A - 一种基于单片机的动态字库优化方法 - Google Patents
一种基于单片机的动态字库优化方法 Download PDFInfo
- Publication number
- CN112559751A CN112559751A CN202011537216.3A CN202011537216A CN112559751A CN 112559751 A CN112559751 A CN 112559751A CN 202011537216 A CN202011537216 A CN 202011537216A CN 112559751 A CN112559751 A CN 112559751A
- Authority
- CN
- China
- Prior art keywords
- code
- upper computer
- data model
- single chip
- chip microcomputer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明提供了一种基于单片机的动态字库优化方法,涉及单片机技术领域,其包括通过串口将单片机与上位机连接,用户通过上位机开发系统的人机交互界面输入需要展示的目标字符并上传保存至上位机中;上位机调用自带的点阵库对目标字符进行编码形成第一编码,并保存第一编码;采用分类算法,以第一编码为训练数据,修正上位机中的原有数据模型得到新数据模型,通过新数据模型得到代码指令和信息编码;单片机下载并调用代码指令和信息编码,根据信息编码对LED点阵实现控制。解决了现有技术中单片机在实现LED点阵控制中过度依赖特定字库芯片造成成本高昂、使用不灵活、信息处理效率低的问题。
Description
技术领域
本发明涉及单片机技术领域,特别是涉及一种基于单片机的动态字库优化方法。
背景技术
在单片机产品的应用中,汉字信息处理十分重要,但是目前由于单片机的成本问题,内部Flash存储器容量受限,而中文字库常用达到6000以上,字库数据庞大,因此当使用单片机实现LED的点阵控制来显示汉字和图案时,传统方法是借助特定的字库芯片。单片机在配套的字库芯片中读取需要的字库代码,再通过字库代码实现LED点阵控制显示。
虽然传统方法能够实现汉字和图案显示,但这类方法过于依赖特定的字库芯片,无法实现所有汉字和特殊图案的显示,用户不能增加和修改汉字信息,缺乏灵活性,并且取模工作量大,字库代码生成慢,消耗单片机内存过多,检索和传输效率低,除此之外,由于配置了字库芯片,单片机的成本也会增高。
发明内容
针对现有技术中的上述问题,本发明提供了一种基于单片机的动态字库优化方法,解决了现有技术中单片机在实现LED点阵控制中过度依赖特定字库芯片造成成本高昂、使用不灵活、信息处理效率低的问题。
为了达到上述发明目的,本发明采用的技术方案如下:
提供一种基于单片机的动态字库优化方法,其包括:
S1,通过串口将单片机与上位机连接,用户通过上位机开发系统的人机交互界面输入需要展示的目标字符并上传保存至上位机中;
S2,上位机调用自带的点阵库对目标字符进行编码形成第一编码,并保存第一编码;
S3,采用分类算法,以第一编码为训练数据,修正上位机中的原有数据模型得到新数据模型,通过新数据模型得到代码指令和信息编码;
S4,单片机下载并调用代码指令和信息编码,根据信息编码对LED点阵实现控制。
本发明的有益效果为:
1、有效利用上位机的信息处理功能,信息处理更快捷,传输效率更高,且不占用单片机的内存,减少了单片机内存损耗。
2、能够很好地处理传统方法中信息显示受限于特定字库芯片的问题,此类方法,使得任何型号类别的单片机均可灵活展示信息。
3、自动化处理水平高,动态字库实时更新、优化,可省去单片机中字库芯片的配置,降低单片机成本,节省PCB空间。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
传统方法中:对于用户所需要使用单片机显示的文字信息,先由用户上传至上位机中,上位机再对单片机输送命令,单片机接收命令后,调动字库芯片读取相关的字库代码,再在单片机中处理,命令控制LED点阵汉字图案显示。
本方案中的基于单片机的动态字库优化方法包括:
S1,通过USB串口将单片机与上位机连接,用户通过上位机开发系统的人机交互界面输入需要展示的目标字符并上传保存至上位机中,比如用户输入的是“学校”两个字。
S2,上位机调用自带的点阵库对目标字符进行编码形成第一编码,并保存第一编码;
上位机对目标字符进行编码的方法具体为:
S21,将收入的汉字、字母和符号构成的字符集分成94个区且每个区有94个位,每个位有一个字符,通过字符所处的区和位对字符进行编码形成区位码。
S22,把换算成十六进制的区位码加上2020H得到国标码,国标码加上8080H得到上位机内码,上位机内码为存储每个字符点阵信息的地址,上位机内码为第一编码。
在GB2312国家标准中包括有6763个常用汉字和682个非汉字字符,并为每个字符规定了标准代码,以便在不同的计算机系统之间进行汉字文本交换。GB2312字符集构成一个94行、94列的二维表,行号称为区号,列号称为位号,每一个汉字或符号在码表中的位置用它所在的区号和位号来表示。例如,“学”字的区号为49,位号为07,它的区位码即为4907,用2个字节的二进制数表示为:00110001 00000111。区位码无法用于汉字通信,因为它可能与通信使用的控制码(00H~1FH)(即0~31)发生冲突,所以规定将每个汉字的区号和位号必须分别加上32(即二进制数00100000),经过这样的处理而得的代码称为国标交换码,简称交换码,因此,“学”字的国标交换码计算为:0101000100100111,用十六进制数表示即为5127H。
由于文本中通常混合使用汉字和西文字符,汉字信息如果不予以特别标识,就会与单字节的ASCII码混淆。解决方法之一是将一个汉字看成是两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位都为1。这种高位为1的双字节汉字编码即为GB2312汉字的机内码,简称为内码。因此,“学”字的机内码为:11010001 10100111,用16进制表示即为D1A7H。
每个字符的计算机内码作为存储该字符点阵信息的地址,得到内码后直接到该地址读取该字符的点阵数据便可显示到LED点阵屏上。需要显示汉字时只需要知道汉字的计算机内码就可得到汉字的存储地址,从而可以得到汉字的点阵信息用来显示。
S3,采用分类算法,以第一编码为训练数据,修正上位机中的原有数据模型得到新数据模型,通过新数据模型得到代码指令和信息编码。
修正上位机中的原有数据模型之前需识别出原有数据模型,具体方法为:
上位机中存储有若干携带有对应专业关键字序列的数据模型,比如“学校”对应与教育专业的数据模型,在教育专业的数据模型中存储了大量跟教育相关的关键字库,比如“学生”、“教师”等,关键字库保存为XML格式的文件,是根据该专业内使用频率进行了收录。关键字库文件中的关键字分为三种类型:单一关键字、复合关键字、数组关键字。单一关键字为一般为专业术语,复合关键字为描述不同但含义相同的两个或者多个单一关键字的组合,这些关键字之间互为同义关键字,数组关键字为带有下标的关键字。
上位机中设置有关键字分析模块,用来分析新输入的字符包含的关键字,形成关键字序列,将该关键字序列遍历所有数据模型并与数据模型中存储的关键字序列进行比较并进行匹配度计算,建立计算结果序列,保存计算结果,计算结果序列只记录匹配度大于零的结果,遍历完所有数据模型后,判断是否有多个匹配结果,如果是,则需过滤多匹配结果,筛选出匹配度最高的数据模型作为识别出的原有数据模型。
具体地,直接比较两个关键字序列,若完全相同,则实现两个关键字序列的完全匹配,匹配度为100%,当数关键字序列实现完全匹配时,则不再与其他数据模型中的关键字序列进行匹配;若两个有不同,则选取匹配度最高的记录。
分类算法采用BP神经网络算法,构建神经网络模型,神经网络模型包括三层:一个输入层,其神经元的个数和训练文档特征向量分量的个数相同;一个输出层,其神经元的个数与训练文档的类别数相同;一个隐藏层,其神经元的个数根据经验和实验进行选定。
其修正上位机中的原有数据模型得到新数据模型的具体方法为:
S31,初始化网络各层权值和参数;
S32,输入第一编码和期望输出;
S33,计算网络实际输出及隐层单元状态;
S34,计算误差;
S35,调整权值和阈值;
S36,判断误差是否达到期望,达到则训练成功,记录网络参数,否则转至S37;
S37,判断是否达到最大迭代次数,是则训练失败,否则转至S32。
S4,单片机下载并调用代码指令和信息编码,根据信息编码对LED点阵实现控制。
通过修正后的数据模型能够通过第一编码的输入而输出能够让单片机准确显示信息的代码指令和信息编码。
Claims (5)
1.一种基于单片机的动态字库优化方法,其特征在于,包括:
S1,通过串口将单片机与上位机连接,用户通过上位机开发系统的人机交互界面输入需要展示的目标字符并上传保存至上位机中;
S2,上位机调用自带的点阵库对目标字符进行编码形成第一编码,并保存第一编码;
S3,采用分类算法,以第一编码为训练数据,修正上位机中的原有数据模型得到新数据模型,通过新数据模型得到代码指令和信息编码;
S4,单片机下载并调用代码指令和信息编码,根据信息编码对LED点阵实现控制。
2.根据权利要求1所述的基于单片机的动态字库优化方法,其特征在于,所述步骤S2中上位机对目标字符进行编码的方法为:
S21,将收入的汉字、字母和符号构成的字符集分成94个区且每个区有94个位,每个位有一个字符,通过字符所处的区和位对字符进行编码形成区位码;
S22,把换算成十六进制的区位码加上2020H得到国标码,国标码加上8080H得到上位机内码,上位机内码为存储每个字符点阵信息的地址,上位机内码为第一编码。
3.根据权利要求1所述的基于单片机的动态字库优化方法,其特征在于,所述步骤S3中修正上位机中的原有数据模型之前需识别出原有数据模型,具体方法为:
上位机中存储有若干携带有对应专业关键字序列的数据模型,将目标字符遍历所有数据模型并与数据模型中的关键字序列进行比较,选取匹配度最高的数据模型作为识别出的原有数据模型。
4.根据权利要求3所述的基于单片机的动态字库优化方法,其特征在于,遍历所有数据模型,将目标字符与数据模型中的每一个关键字序列进行匹配度计算,建立计算结果序列,保存计算结果,计算结果序列只记录匹配度大于零的结果,然后从结果序列中智能筛选出匹配度最大的数据模型。
5.根据权利要求1所述的基于单片机的动态字库优化方法,其特征在于,所述步骤S3中的分类算法采用BP神经网络算法,其修正上位机中的原有数据模型得到新数据模型的具体方法为:
S31,初始化网络各层权值和参数;
S32,输入第一编码和期望输出;
S33,计算网络实际输出及隐层单元状态;
S34,计算误差;
S35,调整权值和阈值;
S36,判断误差是否达到期望,达到则训练成功,记录网络参数,否则转至S37;
S37,判断是否达到最大迭代次数,是则训练失败,否则转至S32。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011537216.3A CN112559751A (zh) | 2020-12-23 | 2020-12-23 | 一种基于单片机的动态字库优化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011537216.3A CN112559751A (zh) | 2020-12-23 | 2020-12-23 | 一种基于单片机的动态字库优化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112559751A true CN112559751A (zh) | 2021-03-26 |
Family
ID=75030958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011537216.3A Pending CN112559751A (zh) | 2020-12-23 | 2020-12-23 | 一种基于单片机的动态字库优化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112559751A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113240491A (zh) * | 2021-05-18 | 2021-08-10 | 福州思飞信息技术有限公司 | 一种显示文字的物联网的商品信息展示牌 |
CN113360113A (zh) * | 2021-05-24 | 2021-09-07 | 中国电子科技集团公司第四十一研究所 | 一种基于oled屏实现动态调整字符显示宽度的系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850837A (zh) * | 2015-05-18 | 2015-08-19 | 西南交通大学 | 手写文字的识别方法 |
CN109358901A (zh) * | 2018-12-06 | 2019-02-19 | 深圳高通半导体有限公司 | 一种可解码点阵字库的处理器芯片及实现方法 |
CN109375962A (zh) * | 2018-10-23 | 2019-02-22 | 北京计算机技术及应用研究所 | 基于嵌入式操作系统的汉字字符混合输出显示的实现方法 |
-
2020
- 2020-12-23 CN CN202011537216.3A patent/CN112559751A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850837A (zh) * | 2015-05-18 | 2015-08-19 | 西南交通大学 | 手写文字的识别方法 |
CN109375962A (zh) * | 2018-10-23 | 2019-02-22 | 北京计算机技术及应用研究所 | 基于嵌入式操作系统的汉字字符混合输出显示的实现方法 |
CN109358901A (zh) * | 2018-12-06 | 2019-02-19 | 深圳高通半导体有限公司 | 一种可解码点阵字库的处理器芯片及实现方法 |
Non-Patent Citations (1)
Title |
---|
冀恩祥: "基于单片机控制电子胸卡的设计", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113240491A (zh) * | 2021-05-18 | 2021-08-10 | 福州思飞信息技术有限公司 | 一种显示文字的物联网的商品信息展示牌 |
CN113360113A (zh) * | 2021-05-24 | 2021-09-07 | 中国电子科技集团公司第四十一研究所 | 一种基于oled屏实现动态调整字符显示宽度的系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020140386A1 (zh) | 基于TextCNN知识抽取方法、装置、计算机设备及存储介质 | |
Nelli | Python data analytics: Data analysis and science using PANDAs, Matplotlib and the Python Programming Language | |
CN103377278B (zh) | 识别要压缩的数据块中的表边界检测的方法与系统 | |
CN112559751A (zh) | 一种基于单片机的动态字库优化方法 | |
CN103389992A (zh) | 一种结构化数据存储方法及装置 | |
CN107766555A (zh) | 基于软约束无监督型跨模态哈希的图像检索方法 | |
CN102024046A (zh) | 数据重复性校验方法和装置及系统 | |
CN102521332B (zh) | 基于强模拟的图模式匹配方法、装置及系统 | |
CN111753514B (zh) | 一种专利申请文本的自动生成方法和装置 | |
CN105138649A (zh) | 数据的搜索方法、装置及终端 | |
CN116483962A (zh) | 一种问答方法、装置、终端设备及可读存储介质 | |
CN102779161B (zh) | 基于rdf知识库的语义标注方法 | |
CN109240549B (zh) | 一种基于外接数位设备和大数据智能分析的书法矫正器 | |
CN112328621A (zh) | Sql转换方法、装置、计算机设备及计算机可读存储介质 | |
CN117131222A (zh) | 基于开放世界大模型的半自动化标注方法和装置 | |
CN116842076A (zh) | 一种数据分析方法、装置、分析设备及可读存储介质 | |
CN110503378A (zh) | 一种bom标准化方法、系统及电子设备和存储介质 | |
CN115099309A (zh) | 一种为图数据的存储和索引设计代价评估模型的方法 | |
CN108334888A (zh) | 针对比特序列的压缩编码 | |
CN113609313A (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN113539241A (zh) | 语音识别校正方法及其相应的装置、设备、介质 | |
Ji | Application of Artificial Intelligence Technology in English Online Learning Platform | |
GB2231420A (en) | Insurance rating | |
CN113032337B (zh) | 一种用于辅助印刷电路板物料焊接的物料查询方法、系统、智能终端及计算机可读存储介质 | |
CN116976294B (zh) | 一种用于实现复杂电子表格自动填充的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210326 |
|
RJ01 | Rejection of invention patent application after publication |