CN113610092B - 一种基于信道编码的人工智能集装箱识别系统 - Google Patents
一种基于信道编码的人工智能集装箱识别系统 Download PDFInfo
- Publication number
- CN113610092B CN113610092B CN202110879145.3A CN202110879145A CN113610092B CN 113610092 B CN113610092 B CN 113610092B CN 202110879145 A CN202110879145 A CN 202110879145A CN 113610092 B CN113610092 B CN 113610092B
- Authority
- CN
- China
- Prior art keywords
- container
- code
- error
- container number
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012937 correction Methods 0.000 claims abstract description 20
- 238000000034 method Methods 0.000 claims description 27
- 238000001514 detection method Methods 0.000 claims description 25
- 208000011580 syndromic disease Diseases 0.000 claims description 23
- 238000005516 engineering process Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 8
- 238000013473 artificial intelligence Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000008439 repair process Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 2
- 238000010276 construction Methods 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 102100032202 Cornulin Human genes 0.000 description 2
- 101000920981 Homo sapiens Cornulin Proteins 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/004—Arrangements for detecting or preventing errors in the information received by using forward error control
- H04L1/0056—Systems characterized by the type of code used
- H04L1/0061—Error detection codes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L1/00—Arrangements for detecting or preventing errors in the information received
- H04L1/0078—Avoidance of errors by organising the transmitted data in a format specifically designed to deal with errors, e.g. location
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Character Discrimination (AREA)
- Error Detection And Correction (AREA)
Abstract
本发明一种基于信道编码的人工智能集装箱识别系统,包括新型集装箱号生成单元和智能识别单元;所述新型集装箱号生成单元和所述智能识别单元通信相连,用以将所述新型集装箱号生成单元编码生成的新型集装箱号通过所述智能识别单元进行识别,完成人工智能集装箱的识别。RS编码可以提供校验功能校验前十位真实信息位是否出错,并且它能够提供错误纠正功能。编码后的集装箱号码序列在AI识别之后,识别后的号码可以再由RS码译码检错器判断出错和错误定位,最后通过RS译码纠错器,纠正错误信息。这可以极大提升整体的集装箱号码识别率助力智慧港口建设。
Description
技术领域
本发明涉及基于深度学习的计算机视觉领域,以及信道编码领域,特别是一种基于信道编码的人工智能集装箱识别系统。
背景技术
在计算机视觉领域,文本识别是一项很重要的任务。生活中文本无处不在,在智能化水平快速发展的今天,如何让计算机自动进行文本识别任务是一项很重要的考验。一旦达到人工乃至超越人工的水平,就能节约很多人力物力财力,那么将大大推动AI世界的进程,实现人工智能化。OCR(光学字符识别)技术旨在研究将输入的扫描文档图像等信息进行分析处理,识别出文档或者图像中的文字信息,所用之技术是基于基础图像处理方法,利用灰度化,二值化等技术提取关键文本区域,使用像素匹配法等进行文本识别。在白字黑字的条件下,一份字迹工整,字体单一,背景简单的文本几乎已经达到了人工识别的程度,甚至超过人工水平。但在自然场景下,如我们所需要应用的港口场景下,由于背景的复杂性,文本字体尺度颜色的多样性等因素,传统OCR技术并不适用,于是在OCR之下,引申出STR(Scene Text Recognition)技术,目前优秀的STR技术都是基于深度学习进行的。STR技术又分为两种方式,一种是文本检测加文本识别,这是一个Two-stage的过程。另一种方式则为End-to-End,这是一个One-stage的过程,它将文本检测任务和文本识别任务并行处理。2020年ECCV会议上提出的最先进的STR技术,,应用在我们港口集装箱的场景下,单字符的识别准确率能够达到95%水平,集装箱识别准确率达到86.5%。但是,还是难以达到95%以上的人工水准。出现错误识别问题,识别出错无法校验问题,无法自动改正问题。
发明内容
有鉴于此,本发明的目的是提供一种基于信道编码的人工智能集装箱识别系统,有效提升港口集装箱吞吐查验效率,减少人工和时间成本。
本发明采用以下方案实现:一种基于信道编码的人工智能集装箱识别系统,其特征在于:包括新型集装箱号生成单元和智能识别单元;所述新型集装箱号生成单元和所述智能识别单元通信相连,用以将所述新型集装箱号生成单元编码生成的新型集装箱号通过所述智能识别单元进行识别,完成人工智能集装箱的识别。
进一步地,所述新型集装箱生成单元编码生成新型集装箱号所使用的编码方式为信道编码RS编码技术,新型集装箱号编码过程包括以下步骤:
步骤S1:定义初始参量,计算信息码符多项式M(x);
定义初始输入信息位有效字符m(x),则生成信息码符多项式M(x)=mnxn+mn+1xn+1+...mn+9xn+9;
步骤S2:定义RS校验码个数,计算RS校验码生成多项式G(x);
定义RS校验码个数为n,n为正整数,RS校验码生成多项式为其中k0是偏移量;
步骤S3:用RS校验码生成多项式G(x)除信息码符多项式M(x)得到余式R(x);
余式R(x)=m0+m1x+...mn-1xn-1;
步骤S4:联合信息码符多项式M(x)和余式R(x)的系数得到最终RS码即新型集装箱号;
最终生成RS码字的多项式表达式为C(x)=M(x)+R(x);新型集装箱号码字序列为c(x)=m10+n-1,m10+n-2,m10+n-3,...m0;将其从6位二进制码转为正常符号加数字的形式,生成最终新型集装箱号,号码长度为10+n。
进一步地,所述智能识别单元包括端到端AI识别器与RS译码检纠错器;所述AI识别器对包含使用新型集装箱号的集装箱实际场景图进行STR识别,得出与箱号序列相同的识别序列;之后所述RS译码检纠错器进行RS译码检纠错操作;利用RS译码检纠错器中的syndrome进行校验,判断进行STR识别生成的序列号是否出错,全部正确则通过去除RS校验码,自动输出AI识别信息位结果;若校验识别出错,将进行错误定位,找到识别出错的位置,进入RS译码检纠错器中的RS译码纠错器进行错误纠正,RS译码纠错器包括RS译码定位错误字符、译码纠错与输出修复结果;纠正之后去除RS校验码,输出正确的十位集装箱号信息位。
进一步地,所述AI识别器识别集装箱实际场景图得出与箱号序列相同的识别序列,所述AI识别器中包括STR检测器与STR识别器;采集集装箱图片或视频数据,标注位置监督标签,使用目标检测算法或文本检测算法进行微调训练,得到集装箱号检测器即STR检测器;采集集装箱图片或视频数据,裁剪集装箱号区域,标注语义监督标签,使用单字符识别算法或多字符识别算法进行微调训练,得到集装箱号识别器即STR识别器;
具体步骤如下:
步骤1:输入带有新型号码的港口集装箱图片或视频;
步骤2:进入STR检测器,检测出新型集装箱号区域;
步骤3:将新型集装箱号区域送入STR识别器进行字符串识别;
步骤4:输出STR结果。
进一步地,利用RS译码检纠错器中的syndrome进行校验的具体内容为:校正子Syndrome是对r(x)执行奇偶校验的结果,确定r(x)是否为有效成员;r(x)是通过AI识别之后的集装箱号转换到伽罗华域的RS码多项式,结构特征为Syndrome由n个符号组成,计算公式为/>如果r(x)中任何一个都是有效的,那么每个Syndrome都为0;若是出现非零Syndrome,那么说明校验的RS码出错。
进一步地,所述RS译码纠错具体包括以下内容:
出现t个错误就需要求解2t个值来进行错误定位和错误值确定;使用里德-所罗门解码算法,解出2t个联立方程组得到错误位置和错误值表示为其中ei为错误值,j为错误位置;错误纠正将r(x)还原为真实值U(x),运算公式为/>U(x)为正确码字;根据公式/>还原出正确码字后,再通过域转换,将伽罗华域的RS码多项式还原为实际输出集装箱信息位。
进一步地,所述目标检测算法能够选择包括但不限于r-cnn、fast r-cnn、mask r-cnn、yolo检测系列或SSD算法。
进一步地,所述文本检测算法能够选择包括但不限于CTPN、Seglink、pixellink、MCN、Textsnake、CRAFT、PAN或EAST算法。
进一步地,所述单字符识别算法能够选择包括但不限于像素匹配法或手写字符识别算法。
进一步地,所述多字符识别算法能够选择包括但不限于crnn+CTC、crnn+attention或transformer算法。
与现有技术相比,本发明具有以下有益效果:
(1)本发明利用信道编码RS码技术,建立新型集装箱号编码规则,有更好的应用价值与应用前景。
(2)本发明建立一套完整的集装箱号智能识别系统,有效提升港口集装箱吞吐查验效率,减少人工和时间成本。
(3)本发明将信道编码技术融合进基于深度学习的计算机视觉领域,极大克服了目前智能识别出现错检的不足,达到智能识别率99%以上,推进港口智能化进程。
附图说明
图1为本发明实施例十四位为例的流程框图。
图2为本发明实施例的十四位为例原始集装箱号与利用本发明新型编码规则生成的新型集装箱号对比图。
图3为本发明实施例的十四位为例利用新型编码规则建立集装箱号的实例流程图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供一种基于信道编码的人工智能集装箱识别系统,其特征在于:包括新型集装箱号生成单元和智能识别单元;所述新型集装箱号生成单元和所述智能识别单元通信相连,用以将所述新型集装箱号生成单元编码生成的新型集装箱号通过所述智能识别单元进行识别,完成人工智能集装箱的识别。
在本实施例中,所述新型集装箱生成单元编码生成新型集装箱号所使用的编码方式为信道编码RS编码技术,新型集装箱号编码过程包括以下步骤:
步骤S1:定义初始参量,计算信息码符多项式M(x);
定义初始输入信息位有效字符m(x),则生成信息码符多项式M(x)=mnxn+mn+1xn+1+...mn+9xn+9;
步骤S2:定义RS校验码个数,计算RS校验码生成多项式G(x);
定义RS校验码个数为n,n为正整数,RS校验码生成多项式为其中k0是偏移量;
步骤S3:用RS校验码生成多项式G(x)除信息码符多项式M(x)得到余式R(x);
余式R(x)=m0+m1x+...mn-1xn-1;
步骤S4:联合信息码符多项式M(x)和余式R(x)的系数得到最终RS码即新型集装箱号;
最终生成RS码字的多项式表达式为C(x)=M(x)+R(x);新型集装箱号码字序列为c(x)=m10+n-1,m10+n-2,m10+n-3,...m0;将其从6位二进制码转为正常符号加数字的形式,生成最终新型集装箱号,为10+RS校验码个数。
在本实施例中,所述智能识别单元包括端到端AI识别器与RS译码检纠错器;所述AI识别器对包含使用新型集装箱号的集装箱实际场景图进行STR识别,首先进行集装箱号区域检测,后将号码区域进行识别,得出与箱号序列相同的识别序列;之后所述RS译码检纠错器进行RS译码检纠错操作;利用RS译码检纠错器中的syndrome进行校验,判断进行STR识别生成的序列号是否出错,全部正确则通过去除RS校验码,自动输出AI识别信息位结果;若校验识别出错,将进行错误定位,找到识别出错的位置,进入RS译码检纠错器中的RS译码纠错器进行错误纠正,RS译码纠错器包括RS译码定位错误字符、译码纠错与输出修复结果;纠正之后去除RS校验码,输出正确的十位集装箱号信息位。
在本实施例中,所述AI识别器识别集装箱实际场景图得出与箱号序列相同的识别序列,AI识别器包括STR检测器和STR识别器两个部分;
采集集装箱图片或视频数据,标注位置监督标签,使用目标检测算法(r-cnn,fastr-cnn,mask r-cnn,yolo检测系列,SSD等)或文本检测算法(CTPN,Seglink,pixellink,MCN,Textsnake,CRAFT,PAN,EAST等)进行微调训练,得到集装箱号检测器即STR检测器;采集集装箱图片或视频数据,裁剪集装箱号区域,标注语义监督标签,使用单字符识别算法(像素匹配法,手写字符识别算法等)或多字符识别算法(crnn+CTC,crnn+attention,transformer等)进行微调训练,得到集装箱号识别器即STR识别器;
具体步骤如下:
步骤1:输入带有新型号码的港口集装箱图片或视频;
步骤2:进入STR检测器,检测出新型集装箱号区域;
步骤3:将新型集装箱号区域送入STR识别器进行字符串识别;
步骤4:输出STR结果。
在本实施例中,利用RS译码检纠错器中的syndrome进行校验的具体内容为:校正子Syndrome是对r(x)执行奇偶校验的结果,确定r(x)是否为有效成员;r(x)是通过AI识别之后的集装箱号转换到伽罗华域的RS码多项式,结构特征为Syndrome由n个符号组成,计算公式为/>如果r(x)中任何一个都是有效的,那么每个Syndrome都为0;若是出现非零Syndrome,那么说明校验的RS码出错。
在本实施例中,所述RS译码纠错具体包括以下内容:
出现t个错误就需要求解2t个值来进行错误定位和错误值确定;使用里德-所罗门解码算法,解出2t个联立方程组得到错误位置和错误值表示为其中ei为错误值,j为错误位置;错误纠正将r(x)还原为真实值U(x),运算公式为/>U(x)为正确码字;根据公式/>还原出正确码字后,再通过域转换,将伽罗华域的RS码多项式还原为实际输出集装箱信息位。
在本实施例中,所述目标检测算法能够选择包括但不限于r-cnn、fastr-cnn、maskr-cnn、yolo检测系列或SSD算法。
在本实施例中,所述文本检测算法能够选择包括但不限于CTPN、Seglink、pixellink、MCN、Textsnake、CRAFT、PAN或EAST算法。
在本实施例中,所述单字符识别算法能够选择包括但不限于像素匹配法或手写字符识别算法。
在本实施例中,所述多字符识别算法能够选择包括但不限于crnn+CTC、crnn+attention或transformer算法。
较佳的,在本实施例中,AI识别器包括STR检测器和STR识别器两个部分;STR检测器:目前在文本定位的算法上可以使用yolo,craft,DB等方法。我们对算法的使用不受限制。针对集装箱号的泛化性,我们需要对集装箱数据集进行微调训练,具体步骤为:采集集装箱图片或视频数据,标注位置监督标签,使用目标检测算法或文本检测算法进行微调训练,得到集装箱号检测器即STR检测器。STR识别器:目前在文本识别的算法上可以使用传统像素匹配法,使用深度学习下单字符识别算法(手写字符识别算法等),多字符识别算法(CRNN+CTC,CRNN+ATTENTION等)。我们对算法的使用不受限制。针对集装箱号的泛化性,我们需要对集装箱数据集进行微调训练,具体步骤为:采集集装箱图片或视频数据,裁剪集装箱号区域,标注语义监督标签,使用上述算法进行微调训练,得到集装箱号识别器即STR识别器。
较佳的,在本实施例中,当前港口使用的集装箱号编码规则是由十位集装箱号加一位校验位构成,校验位提供判断前十位信息位是否正确的功能。在现阶段的智慧港口建设中,集装箱箱号识别与验证是很关键的一环。为了提升识别率,本发明通过利用RS信道编码,将前十位集装箱号信息位根据RS编码规则进行编码得出RS校验码。最终生成的集装箱号为十位集装箱信息位加RS校验码。RS编码可以提供校验功能校验前十位真实信息位是否出错,并且它能够提供错误纠正功能。编码后的集装箱号码序列在AI识别之后,识别后的号码可以再由RS码译码检错器判断出错和错误定位,最后通过RS译码纠错器,纠正错误信息。这可以极大提升整体的集装箱号码识别率助力智慧港口建设。
较佳的,本实施例结合信道编码的RS系统码技术,对初始集装箱号十位信息位进行RS编码,得到编码后的码字。该码字包含初始的十位信息位和RS校验位。将该码字作为集装箱号码序列,作为后期的AI识别系统输入。
原始集装箱号由三部分组成。第一部分为四位英文字母,前三位代表箱主,经营人,第四位代码说明集装箱类型;第二部分由六位数字组成,是箱体的注册码,此为集装箱箱体的唯一标识;第三部分为校验码,是由第一部分和第二部分经过原始校验规则运算得到的,用于校验是否发生错误。在发明专利里,通过我们的编码规则实现的新型序列也是一个由三部分构成的号码,前两个部分不变,将第三部分换成RS校验码,整体称为RS码。号码对比图如图2所示。
具体包括以下步骤:
步骤S1:编码生成新型集装箱号
步骤S2:AI识别系统
集装箱信息位为十位有效字符转为m位二进制码m(x)=m2t+9,m2t+8,...m2t。对其进行RS编码生成RS(n,k)码。其中n为整体RS码长,k为信息位长度,使用的RS码为RS缩短码,系统码RS(n1,k1)为其母码,其中n1=2m-1,k1-k=n1-n。n,k要遵循0<k<n<2m+2,m为符号大小,如m=8则表示符号由8位二进制组成。L=n-k=2t为校验码的符号数,t为之后能够在RS译码中进行纠错的数目。整个编码过程建立在伽罗华域GF(2m)上进行,多项式计算遵循mod2运算。针对集装箱号情况以及目前AI最佳识别率88.5%,我们取n=14,k=10,m=6。即缩短RS(14,10)码,建立在伽罗华域GF(64)上,包括36种(数字0-9,以及字母A-Z)集装箱有效信息位。
生成新型集装箱号过程如图3所示(图中表明输出新型号码替换区域)。新型集装箱号编码过程包括以下步骤:
步骤S11:定义初始参量,计算信息码符多项式M(x)。
定义初始输入信息位有效字符m(x),则生成信息码符多项式M(x)=m4x4+m5x5+...m13x13。
步骤S12:定义RS校验码个数,计算RS校验码生成多项式G(x)。
定义RS校验码个数为4,RS校验码生成多项式为其中k0是偏移量,通常取k0=0或k0=1,这里取0。
步骤S13:用RS校验码生成多项式G(x)除信息码符多项式M(x)得到余式R(x)。
用RS校验码生成多项式G(x)除信息码符多项式M(x),得到余式R(x)=m0+m1x+...m3x3。
步骤S14:联合信息码符多项式M(x)和余式R(x)的系数得到最终RS码即新型集装箱号。
最终生成RS码字的多项式表达式为C(x)=M(x)+R(x)。我们14位新型集装箱号码字序列为c(x)=m13,m12,m11,...m0。将其从6位二进制码转为正常符号加数字的形式,生成我们最终的14位新型集装箱号。
AI识别系统运行流程图如图1所示,可分为两个操作:
(1)STR识别操作。
(2)RS译码检纠错操作。
具体实施包括以下步骤:
步骤S21:STR识别模块四个阶段操作。
阶段一:输入带有新型号码的港口集装箱,可以是图片,视频。
阶段二:进入STR检测器,检测出新型集装箱号区域。
阶段三:将新型集装箱号区域送入STR识别器进行字符串识别。
阶段四:输出STR结果,为(14)位字符串。
步骤S22:RS译码检纠错模块两个阶段操作。
阶段一:RS译码检错验证。计算校正子Syndrome,验证识别字符串是否出错。
校正子是对r(x)执行奇偶校验的结果,确定r(x)是否为有效成员。这里的r(x)是通过AI识别之后的集装箱号转换到伽罗华域的RS码多项式,结构特征为Syndrome由4个符号组成,计算公式为/>如果r(x)中任何一个都是有效的,那么每个Syndrome都为0。若是出现非零Syndrome,那么说明校验的RS码出错。
阶段二:RS译码纠错。包括了错误定位,错误纠正两个部分。出现t个错误就需要求解2t个值来进行错误定位和错误值确定。使用里德-所罗门解码算法,可以解出2t个联立方程组得到错误位置和错误值表示为其中ei为错误值,j为错误位置。错误纠正只需要将r(x)还原为真实值U(x)。运算公式为/>还原出正确码字,再通过域转换。将伽罗华域的RS码多项式还原为实际输出集装箱信息位。
在集装箱号码的智能检错场景,利用此编码方式,人工校验工作十分便捷,只需进行简单的RS译码检错操作就能够实现校验。在AI识别场景下,RS校验码不仅可以完成校验工作,并且它能够提供定位错误,纠正AI识别错误的功能。等价于在通信系统中,传输信息的出错率为5%,在这种场景,通过RS(14,10)译码可将误码率降至10-3。同样,目前应用在集装箱号识别的AI识别算法的字符识别率95%,误识别率为5%,采用RS码译码后也可将字符误识别率降至10-3,也就是将整体号码的识别率提升到95%以上,极大提升集装箱号码识别效果。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
Claims (5)
1.一种基于信道编码的人工智能集装箱识别系统,其特征在于:包括新型集装箱号生成单元和智能识别单元;所述新型集装箱号生成单元和所述智能识别单元通信相连,用以将所述新型集装箱号生成单元编码生成的新型集装箱号通过所述智能识别单元进行识别,完成人工智能集装箱的识别;
所述新型集装箱生成单元编码生成新型集装箱号所使用的编码方式为信道编码RS编码技术,新型集装箱号编码过程包括以下步骤:
步骤S1:定义初始参量,计算信息码符多项式M(x);
定义初始输入信息位有效字符m(x),则生成信息码符多项式M(x)=mnxn+mn+1xn+1+...mn+9xn+9;
步骤S2:定义RS校验码个数,计算RS校验码生成多项式G(x);
定义RS校验码个数为n,n为正整数,RS校验码生成多项式为其中k0是偏移量;
步骤S3:用RS校验码生成多项式G(x)除信息码符多项式M(x)得到余式R(x);
余式R(x)=m0+m1x+...mn-1xn-1;
步骤S4:联合信息码符多项式M(x)和余式R(x)的系数得到最终RS码即新型集装箱号;
最终生成RS码字的多项式表达式为C(x)=M(x)+R(x);新型集装箱号码字序列为c(x)=m10+n-1,m10+n-2,m10+n-3,...m0;将其从6位二进制码转为正常符号加数字的形式,生成最终新型集装箱号,号码长度为10+n;
所述智能识别单元包括端到端AI识别器与RS译码检纠错器;所述AI识别器对包含使用新型集装箱号的集装箱实际场景图进行STR识别,得出与箱号序列相同的识别序列;之后所述RS译码检纠错器进行RS译码检纠错操作;利用RS译码检纠错器中的syndrome进行校验,判断进行STR识别生成的序列号是否出错,全部正确则通过去除RS校验码,自动输出AI识别信息位结果;若校验识别出错,将进行错误定位,找到识别出错的位置,进入RS译码检纠错器中的RS译码纠错器进行错误纠正,RS译码纠错器包括RS译码定位错误字符、译码纠错与输出修复结果;纠正之后去除RS校验码,输出正确的十位集装箱号信息位;
所述AI识别器识别集装箱实际场景图得出与箱号序列相同的识别序列,所述AI识别器中包括STR检测器与STR识别器;采集集装箱图片或视频数据,标注位置监督标签,使用目标检测算法或文本检测算法进行微调训练,得到集装箱号检测器即STR检测器;采集集装箱图片或视频数据,裁剪集装箱号区域,标注语义监督标签,使用单字符识别算法或多字符识别算法进行微调训练,得到集装箱号识别器即STR识别器;
具体包括以下步骤:
步骤1:输入带有新型号码的港口集装箱图片或视频;
步骤2:进入STR检测器,检测出新型集装箱号区域;
步骤3:将新型集装箱号区域送入STR识别器进行字符串识别;
步骤4:输出STR结果;
利用RS译码检纠错器中的syndrome进行校验的具体内容为:校正子Syndrome是对r(x)执行奇偶校验的结果,确定r(x)是否为有效成员;r(x)是通过AI识别之后的集装箱号转换到伽罗华域的RS码多项式,结构特征为Syndrome由n个符号组成,计算公式为/>i=1,...,n;如果r(x)中任何一个都是有效的,那么每个Syndrome都为0;若是出现非零Syndrome,那么说明校验的RS码出错;
所述RS译码纠错具体包括以下内容:
出现t个错误就需要求解2t个值来进行错误定位和错误值确定;使用里德-所罗门解码算法,解出2t个联立方程组得到错误位置和错误值表示为其中ei为错误值,j为错误位置;错误纠正将r(x)还原为真实值U(x),运算公式为/>U(x)为正确码字;根据公式/>还原出正确码字后,再通过域转换,将伽罗华域的RS码多项式还原为实际输出集装箱信息位。
2.根据权利要求1所述的一种基于信道编码的人工智能集装箱识别系统,其特征在于:所述目标检测算法能够选择包括但不限于r-cnn、fastr-cnn、mask r-cnn、yolo检测系列或SSD算法。
3.根据权利要求1所述的一种基于信道编码的人工智能集装箱识别系统,其特征在于:所述文本检测算法能够选择包括但不限于CTPN、Seglink、pixellink、MCN、Textsnake、CRAFT、PAN或EAST算法。
4.根据权利要求1所述的一种基于信道编码的人工智能集装箱识别系统,其特征在于:所述单字符识别算法能够选择包括但不限于像素匹配法或手写字符识别算法。
5.根据权利要求1所述的一种基于信道编码的人工智能集装箱识别系统,其特征在于:所述多字符识别算法能够选择包括但不限于crnn+CTC、crnn+attention或transformer算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110879145.3A CN113610092B (zh) | 2021-07-31 | 2021-07-31 | 一种基于信道编码的人工智能集装箱识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110879145.3A CN113610092B (zh) | 2021-07-31 | 2021-07-31 | 一种基于信道编码的人工智能集装箱识别系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113610092A CN113610092A (zh) | 2021-11-05 |
CN113610092B true CN113610092B (zh) | 2023-11-10 |
Family
ID=78338995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110879145.3A Active CN113610092B (zh) | 2021-07-31 | 2021-07-31 | 一种基于信道编码的人工智能集装箱识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113610092B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1849750A (zh) * | 2004-01-15 | 2006-10-18 | 桑德布里奇技术公司 | 里得-所罗门编码和解码方法 |
CN101325706A (zh) * | 2007-06-13 | 2008-12-17 | 卓胜微电子(上海)有限公司 | 低硬件开销Reed-Solomon解码器 |
CN101583031A (zh) * | 2009-06-26 | 2009-11-18 | 西安电子科技大学 | 基于小波的图像压缩传输方法 |
CN103139571A (zh) * | 2013-03-21 | 2013-06-05 | 南通大学 | 基于fec与wz编解码相结合的视频容错抗误码方法 |
CN107800439A (zh) * | 2016-08-30 | 2018-03-13 | 马维尔国际贸易有限公司 | 用于里德索罗门码的低延迟解码器 |
CN108805502A (zh) * | 2018-06-08 | 2018-11-13 | 网赢如意仓供应链股份有限公司 | 智能识别理货方法和装置 |
CN109522900A (zh) * | 2018-10-30 | 2019-03-26 | 北京陌上花科技有限公司 | 自然场景文字识别方法及装置 |
CN112994838A (zh) * | 2019-12-16 | 2021-06-18 | 中国电信股份有限公司 | 信道编码及译码方法和装置、信息传输系统 |
-
2021
- 2021-07-31 CN CN202110879145.3A patent/CN113610092B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1849750A (zh) * | 2004-01-15 | 2006-10-18 | 桑德布里奇技术公司 | 里得-所罗门编码和解码方法 |
CN101325706A (zh) * | 2007-06-13 | 2008-12-17 | 卓胜微电子(上海)有限公司 | 低硬件开销Reed-Solomon解码器 |
CN101583031A (zh) * | 2009-06-26 | 2009-11-18 | 西安电子科技大学 | 基于小波的图像压缩传输方法 |
CN103139571A (zh) * | 2013-03-21 | 2013-06-05 | 南通大学 | 基于fec与wz编解码相结合的视频容错抗误码方法 |
CN107800439A (zh) * | 2016-08-30 | 2018-03-13 | 马维尔国际贸易有限公司 | 用于里德索罗门码的低延迟解码器 |
CN108805502A (zh) * | 2018-06-08 | 2018-11-13 | 网赢如意仓供应链股份有限公司 | 智能识别理货方法和装置 |
CN109522900A (zh) * | 2018-10-30 | 2019-03-26 | 北京陌上花科技有限公司 | 自然场景文字识别方法及装置 |
CN112994838A (zh) * | 2019-12-16 | 2021-06-18 | 中国电信股份有限公司 | 信道编码及译码方法和装置、信息传输系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113610092A (zh) | 2021-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8553968B1 (en) | Using optical character recognition augmented by an error correction code to detect serial numbers written on a wafer | |
US20100327066A1 (en) | Network based reliable decoding of bar codes | |
US11080500B2 (en) | Two-dimensional code error correction decoding | |
CN114818721B (zh) | 一种结合序列标注的事件联合抽取模型与方法 | |
WO2022237027A1 (en) | License plate classification method, license plate classification apparatus, and computer-readable storage medium | |
CN116978011B (zh) | 一种用于智能目标识别的图像语义通信方法及系统 | |
CN113610092B (zh) | 一种基于信道编码的人工智能集装箱识别系统 | |
JP2002015278A (ja) | ハードコピー・ドキュメントのための画像データ生成方法及び同装置 | |
CN109360143A (zh) | 一种用于大数据的数字水印嵌入和提取方法及系统 | |
Melgar et al. | Channel capacity analysis of 2D barcodes: QR Code and CQR Code-5 | |
JP2002015279A (ja) | ハードコピー・ドキュメントのための画像データ復号化方法及び同装置 | |
CN110798224A (zh) | 一种压缩编码、检错及解码方法 | |
CN110852098A (zh) | 一种数据修正方法及电子设备和存储介质 | |
CN1705029A (zh) | 检测数据中的错误的系统与方法 | |
CN115565179A (zh) | 一种字符识别后纠错方法、系统及装置 | |
CN115147847A (zh) | 文本识别结果的确定方法、装置、存储介质及计算机设备 | |
KR20070025853A (ko) | 이진 영상 압축 장치 및 방법 | |
CN110781185B (zh) | 一种文本文件内容像素化转换及还原方法 | |
CN115936037B (zh) | 二维码的解码方法及装置 | |
CN107689796B (zh) | 一种基于先验信息的无损压缩文件容错解压方法 | |
US6862113B1 (en) | Assist channel coding with character classifications | |
CN115861663B (zh) | 一种基于自监督学习模型的文档图像内容比对方法 | |
CN101420624B (zh) | 一种视频解码错误处理方法及装置 | |
RU2792258C1 (ru) | Способ защиты электронных документов текстового формата, представленных на твердых носителях информации | |
CN113643389B (zh) | 一种基于分割的图像无损压缩方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |