CN109478229A - 用于字符识别的分类网络的训练装置、字符识别装置及方法 - Google Patents
用于字符识别的分类网络的训练装置、字符识别装置及方法 Download PDFInfo
- Publication number
- CN109478229A CN109478229A CN201680087710.XA CN201680087710A CN109478229A CN 109478229 A CN109478229 A CN 109478229A CN 201680087710 A CN201680087710 A CN 201680087710A CN 109478229 A CN109478229 A CN 109478229A
- Authority
- CN
- China
- Prior art keywords
- sample
- network
- feature
- unmarked
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 86
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013527 convolutional neural network Methods 0.000 claims description 34
- 238000010276 construction Methods 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 102100033620 Calponin-1 Human genes 0.000 description 6
- 102100033591 Calponin-2 Human genes 0.000 description 6
- 101000945318 Homo sapiens Calponin-1 Proteins 0.000 description 6
- 101000945403 Homo sapiens Calponin-2 Proteins 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
一种用于字符识别的分类网络的训练装置、字符识别装置及方法。该装置及方法通过对未标记样本构建样本对来训练对称网络,利用经过训练的对称网络的参数对分类网络进行初始化,并利用已标记样本对经过初始化的分类网络进行训练,能够提高分类网络的识别准确率并有效节约标注成本。
Description
PCT国内申请,说明书已公开。
Claims (19)
- PCT国内申请,权利要求书已公开。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2016/097521 WO2018039970A1 (zh) | 2016-08-31 | 2016-08-31 | 用于字符识别的分类网络的训练装置、字符识别装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109478229A true CN109478229A (zh) | 2019-03-15 |
CN109478229B CN109478229B (zh) | 2021-08-10 |
Family
ID=61299688
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680087710.XA Active CN109478229B (zh) | 2016-08-31 | 2016-08-31 | 用于字符识别的分类网络的训练装置、字符识别装置及方法 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP6696622B2 (zh) |
CN (1) | CN109478229B (zh) |
WO (1) | WO2018039970A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102197155B1 (ko) * | 2019-10-22 | 2020-12-31 | 상명대학교산학협력단 | 동물 종 인식 장치 및 방법 |
CN113496277A (zh) | 2020-04-03 | 2021-10-12 | 三星电子株式会社 | 用于检索图像的神经网络装置及其操作方法 |
CN111507247B (zh) * | 2020-04-16 | 2023-04-18 | 华南理工大学 | 一种基于强化学习的古籍文字精准检测方法 |
CN111881943A (zh) * | 2020-07-08 | 2020-11-03 | 泰康保险集团股份有限公司 | 图像分类的方法、装置、设备和计算机可读介质 |
CN114049686A (zh) * | 2021-11-15 | 2022-02-15 | 北京百度网讯科技有限公司 | 签名识别模型训练方法、装置及电子设备 |
CN114399030B (zh) * | 2022-01-18 | 2024-10-01 | 腾讯科技(深圳)有限公司 | 推荐模型的训练方法、媒体信息推荐方法、装置及设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040114803A1 (en) * | 2002-12-17 | 2004-06-17 | Diar Tuganbaev | Method of stricken-out character recognition in handwritten text |
CN1596420A (zh) * | 2001-10-11 | 2005-03-16 | 爱科赛亚有限责任公司 | 用于学习模式分类和判定值估计的方法和装置 |
CN101286202A (zh) * | 2008-05-23 | 2008-10-15 | 中南民族大学 | 多字体多字号的基于彝文字符集的印刷体字符识别方法 |
CN101373519A (zh) * | 2007-08-20 | 2009-02-25 | 富士通株式会社 | 字符识别装置和方法 |
CN102163284A (zh) * | 2011-04-11 | 2011-08-24 | 西安电子科技大学 | 面向中文环境的复杂场景文本定位方法 |
CN102324046A (zh) * | 2011-09-01 | 2012-01-18 | 西安电子科技大学 | 结合主动学习的四分类器协同训练方法 |
CN103577831A (zh) * | 2012-07-30 | 2014-02-12 | 国际商业机器公司 | 用于基于反馈来生成训练模型的方法和装置 |
CN104008384A (zh) * | 2013-02-26 | 2014-08-27 | 山东新北洋信息技术股份有限公司 | 字符识别方法和字符识别装置 |
CN104657744A (zh) * | 2015-01-29 | 2015-05-27 | 中国科学院信息工程研究所 | 一种基于非确定主动学习的多分类器训练方法及分类方法 |
CN105046196A (zh) * | 2015-06-11 | 2015-11-11 | 西安电子科技大学 | 基于级联卷积神经网络的前车车辆信息结构化输出方法 |
CN105139041A (zh) * | 2015-08-21 | 2015-12-09 | 北京旷视科技有限公司 | 基于图像的语种识别方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104346628B (zh) * | 2013-08-01 | 2017-09-15 | 天津天地伟业数码科技有限公司 | 基于多尺度多方向Gabor特征的车牌汉字识别方法 |
CN103870803A (zh) * | 2013-10-21 | 2014-06-18 | 北京邮电大学 | 一种基于粗定位与精定位融合的车牌识别方法和系统 |
US10242313B2 (en) * | 2014-07-18 | 2019-03-26 | James LaRue | Joint proximity association template for neural networks |
-
2016
- 2016-08-31 CN CN201680087710.XA patent/CN109478229B/zh active Active
- 2016-08-31 WO PCT/CN2016/097521 patent/WO2018039970A1/zh active Application Filing
- 2016-08-31 JP JP2019504733A patent/JP6696622B2/ja active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1596420A (zh) * | 2001-10-11 | 2005-03-16 | 爱科赛亚有限责任公司 | 用于学习模式分类和判定值估计的方法和装置 |
US20040114803A1 (en) * | 2002-12-17 | 2004-06-17 | Diar Tuganbaev | Method of stricken-out character recognition in handwritten text |
CN101373519A (zh) * | 2007-08-20 | 2009-02-25 | 富士通株式会社 | 字符识别装置和方法 |
CN101286202A (zh) * | 2008-05-23 | 2008-10-15 | 中南民族大学 | 多字体多字号的基于彝文字符集的印刷体字符识别方法 |
CN102163284A (zh) * | 2011-04-11 | 2011-08-24 | 西安电子科技大学 | 面向中文环境的复杂场景文本定位方法 |
CN102324046A (zh) * | 2011-09-01 | 2012-01-18 | 西安电子科技大学 | 结合主动学习的四分类器协同训练方法 |
CN103577831A (zh) * | 2012-07-30 | 2014-02-12 | 国际商业机器公司 | 用于基于反馈来生成训练模型的方法和装置 |
CN104008384A (zh) * | 2013-02-26 | 2014-08-27 | 山东新北洋信息技术股份有限公司 | 字符识别方法和字符识别装置 |
CN104657744A (zh) * | 2015-01-29 | 2015-05-27 | 中国科学院信息工程研究所 | 一种基于非确定主动学习的多分类器训练方法及分类方法 |
CN105046196A (zh) * | 2015-06-11 | 2015-11-11 | 西安电子科技大学 | 基于级联卷积神经网络的前车车辆信息结构化输出方法 |
CN105139041A (zh) * | 2015-08-21 | 2015-12-09 | 北京旷视科技有限公司 | 基于图像的语种识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6696622B2 (ja) | 2020-05-20 |
JP2019528520A (ja) | 2019-10-10 |
WO2018039970A1 (zh) | 2018-03-08 |
CN109478229B (zh) | 2021-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109478229A (zh) | 用于字符识别的分类网络的训练装置、字符识别装置及方法 | |
US10229346B1 (en) | Learning method, learning device for detecting object using edge image and testing method, testing device using the same | |
CN110363252B (zh) | 趋向于端到端的场景文字检测与识别方法以及系统 | |
Rothacker et al. | Bag-of-features HMMs for segmentation-free word spotting in handwritten documents | |
CN104463101B (zh) | 用于文字性试题的答案识别方法及系统 | |
CN101504719B (zh) | 图像处理装置和方法 | |
CN111709406B (zh) | 文本行识别方法及装置、可读存储介质、电子设备 | |
CN105144239A (zh) | 图像处理装置、程序及图像处理方法 | |
CN112990175B (zh) | 手写中文字符的识别方法、装置、计算机设备和存储介质 | |
CN101866418B (zh) | 确定文档阅读顺序的方法和设备 | |
CN107273883B (zh) | 决策树模型训练方法、确定ocr结果中数据属性方法及装置 | |
CN109740553B (zh) | 一种基于识别的图像语义分割数据筛选方法及系统 | |
CN113627402B (zh) | 一种图像识别方法及相关装置 | |
CN105447508A (zh) | 一种字符图像验证码识别的方法及系统 | |
CN109800750A (zh) | 一种基于图像形态学用于规则排版的文本的文字区域标注方法 | |
CN112883795A (zh) | 一种基于深度神经网络的表格快速自动提取方法 | |
CN105279506A (zh) | 满文单词中轴线的定位方法 | |
WO2024055864A1 (zh) | 结合rpa和ai实现ia的分类模型的训练方法及装置 | |
CN110751234A (zh) | Ocr识别纠错方法、装置及设备 | |
Pan et al. | Ml-bpm: Multi-teacher learning with bidirectional photometric mixing for open compound domain adaptation in semantic segmentation | |
CN113223011B (zh) | 基于引导网络和全连接条件随机场的小样本图像分割方法 | |
CN116486109A (zh) | 模态自适应的描绘性查询行人重识别方法及系统 | |
CN115879453A (zh) | 一种融合词汇边界及语义信息的实体识别及关系抽取方法 | |
CN110503101A (zh) | 字形评价方法、装置、设备及计算机可读存储介质 | |
CN110532449A (zh) | 一种业务文档的处理方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |