CN115331232A - 一种满文历史文档图像列分割方法 - Google Patents
一种满文历史文档图像列分割方法 Download PDFInfo
- Publication number
- CN115331232A CN115331232A CN202210806936.8A CN202210806936A CN115331232A CN 115331232 A CN115331232 A CN 115331232A CN 202210806936 A CN202210806936 A CN 202210806936A CN 115331232 A CN115331232 A CN 115331232A
- Authority
- CN
- China
- Prior art keywords
- text
- column
- image
- manchu
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/164—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/168—Smoothing or thinning of the pattern; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/293—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
一种满文历史文档图像列分割方法,属于文字分割方法领域。现有的汉字、英文的文字分割技术虽相对成熟,但并不适用于存在褪色、破损、印章、列倾斜弯曲问题的手写满文历史档案文字的识别分割。一种满文历史文档图像列分割方法,包括以下步骤:图像预处理;提取列脊线;提取文本轮廓;分割文本列间粘连处;提取文本列;利用获得的灰度图像与获得的双边滤波图像做差,再加上灰度图像的均值,获得背景填充图像;利用文本区域为掩模,以该区域的外接矩形确定文本列分割区域,分割原始满文历史档案图像文本列,并利用获得的图像对文本列进行背景填充。本发明具有满文文字分割准确高的优点且具有良好的泛化性和鲁棒性。
Description
技术领域
本发明涉及一种图像分割方法,特别涉及一种满文历史文档图像列分割方法。
背景技术
满文历史档案是研究明清历史和满族文化的重要资料,满文历史档案资料因经历多次翻阅使用造成了不同程度的损坏和污染,除了对历史资料的保存以外,由于现在会说满语的人越来越少,保护满族文化刻不容缓。将满文历史档案数字化可以有效利用计算机技术、数据库技术和人工智能技术等现代手段保护满文历史文档,并提供多样的研究手段。光学字符识别(OCR)技术是历史档案数字化的核心技术之一,而文字分割结果直接影响文字识别的准确率。汉字、英文的文字分割技术相对成熟,但这些技术大多针对标准印刷体文字,对手写满文历史档案并没有好的解决方案。满文历史档案的褪色、破损、印章、列倾斜弯曲也增加了文字分割的困难。
发明内容
本发明的目的是为了解决现有的汉字、英文的文字分割技术虽相对成熟,但并不适用于存在褪色、破损、印章、列倾斜弯曲问题的手写满文历史档案文字的识别分割的问题,而提出一种满文历史文档图像列分割方法。
一种满文历史文档图像列分割方法,所述方法通过以下步骤实现:
步骤S1、图像预处理;
步骤S1.1、从原始的RGB满文历史文档图像分离出蓝色单通道分量,作为灰度图像;
步骤S1.2、将步骤S1.1获得的灰度图像输入至双边滤波进行滤波处理;
步骤S2、提取列脊线;
步骤S2.1、将步骤S1.2获取的图像与各向异性高斯核函数进行卷积,并通过二值化处理获取文本列响应,将所得列相应作为列脊线;
步骤S2.2、合并间断的列脊线;
步骤S2.3、运用Zhang-Suen细化算法提取步骤S2.2获得的图像的骨架,并将其延长至图像上下边界,设获得的列脊线在图像中从左至右依次为Li(i=0,1,...,m1),m1为列脊线数;
步骤S3、提取文本轮廓;
步骤S3.1、将步骤S1.1获得的灰度图像运用Canny边缘检测;
步骤S3.2、高斯滤波平滑边缘;
步骤S3.3、利用外接矩形方法对文本轮廓筛选并填充,设获得的文本轮廓为 CCi(i=0,1,...,m2),m2为文本轮廓数;
步骤S4、分割文本列间粘连处;
步骤S4.1、判断出粘连的文本列,设由CCk表示待识别的文本列:
令Ak,i=CCk∩Li;如果同时满足Ak,i≠{}和Ak,i+1≠{},则认为CCk是列间粘连;
步骤S4.2、用Li和Li+1将CCk分为若干段,对两端分别连接Li和Li+1的部分,选择文本轮廓在垂直方向上的最窄处作为该列间粘连文本轮廓的分割线处位置;
步骤S5、提取文本列;
步骤S5.1、将步骤S2、步骤S3和步骤S4的结果合并,形成文本列的初始区域;
步骤S5.2、通过边界区域增长对初始文本区域进行左右扩充,至到相邻区域边界彼此接触为止;
步骤S6、利用S1.1获得的灰度图像与S1.2获得的双边滤波图像做差,再加上S1.1获得的灰度图像的均值,获得背景填充图像;
步骤S7、利用步骤S5.2获得的文本区域为掩模,以该区域的外接矩形确定文本列分割区域,分割原始满文历史档案图像文本列,并利用S6获得的图像对文本列进行背景填充。
优选地,所述的步骤S1.2中,将步骤S1.1获得的灰度图像输入至双边滤波进行滤波处理的步骤,具体为:
优选地,所述的步骤2.1中,将步骤S1.2获取的图像与各向异性高斯核函数进行卷积,并通过二值化处理获取文本列响应,将所得列相应作为列脊线的步骤中:
优选地,所述的步骤S2.2中,合并间断的列脊线的步骤,具体为:
则将ti和tj合并,其中D和W为设定的阈值。
本发明的有益效果为:
本发明具有满文文字分割准确高的优点且具有良好的泛化性和鲁棒性。本发明方法通过设计适用于满文文字识别所涉及的文字分割技术,以用于提高满文识别的准确率。
具体技术手段是:
首先运用通道分离和双边滤波对图片预处理,有效去除噪声并保留文字边缘信息;然后通过各向异性高斯核函数与图像提取列脊线,连接列脊线后提取其骨架;同时通过边缘检测和轮廓提取获得文本轮廓;最后将列脊线和文本轮廓合并,并通过边界增长完成文本列的分割。本发明省略对原始满文文本图像的二值化处理过程,克服了光照、褪色、残缺等因素对图像处理的影响;向异性高斯核函数可以有效提取倾斜和略带弯曲的满文历史档案图像的文本列脊线。基于初始文本列的形成和边界增长的方法完成列分割,可以极大地减少满文圈点笔画给文本分割带来的影响。
附图说明
为了更清楚地说明本发明实施或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种满文历史档案图像列分割方法流程图;
图2是本发明实施例中的原始图像;
图3是本发明实施例中的双边滤波图像;
图4(a)各向异性高斯处理图示;
图4(b)间断列脊线连接图示;
图4(c)提取列脊线结果图示;
图5是本发明实施例中的文本轮廓提取结果图示;
图6是本发明实施例中的文本列间粘连分割结果图示;
图7(a)是本发明实施例涉及的初始文本列图示;
图7(b)是本发明实施例涉及的边界增长后文本列分割结果图示;
图8是本发明实施例涉及的满文历史档案图像文本列分割结果图示;
图9(a)是利用本发明方法对页面破损情况满文历史档案文本列分割结果图示;
图9(b)是利用本发明方法文本列倾斜情况满文历史档案文本列分割结果图示。
具体实施方式
具体实施方式一:
本实施方式的一种满文历史文档图像列分割方法,如图1所示,所述方法包括以下步骤:
步骤S1、图像预处理。
步骤S1.1、从图2所示的原始原始的RGB满文历史文档图像分离出蓝色单通道分量,作为灰度图像。
步骤S1.2、将步骤S1.1获得的灰度图像输入至双边滤波进行滤波处理。其结果如图3 所示。双边滤波器为:其中,I(xi,yi)表示滤波图像; Ifilter(x,y)表示滤波输出;(xi,yi)表示像素点坐标;Wij(I)是双边滤波器权值,其表达式为:其中,Wp归一化权值,和为高斯核函数。σs和σr分别取40和20。
步骤S2、提取列脊线,如图4(a)、4(b)、4(c)所示。
步骤S2.1、将步骤S1.2获取的图像与各向异性高斯核函数进行卷积,并通过二值化处理获取文本列响应,即列脊线(白色为列脊线,黑色为背景),用集合表示为T={t1,t2,..., tn},n为提取的列脊线个数。各向异性高斯核函数为:σx和σy分别取3和30。
步骤S2.2、合并间断的列脊线。通过最小外接矩形方法获得列脊线的端点及斜率,设 ti的端点为和Qi(x2,ti,y2,ti),其斜率的倒数表示为如果ti和tj满足则将ti和tj合并,其中D和W为设定的阈值,分别取35和20。
步骤S2.3、运用Zhang-Suen细化算法提取步骤S2.2获得的图像的骨架,并将其延长至图像上下边界,设获得的列脊线在图像中从左至右依次为Li(i=0,1,...,m1),m1为列脊线数。
步骤S3、提取文本轮廓,如图5所示。
步骤S3.1、将步骤S1.1获得的灰度图像运用Canny边缘检测,上界阈值和下界阈值参数取300和100。
步骤S3.2、高斯滤波平滑边缘,高斯核大小选择3×3。
步骤S3.3、利用外接矩形方法对文本轮廓筛选并填充。设获得的文本轮廓为 CCi(i=0,1,...,m2),m2为文本轮廓数。
步骤S4、分割文本列间粘连处,如图6所示。
步骤S4.1、判断出粘连的文本列,设由CCk表示待识别的文本列:
令Ak,i=CCk∩Li。如果同时满足Ak,i≠{}和Ak,i+1≠{},则认为CCk是列间粘连。
步骤S4.2、用Li和Li+1将CCk分为若干段,对两端分别连接Li和Li+1的部分,选择文本轮廓在垂直方向上的最窄处为该列间粘连文本轮廓的分割线。
步骤S5、文本列提取,如图7(a)、7(b)所示。
步骤S5.1、将步骤S2、步骤S3和步骤S4的结果合并,形成文本列的初始区域。
步骤S5.2、通过边界区域增长对初始文本区域进行左右扩充,至到相邻区域边界彼此接触为止。
步骤S6、利用S1.1获得的灰度图像与S1.2获得的双边滤波图像做差,再加上S1.1获得的灰度图像的均值,获得背景填充图像。
步骤S7、如图8所示,利用步骤S5.2获得的文本区域为掩模,以该区域的外接矩形确定文本列分割区域,分割原始满文历史档案图像文本列,并利用S6获得的图像对文本列进行背景填充。
具体实施方式二:
与具体实施方式一不同的是,本实施方式的一种满文历史文档图像列分割方法,所述步骤S2.1中σx与σy可以通过目标函数自动选取。其中,Lmax表示最长列脊线的长度,n表示获得列脊线个数,Areai表示第i个列脊线的面积。
本发明的实施例公布的是较佳的实施例,但并不局限于此,本领域的普通技术人员,极易根据上述实施例,领会本发明的精神,并做出不同的引申和变化,但只要不脱离本发明的精神,都在本发明的保护范围内。
Claims (5)
1.一种满文历史文档图像列分割方法,其特征在于:所述方法通过以下步骤实现:
步骤S1、图像预处理;
步骤S1.1、从原始的RGB满文历史文档图像分离出蓝色单通道分量,作为灰度图像;
步骤S1.2、将步骤S1.1获得的灰度图像输入至双边滤波进行滤波处理;
步骤S2、提取列脊线;
步骤S2.1、将步骤S1.2获取的图像与各向异性高斯核函数进行卷积,并通过二值化处理获取文本列响应,将所得列相应作为列脊线;
步骤S2.2、合并间断的列脊线;
步骤S2.3、运用Zhang-Suen细化算法提取步骤S2.2获得的图像的骨架,并将其延长至图像上下边界,设获得的列脊线在图像中从左至右依次为Li(i=0,1,...,m1),m1为列脊线数;
步骤S3、提取文本轮廓;
步骤S3.1、将步骤S1.1获得的灰度图像运用Canny边缘检测;
步骤S3.2、高斯滤波平滑边缘;
步骤S3.3、利用外接矩形方法对文本轮廓筛选并填充,设获得的文本轮廓为CCi(i=0,1,...,m2),m2为文本轮廓数;
步骤S4、分割文本列间粘连处;
步骤S4.1、判断出粘连的文本列,设由CCk表示待识别的文本列:
令Ak,i=CCk∩Li;如果同时满足Ak,i≠{}和Ak,i+1≠{},则认为CCk是列间粘连;
步骤S4.2、用Li和Li+1将CCk分为若干段,对两端分别连接Li和Li+1的部分,选择文本轮廓在垂直方向上的最窄处作为该列间粘连文本轮廓的分割线处位置;
步骤S5、提取文本列;
步骤S5.1、将步骤S2、步骤S3和步骤S4的结果合并,形成文本列的初始区域;
步骤S5.2、通过边界区域增长对初始文本区域进行左右扩充,至到相邻区域边界彼此接触为止;
步骤S6、利用S1.1获得的灰度图像与S1.2获得的双边滤波图像做差,再加上S1.1获得的灰度图像的均值,获得背景填充图像;
步骤S7、利用步骤S5.2获得的文本区域为掩模,以该区域的外接矩形确定文本列分割区域,分割原始满文历史档案图像文本列,并利用S6获得的图像对文本列进行背景填充。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210806936.8A CN115331232B (zh) | 2022-07-08 | 2022-07-08 | 一种满文历史文档图像列分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210806936.8A CN115331232B (zh) | 2022-07-08 | 2022-07-08 | 一种满文历史文档图像列分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115331232A true CN115331232A (zh) | 2022-11-11 |
CN115331232B CN115331232B (zh) | 2023-08-18 |
Family
ID=83917244
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210806936.8A Active CN115331232B (zh) | 2022-07-08 | 2022-07-08 | 一种满文历史文档图像列分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115331232B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104361336A (zh) * | 2014-11-26 | 2015-02-18 | 河海大学 | 一种水下视频图像的文字识别方法 |
CN104376319A (zh) * | 2014-10-22 | 2015-02-25 | 西安工程大学 | 一种基于各向异性高斯核提取封闭边缘图像轮廓的方法 |
WO2015115499A1 (ja) * | 2014-02-03 | 2015-08-06 | 株式会社タカコ | 工具検査方法及び工具検査装置 |
US20160253571A1 (en) * | 2015-02-27 | 2016-09-01 | Sharp Laboratories Of America, Inc. | Methods and Systems for Suppressing Non-Document-Boundary Contours in an Image |
CN106683102A (zh) * | 2016-12-30 | 2017-05-17 | 西安电子科技大学 | 基于脊波滤波器和卷积结构模型的sar图像分割方法 |
CN108564078A (zh) * | 2018-04-24 | 2018-09-21 | 大连民族大学 | 提取满文单词图像中轴线的方法 |
CN108596182A (zh) * | 2018-04-24 | 2018-09-28 | 大连民族大学 | 满文部件切分方法 |
CN109271988A (zh) * | 2018-08-30 | 2019-01-25 | 中国传媒大学 | 一种基于图像分割及动态阈值的字幕提取方法 |
CN109740406A (zh) * | 2018-08-16 | 2019-05-10 | 大连民族大学 | 无分割印刷体满文单词识别方法及识别网络 |
CN110826360A (zh) * | 2018-08-10 | 2020-02-21 | 南京宁融信网络科技有限公司 | Ocr图像预处理与文字识别 |
CN111144419A (zh) * | 2019-12-05 | 2020-05-12 | 大连民族大学 | 基于分块自适应同态滤波的历史文档图像二值化方法 |
CN112508976A (zh) * | 2020-12-22 | 2021-03-16 | 大连民族大学 | 基于u型卷积神经网络的满文历史文档图像二值化方法 |
CN112686265A (zh) * | 2021-01-07 | 2021-04-20 | 南京大学 | 一种基于层级轮廓提取的象形文字分割方法 |
-
2022
- 2022-07-08 CN CN202210806936.8A patent/CN115331232B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015115499A1 (ja) * | 2014-02-03 | 2015-08-06 | 株式会社タカコ | 工具検査方法及び工具検査装置 |
JP2015145819A (ja) * | 2014-02-03 | 2015-08-13 | 株式会社タカコ | 工具検査方法及び工具検査装置 |
TW201543001A (zh) * | 2014-02-03 | 2015-11-16 | Takako Ind Inc | 工具檢查方法及工具檢查裝置 |
CN104376319A (zh) * | 2014-10-22 | 2015-02-25 | 西安工程大学 | 一种基于各向异性高斯核提取封闭边缘图像轮廓的方法 |
CN104361336A (zh) * | 2014-11-26 | 2015-02-18 | 河海大学 | 一种水下视频图像的文字识别方法 |
US20160253571A1 (en) * | 2015-02-27 | 2016-09-01 | Sharp Laboratories Of America, Inc. | Methods and Systems for Suppressing Non-Document-Boundary Contours in an Image |
CN106683102A (zh) * | 2016-12-30 | 2017-05-17 | 西安电子科技大学 | 基于脊波滤波器和卷积结构模型的sar图像分割方法 |
CN108564078A (zh) * | 2018-04-24 | 2018-09-21 | 大连民族大学 | 提取满文单词图像中轴线的方法 |
CN108596182A (zh) * | 2018-04-24 | 2018-09-28 | 大连民族大学 | 满文部件切分方法 |
CN110826360A (zh) * | 2018-08-10 | 2020-02-21 | 南京宁融信网络科技有限公司 | Ocr图像预处理与文字识别 |
CN109740406A (zh) * | 2018-08-16 | 2019-05-10 | 大连民族大学 | 无分割印刷体满文单词识别方法及识别网络 |
CN109271988A (zh) * | 2018-08-30 | 2019-01-25 | 中国传媒大学 | 一种基于图像分割及动态阈值的字幕提取方法 |
CN111144419A (zh) * | 2019-12-05 | 2020-05-12 | 大连民族大学 | 基于分块自适应同态滤波的历史文档图像二值化方法 |
CN112508976A (zh) * | 2020-12-22 | 2021-03-16 | 大连民族大学 | 基于u型卷积神经网络的满文历史文档图像二值化方法 |
CN112686265A (zh) * | 2021-01-07 | 2021-04-20 | 南京大学 | 一种基于层级轮廓提取的象形文字分割方法 |
Non-Patent Citations (2)
Title |
---|
J.H. JASEEMA YASMIN; M. MOHAMED SATHIK; S. ZULAIKHA BEEVI: "《Robust segmentation algorithm using LOG edge detector for effective border detection of noisy skin lesions》", 《2011 INTERNATIONAL CONFERENCE ON COMPUTER, COMMUNICATION AND ELECTRICAL TECHNOLOGY (ICCCET)》 * |
杨洋: "《单幅图像去雾算法研究》", 《现代信息科技》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115331232B (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lee et al. | Binary segmentation algorithm for English cursive handwriting recognition | |
CN104361336A (zh) | 一种水下视频图像的文字识别方法 | |
CN109241973B (zh) | 一种纹理背景下的字符全自动软分割方法 | |
CN113128442A (zh) | 基于卷积神经网络的汉字书法风格识别方法和评分方法 | |
CN116071763B (zh) | 基于文字识别的教辅图书智能校编系统 | |
Al Abodi et al. | An effective approach to offline Arabic handwriting recognition | |
CN113139457A (zh) | 一种基于crnn的图片表格提取方法 | |
CN112861736B (zh) | 基于图像处理的文献表格内容识别与信息提取方法 | |
Ali et al. | An efficient character segmentation algorithm for recognition of Arabic handwritten script | |
CN112686265A (zh) | 一种基于层级轮廓提取的象形文字分割方法 | |
Kaundilya et al. | Automated text extraction from images using OCR system | |
CN107730511B (zh) | 一种基于基线估计的藏文历史文献文本行切分方法 | |
Mullick et al. | An efficient line segmentation approach for handwritten Bangla document image | |
CN109271882B (zh) | 一种区分颜色的手写体汉字提取方法 | |
CN110059600B (zh) | 一种基于指向手势的单行文字识别方法 | |
Karthik et al. | Segmentation and recognition of handwritten kannada text using relevance feedback and histogram of oriented gradients–a novel approach | |
Kumar et al. | Online handwritten character recognition for Telugu language using support vector machines | |
CN115331232A (zh) | 一种满文历史文档图像列分割方法 | |
CN110633666A (zh) | 一种基于手指颜色贴片的手势轨迹识别方法 | |
CN115731550A (zh) | 一种基于深度学习的药品说明书自动识别方法、系统及存储介质 | |
Munir et al. | Automatic character extraction from handwritten scanned documents to build large scale database | |
Nguyen et al. | Enhanced character segmentation for format-free Japanese text recognition | |
CN110298350B (zh) | 一种高效的印刷体维吾尔文单词分割算法 | |
Soua et al. | Improved Hybrid Binarization based on Kmeans for Heterogeneous document processing | |
Antony et al. | Segmentation and recognition of characters on Tulu palm leaf manuscripts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |