CN107730511B - 一种基于基线估计的藏文历史文献文本行切分方法 - Google Patents

一种基于基线估计的藏文历史文献文本行切分方法 Download PDF

Info

Publication number
CN107730511B
CN107730511B CN201710849135.9A CN201710849135A CN107730511B CN 107730511 B CN107730511 B CN 107730511B CN 201710849135 A CN201710849135 A CN 201710849135A CN 107730511 B CN107730511 B CN 107730511B
Authority
CN
China
Prior art keywords
image
tibetan
line
baseline
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710849135.9A
Other languages
English (en)
Other versions
CN107730511A (zh
Inventor
段立娟
李颜兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201710849135.9A priority Critical patent/CN107730511B/zh
Publication of CN107730511A publication Critical patent/CN107730511A/zh
Application granted granted Critical
Publication of CN107730511B publication Critical patent/CN107730511B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明涉及一种对藏文历史文献文本行切分的方法。通过提取藏文历史文献的左侧部分图像,去除藏文元音音节点和某些突出的笔画,获取藏文文本行基线的起始位置信息以及文本行数;根据基线的起始位置,自左向右建立基线,在基线建立的过程中需要根据周围点的像素值动态调整基线;利用估计好的基线,采用连通区域分析法,从两基线之间确定粘连区域的位置并进行切分,最终分离出文本行。本发明提出的一种基于基线估计的藏文历史文献文本行切分方法更加适用于藏文历史文献文本行的切分,比传统的基于投影切分的技术切分精确度高。比起只使用基于投影切分的方式,本发明方法的切分出来的文本行正确率更高。

Description

一种基于基线估计的藏文历史文献文本行切分方法
技术领域
本发明涉及图像处理方法,特别是涉及藏文文本图像文本行分割方法。
背景技术
文字是人类发展的重要载体,是信息传递的主要媒介之一,也是人们记录历史的重要方式之一。藏文是我国第一个具有国际标准的民族文字,也是世界上最古老的文字之一。藏文历史文献保存了藏族文化思想的精髓,是全人类文化思想的宝贵财富。为了能够保护这一古老而又珍贵的历史文化遗产,并方便人们可以按照文字内容进行查阅,将藏文古籍图像转换为文本的方式存储是保护藏文历史文献的一个重要的方法。
一般来说,古籍图像转化成为计算机可读的文本需要经历4个阶段:文字区域的检测,文本行切分,字符切分和文字识别。本发明是针对藏文历史文献转化为文本时文本行切分阶段提出的。比起传统的基于投影的切分方法,使用动态追踪基线的方式更能有效的规避藏文历史文献文档中出现的行与行之间出现的粘连以及文本行的弯曲的现象。
传统的方式一般是通过统计纵向前景像素点的值来确定文本行的起始以及结束的位置。该方法在处理藏文历史文献中有2点不足:(1)只能估计文档中文本行的大体位置,无法处理藏文历史文献当中大量存在的弯曲的文本行。(2)对于藏文历史文献中的粘连部分,传统基于投影的分割方法并不能准确的定位和切分。
发明内容
针对上述传统的处理藏文历史文献方法的不足,本发明提出了一种基于基线估计的藏文历史文献文本行切分方法。该方法在处理藏文历史文献的过程中,使用了动态追踪的方式来拟合文献图像的文本基线的走向。根据基线和连通区域分析的方式定位粘连区域在图像中的位置,并使用基于距离变换(Distance Transform)的方法来确定行切分位置。
实现本发明的方法的主要思路是:提取藏文历史文献的左侧部分图像,去除藏文元音音节点和某些突出的笔画,获取藏文文本行基线的起始位置信息以及文本行数;根据基线的起始位置,自左向右建立基线,在基线建立的过程中需要根据周围点的像素值动态调整基线;利用估计好的基线,采用连通区域分析法,从两基线之间确定粘连区域的位置并进行切分。
一种基于基线估计的藏文历史文献文本行切分方法,包括如下步骤:
(1)提取左侧部分图像
从输入的藏文历史文献图像中提取左侧1/4部分图像,用以分析并提取文本行的基线位置及行数,并将该图像命名为图像A。
(2)去除藏文元音音节点和某些突出的笔画
通过滑动窗口,将原始图像切分成N*M大小的图像块,手动选取其中80个顶部包含基线的图像块作为匹配模板,并使用主成分分析(PCA)方法提取特征。使用同样大小的滑动窗口对图像A进行模板匹配(Template Matching),若窗口中的图像和匹配模板中的某个图像相似度大于一定阈值,则保留窗口中的图像。否则,将其替换成为背景色。将经过模板匹配的图像命名为图像B。
(3)获取藏文文本行基线的起始位置信息以及文本行数
计算图像B中水平投影,并得到其中的连续的包含前景像素点的个数不为0的区域。分别计算每个区域的前景点个数的最大值Mi。将图像B中各连续区域内小于前景点个数Mi/2的行内的像素替换为背景色得到图像C。对图像C进行闭运算(Closing)得到图像D。同样,获取图像D中的包含前景像素点的连续不为0的投影区域,投影区域的个数即为文本换行的个数,每个投影区域的上边界即为建立基线的起始位置。
(4)建立基线
从基线起始位置开始到图像右侧边界结束,自左向右每隔N个像素点,选取一个像素点作为追踪点,并根据追踪点的附近的像素点的像素值决定是否向上,向下调整追踪点的位置。最后,基线由每行的追踪点自左向右连接得出。
(5)确定粘连区域的位置
首先,基于步骤(4)中建立的基线,将原始图像切分成文本行条。然后根据一定的步长将文本行条切分成图像块,保证每个图像块位于上下两条基线之间。分析图像块中的前景连通单元:如果图像块中存在高度接近于该图像块高度的连通单元则说明该块中含有粘连区域。否则认为和下基线相连的连通单元为下一行,认为其余的连通单元为本行。
(6)切分粘连区域
将步骤(5)中得到的粘连图像块进行距离变换(Distance transform),然后对其进行水平投影。根据投影找到其极小值对应的行,按照该行将粘连区域切分成两部分:上方部分为本行内容,下方部分(包含极小值行)为下一行内容。
1、一种基于基线估计的藏文历史文献文本行切分方法,其特征在于:
步骤1,提取输入图像的左侧部分图像;
从输入的藏文历史文献图像中提取左侧1/4部分图像,用以分析并提取文本行的基线位置及行数,并将该图像命名为图像A;
步骤2,去除藏文元音音节点和某些突出的笔画;
通过大小N*M滑动窗口将输入图像切分图像块,其中宽度N为图像中藏文字丁的宽度,长M为宽度N的2倍;从图像块中选取至少80个顶部含有基线的图像块作为模板,使用主成分分析法获取其13维特征;以同样大小的滑动窗口对图像A进行模板匹配,保留图像A中和任意模板相似度大于0.9的图像块,否则将其设置为背景色;得到图像B;
步骤3,获取藏文文本行基线的起始位置信息以及文本行数;
二值化原始图像,令前景点像素值为1,背景点像素值为0,水平投影图像B,并获得其中连续的投影值不为0的区域,分别计算每个区域的最大投影值Mi;将各区域与中投影值小于Mi/2的行内像素替换成背景色,得到图像C;对图像C进行闭运算得到图像D,获取图像D的水平投影中的连续不为0的投影区域,投影区域的个数即为文本换行的个数,每个投影区域的上边界即为建立基线的起始位置;
步骤4,建立基线;
从基线起始位置开始到图像末尾结束,自左向右每隔5个像素点,选取一个像素点作为追踪点;选择上一个追踪点右方水平第5个像素点及该点上下各两个点为下一个追踪点的候选点,分别将水平点命名为P,上方两个点U1、U2,下方两个点D1、D2;根据以下规则从上至下依次判断计算出下一个追踪点:
1).若P、U1、U2、D1、D2的像素值相同,选取P为下一个追踪点;
2).否则,若P为背景点,且D1或D2为前景点,选取D1为下一个追踪点;
3).否则,若P为前景点,且U1或U2为背景点,选取U1为下一个追踪点;
4).其他,选取P为下一个追踪点;
基线由追踪点自左向右相连得出;
步骤5,确定粘连区域的位置;
基于步骤4中建立的基线,将原始图像切分成多个文本行条;然后,每隔90~120像素,将文本行条切分成图像块,保证每个图像块位于上下两条基线之间;分析图像块中的连通区域的高度,若图像块中存在大于其高度的9/10的连通区域,则认为该图像块为粘连图像块,需要进一步处理;否则将和下基线相连的连通区域标记为下一行,其余的标记为本行;
步骤6,切分粘连区域;
将步骤5中得到的粘连块进行距离变换处理,并对处理后的图像进行水平投影;从投影中找到最小值对应的行作为切分行所在的位置,将切分行下方的前景区域标记为下一行,其余区域标记为本行。
与传统的基于投影切分的技术相比,本发明具有以下明显的优势和有益效果:
(1)本发明提出的一种基于基线估计的藏文历史文献文本行切分方法更加适用于藏文历史文献文本行的切分,比传统的基于投影切分的技术切分精确度高。
(2)比起只使用基于投影切分的方式,本发明方法的切分出来的文本行,在切分精确度提高时分离出正确的文本行的个数更多。实验表明,当切分精确度为0.90时,运用本方法分离出的文本行正确率为97.40%,比起传统的基于投影切分的方法提高了29.57%
附图说明
图1为本发明所提出的基于基线估计的藏文历史文献文本行切分方法的流程图;
图2为本发明选取匹配模板的示意图
图3为本发明获取基线位置和行数的步骤及中间结果样例图
图4为本发明基线估计的示意图
图5为本发明输入的原始图像样例图
图6为本发明输出的切分后的效果图
具体实施方式
下面结合附图和具体实施方式对本发明做进一步的描述。
本发明所涉及方法的流程图如图1所示,包括以下步骤:
步骤1,提取输入图像的左侧部分图像。
从输入的藏文历史文献图像中提取左侧1/4部分图像,用以分析并提取文本行的基线位置及行数,并将该图像命名为图像A。
步骤2,去除藏文元音音节点和某些突出的笔画。
通过大小N*M滑动窗口将输入图像切分图像块,其中宽度N为图像中藏文字丁的宽度,长M为宽度N的2倍。如图2所示,从图像块中选取80个顶部含有基线的图像块作为模板,使用主成分分析(PCA)法获取其13维特征。以同样大小的滑动窗口对图像A进行模板匹配,保留图像A相似度大于0.9的图像块,否则将其设置为背景色。得到图像B。
步骤3,获取藏文文本行基线的起始位置信息以及文本行数。
二值化原始图像,令前景点像素值为1,背景点像素值为0,水平投影图像B,并获得其中连续的投影值不为0的区域,分别计算每个区域的最大投影值Mi。将各区域与中投影值小于Mi/2的行内像素替换成背景色,得到图像C。对图像C进行闭运算(Closing)得到图像D,获取图像D的水平投影中的连续不为0的投影区域,投影区域的个数即为文本换行的个数,每个投影区域的上边界即为建立基线的起始位置。步骤3及步骤2处理过程示意图如图3所示。
步骤4,建立基线。
从基线起始位置开始到图像末尾结束,自左向右每隔5个像素点,选取一个像素点作为追踪点。下一个追踪点的位置由上一个追踪点得出:选择上一个追踪点右方水平第5个像素点及该点上下各两个点为下一个追踪点的候选点,分别将水平点命名为P,上方两个点U1、U2,下方两个点D1、D2。根据以下规则计算出下一个追踪点:
1.若P、U1、U2、D1、D2的像素值相同,选取P为下一个追踪点,如图4(a)。
2.否则,若P为背景点,且D1或D2为前景点,选取D1为下一个追踪点,图4(b)。
3.否则,若P为前景点,且U1或U2为背景点,选取U1为下一个追踪点,图4(c)。
4.其他,选取P为下一个追踪点。
基线由追踪点自左向右相连得出。
步骤5,确定粘连区域的位置。
基于步骤4中建立的基线,将原始图像切分成多个文本行条。然后,每隔100像素,将文本行条切分成图像块,保证每个图像块位于上下两条基线之间。分析图像块中的连通区域的高度,若图像块中存在大于其高度的9/10的连通区域,则认为该图像块为粘连图像块,需要进一步处理。否则将和下基线相连的连通区域标记为下一行,其余的标记为本行。
步骤6,切分粘连区域。
将步骤5中得到的粘连块进行距离变换处理,并对处理后的图像进行水平投影。从投影中找到最小值对应的行作为切分行所在的位置,将切分行下方的前景区域标记为下一行,其余区域标记为本行。
为了验证本发明的有效性,以及与传统的基于投影切分的技术相比切分效果的优劣,进行了一组对比实验,用以下的方式评估切分效果:令I为图像中的所有的前景像素点,Gj为真值包含的前景像素点,Ri为实验结果所包含的前景像素点。使用公式(1)定义两个文本行的匹配度MatchScore,当匹配度大于0.90时认为正确分离出一文本行。分离的正确率定义为正确分离的行数除以应分离出的行数。若匹配度提升,则分离的正确率会下降。
Figure BDA0001412832970000061
本发明方法和基于投影的切分方法的正确率比较结果如表1所示。
表1本发明方法与基于投影的切分方法的比较结果
Figure BDA0001412832970000062
由表1可以看出,运用本发明的方法在对藏文历史文献分割过程中,当匹配度为0.90时,本方法分类正确率为97.40%,比基于投影的切分方法提高了29.57%;当匹配度为0.95时,运用本发明方法分类正确率为71.82%,比基于投影切分方法提高了54.29%。

Claims (1)

1.一种基于基线估计的藏文历史文献文本行切分方法,其特征在于:
步骤1,提取输入图像的左侧部分图像;
从输入的藏文历史文献图像中提取左侧1/4部分图像,用以分析并提取文本行的基线位置及行数,并将提取左侧1/4部分图像命名为图像A;
步骤2,去除藏文元音音节点和突出的笔画;
通过大小N*M滑动窗口将输入图像切分图像块,其中宽度N为图像中藏文字丁的宽度,长M为宽度N的2倍;从图像块中选取至少80个顶部含有基线的图像块作为模板,使用主成分分析法获取其13维特征;以同样大小的滑动窗口对图像A进行模板匹配,保留图像A中和任意模板相似度大于0.9的图像块,否则将其设置为背景色;得到图像B;
步骤3,获取藏文文本行基线的起始位置信息以及文本行数;
二值化原始图像,令前景点像素值为1,背景点像素值为0,水平投影图像B,并获得其中连续的投影值不为0的区域,分别计算每个区域的最大投影值Mi;将各区域与中投影值小于Mi/2的行内像素替换成背景色,得到图像C;对图像C进行闭运算得到图像D,获取图像D的水平投影中的连续不为0的投影区域,投影区域的个数即为文本换行的个数,每个投影区域的上边界即为建立基线的起始位置;
步骤4,建立基线;
从基线起始位置开始到图像末尾结束,自左向右每隔5个像素点,选取一个像素点作为追踪点;选择上一个追踪点右方水平第5个像素点及上一个追踪点右方水平第5个像素点的上下各两个点为下一个追踪点的候选点,分别将水平点命名为P,上方两个点U1、U2,下方两个点D1、D2;根据以下规则从上至下依次判断计算出下一个追踪点:
1). 若P、U1、U2、D1、D2的像素值相同,选取P为下一个追踪点;
2). 否则,若P为背景点,且D1或D2为前景点,选取D1为下一个追踪点;
3). 否则,若P为前景点,且U1或U2为背景点,选取U1为下一个追踪点;
4). 其他,选取P为下一个追踪点;
基线由追踪点自左向右相连得出;
步骤5,确定粘连区域的位置;
基于步骤4中建立的基线,将原始图像切分成多个文本行条;然后,每隔90~120像素,将文本行条切分成图像块,保证每个图像块位于上下两条基线之间;分析图像块中的连通区域的高度,若图像块中存在大于其高度的9/10的连通区域,则认为该图像块为粘连图像块,需要进一步处理;否则将和下基线相连的连通区域标记为下一行,其余的标记为本行;
步骤6,切分粘连区域;
将步骤5中得到的粘连块进行距离变换处理,并对处理后的图像进行水平投影;从投影中找到最小值对应的行作为切分行所在的位置,将切分行下方的前景区域标记为下一行,其余区域标记为本行。
CN201710849135.9A 2017-09-20 2017-09-20 一种基于基线估计的藏文历史文献文本行切分方法 Active CN107730511B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710849135.9A CN107730511B (zh) 2017-09-20 2017-09-20 一种基于基线估计的藏文历史文献文本行切分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710849135.9A CN107730511B (zh) 2017-09-20 2017-09-20 一种基于基线估计的藏文历史文献文本行切分方法

Publications (2)

Publication Number Publication Date
CN107730511A CN107730511A (zh) 2018-02-23
CN107730511B true CN107730511B (zh) 2020-10-27

Family

ID=61206549

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710849135.9A Active CN107730511B (zh) 2017-09-20 2017-09-20 一种基于基线估计的藏文历史文献文本行切分方法

Country Status (1)

Country Link
CN (1) CN107730511B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108710601B (zh) * 2018-05-14 2022-04-01 广州腾讯科技有限公司 一种文本显示方法及其设备、存储介质、电子设备
CN110032938B (zh) * 2019-03-12 2021-02-19 北京汉王数字科技有限公司 一种藏文识别方法、装置及电子设备
CN113269181A (zh) * 2020-02-14 2021-08-17 富士通株式会社 信息处理装置、信息处理方法及计算机可读记录介质
CN114842485B (zh) * 2022-04-26 2023-06-27 北京百度网讯科技有限公司 一种字幕去除方法、装置及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1570958A (zh) * 2004-04-23 2005-01-26 清华大学 多字体多字号印刷体藏文字符识别方法
CN1741035A (zh) * 2005-09-23 2006-03-01 清华大学 印刷体阿拉伯字符集文本切分方法
US7471826B1 (en) * 2008-03-31 2008-12-30 International Business Machines Corporation Character segmentation by slices
CN102930277A (zh) * 2012-09-19 2013-02-13 上海珍岛信息技术有限公司 一种基于识别反馈的字符图像验证码识别方法
US8542926B2 (en) * 2010-11-19 2013-09-24 Microsoft Corporation Script-agnostic text reflow for document images
CN105354571A (zh) * 2015-10-23 2016-02-24 中国科学院自动化研究所 基于曲线投影的畸变文本图像基线估计方法
CN106056055A (zh) * 2016-05-24 2016-10-26 西北民族大学 基于部件组合的梵音藏文联机手写样本生成方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1570958A (zh) * 2004-04-23 2005-01-26 清华大学 多字体多字号印刷体藏文字符识别方法
CN1741035A (zh) * 2005-09-23 2006-03-01 清华大学 印刷体阿拉伯字符集文本切分方法
US7471826B1 (en) * 2008-03-31 2008-12-30 International Business Machines Corporation Character segmentation by slices
US8542926B2 (en) * 2010-11-19 2013-09-24 Microsoft Corporation Script-agnostic text reflow for document images
CN102930277A (zh) * 2012-09-19 2013-02-13 上海珍岛信息技术有限公司 一种基于识别反馈的字符图像验证码识别方法
CN105354571A (zh) * 2015-10-23 2016-02-24 中国科学院自动化研究所 基于曲线投影的畸变文本图像基线估计方法
CN106056055A (zh) * 2016-05-24 2016-10-26 西北民族大学 基于部件组合的梵音藏文联机手写样本生成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"印刷体藏文文字识别技术研究";欧珠等;《计算机工程与应用》;20090821;第45卷(第24期);全文 *
"基于几何形状分析的藏文字符识别";周纬等;《第五届全国几何设计与计算学术会》;20111111;全文 *

Also Published As

Publication number Publication date
CN107730511A (zh) 2018-02-23

Similar Documents

Publication Publication Date Title
CN107730511B (zh) 一种基于基线估计的藏文历史文献文本行切分方法
Antonacopoulos et al. ICDAR 2009 page segmentation competition
US8908961B2 (en) System and methods for arabic text recognition based on effective arabic text feature extraction
CN104298982B (zh) 一种文字识别方法及装置
CN102663378B (zh) 连笔手写字符的识别方法
CN101515325A (zh) 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN106503711A (zh) 一种文字识别方法
CN108830270B (zh) 对满文单词正确分割各识别的满文单词中轴线的定位方法
Van Phan et al. Development of Nom character segmentation for collecting patterns from historical document pages
CN102136074B (zh) 一种基于mmi的木材图像纹理分析与识别方法
Valy et al. Line segmentation approach for ancient palm leaf manuscripts using competitive learning algorithm
CN106778752A (zh) 一种文字识别方法
Kaundilya et al. Automated text extraction from images using OCR system
CN116824608A (zh) 基于目标检测技术的答题卡版面分析方法
Mullick et al. An efficient line segmentation approach for handwritten Bangla document image
Verma et al. Removal of obstacles in Devanagari script for efficient optical character recognition
Zhan et al. A robust split-and-merge text segmentation approach for images
Xue Optical character recognition
Aravinda et al. Template matching method for Kannada handwritten recognition based on correlation analysis
Modi et al. Text line detection and segmentation in Handwritten Gurumukhi Scripts
Ahmed et al. Enhancing the character segmentation accuracy of bangla ocr using bpnn
Refaey Ruled lines detection and removal in grey level handwritten image documents
CN110298350B (zh) 一种高效的印刷体维吾尔文单词分割算法
Basu et al. Segmentation of offline handwritten Bengali script
Bhujade et al. A technique for segmentation of handwritten Hindi text

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20180223

Assignee: Luoyang Wuhuang Peony Culture Development Co.,Ltd.

Assignor: Beijing University of Technology

Contract record no.: X2024980000224

Denomination of invention: A Line Segmentation Method for Tibetan Historical Literature Text Based on Baseline Estimation

Granted publication date: 20201027

License type: Common License

Record date: 20240105

Application publication date: 20180223

Assignee: LUOYANG PEONY HARMONY TECHNOLOGY CO.,LTD.

Assignor: Beijing University of Technology

Contract record no.: X2024980000181

Denomination of invention: A Line Segmentation Method for Tibetan Historical Literature Text Based on Baseline Estimation

Granted publication date: 20201027

License type: Common License

Record date: 20240105