CN101881999B - 甲骨文视频输入系统及实现方法 - Google Patents

甲骨文视频输入系统及实现方法 Download PDF

Info

Publication number
CN101881999B
CN101881999B CN2010102036298A CN201010203629A CN101881999B CN 101881999 B CN101881999 B CN 101881999B CN 2010102036298 A CN2010102036298 A CN 2010102036298A CN 201010203629 A CN201010203629 A CN 201010203629A CN 101881999 B CN101881999 B CN 101881999B
Authority
CN
China
Prior art keywords
inscriptions
bones
tortoise shells
oracle
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2010102036298A
Other languages
English (en)
Other versions
CN101881999A (zh
Inventor
栗青生
王爱民
杨玉星
张智会
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anyang Normal University
Original Assignee
Anyang Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anyang Normal University filed Critical Anyang Normal University
Priority to CN2010102036298A priority Critical patent/CN101881999B/zh
Publication of CN101881999A publication Critical patent/CN101881999A/zh
Application granted granted Critical
Publication of CN101881999B publication Critical patent/CN101881999B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种视频输入系统及实现方法,输入系统包括:图像采集模块、文字特征提取模块、智能识别模块,其中,图像采集模块用于实时采集用户需要输入的甲骨文图像,将提取文字结构后的图像数据传递给文字特征提取模块;文字特征提取模块用于分析采集到的甲骨文结构图像数据,采用特征提取算法提取图像文字;智能识别模块,用于通过数据库识别算法识别文字特征提取模块中提取的图像文字,并将识别出的甲骨文字及该甲骨文字的相关信息输出到终端。本发明提供了一种简单方便又高效地甲骨文视频输入法,为甲骨文字的编辑、印刷和排版及甲骨文字的数字化研究提供了一种方便的甲骨文输入方法,解决了困扰甲骨文学者多年的甲骨文输入困难。

Description

甲骨文视频输入系统及实现方法
技术领域
本发明涉及多媒体技术领域,特别涉及甲骨文研究领域的文字输入法,具体为甲骨文视频输入系统及实现方法。
背景技术
自上世纪七十年代美国加洲大学周鸿翔教授利用电脑技术对甲骨文拼写以来,随着对甲骨文字研究的深入,中外学者在甲骨文字形的结构分析方面做过很多工作,目前,关于甲骨文字字形结构的研究资料较少,研究工具落后,远远不能适应现代汉字研究的需要。
由于现存的五千多个甲骨文中还有近二分之一的文字没法识别,因此,利用现代汉字对应的拼音输入方法显然不能保证输入所有的甲骨文字。目前,许多研究学者是把现代汉字的构形分析方式应用到甲骨文中,这种方法确实对部分甲骨文字有效,但也存在着大量的歧义和缺失,无法支持字形特征的提取、分析和计算。1996年李继明提出了甲骨文象形结构分析方案;1999年肖明等人提出了运用模糊数学和面向对象Petri网方法研究甲骨文的部件和结构分析方案,2003年周晓文利用小篆造字软件拟合甲骨文字形,2004年刘永革和栗青生提出了甲骨文字的可视化输入方法。2009年顾绍通和马小虎等人提出了基于字形拓扑结构的甲骨文输入方法,但是上述方案有两个明显的不足,一是将现代汉字的输入方法应用到甲骨文字的输入方法中,没有充分的考虑甲骨文字的特殊性,例如,在甲骨文字形没还没有完全、准确定形的情况下来分析甲骨文字形的拓扑结构显然不合适。二是所有的方案在处理甲骨文字过程中有意无意的避开了目前还没有完全识读的甲骨文字,因此所归纳出的构字部件均是针对部分甲骨文字形分析得出,并不全面。
近几年来,甲骨文研究的技术难题一个个被突破,经过多年的研究,我们认为,要全面的分析甲骨文的字形特征,首先必须要先“定形”。为此要建立甲骨文的字形数据库,但即使是定形后的甲骨文字由于其独特的线条结构,也不能像现代汉字一样书写方便,因此,几十年来,许多研究学者和甲骨文字出版商一真在使用绘图工具“画”甲骨文字。另一方面,随着流媒体视频技术的发展,一些视频采集设备(例如:摄像头)也成为计算机或移动终端的常见配置,这也为固定设备或移动终端提供了一种新的信息获取源。因此,可以通过视频采集设备对甲骨文字进行输入。
为此,需要找到一种甲骨文输入法,能够通过对视频采集设备进行甲骨文字的输入,以方便地研究和使用甲骨文。
发明内容
为了克服上述所述的现有技术中的不足,本发明提供了一种通过视频采集设备进行甲骨文字的定形输入的甲骨文视频输入系统及实现方法。
本发明是这样实现的:
甲骨文视频输入系统,包括:图像采集模块(1)、文字特征提取模块(2)、智能识别模块(3);
A、图像采集模块(1)实时采集用户需要输入的甲骨文图像,将提取文字结构后的图像数据传递给文字特征提取模块(2);
B、文字特征提取模块(2)分析采集到的甲骨文结构图像数据,采用文字特征提取算法提取图像文字,并将图像文字传递给智能识别模块(3);
C、智能识别模块(3)通过甲骨文特征数据库的特征信息和文字特征提取模块(2)中提取的图像文字信息进行智能匹配,并将识别出的甲骨文字及该甲骨文字的相关信息输出到文字编辑工具或其它终端设备。
所述的图像采集模块(1)包括usb接口摄像头、或者其它的网络摄像头。
所述文字特征提取模块(2)中,文字特征提取算法包括隐马尔可夫模型算法、或者神经网络算法或者遗传算法。
所述智能识别算法通过文字特征匹配技术和数据库匹配识别算法识别文字特征提取模块(2)中提取的图像文字。
甲骨文视频输入实现方法,其特征在于:包括如下步骤:
步骤A:实时采集用户需要输入的甲骨文图像,采用甲骨文字特征提取算法提取图像文字;
步骤B:通过智能识别算法识别步骤A中提取到的甲骨文图像文字,并根据识别出的甲骨文字及该甲骨文字的相关信息执行输出操作。
在所述步骤A中,通过usb摄像头、或者其它接口的网络摄像头实时采集用户需要输入的甲骨文图像。
在步骤A中,所述文字特征提取算法包括隐马尔可夫模型算法、或者神经网络算法或者遗传算法。
在步骤B中,所述智能识别算法通过智能识别技术和数据库匹配识别算法识别文字特征提取模块中提取的图像文字。
本发明的有益效果:依照本发明的视频输入实现方法及系统能够进行甲骨文字的输入操作,从而解决了困扰甲骨文学者多年的甲骨文输入困难;另外,充分发挥了视频采集设备(例如:摄像头)的作用,为甲骨文字的编辑出版和印刷端提供了一种甲骨文获取源,是一种简单、方便而又高效地甲骨文输入法。
附图说明
图1为本发明的甲骨文视频输入系统的示意图;
图2为本发明的甲骨文视频输入法的实现流程图;
具体实施方式
下面结合附图,对本发明的甲骨文视频输入实现方法及系统作进一步的说明:
如图1所示,甲骨文视频输入系统,包括:图像采集模块(1)、文字特征提取模块(2)、智能识别模块(3);
A、图像采集模块(1)实时采集用户需要输入的甲骨文图像,将输入的甲骨文图像转换为甲骨文字结构图像数据,将转换后的甲骨文字结构图像数据的细化信息数据传递给文字特征提取模块(2)
B、文字特征提取模块(2)分析采集到的甲骨文结构图像数据的细化信息数据,采用文字特征提取算法提取甲骨文字信息,然后可以将输入的甲骨文字信息进行保存(例如可以放在内存或存为文件)。
C、智能识别模块(3)用于通过智能识别算法识别接收到的图像信息,并将识别的结果传送到输出终端(如显示屏和打印机等)或编辑器(如WORD、WPS)进行编辑。
通过智能识别算法识别文字特征提取模块(2)中提取的图像文字,即接收到的甲骨文字图像数据,并将识别出的甲骨文字及该甲骨文字的相关信息输出到编辑系统或终端设备。
其中,智能匹配算法主要思路是将甲骨文字图像数据特征化之后依据甲骨文特征数据库进行特征检索,找到相匹配的结果后用对应该的文字显示输入的结果。
在本例的实施中,特征匹配算法是将甲骨文的文字特征化处理为由不同部件和笔画组成的特征数据库,而每一个甲骨文字都可以根据量化成为不同的部件组合,特征匹配时先匹配简单特征,按简单特征先进行分类,然后再进行其它特征的匹配,例如:“天”对应该的甲骨文字是
Figure BSA00000161752500041
是由
Figure BSA00000161752500042
Figure BSA00000161752500043
两部分组成,进行特征匹配时先对
Figure BSA00000161752500044
进行分类检索,将所有有结构的甲骨文字分成小类,然后再从该小类类找出具有
Figure BSA00000161752500046
特征的甲骨文字,这样可以提高检索的速度和准确度。
针对甲骨文的各个部件的识别可采用隐马尔可夫模型(Hidden MarkovModel,HMM)和神经网络(Neural Network,NN)方法,也可以采用遗传算法(Genetic Algorithm,GA)进行分类和识别。
类似地,也可以进行手写甲骨文的匹配和识别。(尽管由于甲骨文的书写方法和顺序还没有确定,但由手工“画”出来的甲骨文,并不影响分类和识别)
如图2所示,本发明的甲骨文输入方法具体包括以下步骤:
步骤1:用户使用摄像头将甲骨文文献资料、甲骨文字典或者甲骨文手写材料对准摄像头进行视频图像采集。
步骤2:将采集得到的视频图像进行预处理,例如,图像分割,校正、二值化转换处理等。
步骤3:经过预处理后的图像文字,采用文字特征提取算法提取图像文字的字形特征;
步骤4:利用特征匹配算法将特征数据库中的甲骨文字和步骤3中得到的字形特征进行匹配。
其中,特征匹配算法是将甲骨文的文字特征数字化处理为由不同部件和笔画组成的特征数据库,而每一个甲骨文字都可以根据量化成为不同的部件组合,特征匹配时先匹配简单特征,按简单特征先进行分类,然后再进行其它特征的匹配,例如:“天”对应该的甲骨文字是
Figure BSA00000161752500051
是由
Figure BSA00000161752500052
Figure BSA00000161752500053
两部分组成,进行特征匹配时先对
Figure BSA00000161752500054
进行分类检索,将所有有
Figure BSA00000161752500055
结构的甲骨文字分成小类,然后再从该小类类找出具有
Figure BSA00000161752500056
特征的甲骨文字,这样可以提高检索的速度和准确度。
另外,甲骨文字形特征数据库是在现有甲骨文字的基础上对甲骨文字部件进行数字化整合得到,这些数据根据用户的需要还可以编辑修改,以确保甲骨文字形特征数据库的正确性和准确性。
步骤5:找到最佳的匹配结果后,由用户选择进行输出或编辑。
以上举例的形式对本发明在使用视频摄像头来输入甲骨文字的情形进行了详细的描述,但是本发明并不局限于摄像头,对于配备和使用了手写输入设备的用户,通过在屏幕上直接书写而形成的图像甲骨文字同样可以使用本发明的方法来实现。对应到图1、图2所示的输入法和系统当中,使用手写设备的甲骨文手写输入和使用摄像头的视频输入的区别是:甲骨文手写输入不使用视频图像采集和对应的预处理模块。
绽上所述,依照本发明的视频输入实现方法及系统能够进行甲骨文字的输入操作,从而解决了困扰甲骨文学者多年的甲骨文输入困难;另外,充分发挥了视频采集设备(例如:摄像头)的作用,为甲骨文字的编辑出版和印刷提供了一种甲骨文获取源,是一种简单、方便而又高效地甲骨文输入法。
以上实施例仅用于说明本发明的优选实施方式,但本发明并不限于上述实施方式,在所述领域普通技术人员所具备的知识范围内,本发明的精神和原则之内所作的任何修改、等同替代和改进等,其均应涵盖在本发明请求保护的技术方案范围之内。

Claims (4)

1.一种甲骨文视频输入方法,通过甲骨文视频输入系统进行甲骨文字的输入,所述输入系统包括:图像采集模块、文字特征提取模块、智能识别模块;图像采集模块实时采集用户需要输入的甲骨文图像,将输入的甲骨文图像转换为甲骨文字结构图像数据,将转换后的甲骨文字结构图像数据的细化信息数据传递给文字特征提取模块;文字特征提取模块分析采集到的甲骨文字结构图像数据的细化信息数据,采用文字特征提取算法提取甲骨文字信息,然后将输入的甲骨文字信息进行保存;文字特征提取算法采用遗传算法;智能识别模块用于通过智能识别算法识别接收到的图像信息,并将识别的结果传送到输出终端或编辑器进行编辑;其特征在于,所述输入方法包括以下步骤:
步骤1:用户将甲骨文文献资料对准摄像头进行视频图像采集;
步骤2:将采集得到的视频图像进行预处理; 
步骤3:经过预处理后的图像文字,采用文字特征提取算法提取图像文字的字形特征; 
步骤4:利用特征匹配算法将特征数据库中的甲骨文字和步骤3中得到的字形特征进行匹配;其中,特征匹配算法是将甲骨文的文字特征数字化处理为由不同部件和笔画组成的特征数据库,而每一个甲骨文字都根据量化成为不同的部件组合,特征匹配时先匹配简单特征,按简单特征先进行分类,然后再进行其它特征的匹配;
步骤5:找到最佳的匹配结果后,由用户选择进行输出或编辑。
2.根据权利要求1所述的方法,其特征在于:所述的图像采集模块为usb接口摄像头、或者其它的网络摄像头。
3.根据权利要求1所述的方法,其特征在于:所述的输出终端为显示屏和打印机;所述的编辑器为WORD、WPS。
4.根据权利要求1所述的方法,其特征在于:所述的预处理为图像分割,校正、二值化转换处理。
CN2010102036298A 2010-06-21 2010-06-21 甲骨文视频输入系统及实现方法 Expired - Fee Related CN101881999B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010102036298A CN101881999B (zh) 2010-06-21 2010-06-21 甲骨文视频输入系统及实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010102036298A CN101881999B (zh) 2010-06-21 2010-06-21 甲骨文视频输入系统及实现方法

Publications (2)

Publication Number Publication Date
CN101881999A CN101881999A (zh) 2010-11-10
CN101881999B true CN101881999B (zh) 2012-11-21

Family

ID=43054030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102036298A Expired - Fee Related CN101881999B (zh) 2010-06-21 2010-06-21 甲骨文视频输入系统及实现方法

Country Status (1)

Country Link
CN (1) CN101881999B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102087742B (zh) * 2011-01-26 2012-07-04 王爱民 基于图像处理的甲骨碎片缀合方法
JP5606385B2 (ja) * 2011-04-28 2014-10-15 楽天株式会社 サーバ装置、サーバ装置の制御方法、及び、プログラム
CN102750094A (zh) * 2012-06-13 2012-10-24 胡锦云 图像采集方法
CN103488798B (zh) * 2013-10-14 2016-06-15 大连民族学院 一种甲骨文自动识别方法
CN104834389A (zh) * 2015-05-13 2015-08-12 安阳师范学院 一种汉字Webfont生成方法
CN106940798A (zh) * 2017-03-08 2017-07-11 深圳市金立通信设备有限公司 一种文字识别的修正方法以及终端
CN108628814A (zh) * 2017-03-20 2018-10-09 珠海金山办公软件有限公司 一种快速插入识别文字的方法及装置
CN109271949A (zh) * 2018-09-28 2019-01-25 中国科学院长春光学精密机械与物理研究所 多谱段图像数据提取方法、装置、设备及可读存储介质
CN111915540B (zh) * 2020-06-17 2023-08-18 华南理工大学 拓片甲骨文字符图像增广方法、系统、计算机设备及介质
CN112232348B (zh) * 2020-09-07 2021-10-01 华南师范大学 一种基于机器视觉的甲骨文识别方法及系统
CN112167845B (zh) * 2020-09-29 2022-10-18 安阳师范学院 甲骨文字形中的乐舞形态探索用多层分类式资料收集装置
CN113051871A (zh) * 2021-03-16 2021-06-29 安阳师范学院 一种基于造字机理的甲骨字生成方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965458A (en) * 1988-08-10 1990-10-23 Telecommunication Laboratories, Directorate General of Telecommunications , Ministry of Communications Apparatus for translating oracle-bone scripture into a more formal language
CN1549192A (zh) * 2003-05-16 2004-11-24 中国地质大学(武汉) 手写字体的计算机识别与自动输入方法
CN1734467A (zh) * 2004-12-24 2006-02-15 康佳集团股份有限公司 一种拍照录入文本的手机及其录入方法
CN101140617A (zh) * 2007-09-29 2008-03-12 东莞市步步高教育电子产品有限公司 电子设备及其文本录入的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965458A (en) * 1988-08-10 1990-10-23 Telecommunication Laboratories, Directorate General of Telecommunications , Ministry of Communications Apparatus for translating oracle-bone scripture into a more formal language
CN1549192A (zh) * 2003-05-16 2004-11-24 中国地质大学(武汉) 手写字体的计算机识别与自动输入方法
CN1734467A (zh) * 2004-12-24 2006-02-15 康佳集团股份有限公司 一种拍照录入文本的手机及其录入方法
CN101140617A (zh) * 2007-09-29 2008-03-12 东莞市步步高教育电子产品有限公司 电子设备及其文本录入的方法

Also Published As

Publication number Publication date
CN101881999A (zh) 2010-11-10

Similar Documents

Publication Publication Date Title
CN101881999B (zh) 甲骨文视频输入系统及实现方法
CN108664996B (zh) 一种基于深度学习的古文字识别方法及系统
CN109063159B (zh) 一种基于神经网络的实体关系抽取方法
CN102622610B (zh) 一种基于分类器集成的手写维文字符识别方法
CN101719142B (zh) 基于分类字典的稀疏表示图片文字检测方法
CN110472652B (zh) 基于语义引导的少量样本分类方法
CN101140617A (zh) 电子设备及其文本录入的方法
CN201191870Y (zh) 具有ocr识别功能的手机
CN104732226A (zh) 一种字符识别方法和装置
CN105117740A (zh) 字体识别方法及装置
CN102855317A (zh) 一种基于演示视频的多模式索引方法及系统
CN106650664A (zh) 一种高招大本数据采集系统及方法
Abuzaraida et al. Online handwriting Arabic recognition system using k-nearest neighbors classifier and DCT features
CN114090736A (zh) 一种基于文本相似度的企业行业识别系统及识别方法
CN104866606B (zh) 一种MapReduce并行化大数据文本分类方法
CN116543391A (zh) 一种结合图像校正的文本数据采集系统及方法
Chaithra et al. Handwritten online character recognition for single stroke Kannada characters
Da et al. Vision grid transformer for document layout analysis
CN110222317B (zh) 一种PowerPoint演示文稿向Word文档转换的方法及系统
CN103136292B (zh) 一种基于图像特征的图像检索方法和装置
CN104504385B (zh) 手写粘连数字串的识别方法
CN116958996A (zh) Ocr信息提取方法、系统及设备
Hu et al. Multimedia analysis and access of ancient maya epigraphy: Tools to support scholars on Maya hieroglyphics
Xin et al. Comic text detection and recognition based on deep learning
CN111898618A (zh) 一种识别古代图形文字的方法、装置和程序储存介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121121

Termination date: 20180621

CF01 Termination of patent right due to non-payment of annual fee