CN116703748A - 书法作品评价方法、装置、电子设备及计算机可读存储介质 - Google Patents
书法作品评价方法、装置、电子设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN116703748A CN116703748A CN202310485413.2A CN202310485413A CN116703748A CN 116703748 A CN116703748 A CN 116703748A CN 202310485413 A CN202310485413 A CN 202310485413A CN 116703748 A CN116703748 A CN 116703748A
- Authority
- CN
- China
- Prior art keywords
- image
- standard
- character
- score
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 claims abstract description 63
- 238000010801 machine learning Methods 0.000 claims abstract description 48
- 238000012549 training Methods 0.000 claims description 40
- 238000012360 testing method Methods 0.000 claims description 20
- 230000005484 gravity Effects 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 10
- 230000009467 reduction Effects 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 7
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 241000238413 Octopus Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Molecular Biology (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种书法作品评价方法、装置、电子设备及计算机可读存储介质,该方法可以包括:获取书法作品的第一图像;将所述第一图像拆分成至少一张第二图像,其中,每张所述第二图像中均包含一个书写的文字;通过训练好的机器学习模型提取每张第二图像所包含的文字,得到待测评文字信息;从标准字库中获取所述每张第二图像所包含的文字的标准字信息;对所述待测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。实施本申请,可以解决现有技术中书法测评主要依靠人工来进行测评所导致的问题。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及一种书法作品评价方法、装置、电子设备及计算机可读存储介质。
背景技术
伴随着经济的快速发展和科技的进步,中国传统文化受到越来越多人的关注,而书法是中国传统文化的重要表达形式和传播载体,它按照文字特点及其涵义,以相应笔法、结构和章法写字,使之成为富有美感的艺术作品,对传承和弘扬中国传统文化有着不可替代的重要作用。
现有的书法测评都是由人通过观察书法爱好者的书法作品,依托于自身对书法作品的主观评价得出评分,由于每个人的主观意识都有所不同,因此,不同的人对同一个书法作品所给出的评分也不尽相同。因此,如何提出一种科学有效地方法来评价书法作品是亟需解决的技术问题。
发明内容
本申请实施例提供一种书法作品评价方法、装置、电子设备及计算机可读存储介质,可以解决现有技术中书法测评主要依靠人工来进行测评所导致的问题。
第一方面,本申请实施例提供了一种书法作品评价方法,该方法包括:
获取书法作品的第一图像;
将所述第一图像拆分成至少一张第二图像,其中,每张所述第二图像中均包含一个书写的文字;
通过训练好的机器学习模型提取每张第二图像所包含的文字,得到待测评文字信息;
从标准字库中获取所述每张第二图像所包含的文字的标准字信息;
对所述待测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
实施本申请实施例,在对书法作品进行评价时,首先,获取书法作品的图像,然后,对书法作品的图像进行拆分,得到每个书写的文字的图像,之后,通过训练好的机器学习模型提取图像所包含的文字,得到待测评文字信息,并从标准字库中获取该文字对应的标准字信息,对待测评文字信息和标准字信息进行比较,得到每个文字的得分,以根据每个文字的得分得到书法作品的评分。以这种方式,可以解决现有技术中的书法测评方法主要依靠人工来进行测评所导致的问题,一方面,可以提高书法测评的便利性和效率;另一方面,节约了人工成本。
在一种可能的实现方式中,所述待测评文字信息包括至少一个文字特征,所述文字特征包括文字的大小、重心、形态、位置、笔画轮廓;所述标准字信息包括至少一个标准文字特征,所述标准文字特征包括文字的标准大小、标准重心、标准形态、标准位置、标准笔画轮廓;所述对所述测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,包括:
基于所述待测评文字信息和所述标准字信息,分别计算同一类型的文字特征所对应的特征差异度;
根据所述特征差异度确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
在一种可能的实现方式中,所述根据所述特征差异度确定每张所述第二图像所包含的文字的得分,包括:
在确定所述书法作品的评分时,根据以下公式计算
Y=w1*X1+w2*X2+w3*X3+w4*X4+w5*X5
其中,w1、w2、w3、w4和w5为权重系数;X1表示大小项对应的特征差异度;X2表示重心项对应的特征差异度;X3表示形态项对应的特征差异度;X4表示位置项对应的特征差异度;X5表示笔画轮廓项对应的特征差异度。
在一种可能的实现方式中,所述将所述第一图像拆分成至少一张第二图像之后,还包括:
对所述第二图像进行预处理,其中,所述预处理包括图像灰度化、二值化、降噪、倾斜校正、文字分割中的至少一种。
在一种可能的实现方式中,所述方法还包括:
基于聚类算法对样本图像数据进行分类,并通过人工监督方式完成样本图像数据的标记,得到标记结果;
基于所述标记结果生成数据集;其中,所述数据集包括训练数据集和测试数据集;
通过所述训练数据集对所述机器学习模型进行训练,并结合测试数据集对所述机器学习模型进行测试,在确定所述机器学习模型所对应的文字识别结果大于预设值的情况下,得到所述训练好的机器学习模型。
在一种可能的实现方式中,所述训练数据集中所包含的数据数量大于所述测试训练集中所包含的数据数量。
在一种可能的实现方式中,所述机器学习模型包括卷积神经网络模型。
第二方面,本申请实施例提供了一种书法作品评价装置,包括:
获取图像单元,用于获取书法作品的第一图像;
拆分单元,用于将所述第一图像拆分成至少一张第二图像,其中,每张所述第二图像中均包含一个书写的文字;
文字识别单元,用于通过训练好的机器学习模型提取每张第二图像所包含的文字,得到待测评文字信息;
信息获取单元,用于从标准字库中获取所述每张第二图像所包含的文字的标准字信息;
评分单元,用于对所述待测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
第三方面,本申请实施例提供了一种电子设备,包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储支持服务器执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
第五方面,本申请实施例还提供了一种计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1是本申请实施例提供的一种电子设备的结构示意图;
图2是本申请实施例提供的一种机器学习模型训练方法流程图;
图3是本申请实施例提供的一种书法作品评价方法的流程示意图;
图4a是本申请实施例提供的一种文字的外轮廓的示意图;
图4b是本申请实施例提供的一种文字的内轮廓的示意图;
图5是本申请实施例提供的一种书法作品评价装置的结构示意图;
图6是本申请实施例提供的另一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
在本说明书中使用的术语“部件”、“模块”、“系统”等用于表示计算机相关的实体、硬件、固件、硬件和软件的组合、软件、或执行中的软件。例如,部件可以是但不限于,在处理器上运行的进程、处理器、对象、可执行文件、执行线程、程序和/或计算机。通过图示,在计算设备上运行的应用和计算设备都可以是部件。一个或多个部件可驻留在进程和/或执行线程中,部件可位于一个计算机上和/或分布在2个或更多个计算机之间。此外,这些部件可从在上面存储有各种数据结构的各种计算机可读介质执行。部件可例如根据具有一个或多个数据分组(例如来自与本地系统、分布式系统和/或网络间的另一部件交互的二个部件的数据,例如通过信号与其它系统交互的互联网)的信号通过本地和/或远程进程来通信。
本申请涉及用于书法作品评价方法、装置、电子设备及计算机可读存储介质,以解决现有技术中书法测评主要依靠人工来进行测评所导致的问题。以下,将参考附图详细描述本发明。
概述
申请人在研究中发现,现有的书法测评都是由人通过观察书法爱好者的书法作品,依托于自身对书法作品的主观评价得出评分,由于每个人的主观意识都有所不同,因此,不同的人对同一个书法作品所给出的评分也不尽相同。因此,如何提出一种科学有效地方法来评价书法作品是亟需解决的技术问题。
为了解决发明人经过研究发现的上述问题,发明人提出了在对书法作品进行评价时,首先,获取书法作品的图像,然后,对书法作品的图像进行拆分,得到每个书写的文字的图像,之后,通过训练好的机器学习模型提取图像所包含的文字,得到待测评文字信息,并从标准字库中获取该文字对应的标准字信息,对待测评文字信息和标准字信息进行比较,得到每个文字的得分,以根据每个文字的得分得到书法作品的评分。以这种方式,可以解决现有技术中的书法测评方法主要依靠人工来进行测评所导致的问题,一方面,可以提高书法测评的便利性和效率;另一方面,节约了人工成本。
基于上述构思,发明人提供了一种书法作品评价方法,下面将结合附图,对本说明书实施方式提供的书法作品评价方法进行示例性描述。
首先,参照图1来描述用于实现根据本申请实施例的书法作品评价方法和装置的示例电子设备100。如图1所示,电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106、输出装置108。电子设备100还可以包括数据获取装置110和/或图像采集装置112,这些组件通过总线系统114和/或其它形式的连接机构(未示出)互连。应当注意,图1所示的电子设备100的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。
所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,并且可以控制所述电子设备100中的其它组件以执行期望的功能。
所述存储装置104可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM、硬盘、闪存)等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器102可以运行所述程序指令,以实现下文所述的本申请实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据,例如所述应用程序使用和/或产生的各种数据等。
所述输入装置106可以是用户用来输入指令的装置,并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。
所述输出装置108可以向外部(例如用户)输出各种信息(例如图像和/或声音),并且可以包括显示器、扬声器等中的一个或多个。
在电子设备100用于实现根据本申请实施例的书法作品评价方法和装置的情况下,电子设备100可以包括数据获取装置110。所述数据获取装置110可以获取样本图像数据和对应的标注数据,并且将样本图像数据和标注数据存储在所述存储装置104中以供其它组件使用,以训练得到训练好的机器学习模型。例如,数据获取装置110可以包括有线或无线网络接口、通用串行接口总线(USB)接口、光盘驱动器等中的一个或多个。
在电子设备100用于实现根据本申请实施例的书法作品评价方法和装置的情况下,电子设备100可以包括图像采集装置112。所述图像采集装置112可以采集书法作品的图像,并且将所采集的图像存储在所述存储装置104中以供其它组件使用。图像采集装置112可以是摄像头,应当理解,图像采集装置112仅是示例,电子设备100可以不包括图像采集装置112。在这种情况下,可以利用其他具有图像采集能力的器件采集待处理图像,并将采集的图像发送给电子设备100。
示例性地,用于实现根据本申请实施例的书法作品评价方法和装置的示例电子设备可以在诸如个人计算机或远程服务器等的设备上实现。
下面结合图2具体介绍本申请提出的机器学习模型训练方法,如图2所示,该方法可以包括但不限于如下步骤:
步骤S201、获取样本图像数据。
样本图像可以是电子设备100获取的原始图像,也可以是对原始图像进行预处理之后获得的图像。
步骤S202、基于聚类算法对样本图像数据进行分类,并通过人工监督方式完成样本图像数据的标记,得到标记结果。
示例性地,聚类算法可以包括但不限于K-means聚类算法,还可以包括其他聚类算法。
样本图像和标注数据可以由远程设备(诸如存储有训练数据集的服务器)发送到电子设备100以由电子设备100的处理器102进行机器学习模型训练,也可以由电子设备100包括的数据获取装置110获取并传送到处理器102进行机器学习模型训练。
步骤S203、基于所述标记结果生成数据集;其中,所述数据集包括训练数据集和测试数据集。
示例性地,训练数据集中所包含的数据数量大于所述测试训练集中所包含的数据数量。例如,训练数据集中所包含的数据数量为数据集数量的80%,测试数据集中所包含的数据数量为数据集数量的20%。
步骤S204、通过所述训练数据集对所述机器学习模型进行训练,并结合测试数据集对所述机器学习模型进行测试,在确定所述机器学习模型所对应的文字识别结果大于预设值的情况下,得到所述训练好的机器学习模型。
示例性地,根据本申请实施例的机器学习模型训练方法可以在具有存储器和处理器的设备、装置或者系统中实现。根据本申请实施例的机器学习模型训练方法可以独立部署在客户端或服务器处。替代地,根据本申请实施例的机器学习模型训练方法还可以分布地部署在服务器端(或云端)和客户端处。例如,可以在客户端获取样本图像和标注数据,客户端将获取的图像传送给服务器端(或云端),由服务器端(或云端)进行机器学习模型训练。
根据本申请实施例,机器学习模型可以采用神经网络实现(例如,卷积神经网络模型)。当然,本申请不局限于神经网络,任何基于参数学习的模型都可以应用于本申请。神经网络是一种能够自主学习的网络,其具有强大的图像处理能力,是非常好的模型选择。另外,本申请实施例还可以通过多种方式对样本图像进行增强,从而增强该机器学习模型的鲁棒性。
本申请实施例提供的机器学习模型训练方法主要在训练过程中生效,并不影响机器学习模型的部署使用。
根据本申请另一方面,提供一种书法作品评价方法。图3示出根据本申请一个实施例的书法作品评价方法的示意性流程图,该方法可以包括但不限于如下步骤:
步骤S301、获取书法作品的第一图像。
步骤S302、将所述第一图像拆分成至少一张第二图像,其中,每张所述第二图像中均包含一个书写的文字。
在实际应用中,在获取到第二图像后,可以对第二图像进行预处理,其中,预处理可以包括图像灰度化、二值化、降噪、倾斜校正、文字分割中的至少一种。
其中,降噪可以包括但不限于利用均值滤波器、自适应维纳滤波器、中值滤波器、形态学噪声滤除器等进行降噪;小波去噪等。
考虑到获取到的第二图像时通常不会处于绝对水平位置,透视关系会导致图像变形从而影响识别。在这种情况下,可通过霍夫变换将第二图像进行膨胀处理,将断续的文字连成一条直线,便于直线检测。计算出直线的角度后就可以利用旋转算法,将倾斜图像矫正到水平位置。
其中,文字分割是指,先做行切分再做字符切分。行切分即将完成倾斜矫正的图像,投影至Y轴并累加所有值,得到基于y轴的直方图,直方图的谷底是背景,峰值则是文字所在的区域,从而识别每行文字的位置范围;同理,将完成行切分的图像投影至x轴,获取基于x轴的直方图,从而识别每个字符的位置范围和mask坐标信息。切分后的每个字符分割成独立样本图片,保存待用。
步骤S303、通过训练好的机器学习模型提取每张第二图像所包含的文字,得到待测评文字信息。
示例性地,待测评文字信息包括至少一个文字特征,文字特征包括文字的大小、重心、形态、位置、笔画轮廓等。
其中,在文字的结构为上下结构的情况下,文字的大小包括上侧文字占比和下侧文字占比。在文字的结构为左右结构的情况下,文字的大小包括左侧文字占比和右侧文字占比。
其中,重心是指文字标记点的坐标的中心。
其中,形态是指文字最小外接矩形宽与高的比较。
其中,位置是指根据文字的最小外接矩形的中心在田字格中的位置。
其中,笔画轮廓包括内轮廓和外轮廓。外轮廓是指,从上面向下引线,第一次遇到文字的区域为有效区域,统计有效区域的范围。上下左右依次做相同操作统计有效区域,构成外轮廓矢量(如图4a)。内轮廓是指:从上往下引线,第一遇到文字和第二字遇到文字之前的区域为有效区域,统计有效区域的面积。上下左右依次做相同操作,构成内轮廓矢量(如图4b)。
步骤S304、从标准字库中获取所述每张第二图像所包含的文字的标准字信息。
示例性地,标准字信息包括至少一个标准文字特征,标准文字特征包括文字的标准大小、标准重心、标准形态、标准位置、标准笔画轮廓等。
步骤S305、对所述待测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
在一个实施例中,可以基于所述待测评文字信息和所述标准字信息,分别计算同一类型的文字特征所对应的特征差异度,之后,根据获取到的多个特征差异度中的最小值来确定每张图像所包含的文字的得分。
在一个实施例中,可以基于所述待测评文字信息和所述标准字信息,分别计算同一类型的文字特征所对应的特征差异度,之后,根据获取到的多个特征差异度中的最大值来确定每张图像所包含的文字的得分。
在一个实施例中,可以基于所述待测评文字信息和所述标准字信息,分别计算同一类型的文字特征所对应的特征差异度,之后,根据获取到的任意一个特征差异度来确定每张图像所包含的文字的得分。
在一个实施例中,在确定所述书法作品的评分时,根据以下公式计算:
Y=w1*X1+w2*X2+w3*X3+w4*X4+w5*X5
其中,w1、w2、w3、w4和w5为权重系数;X1表示大小项对应的特征差异度;X2表示重心项对应的特征差异度;X3表示形态项对应的特征差异度;X4表示位置项对应的特征差异度;X5表示笔画轮廓项对应的特征差异度。
在实际应用中,可以调整上述w1、w2、w3、w4、w5的大小。
需要说明的是,上述w1、w2、w3、w4以及w5的取值范围为(0,1)。
在上述步骤之后,还可以根据对每个字的评分,获取该书法作品的整体得分,例如可以将每个字评分的平均值作为所述书法作品的评分。
实施本申请实施例,在对书法作品进行评价时,首先,获取书法作品的图像,然后,对书法作品的图像进行拆分,得到每个书写的文字的图像,之后,通过训练好的机器学习模型提取图像所包含的文字,得到待测评文字信息,并从标准字库中获取该文字对应的标准字信息,对待测评文字信息和标准字信息进行比较,得到每个文字的得分,以根据每个文字的得分得到书法作品的评分。以这种方式,可以解决现有技术中的书法测评方法主要依靠人工来进行测评所导致的问题,一方面,可以提高书法测评的便利性和效率;另一方面,节约了人工成本。
作为另一个可选的实施方式,上述方法可以在服务器中实施,还可以提供一个客户端,该客户端可以是网页也可以是一个应用或者软件,以下为了描述方便,使用应用代表客户端。用户可以在应用中进行登录,然后上传自己的写的书法作品,在所述书法作品中的第一汉字被识别出来之后,获取所述用户历史上上传过并进行过评分的与该第一汉字相同的汉字,将该第一汉字以及对应的得分,以及与该第一汉字相同的汉字对应得分均显示给所述用户,并且将历史得分以及该第一汉字得分显示为曲线,这样有利于用户看到自己的进步或退步。
下面结合一个可选的实施例进行说明本申请是如何对书法作品进行评价的。本可选实施例适用于书法教学和书法学习效果测评,提升书法学习的氛围和减轻书法教学及评测的工作负担,运用信息化的手段,结合图像采集,图像裁剪,大数据分析实现毛笔书法的人工智能评测,支持从儿童到成人全年龄覆盖的习字评测,同时支持单字评测,多字评测。实现对笔画、结构、章法等维度进行分析打分并给出相对应的学习改进意见。
在本申请实施例中,首先进行图像采集,得到书法作品的第一图像,之后,对第一图像进行预处理,其中,预处理包括图像灰度化、二值化、降噪、倾斜校正、文字分割中的至少一种,之后,对获取到的第一图像进行裁剪,得到多张第二图像,其中,每张第二图像均包括书法作品的一个文字(例如,该文字可以为汉字)。
在进行裁剪之后,对于裁剪得到的每个图像进行汉字识别。汉字识别的方式有很多种,例如,可以建立包含多个(在本实施例中为3757个)常用字的单字数据集,其中,每个字包括简体和繁体在内的多种(在本实施例中为约100种)字体风格。将这些数据做训练数据(在本实施例中称为是汉字训练数据),使用一种基于机器学习训练书法作品单字识别模型的学习方法,进行训练。训练得到的模型可以进行汉字识别了。从而可以得到待测评文字信息,之后,从标准字库中获取每张第二图像所包含的文字的标准字信息,并对所述待测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本披露并不受所描述的动作顺序的限制,因为依据本披露,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本披露所必须的。
进一步需要说明的是,虽然图2、图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
上文结合图1-图4b对本申请实施例的书法作品评价方法进行了详细描述,为了便于更好地实施本申请实施例的上述方案,相应地,下面还提供用于配合实施上述方案的相关装置和设备。
参见图5,是本申请实施例提供的一种书法作品评价装置50的结构示意图,可以包括:
获取图像单元500,用于获取书法作品的第一图像;
拆分单元501,用于将所述第一图像拆分成至少一张第二图像,其中,每张所述第二图像中均包含一个书写的文字;
文字识别单元502,用于通过训练好的机器学习模型提取每张第二图像所包含的文字,得到待测评文字信息;
信息获取单元503,用于从标准字库中获取所述每张第二图像所包含的文字的标准字信息;
评分单元504,用于对所述待测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
在一种可能的实现方式中,所述待测评文字信息包括至少一个文字特征,所述文字特征包括文字的大小、重心、形态、位置、笔画轮廓;所述标准字信息包括至少一个标准文字特征,所述标准文字特征包括文字的标准大小、标准重心、标准形态、标准位置、标准笔画轮廓;所述评分单元504,具体用于:
基于所述待测评文字信息和所述标准字信息,分别计算同一类型的文字特征所对应的特征差异度;
根据所述特征差异度确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
在一种可能的实现方式中,所述根据所述特征差异度确定每张所述第二图像所包含的文字的得分,包括:
在确定所述书法作品的评分时,根据以下公式计算:
Y=w1*X1+w2*X2+w3*X3+w4*X4+w5*X5
其中,w1、w2、w3、w4和w5为权重系数;X1表示大小项对应的特征差异度;X2表示重心项对应的特征差异度;X3表示形态项对应的特征差异度;X4表示位置项对应的特征差异度;X5表示笔画轮廓项对应的特征差异度。
在一种可能的实现方式中,所述装置50还可以包括:
预处理单元,用于对所述第二图像进行预处理,其中,所述预处理包括图像灰度化、二值化、降噪、倾斜校正、文字分割中的至少一种。
在一种可能的实现方式中,所述装置50还可以包括:
训练单元,用于基于聚类算法对样本图像数据进行分类,并通过人工监督方式完成样本图像数据的标记,得到标记结果;基于所述标记结果生成数据集;其中,所述数据集包括训练数据集和测试数据集;通过所述训练数据集对所述机器学习模型进行训练,并结合测试数据集对所述机器学习模型进行测试,在确定所述机器学习模型所对应的文字识别结果大于预设值的情况下,得到所述训练好的机器学习模型。
需要说明的是,上述系统中的各个装置还可以包括其他单元,各个设备、单元的具体实现可以参见上述方法实施例中相关描述,此处,不再赘述。
为了便于更好地实施本申请实施例的上述方案,本申请还对应提供了一种电子设备60,下面结合附图来进行详细说明:
如图6示出的本申请实施例提供的电子设备的结构示意图,电子设备600可以包括处理器601、存储器604和通信模块605,处理器601、存储器604和通信模块605可以通过总线606相互连接。存储器604可以是高速随机存储记忆体(Random Access Memory,RAM)存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器604可选的还可以是至少一个位于远离前述处理器601的存储系统。存储器604用于存储应用程序代码,可以包括操作系统、网络通信模块、用户接口模块以及数据处理程序,通信模块605用于与外部设备进行信息交互;处理器601被配置用于调用该程序代码,执行以下步骤:
获取书法作品的第一图像;
将所述第一图像拆分成至少一张第二图像,其中,每张所述第二图像中均包含一个书写的文字;
通过训练好的机器学习模型提取每张第二图像所包含的文字,得到待测评文字信息;
从标准字库中获取所述每张第二图像所包含的文字的标准字信息;
对所述待测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
其中,所述待测评文字信息包括至少一个文字特征,所述文字特征包括文字的大小、重心、形态、位置、笔画轮廓;所述标准字信息包括至少一个标准文字特征,所述标准文字特征包括文字的标准大小、标准重心、标准形态、标准位置、标准笔画轮廓;所述处理器601对所述测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,包括:
基于所述待测评文字信息和所述标准字信息,分别计算同一类型的文字特征所对应的特征差异度;
根据所述特征差异度确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
其中,所述处理器601根据所述特征差异度确定每张所述第二图像所包含的文字的得分,包括:
在确定所述书法作品的评分时,根据以下公式计算:
Y=w1*X1+w2*X2+w3*X3+w4*X4+w5*X5
其中,w1、w2、w3、w4和w5为权重系数;X1表示大小项对应的特征差异度;X2表示重心项对应的特征差异度;X3表示形态项对应的特征差异度;X4表示位置项对应的特征差异度;X5表示笔画轮廓项对应的特征差异度。
其中,所述处理器601将所述第一图像拆分成至少一张第二图像之后,还包括:
对所述第二图像进行预处理,其中,所述预处理包括图像灰度化、二值化、降噪、倾斜校正、文字分割中的至少一种。
其中,所述处理器601还包括:
基于聚类算法对样本图像数据进行分类,并通过人工监督方式完成样本图像数据的标记,得到标记结果;
基于所述标记结果生成数据集;其中,所述数据集包括训练数据集和测试数据集;
通过所述训练数据集对所述机器学习模型进行训练,并结合测试数据集对所述机器学习模型进行测试,在确定所述机器学习模型所对应的文字识别结果大于预设值的情况下,得到所述训练好的机器学习模型。
其中,所述训练数据集中所包含的数据数量大于所述测试训练集中所包含的数据数量。
其中,所述机器学习模型包括卷积神经网络模型。
本申请实施例还提供了一种计算机存储介质,该计算机可读存储介质中存储有指令,当其在计算机或处理器上运行时,使得计算机或处理器执行上述任一个实施例所述方法中的一个或多个步骤。上述装置的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在所述计算机可读取存储介质中,基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机产品存储在计算机可读存储介质中。
上述计算机可读存储介质可以是前述实施例所述的设备的内部存储单元,例如硬盘或内存。上述计算机可读存储介质也可以是上述设备的外部存储设备,例如配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,上述计算机可读存储介质还可以既包括上述设备的内部存储单元也包括外部存储设备。上述计算机可读存储介质用于存储上述计算机程序以及上述设备所需的其他程序和数据。上述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可通过计算机程序来指令相关的硬件来完成,该计算机的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可存储程序代码的介质。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
可以理解,本领域普通技术人员可以意识到,结合本申请各个实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本领域技术人员能够领会,结合本申请各个实施例中公开描述的各种说明性逻辑框、模块和算法步骤所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,那么各种说明性逻辑框、模块、和步骤描述的功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本申请中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种书法作品评价方法,其特征在于,包括:
获取书法作品的第一图像;
将所述第一图像拆分成至少一张第二图像,其中,每张所述第二图像中均包含一个书写的文字;
通过训练好的机器学习模型提取每张第二图像所包含的文字,得到待测评文字信息;
从标准字库中获取所述每张第二图像所包含的文字的标准字信息;
对所述待测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
2.根据权利要求1所述的方法,其特征在于,所述待测评文字信息包括至少一个文字特征,所述文字特征包括文字的大小、重心、形态、位置、笔画轮廓;所述标准字信息包括至少一个标准文字特征,所述标准文字特征包括文字的标准大小、标准重心、标准形态、标准位置、标准笔画轮廓;所述对所述测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,包括:
基于所述待测评文字信息和所述标准字信息,分别计算同一类型的文字特征所对应的特征差异度;
根据所述特征差异度确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
3.根据权利要求2所述的方法,其特征在于,所述根据所述特征差异度确定每张所述第二图像所包含的文字的得分,包括:
在确定所述书法作品的评分时,根据以下公式计算:
Y=w1*X1+w2*x2+w3*x3+w4*X4+w5*X5
其中,w1、w2、w3、w4和w5为权重系数;X1表示大小项对应的特征差异度;X2表示重心项对应的特征差异度;X3表示形态项对应的特征差异度;X4表示位置项对应的特征差异度;X5表示笔画轮廓项对应的特征差异度。
4.根据权利要求1所述的方法,其特征在于,所述将所述第一图像拆分成至少一张第二图像之后,还包括:
对所述第二图像进行预处理,其中,所述预处理包括图像灰度化、二值化、降噪、倾斜校正、文字分割中的至少一种。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
基于聚类算法对样本图像数据进行分类,并通过人工监督方式完成样本图像数据的标记,得到标记结果;
基于所述标记结果生成数据集;其中,所述数据集包括训练数据集和测试数据集;
通过所述训练数据集对所述机器学习模型进行训练,并结合测试数据集对所述机器学习模型进行测试,在确定所述机器学习模型所对应的文字识别结果大于预设值的情况下,得到所述训练好的机器学习模型。
6.根据权利要求5所述的方法,其特征在于,所述训练数据集中所包含的数据数量大于所述测试训练集中所包含的数据数量。
7.根据权利要求5所述的方法,其特征在于,所述机器学习模型包括卷积神经网络模型。
8.一种书法作品评价装置,其特征在于,包括:
获取图像单元,用于获取书法作品的第一图像;
拆分单元,用于将所述第一图像拆分成至少一张第二图像,其中,每张所述第二图像中均包含一个书写的文字;
文字识别单元,用于通过训练好的机器学习模型提取每张第二图像所包含的文字,得到待测评文字信息;
信息获取单元,用于从标准字库中获取所述每张第二图像所包含的文字的标准字信息;
评分单元,用于对所述待测评文字信息和所述标准字信息进行比较,确定每张所述第二图像所包含的文字的得分,以得到所述书法作品的评分。
9.一种电子设备,其特征在于,包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310485413.2A CN116703748A (zh) | 2023-04-28 | 2023-04-28 | 书法作品评价方法、装置、电子设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310485413.2A CN116703748A (zh) | 2023-04-28 | 2023-04-28 | 书法作品评价方法、装置、电子设备及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116703748A true CN116703748A (zh) | 2023-09-05 |
Family
ID=87844213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310485413.2A Pending CN116703748A (zh) | 2023-04-28 | 2023-04-28 | 书法作品评价方法、装置、电子设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116703748A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117237954A (zh) * | 2023-11-14 | 2023-12-15 | 暗物智能科技(广州)有限公司 | 一种基于排序学习的文字智能评分方法及系统 |
-
2023
- 2023-04-28 CN CN202310485413.2A patent/CN116703748A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117237954A (zh) * | 2023-11-14 | 2023-12-15 | 暗物智能科技(广州)有限公司 | 一种基于排序学习的文字智能评分方法及系统 |
CN117237954B (zh) * | 2023-11-14 | 2024-03-19 | 暗物智能科技(广州)有限公司 | 一种基于排序学习的文字智能评分方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110232311B (zh) | 手部图像的分割方法、装置及计算机设备 | |
JP6719457B2 (ja) | 画像の主要被写体を抽出する方法とシステム | |
US8965117B1 (en) | Image pre-processing for reducing consumption of resources | |
JP5047005B2 (ja) | 画像処理方法、パターン検出方法、パターン認識方法及び画像処理装置 | |
CN108805076B (zh) | 环境影响评估报告书表格文字的提取方法及系统 | |
Nai et al. | Fast hand posture classification using depth features extracted from random line segments | |
CA2481828C (en) | System and method for detecting a hand-drawn object in ink input | |
WO2019061658A1 (zh) | 眼镜定位方法、装置及存储介质 | |
CN109902541B (zh) | 一种图像识别的方法及系统 | |
WO2019173185A1 (en) | Object tracking in zoomed video | |
CN104392229B (zh) | 基于笔画片段方向分布特征的笔迹识别方法 | |
CN104484643A (zh) | 一种手写表格的智能识别方法及系统 | |
CN110598686A (zh) | 发票的识别方法、系统、电子设备和介质 | |
CN111079571A (zh) | 证卡信息识别及其边缘检测模型训练方法、装置 | |
CN110717492B (zh) | 基于联合特征的图纸中字符串方向校正方法 | |
US9679218B2 (en) | Method and apparatus for image matching | |
CN116703748A (zh) | 书法作品评价方法、装置、电子设备及计算机可读存储介质 | |
CN112668541A (zh) | 一种基于点阵笔的智能听写系统及其方法 | |
CN113748429A (zh) | 单词识别方法、设备及存储介质 | |
EP2866171A2 (en) | Object detection method and device | |
CN110781866A (zh) | 基于深度学习的大熊猫脸部图像性别识别方法及装置 | |
CN112580395A (zh) | 基于深度信息的3d人脸活体识别方法、系统、设备及介质 | |
CN112348112B (zh) | 图像识别模型的训练方法、训练装置及终端设备 | |
CN109635798A (zh) | 一种信息提取方法及装置 | |
CN110119202B (zh) | 一种实现场景交互的方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |