CN116600176B - 笔顺音视频生成方法、装置、计算机设备及存储介质 - Google Patents

笔顺音视频生成方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN116600176B
CN116600176B CN202310715352.4A CN202310715352A CN116600176B CN 116600176 B CN116600176 B CN 116600176B CN 202310715352 A CN202310715352 A CN 202310715352A CN 116600176 B CN116600176 B CN 116600176B
Authority
CN
China
Prior art keywords
chinese character
stroke
stroke order
video
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310715352.4A
Other languages
English (en)
Other versions
CN116600176A (zh
Inventor
黄元忠
张文凯
杨正华
杨开勇
王昆龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Fangzhi Technology Co ltd
Original Assignee
Shenzhen Fangzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Fangzhi Technology Co ltd filed Critical Shenzhen Fangzhi Technology Co ltd
Priority to CN202310715352.4A priority Critical patent/CN116600176B/zh
Publication of CN116600176A publication Critical patent/CN116600176A/zh
Application granted granted Critical
Publication of CN116600176B publication Critical patent/CN116600176B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/816Monomedia components thereof involving special video data, e.g 3D video
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/23424Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving splicing one content stream with another content stream, e.g. for inserting or substituting an advertisement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Marketing (AREA)
  • User Interface Of Digital Computer (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明实施例公开了笔顺音视频生成方法、装置、计算机设备及存储介质。所述方法包括:获取汉字清单;根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息;根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合;根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件。通过实施本发明实施例的方法可实现自动生成汉字笔顺视频,提高了笔顺视频的生产效率和准确率,节省开发人力。

Description

笔顺音视频生成方法、装置、计算机设备及存储介质
技术领域
本发明涉及音视频处理方法,更具体地说是指笔顺音视频生成方法、装置、计算机设备及存储介质。
背景技术
在学习汉字时,一般会通过汉字学习的笔顺视频进行学习,而汉字学习时的笔顺视频,大多数需要人工手动进行制作,在笔顺动画视频制作时,需要确定一个笔锋的范围,不能超出该范围,否则容易出现穿帮镜头,与此同时,笔顺动画对应的音频需要手动导入并指定起始点和结束点,这样制作的效率低,容易出现错误镜头。
因此,有必要设计一种新的方法,实现自动生成汉字笔顺音视频,提高了笔顺音视频的生产效率和准确率,节省开发人力。
发明内容
本发明的目的在于克服现有技术的缺陷,提供笔顺音视频生成方法、装置、计算机设备及存储介质。
为实现上述目的,本发明采用以下技术方案:笔顺音视频生成方法,包括:
获取汉字清单;
根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息;
根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合;
根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件。
其进一步技术方案为:所述根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息,包括:
根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
其进一步技术方案为:所述根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息,包括:
根据所述汉字清单从已存库中的汉字信息识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
其进一步技术方案为:所述根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合,包括:
将每个汉字的特征信息转换为图片;
从所述图片中提炼出每个汉字的笔顺;
根据每个汉字的笔顺计算对应笔画的位置信息,以得到每个汉字的笔画集合。
其进一步技术方案为:所述从所述图片中提炼出每个汉字的笔顺,包括:
对所述图片进行像素扫描,以得到每个汉字的各个笔锋的边界点;
对每个汉字将各个笔锋的边界点进行连接,以得到每个汉字的笔顺。
其进一步技术方案为:所述根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件,包括:
根据每个汉字的笔顺以及每个汉字的笔画集合为每个汉字的每一笔指定变色的起点、终点以及方向,以得到笔顺动画视频;
记录笔顺动画视频中的单段视频的起点和终点,以得到记录结果;
从声音集合中搜索匹配所述笔顺动画视频对应的音频文件;
将音频文件接入记录结果的起点位置,并与对应的笔顺动画视频匹配,以得到每个汉字的笔顺音视频文件。
本发明还提供了笔顺音视频生成装置,包括:
清单获取单元,用于获取汉字清单;
特征识别单元,用于根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息;
集合确定单元,用于根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合;
文件处理单元,用于根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件。
其进一步技术方案为:所述特征识别单元,用于根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
本发明与现有技术相比的有益效果是:本发明通过识别汉字清单中每个汉字的特征,提取每个汉字的笔顺,并确定笔画的位置信息,根据笔顺和笔画集合制作视频文件,并匹配对应的音频文件,将视频文件和音频文件结合,生成每个汉字的笔顺音视频文件,实现自动生成汉字笔顺音视频,提高了笔顺音视频的生产效率和准确率,节省开发人力。
下面结合附图和具体实施例对本发明作进一步描述。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的笔顺音视频生成方法的应用场景示意图;
图2为本发明实施例提供的笔顺音视频生成方法的流程示意图;
图3为本发明实施例提供的笔顺音视频生成方法的子流程示意图;
图4为本发明实施例提供的笔顺音视频生成方法的子流程示意图;
图5为本发明实施例提供的笔顺音视频生成方法的子流程示意图;
图6为本发明实施例提供的笔顺音视频生成装置的示意性框图;
图7为本发明实施例提供的笔顺音视频生成装置的集合确定单元的示意性框图;
图8为本发明实施例提供的笔顺音视频生成装置的提炼子单元的示意性框图;
图9为本发明实施例提供的笔顺音视频生成装置的文件处理单元的示意性框图;
图10为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的笔顺音视频生成方法的应用场景示意图。图2为本发明实施例提供的笔顺音视频生成方法的示意性流程图。该笔顺音视频生成方法应用于服务器中。该服务器与终端进行数据交互,通过终端导入汉字清单,并根据对汉字的特征进行识别,笔顺的提取和笔画位置的确定,进而生成音视频文件,从终端输出,实现自动生成汉字笔顺视频,提高了笔顺视频的生产效率和准确率,节省开发人力。
图2是本发明实施例提供的笔顺音视频生成方法的流程示意图。如图2所示,该方法包括以下步骤S110至S150。
S110、获取汉字清单。
在本实施例中,汉字清单是指写有汉字的文件。主要是小学阶段语文课程标准中规定的会认字和会写字的汉字,大约有3500个汉字。
S120、根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息。
在本实施例中,特征信息是指汉字的结构、部首、笔顺、拼音、形状等内容。
具体地,根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
根据所述汉字清单从已存库中的汉字信息识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
S130、根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合。
在本实施例中,每个汉字的笔画集合包括汉字的笔顺以及起点、终点等信息。
在一实施例中,请参阅图3,上述的步骤S130可包括步骤S131~S133。
S131、将每个汉字的特征信息转换为图片。
在本实施例中,将每个汉字的特征信息转换为白底黑字的图片,也就是这张图片显示白色底和黑色的汉字。
S132、从所述图片中提炼出每个汉字的笔顺。
在本实施例中,每个汉字的笔顺是指每个汉字的每一笔的起点和终端信息等。
在一实施例中,请参阅图4,上述的步骤S132可包括步骤S1321~S1322。
S1321、对所述图片进行像素扫描,以得到每个汉字的各个笔锋的边界点;
S1322、对每个汉字将各个笔锋的边界点进行连接,以得到每个汉字的笔顺。
在本实施例中,根据像素扫描得出每个汉字汇总的各个笔锋的边界点进行连接,形成笔顺中起点和终点数据。
比如生这个字,一撇是左上方,起始位置在左上方,和后面的后字的撇是不一样的,大部分的生字的笔顺都会有自身的特点。可以通过扫描图片的像素进行确定。
具体地,根据汉字的特征,提炼出汉字的部首,再提炼出汉字的每个笔顺,从笔顺的历史库中提炼出对应的笔顺特征,获得笔顺的主要数据:名称,形状,方向等,比如横竖撇捺等笔画。
S133、根据每个汉字的笔顺计算对应笔画的位置信息,以得到每个汉字的笔画集合。
在本实施例中,具体是确定每一笔的笔画位置大小,确定了笔顺和每个笔画的位置大小等,为后续的变色提供基础,比如在未落笔之前该位置是黑色,后面落笔时逐渐显示红色或者其他颜色。
S140、根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件。
在一实施例中,请参阅图5,上述的步骤S140可包括步骤S141~S144。
S141、根据每个汉字的笔顺以及每个汉字的笔画集合为每个汉字的每一笔指定变色的起点、终点以及方向,以得到笔顺动画视频。
在本实施例中,笔顺动画视频是指每个汉字的每一笔指定变色的起点、终点以及方向形成的动画。
S142、记录笔顺动画视频中的单段视频的起点和终点,以得到记录结果。
在本实施例中,记录结果是指笔顺动画视频中的单段视频的起点和终点,单段视频是指每个汉字的每一笔的起始点到终点所录制的视频内容。
S143、从声音集合中搜索匹配所述笔顺动画视频对应的音频文件。
在本实施例中,音频文件是指与笔顺动画视频对应的声音解说文件。
声音集合是指预先录制好的每个汉字的笔顺对应的解说音频。
S144、将音频文件接入记录结果的起点位置,并与对应的笔顺动画视频匹配,以得到每个汉字的笔顺音视频文件。
从声音集合中搜索匹配对应的音频文件,将音频接入视频的起点位置,与对应的笔顺动画匹配,形成音画同步,具体地,将汉字中的基本笔画形成声音集合库,每个笔顺对应一个音频文件。针对每个汉字分析笔画,在动画的视频分段的起点处,导入和当前笔画匹配的音频文件,让音频波形和视频同步进行,达到音画同步的效果。
在本实施例中,等一个汉字的所有笔顺生成完成后,输出单个字的笔顺动画视频,再进入集合中的下一个汉字,直到当前汉字集合中的字都处理完。
本实施例实现了汉字的笔顺动画视频生成和音频导入匹配进行合成,输出完整的笔顺描绘视频,提高了笔顺音视频的生产效率和准确率,节省开发人力。
上述的笔顺音视频生成方法,通过识别汉字清单中每个汉字的特征,提取每个汉字的笔顺,并确定笔画的位置信息,根据笔顺和笔画集合制作视频文件,并匹配对应的音频文件,将视频文件和音频文件结合,生成每个汉字的笔顺音视频文件,实现自动生成汉字笔顺视频,提高了笔顺视频的生产效率和准确率,节省开发人力。
图6是本发明实施例提供的一种笔顺音视频生成装置300的示意性框图。如图6所示,对应于以上笔顺音视频生成方法,本发明还提供一种笔顺音视频生成装置300。该笔顺音视频生成装置300包括用于执行上述笔顺音视频生成方法的单元,该装置可以被配置于服务器中。具体地,请参阅图6,该笔顺音视频生成装置300包括清单获取单元301、特征识别单元302、集合确定单元303以及文件处理单元304。
清单获取单元301,用于获取汉字清单;特征识别单元302,用于根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息;集合确定单元303,用于根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合;文件处理单元304,用于根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件。
在一实施例中,所述特征识别单元302,用于根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
在一实施例中,所述特征识别单元302,用于根据所述汉字清单从已存库中的汉字信息识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
在一实施例中,如图7所示,所述集合确定单元303包括转换子单元3031、提炼子单元3032以及计算子单元3033。
转换子单元3031,用于将每个汉字的特征信息转换为图片;提炼子单元3032,用于从所述图片中提炼出每个汉字的笔顺;计算子单元3033,用于根据每个汉字的笔顺计算对应笔画的位置信息,以得到每个汉字的笔画集合。
在一实施例中,如图8所示,所述提炼子单元3032包括扫描模块30321以及连接模块30322。
扫描模块30321,用于对所述图片进行像素扫描,以得到每个汉字的各个笔锋的边界点;连接模块30322,用于对每个汉字将各个笔锋的边界点进行连接,以得到每个汉字的笔顺。
在一实施例中,如图9所示,所述文件处理单元304包括指定子单元3041、记录子单元3042、搜索子单元3043以及匹配子单元3044。
指定子单元3041,用于根据每个汉字的笔顺以及每个汉字的笔画集合为每个汉字的每一笔指定变色的起点、终点以及方向,以得到笔顺动画视频;记录子单元3042,用于记录笔顺动画视频中的单段视频的起点和终点,以得到记录结果;搜索子单元3043,用于从声音集合中搜索匹配所述笔顺动画视频对应的音频文件;匹配子单元3044,用于将音频文件接入记录结果的起点位置,并与对应的笔顺动画视频匹配,以得到每个汉字的笔顺音视频文件。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述笔顺音视频生成装置300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述笔顺音视频生成装置300可以实现为一种计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
请参阅图10,图10是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图10,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种笔顺音视频生成方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种笔顺音视频生成方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
获取汉字清单;根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息;根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合;根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件。
在一实施例中,处理器502在实现所述根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息步骤时,具体实现如下步骤:
根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
在一实施例中,处理器502在实现所述根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息步骤时,具体实现如下步骤:
根据所述汉字清单从已存库中的汉字信息识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
在一实施例中,处理器502在实现所述根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合步骤时,具体实现如下步骤:
将每个汉字的特征信息转换为图片;从所述图片中提炼出每个汉字的笔顺;根据每个汉字的笔顺计算对应笔画的位置信息,以得到每个汉字的笔画集合。
在一实施例中,处理器502在实现所述从所述图片中提炼出每个汉字的笔顺步骤时,具体实现如下步骤:
对所述图片进行像素扫描,以得到每个汉字的各个笔锋的边界点;对每个汉字将各个笔锋的边界点进行连接,以得到每个汉字的笔顺。
在一实施例中,处理器502在实现所述根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件步骤时,具体实现如下步骤:
根据每个汉字的笔顺以及每个汉字的笔画集合为每个汉字的每一笔指定变色的起点、终点以及方向,以得到笔顺动画视频;记录笔顺动画视频中的单段视频的起点和终点,以得到记录结果;从声音集合中搜索匹配所述笔顺动画视频对应的音频文件;将音频文件接入记录结果的起点位置,并与对应的笔顺动画视频匹配,以得到每个汉字的笔顺音视频文件。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:
获取汉字清单;根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息;根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合;根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件。
在一实施例中,所述处理器在执行所述计算机程序而实现所述根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息步骤时,具体实现如下步骤:
根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
在一实施例中,所述处理器在执行所述计算机程序而实现所述根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息步骤时,具体实现如下步骤:
根据所述汉字清单从已存库中的汉字信息识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
在一实施例中,所述处理器在执行所述计算机程序而实现所述根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合步骤时,具体实现如下步骤:
将每个汉字的特征信息转换为图片;从所述图片中提炼出每个汉字的笔顺;根据每个汉字的笔顺计算对应笔画的位置信息,以得到每个汉字的笔画集合。
在一实施例中,所述处理器在执行所述计算机程序而实现所述从所述图片中提炼出每个汉字的笔顺步骤时,具体实现如下步骤:
对所述图片进行像素扫描,以得到每个汉字的各个笔锋的边界点;对每个汉字将各个笔锋的边界点进行连接,以得到每个汉字的笔顺。
在一实施例中,所述处理器在执行所述计算机程序而实现所述根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件步骤时,具体实现如下步骤:
根据每个汉字的笔顺以及每个汉字的笔画集合为每个汉字的每一笔指定变色的起点、终点以及方向,以得到笔顺动画视频;记录笔顺动画视频中的单段视频的起点和终点,以得到记录结果;从声音集合中搜索匹配所述笔顺动画视频对应的音频文件;将音频文件接入记录结果的起点位置,并与对应的笔顺动画视频匹配,以得到每个汉字的笔顺音视频文件。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (8)

1.笔顺音视频生成方法,其特征在于,包括:
获取汉字清单;
根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息;
根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合;
根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件;
所述根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合,包括:
将每个汉字的特征信息转换为图片;
从所述图片中提炼出每个汉字的笔顺;
根据每个汉字的笔顺计算对应笔画的位置信息,以得到每个汉字的笔画集合;
所述从所述图片中提炼出每个汉字的笔顺,包括:
对所述图片进行像素扫描,以得到每个汉字的各个笔锋的边界点;
对每个汉字将各个笔锋的边界点进行连接,以得到每个汉字的笔顺。
2.根据权利要求1所述的笔顺音视频生成方法,其特征在于,所述根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息,包括:
根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
3.根据权利要求2所述的笔顺音视频生成方法,其特征在于,所述根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息,包括:
根据所述汉字清单从已存库中的汉字信息识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
4.根据权利要求1所述的笔顺音视频生成方法,其特征在于,所述根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件,包括:
根据每个汉字的笔顺以及每个汉字的笔画集合为每个汉字的每一笔指定变色的起点、终点以及方向,以得到笔顺动画视频;
记录笔顺动画视频中的单段视频的起点和终点,以得到记录结果;
从声音集合中搜索匹配所述笔顺动画视频对应的音频文件;
将音频文件接入记录结果的起点位置,并与对应的笔顺动画视频匹配,以得到每个汉字的笔顺音视频文件。
5.笔顺音视频生成装置,其特征在于,包括:
清单获取单元,用于获取汉字清单;
特征识别单元,用于根据所述汉字清单识别每个汉字的特征,以得到每个汉字的特征信息;
集合确定单元,用于根据每个汉字的特征信息提取每个汉字的笔顺,并计算对应笔画的位置信息,以得到每个汉字的笔画集合;
文件处理单元,用于根据每个汉字的笔顺以及每个汉字的笔画集合处理音视频文件,以得到每个汉字的笔顺音视频文件;
所述集合确定单元包括转换子单元、提炼子单元以及计算子单元;
转换子单元,用于将每个汉字的特征信息转换为图片;提炼子单元,用于从所述图片中提炼出每个汉字的笔顺;计算子单元,用于根据每个汉字的笔顺计算对应笔画的位置信息,以得到每个汉字的笔画集合;
所述提炼子单元包括扫描模块以及连接模块;
扫描模块,用于对所述图片进行像素扫描,以得到每个汉字的各个笔锋的边界点;连接模块,用于对每个汉字将各个笔锋的边界点进行连接,以得到每个汉字的笔顺。
6.根据权利要求4所述的笔顺音视频生成装置,其特征在于,所述特征识别单元,用于根据所述汉字清单识别汉字的结构、部首、笔顺、拼音、形状,以得到每个汉字的特征信息。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的方法。
8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述的方法。
CN202310715352.4A 2023-06-15 2023-06-15 笔顺音视频生成方法、装置、计算机设备及存储介质 Active CN116600176B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310715352.4A CN116600176B (zh) 2023-06-15 2023-06-15 笔顺音视频生成方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310715352.4A CN116600176B (zh) 2023-06-15 2023-06-15 笔顺音视频生成方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN116600176A CN116600176A (zh) 2023-08-15
CN116600176B true CN116600176B (zh) 2024-04-09

Family

ID=87590080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310715352.4A Active CN116600176B (zh) 2023-06-15 2023-06-15 笔顺音视频生成方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN116600176B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1588350A (zh) * 2004-09-17 2005-03-02 华南理工大学 一种含书写时序信息的动态汉字字库的处理方法及其应用
CN203405969U (zh) * 2013-06-24 2014-01-22 深圳市状元娃科技有限公司 一种点读笔及点读系统
CN104581339A (zh) * 2015-01-07 2015-04-29 北京凌鸿智业教育科技有限公司 一种与音频同步显示笔迹的装置及其方法
CN204390527U (zh) * 2014-12-11 2015-06-10 李霞 一种笔画学习机
CN105094381A (zh) * 2015-07-21 2015-11-25 网易(杭州)网络有限公司 一种书写处理方法和装置
CN105425980A (zh) * 2015-11-02 2016-03-23 中国科学院自动化研究所 基于Web的汉字一笔一划书写方法
CN112068748A (zh) * 2020-11-16 2020-12-11 南京孜博汇信息科技有限公司 基于点阵的音频信息处理方法
CN113436298A (zh) * 2021-07-05 2021-09-24 深圳软牛科技有限公司 一种自动生成汉字笔顺动画的方法、装置及其相关组件
CN113763514A (zh) * 2021-07-15 2021-12-07 北京字节跳动网络技术有限公司 笔顺动画的生成方法、装置、系统及电子设备
CN114973798A (zh) * 2022-06-28 2022-08-30 深圳市方直科技股份有限公司 一种单词学习卡生成方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1588350A (zh) * 2004-09-17 2005-03-02 华南理工大学 一种含书写时序信息的动态汉字字库的处理方法及其应用
CN203405969U (zh) * 2013-06-24 2014-01-22 深圳市状元娃科技有限公司 一种点读笔及点读系统
CN204390527U (zh) * 2014-12-11 2015-06-10 李霞 一种笔画学习机
CN104581339A (zh) * 2015-01-07 2015-04-29 北京凌鸿智业教育科技有限公司 一种与音频同步显示笔迹的装置及其方法
CN105094381A (zh) * 2015-07-21 2015-11-25 网易(杭州)网络有限公司 一种书写处理方法和装置
CN105425980A (zh) * 2015-11-02 2016-03-23 中国科学院自动化研究所 基于Web的汉字一笔一划书写方法
CN112068748A (zh) * 2020-11-16 2020-12-11 南京孜博汇信息科技有限公司 基于点阵的音频信息处理方法
CN113436298A (zh) * 2021-07-05 2021-09-24 深圳软牛科技有限公司 一种自动生成汉字笔顺动画的方法、装置及其相关组件
CN113763514A (zh) * 2021-07-15 2021-12-07 北京字节跳动网络技术有限公司 笔顺动画的生成方法、装置、系统及电子设备
CN114973798A (zh) * 2022-06-28 2022-08-30 深圳市方直科技股份有限公司 一种单词学习卡生成方法及装置

Also Published As

Publication number Publication date
CN116600176A (zh) 2023-08-15

Similar Documents

Publication Publication Date Title
US11605226B2 (en) Video data processing method and apparatus, and readable storage medium
CN110705405B (zh) 目标标注的方法及装置
CN110148400B (zh) 发音类型的识别方法、模型的训练方法、装置及设备
CN109376256B (zh) 图像搜索方法及装置
CN109034069B (zh) 用于生成信息的方法和装置
CN111582241A (zh) 视频字幕识别方法、装置、设备及存储介质
US8627203B2 (en) Method and apparatus for capturing, analyzing, and converting scripts
CN112382295B (zh) 语音识别方法、装置、设备及可读存储介质
CN112270297A (zh) 用于显示识别结果的方法和计算机系统
CN112818949A (zh) 一种产证文字的识别方法及系统
CN114357206A (zh) 基于语义分析的教育类视频彩色字幕生成方法及系统
CN116600176B (zh) 笔顺音视频生成方法、装置、计算机设备及存储介质
US9152876B1 (en) Methods and systems for efficient handwritten character segmentation
CN112560728B (zh) 目标对象识别方法及装置
CN113221718B (zh) 公式识别方法、装置、存储介质和电子设备
CN110795918A (zh) 确定阅读位置的方法、装置及设备
CN111738248B (zh) 字符识别方法、字符译码模型的训练方法及电子设备
CN111582281A (zh) 一种图片显示优化的方法、装置、电子设备和存储介质
CN111737500A (zh) 电子页面的检索方法及装置、学习设备、可读存储介质
JP5188290B2 (ja) アノテーション装置、アノテーション方法およびプログラム
CN111161737A (zh) 数据处理方法、装置、电子设备和存储介质
CN110163203B (zh) 字符识别方法、装置、存储介质及计算机设备
US20230393873A1 (en) Value-Added Content Providing Method and Computer System thereof
CN111597906B (zh) 一种结合文字信息的快速绘本识别方法及系统
CN114708581A (zh) 一种图像处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant