CN117956093B - 扫描笔文本扫描方法、装置、介质及计算机设备 - Google Patents
扫描笔文本扫描方法、装置、介质及计算机设备 Download PDFInfo
- Publication number
- CN117956093B CN117956093B CN202410357044.3A CN202410357044A CN117956093B CN 117956093 B CN117956093 B CN 117956093B CN 202410357044 A CN202410357044 A CN 202410357044A CN 117956093 B CN117956093 B CN 117956093B
- Authority
- CN
- China
- Prior art keywords
- scanning
- image
- text
- playing
- acquiring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000000605 extraction Methods 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/04—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
- H04N1/10—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using flat picture-bearing surfaces
- H04N1/107—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa using flat picture-bearing surfaces with manual scanning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Character Input (AREA)
Abstract
本申请提出一种扫描笔文本扫描方法、装置、介质及计算机设备。本发明的扫描笔文本扫描方法,根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,水平分量为扫描速度在文字排布方向上的分量,垂直分量为扫描速度在文字排布垂直方向上的分量;依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;通过第一播放模块播放所述播放视频。本方案通过对扫描速度的分量化处理从两个维度同时减少了设备生成播放视频时的数据处理量,实现了设备成本下降的同时提升视频处理质量的效果。
Description
技术领域
本发明涉及一种扫描笔文本扫描方法、装置、介质及计算机设备,属于扫描笔数据处理技术领域。
背景技术
现有的扫描笔文字提取方法,通常通过扫描笔扫描模块获取待扫描文本的连续图像,再将图像进行调整后进行图像拼接,对拼接完成的图像进行文字提取和识别。该方案基于图像进行文字识别,因此对连续图像的拼接技术有较高要求,同时对扫描终端的扫描方式有相对较高的要求,扫描速度超处预设阈值都会导致图像拼接的数据处理量增大,在扫描终端或云端计算算力不足时易导致扫描结果出现偏差。例如,申请号为202110276177.4的专利文件中公开了一种扫描笔的扫描控制系统及方法,通过记录扫描开始时扫描笔的位置数据和扫描过程中的实时位置数据,获得扫描速度并进行监测,在扫描速度过大或过小时都对用户进行提示,并在扫描速度正常时自动调整帧率。其调整帧率的基本工作原理是,当扫描速度快时,增加扫描帧率,拍摄更多的扫描图像,扫描速度慢时,减少扫描帧率,拍摄更少的扫描图像,即扫描终端根据扫描速度调节摄像头的拍照帧率,获取合适数量的扫描图像保证扫描图像的质量足以被正确识别。
具体的,在申请号为202110276177.4的发明专利中,其直接通过位置传感器获取了扫描笔的移动速度,本质上,其默认了扫描笔的移动方向就是待识别文字的方向,虽然通常用户在使用扫描笔进行文本识别时会根据文字排布方向进行扫描,扫描笔等识别设备也会对扫描文本的方向进行限定,并在扫描窗口偏离正常的带扫描文本时进行报警,并将获取的无法识别的扫描图像进行废弃处理,但是,无法避免的,用户在依据文字排布方向进行扫描时会有持续的、微小偏移,本质上就是位置传感器的移动方向偏离了文字排布方向,此时,如果仍默认位置传感器的移动方向就是文字排布方向,就需要后续使用更大算力对偏离的扫描图像进行校正,无疑增加了后续的算力及算力门槛,造成设备的成本较高。
发明内容
针对上述现有技术的不足,本发明的目的在于提供一种扫描笔文本扫描方法、装置、介质及计算机设备。
根据本发明的实施方案,提供第一个方案为:一种扫描笔文本扫描方法,包括如下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
进一步地,所述依据初始扫描图像获取待扫描文本的文字排布方向的步骤包括:
识别初始扫描图像中的单元文字图像及文字类型;
依据文字类型获取单元文字图像的单元虚拟框;
识别初始扫描图像中单元文字图像的单元虚拟框的底边方向集合;
根据底边方向集合获取文字排布方向。
进一步地,所述依据初始扫描图像的文字排布方向获取扫描终端的扫描方向的步骤包括:
获取文字排布方向对应的多个单元虚拟框;
依据标定规则标记每个单元虚拟框的定位点;
依据初始扫描图像中文字单元图像的单元虚拟框的定位点集合获取扫描曲线及扫描方向。
进一步地,所述获取扫描终端的初始扫描图像的步骤包括:
获取扫描笔移动启动信号,在启动后的第一时间段内以第一固定帧率对待扫描文本进行扫描并获取初始扫描图像。
进一步地,所述依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率的步骤包括,通过帧率计算公式计算扫描帧率:
式中,为扫描模块的扫描帧率,/>为帧率调节参数,/>为第一固定帧率,/>为扫描速度的水平分量;
所述依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像的步骤包括,通过图像切割量公式计算扫描图像在垂直方向的预切割量:
式中,为扫描图像在垂直方向上的切割距离,/>为切割量参数,/>为扫描速度的垂直分量。
进一步地,还包括步骤:依据第一播放模块播放的播放视频进行文字提取,并将提取结果发送到第二播放模块播放。
进一步地,还包括:
通过视频摄像模块对第一播放模块进行视频扫描识别并获取文字扫描图像,依据文字扫描图像进行文字提取;
其中,通过视频播放速度计算公式计算第一播放模块的视频播放速度:
式中,为第一播放模块的视频播放速度,/>为播放调整参数,/>为额定视频播放速度,/>为视频摄像模块的额定帧率,/>为扫描模块的扫描帧率。
根据本发明的实施方案,利用本发明提供的第一个方案中的扫描笔文本扫描方法,提供第二个方案为:
一种扫描笔文本扫描装置,包括:
文字排布方向获取模块,用于获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
扫描方向获取模块,用于获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
分量计算模块,用于根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
扫描图像获取模块,用于依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
预处理图像获取模块,用于依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
播放视频生成模块,用于将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
视频播放模块,用于通过第一播放模块播放所述播放视频。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
与现有技术相比,本申请提供的技术方案独权的有益效果:通过对文字排布方向的识别将获取的扫描速度重新标定扫描方向,再根据扫描速度的水平分量进行扫描模块的扫描帧率调整,使得扫描图像的识别帧率设定更加准确合理,同时,根据扫描速度的垂直分量对扫描图像进行预切割处理从而减少后续的根据扫描图像生成播放视频时的数据处理量。本方案通过对扫描速度的分量化处理从两个维度同时减少了设备生成播放视频时的数据处理量,实现了设备成本下降的同时提升视频处理质量的优良效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中扫描笔文本扫描方法的流程图;
图2为一个实施例中扫描笔文本扫描方法的扫描图像中的单元虚拟框的示意图;
图3为一个实施例中扫描笔文本扫描装置的结构框图;
图4为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本领域的技术人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
本实施例要解决的技术问题是,现有的扫描笔的移动方向是通过位置传感器来获取移动速度,将文字排布方向默认为移动方向,虽然通常用户在使用扫描笔进行文本识别时会根据文字排布方向进行扫描,扫描笔等识别设备也会对扫描文本的方向进行限定,并在扫描窗口偏离正常的带扫描文本时进行报警,并将获取的无法识别的扫描图像进行废弃处理,但是,无法避免的,用户在依据文字排布方向进行扫描时会有持续的、微小偏移,本质上就是位置传感器的移动方向偏离了文字排布方向,此时,如果仍默认位置传感器的移动方向就是文字排布方向,就需要后续使用更大算力对偏离的扫描图像进行校正,无疑增加了后续的算力及算力门槛,造成设备的成本较高。
为了解决上述技术问题,本实施例提供一种扫描笔文本扫描方法,如图1所示,包括如下步骤:
S101:获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
具体的,在获取扫描笔移动启动信号后,在启动后的第一时间段内通过扫描模块以第一固定帧率对待扫描文本进行扫描并获取初始扫描图像。具体的,第一时间段可设置为0.4-0.6秒,第一固定帧率可设置为60帧率。
S102:获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
具体的,通过位置传感器获取扫描终端的扫描速度的绝对值,基于本申请面对的技术问题,需要依据初始扫描图像的文字排布方向获取扫描终端的扫描方向,即扫描方向受到使用者不精准操作的影响使得扫描方向偏离文字排布方向,进而造成通过默认的位置传感器的移动方向来进行扫描图像的处理,增大了算力及算力门槛的问题。
具体的,所述依据初始扫描图像获取待扫描文本的文字排布方向的步骤包括:
S1021:识别初始扫描图像中的单元文字图像及文字类型;例如,单元文字类型为简体汉字,单元文字图像为单一的汉字字符,文字类型为英文,单元文字图像为字母字符。进一步的,单元文字类型还可以为汉字的艺术体等排列不规整的字体。
S1022:依据文字类型获取单元文字图像的单元虚拟框;例如,汉字字符的单元虚拟框为包含该汉字字符的虚拟的线条框,该虚拟的线条框将汉字字符包含在内,且初始扫描图像中的汉字字符的单元虚拟框默认为面积、形状相同的框体。进一步的,还可以在文字类型中进一步识别为文字类型及文字字体大小,根据文字字体大小不同分别赋予汉字字符不同的单元虚拟框。
S1023:识别初始扫描图像中单元文字图像的单元虚拟框的底边方向集合;
具体的,例如图2所示,初始扫描图像中“抬头仰望是清”可获取6个汉字字符,每个汉字字符匹配一个单元虚拟框,该单元虚拟框为矩形框体,因此,每个单元虚拟框都可以至少提取出1个底边的方向,因此,可获取至少6个底边方向集合。
S1024:根据底边方向集合获取文字排布方向。
在图像分析中,不可避免的收到图像采集、文字变形等细微影响使得每个单元虚拟框的底边方向有微小形变偏离,因此,通过底边方向集合的统计处理可以缩小该偏离量,即通过多个单元虚拟框的底边方向集合将多个底边方向的中间值确定为文字排布方向,可最大程度地得到准确的文字排布方向。
具体的,所述依据初始扫描图像获取待扫描文本的文字排布方向的步骤包括:
S1031:获取文字排布方向对应的多个单元虚拟框;
S1032:依据标定规则标记每个单元虚拟框的定位点;标定规则可为每个单元虚拟框的矩形框体的左下角端点。
S1033:依据初始扫描图像中文字单元图像的单元虚拟框的定位点集合获取扫描曲线及扫描方向。
如图2所示,初始扫描图像中“抬头仰望是清”可获取6个汉字字符,获取6个汉字字符单元虚拟框的定位点为6个矩形框的左下角端点,连接6个端点可获取扫描曲线,该扫描曲线反应了真实的用户使用扫描终端的扫描动作,通过计算扫描曲线的斜率可获取扫描方向,以图2为例,扫描方向为文字排布方向偏上倾斜。在具体图像数据处理总,该扫描曲线并非数学上的斜率一定的曲线,因此需要对该扫描曲线进行拟合处理后形成斜率取中的拟合曲线,根据该拟合曲线的斜率得到扫描方向及扫描夹角,该扫描夹角为扫描方向与文字排布方向的夹角。
S103:根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量。
S104:依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像。
S105:依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像。
具体的,所述依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率的步骤包括,通过帧率计算公式计算扫描帧率:
式中,为扫描模块的扫描帧率,/>为帧率调节参数,/>为第一固定帧率,/>为扫描速度的水平分量;
所述依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像的步骤包括,通过图像切割量公式计算扫描图像在垂直方向的预切割量:
式中,为扫描图像在垂直方向上的切割距离,/>为切割量参数,/>为扫描速度的垂直分量。
S106:将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频。
S107:通过第一播放模块播放所述播放视频。
通过对文字排布方向的识别将获取的扫描速度重新标定扫描方向,再根据扫描速度的水平分量进行扫描模块的扫描帧率调整,使得扫描图像的识别帧率设定更加准确合理,同时,根据扫描速度的垂直分量对扫描图像进行预切割处理从而减少后续的根据扫描图像生成播放视频时的数据处理量。本方案通过对扫描速度的分量化处理从两个维度同时减少了设备生成播放视频时的数据处理量,实现了设备成本下降的同时提升视频处理质量的优良效果。
实施例二
本实施例基于实施例,具体提出一种扫描文本的文字提取方法,包括如下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频;
依据第一播放模块播放的播放视频进行文字提取,并将提取结果发送到第二播放模块播放。
基于图像拼接技术的文字提取方法,对图像拼接的技术门槛要求较高,造成设备的算力或者与设备连接的云算力要求较高,造成成本较高,同时扫描图像的数据量很容易因为扫描方式不同而重复产生,增大数据处理量,导致文本识别耗时较长,降低用户使用体验。
本方案中由于对扫描图像进行了视频转换,基于视频转换的结果再进行文字提取时,由于播放视频已经经过处理,可以以更加稳定高质量的效果进行播放时,再进行文字提取,可以大幅度减小文字提取的识别难度及计算量。
具体的,通过视频摄像模块对第一播放模块进行视频扫描识别并获取文字扫描图像,依据文字扫描图像进行文字提取;
其中,通过视频播放速度计算公式计算第一播放模块的视频播放速度:
式中,为第一播放模块的视频播放速度,/>为播放调整参数,/>为额定视频播放速度,/>为视频摄像模块的额定帧率,/>为扫描模块的扫描帧率。
具体的,视频摄像模块作为微型摄像机,其额定帧率即该微型摄像机在录像成像的实际帧率。
具体的,视频摄像模块的额定帧率为16时,扫描模块的扫描帧率为48,可知第一播放模块的视频播放速度是额定视频播放速度的1/3,即将第一播放模块的播放速度调整为额定播放速度的1/3倍进行播放,视频摄像模块对完成播放速度调节后的第一播放模块进行视频扫描,将该视频扫描结果发送到文字识别模块中进行文字识别提取。
进一步的,文字识别提取结果还可以发送到第二播放模块总播放,第二播放模块可以对文字识别提取结果进行渲染修改后播放,以增加播放风格提升播放效果。第二播放模块还可以根据文字识别提取结果进行文字朗读等其他功能实现。
本方案的优点还在于,根据视频摄像模块的额定帧率对第一播放模块中的视频播放速度进行调节,通过结合视频摄像模块的额定帧率、扫描模块的扫描帧率调节进行视频播放速度的计算,根据计算结果对第一播放模块中播放视频的速度进行调节,为视频摄像模块的采集图像质量提供有效保障的同时,保证了文字识别提取结果的精度。
实施例三
如图3所示,本实施例提供一种扫描笔文本扫描装置,包括:
文字排布方向获取模块100,用于获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
扫描方向获取模块200,用于获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
分量计算模块300,用于根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
扫描图像获取模块400,用于依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
预处理图像获取模块500,用于依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
播放视频生成模块600,用于将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
视频播放模块700,用于通过第一播放模块播放所述播放视频。
通过对文字排布方向的识别将获取的扫描速度重新标定扫描方向,再根据扫描速度的水平分量进行扫描模块的扫描帧率调整,使得扫描图像的识别帧率设定更加准确合理,同时,根据扫描速度的垂直分量对扫描图像进行预切割处理从而减少后续的根据扫描图像生成播放视频时的数据处理量。本方案通过对扫描速度的分量化处理从两个维度同时减少了设备生成播放视频时的数据处理量,实现了设备成本下降的同时提升视频处理质量的优良效果。
实施例四
图4示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图4所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现扫描笔文本扫描方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行扫描笔文本扫描方法。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行以下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行以下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种扫描笔文本扫描方法,其特征在于,包括如下步骤:
获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
所述依据初始扫描图像获取待扫描文本的文字排布方向的步骤包括:
识别初始扫描图像中的单元文字图像及文字类型;
依据文字类型获取单元文字图像的单元虚拟框;
识别初始扫描图像中单元文字图像的单元虚拟框的底边方向集合;
根据底边方向集合获取文字排布方向;
获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
所述依据初始扫描图像的文字排布方向获取扫描终端的扫描方向的步骤包括:
获取文字排布方向对应的多个单元虚拟框;
依据标定规则标记每个单元虚拟框的定位点;
依据初始扫描图像中文字单元图像的单元虚拟框的定位点集合获取扫描曲线及扫描方向;
根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
通过第一播放模块播放所述播放视频。
2.根据权利要求1所述的扫描笔文本扫描方法,其特征在于,所述获取扫描终端的初始扫描图像的步骤包括:
获取扫描笔移动启动信号,在启动后的第一时间段内以第一固定帧率对待扫描文本进行扫描并获取初始扫描图像。
3.根据权利要求1所述的扫描笔文本扫描方法,其特征在于,所述依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率的步骤包括,通过帧率计算公式计算扫描帧率:
式中,为扫描模块的扫描帧率,/>为帧率调节参数,/>为第一固定帧率,/>为扫描速度的水平分量;
所述依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像的步骤包括,通过图像切割量公式计算扫描图像在垂直方向的预切割量:
式中,为扫描图像在垂直方向上的切割距离,/>为切割量参数,/>为扫描速度的垂直分量。
4.根据权利要求1所述的扫描笔文本扫描方法,其特征在于,还包括步骤:
依据第一播放模块播放的播放视频进行文字提取,并将提取结果发送到第二播放模块播放。
5.根据权利要求1所述扫描笔文本扫描方法,其特征在于,还包括:
通过视频摄像模块对第一播放模块进行视频扫描识别并获取文字扫描图像,依据文字扫描图像进行文字提取;
其中,通过视频播放速度计算公式计算第一播放模块的视频播放速度:
式中,为第一播放模块的视频播放速度,/>为播放调整参数,/>为额定视频播放速度,/>为视频摄像模块的额定帧率,/>为扫描模块的扫描帧率。
6.一种扫描笔文本扫描装置,其特征在于,包括:
文字排布方向获取模块,用于获取扫描终端的初始扫描图像,依据初始扫描图像获取待扫描文本的文字排布方向;
所述依据初始扫描图像获取待扫描文本的文字排布方向的步骤包括:
识别初始扫描图像中的单元文字图像及文字类型;
依据文字类型获取单元文字图像的单元虚拟框;
识别初始扫描图像中单元文字图像的单元虚拟框的底边方向集合;
根据底边方向集合获取文字排布方向;
扫描方向获取模块,用于获取扫描终端的扫描速度,依据初始扫描图像的文字排布方向获取扫描终端的扫描方向;
所述依据初始扫描图像的文字排布方向获取扫描终端的扫描方向的步骤包括:
获取文字排布方向对应的多个单元虚拟框;
依据标定规则标记每个单元虚拟框的定位点;
依据初始扫描图像中文字单元图像的单元虚拟框的定位点集合获取扫描曲线及扫描方向;
分量计算模块,用于根据文字排布方向和扫描方向获取扫描速度的水平分量和垂直分量,所述水平分量为扫描速度在文字排布方向上的分量,所述垂直分量为扫描速度在文字排布垂直方向上的分量;
扫描图像获取模块,用于依据扫描速度的水平分量调整扫描终端的扫描模块的扫描帧率,扫描模块根据调整后的扫描帧率获取连续的扫描图像;
预处理图像获取模块,用于依据扫描速度的垂直分量对扫描图像进行垂直方向上的预切割并获取连续的预处理图像;
播放视频生成模块,用于将预处理图像的每组相邻图像作为一组处理对象,顺序识别处理对象的图像标定点集,依据图像标定点集调整预处理图像的播放位置并生成播放视频;
视频播放模块,用于通过第一播放模块播放所述播放视频。
7.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至5中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410357044.3A CN117956093B (zh) | 2024-03-27 | 2024-03-27 | 扫描笔文本扫描方法、装置、介质及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410357044.3A CN117956093B (zh) | 2024-03-27 | 2024-03-27 | 扫描笔文本扫描方法、装置、介质及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117956093A CN117956093A (zh) | 2024-04-30 |
CN117956093B true CN117956093B (zh) | 2024-06-18 |
Family
ID=90792590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410357044.3A Active CN117956093B (zh) | 2024-03-27 | 2024-03-27 | 扫描笔文本扫描方法、装置、介质及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117956093B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109272574A (zh) * | 2018-09-10 | 2019-01-25 | 武汉大学 | 基于投影变换的线阵旋转扫描相机成像模型构建方法和标定方法 |
CN111950463A (zh) * | 2020-08-13 | 2020-11-17 | 安徽淘云科技有限公司 | 扫描方法、装置、扫描笔和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7298344B2 (ja) * | 2018-09-05 | 2023-06-27 | 株式会社リコー | 画像形成装置、情報処理装置、画像形成方法、プログラム |
CN117253234B (zh) * | 2023-11-20 | 2024-03-12 | 深圳市云希谷科技有限公司 | 扫描笔连续图像拼接方法、装置、介质及计算机设备 |
CN117274998B (zh) * | 2023-11-21 | 2024-03-26 | 深圳市云希谷科技有限公司 | 扫描笔扫描控制方法及装置 |
-
2024
- 2024-03-27 CN CN202410357044.3A patent/CN117956093B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109272574A (zh) * | 2018-09-10 | 2019-01-25 | 武汉大学 | 基于投影变换的线阵旋转扫描相机成像模型构建方法和标定方法 |
CN111950463A (zh) * | 2020-08-13 | 2020-11-17 | 安徽淘云科技有限公司 | 扫描方法、装置、扫描笔和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117956093A (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11727663B2 (en) | Method and apparatus for detecting face key point, computer device and storage medium | |
US20210390289A1 (en) | Gesture language recognition method and apparatus, computer-readable storage medium, and computer device | |
EP3742333A1 (en) | Image processing method and apparatus, and computer device and storage medium | |
US8532386B2 (en) | Electronic document producing device, electronic document producing method and storage medium | |
CN105516590B (zh) | 一种图片处理方法及装置 | |
CN110969154A (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN110942067A (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN109858409A (zh) | 手工图转换方法、装置、设备及介质 | |
US11393248B2 (en) | Data detection method and device, computer equipment and storage medium | |
CN110796663A (zh) | 图片剪裁方法、装置、设备和存储介质 | |
CN117956093B (zh) | 扫描笔文本扫描方法、装置、介质及计算机设备 | |
CN113139535A (zh) | 一种ocr文档识别方法 | |
US8773733B2 (en) | Image capture device for extracting textual information | |
CN115223183A (zh) | 一种信息提取方法、装置及电子设备 | |
CN114222181B (zh) | 一种图像处理方法、装置、设备及介质 | |
US8908970B2 (en) | Textual information extraction method using multiple images | |
US8768058B2 (en) | System for extracting text from a plurality of captured images of a document | |
CN111860372A (zh) | 基于人工智能的表情包生成方法、装置、设备及存储介质 | |
CN111695550A (zh) | 一种文字提取方法、图像处理设备和计算机可读存储介质 | |
CN115225769B (zh) | 基于移动设备的扫描方法、装置、设备及存储介质 | |
US11881007B2 (en) | Video cropping method and apparatus, device, and storage medium | |
CN112183019B (zh) | 电子书手写笔记的显示方法、计算设备及计算机存储介质 | |
CN112101106B (zh) | 人脸关键点确定方法、装置以及存储介质 | |
CN112257718A (zh) | 一种关于放射科胶片的文本识别方法及装置 | |
CN113014914A (zh) | 一种基于神经网络的单人换脸短视频的识别方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |