CN112667115B - 文字显示方法以及电子设备、存储装置 - Google Patents
文字显示方法以及电子设备、存储装置 Download PDFInfo
- Publication number
- CN112667115B CN112667115B CN202011529547.2A CN202011529547A CN112667115B CN 112667115 B CN112667115 B CN 112667115B CN 202011529547 A CN202011529547 A CN 202011529547A CN 112667115 B CN112667115 B CN 112667115B
- Authority
- CN
- China
- Prior art keywords
- text
- layer
- image
- characters
- image layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Processing Or Creating Images (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种文字显示方法以及电子设备、存储装置,其中,文字显示方法包括:将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并识别原始图像中文字,得到文本层;第一数值大于预设值,且预设值表示完全不透明;将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件;其中,图像层中各个文字与文本层中对应文字至少部分重叠。上述方案,能够在保留原始图像的文字排版基础上,提高处理文本的便利性。
Description
技术领域
本申请涉及信息技术领域,特别是涉及一种文字显示方法以及电子设备、存储装置。
背景技术
随着信息技术的发展,人工智能等相关技术对图像的识别能力也随之而得到了提高。得益于此,越来越多的纸质文件经扫描得到原始图像之后,通过相关图像引擎将原始图像中文字以文本形式予以呈现,以便工作人员阅读、处理。有鉴于此,如何在保留原始图像的文字排版基础上,提高处理文本的便利性成为极具研究价值的课题。
发明内容
本申请主要解决的技术问题文本是提供一种文字显示方法以及电子设备、存储装置,能够在保留原始图像的文字排版基础上,提高处理文本的便利性。
为了解决上述问题文本,本申请第一方面提供了一种文字显示方法,包括:将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并识别原始图像中文字,得到文本层;第一数值大于预设值,且预设值表示完全不透明;将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件;其中,图像层中各个文字与文本层中对应文字至少部分重叠。
为了解决上述问题文本,本申请第二方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的文字显示方法。
为了解决上述问题文本,本申请第三方面提供了一种存储装置,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的文字显示方法。
上述方案,通过将原始图像中文字以外区域的透明度处理为大于预设值的第一数值,得到图像层,且预设值表示完全不透明,并识别原始图像中文字,得到文本层,在此基础上将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件,且图像层中各个文字与文本层中对应文字至少部分重叠。由于图像层设置为不响应鼠标事件,故鼠标事件能够透过图像层直接作用于文本层,且由于图像层中各个文字与文本层中对应文字至少部分重叠,故能直接通过显示于上层的图像层来选择并处理下层的文本层,而由于图像层中文字以外区域的透明度大于预设值,从而在文本层中文字被选择之后,文字选区背景色能够透过图像层而呈现,能够通过选区背景色来表示所选择的文字,且由于图像层层叠显示于文本层上方,故也能够保持图像层上文字原有清晰度。故此,能够在通过图像层保留原始图像的文字排版基础上,提高处理文本的便利性。
附图说明
图1是本申请文字显示方法一实施例的流程示意图;
图2是图像层和文本层层叠显示效果一实施例的示意图;
图3是图像层和文本层文字相对位置一实施例的示意图;
图4是图像层和文本层文字相对位置另一实施例的示意图;
图5是图像层层叠显示于文本层上方一实施例的示意图;
图6是文本层层叠显示于图像层上方一实施例的示意图;
图7是图像层层叠显示于文本层上方一实施例的效果示意图;
图8是文本层层叠显示于图像层上方一实施例的效果示意图;
图9是采用DIV标签得到文本层一实施例的示意图;
图10是本申请文字显示方法另一实施例的流程示意图;
图11是本申请文字显示方法又一实施例的流程示意图;
图12是本申请电子设备一实施例的框架示意图;
图13是本申请存储装置一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请结合参阅图1,图1是本申请文字显示方法一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S11:将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并识别原始图像中文字,得到文本层。
在一个实施场景中,原始图像可以是对纸质文件扫描得到的。根据具体使用场景的不同,纸质文件也可以为不同类型文件。例如,在教育场景中,纸质文件可以是考卷;或者,在司法场景中,纸质文件可以是卷宗,其他场景可以以此类推,在此不再一一举例。
在另一个实施场景中,原始图像也可以是通过截图、拍照等方式得到的,在此不做限定。例如,以教育场景为例,可以对考卷进行拍照得到原始图像,或者可以对机考界面进行截图,得到原始图像。其他场景可以以此类推,在此不再一一举例。
在一个实施场景中,文字以外区域具体可以包括除文字笔画之外的区域,即是将文字笔画之外区域的透明度全都处理为第一数值。例如,对于诸如“口”字等全包围文字,其以外区域不仅包含“口”字外围,还包含“口”字笔画内部,即对于“口”字,可以将其除笔画之外区域的透明度全都处理为第一数值。其他结构的文字可以以此类推,在此不再一一举例。
需要说明的是,本公开实施例中,第一数值大于预设值。此外,预设值表示完全不透明,例如可以为0,或其它用于表征完全不透明的数值。此外,第一数值越大,表示透明度越高。
在一个具体的实施场景中,透明度可以以百分比进行表示,百分比越大,透明度越高。具体可以以“0%”表示完全不透明,以“100%”表示完全透明,从而第一数值具体可以为:10%、20%、30%、40%、50%、60%、70%、80%、90%、100%等等,在此不做限定。
在另一个具体的实施场景中,透明度可以以百分制进行表示,分值越大,透明度越高,具体可以以“0”表示完全不透明,以“100”表示完全透明,从而第一数值具体可以为:10、20、30、40、50、60、70、80、90、100等等,在此不做限定。
在又一个具体的实施场景中,透明度也可以以十分制(即0至10),甚至以0至1来进行表示,具体可以根据具体应用情况进行设置,在此不做限定。
在一个实施场景中,可以通过OpenCV等来实现图像处理引擎,从而利用图像处理引擎对原始图像中文字以外区域的透明度处理为第一数值。
在一个具体的实施场景中,为了使图像层支持背景透明,可以将图像层保存为png(Portable Network Graphics,便携式网络图形)、gif(Graphics Interchange Format,图形交换格式)等支持背景透明的文件格式。
需要说明的是,本公开实施例中,图像层中各个文字与文本层中对应文字至少部分重叠,即图像层中第i行第j个文字与文本层中第i行第j个文字至少部分重叠。
在一个实施场景中,图像层中各个文字可以与文本层中对应文字完全重叠,即两个文字边缘完全对齐。也就是说,两个文字的字号、字体完全一致。
在另一个实施场景中,图像层中各个文字也可以与文本层中对应文字仅有部分重重叠,即两个文字边缘并不完全对齐,或者完全不对齐。也就是说,两个文字的字号、字体至少有一者不同。
在一个具体的实施场景中,在图像层中各个文字也可以与文本层中对应文字仅有部分重重叠的情况下,如后所述,本公开实施例中,图像层层叠显示于文本层上方,而图像层文字以外区域的透明度又设置为大于预设值,故文本层的文字可能会透过图像层,从而可能会影响阅读,故为了降低文本层的文字透过图像层的概率,提高文字可读性以及文字显示效果,图像层中文字可以遮盖文本层中对应文字。请结合参阅图2,图2是图像层和文本层层叠显示效果一实施例的示意图。如图2所示,实线“口”字位于图像层,虚线“口”字位于文本层,且图像层实线“口”字遮盖文本层虚线“口”字,其他文字可以以此类推,在此不再一一举例。
在另一个具体的实施场景中,在图像层中各个文字也可以与文本层中对应文字仅有部分重重叠的情况下,如后所述,本公开实施例中,图像层层叠显示于文本层上方,而图像层文字以外区域的透明度又设置为大于预设值,故文本层的文字可能会透过图像层,从而可能会影响阅读,故为了降低文本层的文字透过图像层的概率,提高文字可读性以及文字显示效果,文本层中文字可以直接设置为完全透明。
此外,也可以将文本层中各个文字的透明度设置为第二数值,且第二数值不小于第一数值。例如,第一数值为90%,即图像层文字以外区域的透明度为90%,则可以将位于下方的文本层中各个文字的透明度设置为不小于90%,例如,95%、100%。在应用于网页时,可以通过opacity(不透明度)属性来设置,opacity属性值为0表示完全透明,opacity属性值为1表示完全不透明,具体的属性值可以根据实际应用需要进行设置,在此不做限定。上述方式,可以有效降低下层文本层中文字透过上层图像层的概率,提高文字可读性以及文字显示效果。
此外,考虑到在实际使用过程中,文本层中文字可能会被选择,故还可以设置文本层中各个文字被选择后的透明度为完全透明,或者也可以设置为第三数值,且第三数值不小于第一数值。例如,第一数值为90%,即图像层文字以外区域的透明度为90%,则可以将位于下方的文本层中各个文字被选择后的透明度设置为不小于90%,例如,95%、100%。如前所述,在应用于网页时,可以通过opacity(不透明度)属性来设置,opacity属性值为0表示完全透明,opacity属性值为1表示完全不透明,具体的属性值可以根据实际应用需要进行设置,在此不做限定。上述方式,可以有效降低下层文本层中文字透过上层图像层的概率,提高文字可读性以及文字显示效果。
在一个实施场景中,图像层与文本层尺寸相同,且图像层中各个文字的相对位置和对应文字在文本层中的相对位置相同,故可以直接将图像层层叠于文本层上方,且两者边缘对齐,即可使得图像层中各个文字与文本层中对应文字至少部分重叠,从而可以降低图像层和文本层层叠显示的复杂度。具体实现过程可以参阅下述相关实施例,在此暂不赘述。
在一个具体的实施场景中,相对位置可以通过文字距所在层的左侧边缘的距离以及上侧边缘的距离来进行表示;或者,也可以通过文字距所在层的左侧边缘的距离以及下侧边缘的距离来进行表示;或者,也可以通过文字距所在层的右侧边缘的距离以及距上侧边缘的距离来进行表示;或者,也可以通过文字距所在层的右侧边缘以及距下侧边缘的距离来进行表示,在此不做限定。
在另一个具体的实施场景中,请结合参阅图3,图3是图像层和文本层文字相对位置一实施例的示意图。如图3所示,图像层和文本层尺寸相同,且图像层和文本层中均含有“口”字,图像层中“口”字距图像层上侧边缘30px(pixel,像素)以及距左侧边缘40px,文本层中“口”字距文本层上侧边缘30px以及距左侧边缘40px,故两者的相对位置相同。
在另一个实施场景中,图像层与文本层的尺寸也可以不同,且图像层与文本层文字版式相同,在此情形下,可以选择至少一个文字,作为定位文字,从而可以将图像层层叠于文本层上方,并对齐图像层和文本层中的定位文字,即可使得图像层中各个文字与文本层中对应文字至少部分重叠。
在一个具体的实施场景中,为了提高文字对齐精度,定位文字可以选择多个,例如,2个、3个、4个等等,在此不做限定。
在另一个具体的实施场景中,请结合参阅图4,图4是图像层和文本层文字相对位置另一实施例的示意图。如图4所示,图像层和文本层尺寸不同,且图像层和文本层文字版式相同,在此情形下,可以选择文字“口”、“耳”、“眼”、“手”中的至少一个,作为定位文字。此外,为了提高文字对齐的精度,还可以选择位于对角的两个文字,作为定位文字,如可以选择文字“口”和“手”作为定位文字;或者,可以选择文字“耳”和文字“眼”作为定位文字;或者,选择文字“口”、“耳”、“眼”、“手”作为定位文字,在此不做限定。
此外,具体可以通过OpenCV等来实现OCR(Optical Character Recognition,光学字符识别)引擎,从而利用OCR引擎来对原始图像进行文字识别。
步骤S12:将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件。
本公开实施例中,不响应鼠标事件表示当鼠标事件作用于图像层上时,能够透过图像层直接作用于位于下方的文本层。具体地,例如,在应用于网页时,可以利用CSS(Cascading Style Sheets,层叠样式表)设置图像层鼠标事件属性pointer-events为none;或者,在应用于网页,且浏览器版本较低(如,IE7、IE8、IE9等)时,可以利用JavaScript编写程序以调用浏览器内核,从而实现上方图像层不响应鼠标事件,具体实现代码在此不再列出。
请结合参阅图5,图5是图像层层叠显示于文本层上方一实施例的示意图。如图5所示,图像层层叠显示于文本层上方,图像层中文字“人”与文本层中文字“人”重叠。需要说明的是,图5为表示图像层和文本层的层叠框架并未展示重叠效果,图5中图像层和文本层之间的虚线表示两者具有重叠关系。此外,文本层中文字“人”外围的虚线框表示文字“人”被选择后所显示的文字选区,如前所述,由于图像层文字以外区域的透明度大于预设值,且图像层设置为不响应鼠标事件,故鼠标事件能够透过图像层直接作用于文本层,且文字选区的背景色(如,蓝色等)能够透过图像层显示,再者,由于图像层位于文本层上方,故位于下方的文字选区也不会影响位于上方的对应文字的清晰度。
与本公开实施例中方案相反地,文本层也可以层叠显示于图像层上方,且文本层中各个文字与图像层中对应文字至少部分重叠,具体可以参阅前述相关描述。在此基础上,可以不必设置图像层不响应鼠标事件。此外,为了使文本层不影响下方图像层的正常显示,可以设置整个文本层的透明度大于预设值(例如,可以设置整个文本层完全透明),以及为了使文本层中文字被选择后,选择的文字不影响图像层对应文字的正常显示,可以设置文本层中文字被选择后的透明度大于预设值(例如,可以设置文本层中文字被选择后完全透明)。区别于本公开实施例,由于文本层层叠显示于图像层上方,故文本层中文字被选择后,文字选区的背景色(如,蓝色)会遮盖下方图像层中对应文字,从而直接影响对应文字的清晰度,尽管通过提高文字选区背景色的透明,能够减弱背景色对下方图像层对应文字的遮盖,但由于仍需通过文字选区的背景色来表示当前所选择的文字,故背景色无论如何都会遮盖下方图像层对应文字,进而影响正常阅读。请结合参阅图6,图6是文本层层叠显示于图像层上方一实施例的示意图。如图6所示,文本层层叠显示于图像层上方,文本层中文字“人”与图像层中文字“人”重叠。需要说明的是,图6为表示文本层和图像层的层叠框架并未展示重叠效果,图6中文本层和图像层之间的虚线表示两者具有重叠关系。此外,文本层中文字“人”外围的虚线框表示文字“人”被选择后所显示的文字选区,如前所述,由于文本层层叠显示于图像层上方,故虚线框所示的文字选区的背景色会遮盖位于下方的图像层的文字“人”,从而降低下方图像层文字“人”的清晰度,影响阅读。
为了清楚地对比本公开实施例以及上述与本公开实施例相反的方案,请参阅图7和图8,图7是图像层层叠显示于文本层上方一实施例的效果示意图,图8是文本层层叠显示于图像层上方一实施例的效果示意图,具体地,图7所示的是采用本公开实施例的文字显示效果,秃8所示的是采用与本公开实施例相反的方案的文字显示效果。图7和图8中,灰色背景为文字选区,如图7所示,采用本公开实施例,文字选区中的文字与其他文字具有相同的清晰度,作为对比,如图8所示,采用与本公开实施例相反的方案,文字选区的文字清晰度明显弱于其他文字的清晰度。
在一个具体的实施场景中,本公开实施例具体可以应用于B/S(Browser/Server,浏览器/服务器)架构的双层pdf中。例如,在教育场景中,上述原始图像可以为考卷,通过本公开实施例对原始图像进行处理之后,教师可以线上对考卷进行批阅;或者,在司法场景中,上述原始图像可以为卷宗,办案人员可以在卷宗流转过程中,分别在线上对卷宗增加批注等以供不同侧办案人员复核。其他场景可以以此类推,在此不再一一举例。
上述方案,通过将原始图像中文字以外区域的透明度处理为大于预设值的第一数值,得到图像层,且预设值表示完全不透明,并识别原始图像中文字,得到文本层,在此基础上将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件,且图像层中各个文字与文本层中对应文字至少部分重叠。由于图像层设置为不响应鼠标事件,故鼠标事件能够透过图像层直接作用于文本层,且由于图像层中各个文字与文本层中对应文字至少部分重叠,故能直接通过显示于上层的图像层来选择并处理下层的文本层,而由于图像层中文字以外区域的透明度大于预设值,从而在文本层中文字被选择之后,文字选区背景色能够透过图像层而呈现,能够通过选区背景色来表示所选择的文字,且由于图像层层叠显示于文本层上方,故也能够保持图像层上文字原有清晰度。故此,能够在通过图像层保留原始图像的文字排版基础上,提高处理文本的便利性。
请参阅图9,图9是图1中步骤S11一实施例的流程示意图。具体可以包括如下步骤:
步骤S91:对原始图像进行文字识别,得到原始图像中的文字和文字的属性信息。
本公开实施例,属性信息包括:文字位置、文字尺寸。文字位置具体可以表示文字在原始图像中的相对位置,如前述公开实施例所述,具体可以包括:文字距图像层上侧边缘的距离和距左侧边缘的距离;或者,文字距图像层上侧边缘的距离和距右侧边缘的距离;或者,文字距图像下侧边缘的距离和距左侧边缘的距离;或者,文字距图像层下侧边缘的距离和距右侧边缘的距离,在此不做限定。文字尺寸具体可以包括文字的字号(如,四号、8磅)等。
在一个实施场景中,文字在图像层中的属性信息可以以包围文字的矩形框在图像层中的相对位置以及矩形框的大小来表示。请结合参阅图3,图像层中的文字“口”,可以采用包围该文字的矩形框(即图3中虚线矩形框)的宽度(width)和高度(height)来表示文字尺寸,并采用矩形框的左上顶点距上侧边缘的距离(30px)和距左侧边缘的距离(40px)来表示文字位置,其他场景可以以此类推,在此不再一一举例。
在另一个实施场景中,如前述公开实施例所述,可以通过OpenCV等来实现OCR(Optical Character Recognition,光学字符识别)引擎,从而利用OCR引擎来对原始图像进行文字识别,得到文字和文字的属性信息,具体地,OCR引擎可以返回识别结果,识别结果中可以包括文字和文字的属性信息。仍以图3所示的图像层为例,通过OCR引擎识别后,得到如下识别结果{x:40px,y:30px,width:20px,height:20px,char:“口”},即OCR引擎识别得到的文字为“口”,文字宽度(width)为20px,文字高度(height)为20px,文字距左侧边缘的距离(即x)为40px,文字距上侧边缘的距离(即y)为30px。其他情况可以以此类推,在此不再一一举例。
步骤S92:利用文字和文字的属性信息,生成文本层。
具体地,可以将各个文字封装为分隔区块,且分隔区块的大小与文字尺寸相同,在此基础上,可以分别按照各个文字的文字位置,将对应文字的分隔区块进行绝对定位,从而得到文本层。例如,可以先获取一个空白层,该空白层不包含任何信息,且该空白层与图像层尺寸相同,在此基础上,可以基于文字位置将分隔区块绝对定位于空白层,从而得到文本层。在采用绝对定位的情况下,若文字在图像层中距上侧边缘X像素,并距左侧边缘Y像素,则该文字在文本层中也距上侧边缘X像素,并距左侧边缘Y像素。上述方式,分别将各个文字分装为分隔区块,且分隔区块的大小为文字尺寸,从而分别按照各个文字的文字位置,将对应的分隔区块进行绝对定位,得到文本层,能够提高获取文本层的效率。
此外,为了提高后续将图像层层叠显示于文本层上方后的文字显示效果,文本层各个文字的透明度可以设置为第二数值,且第二数值不小于第一数值;或者,还可以将文本层各个文字被选择后的透明度设置为第三数值,且第三数值不小于第一数值,具体可以参阅前述公开实施例中相关描述,在此不再赘述。
在一个实施场景中,本公开实施例具体可以应用于网页,则可以采用DIV(DIVsion)标签,分别将各个文字封装为分隔区块,且分隔区块的大小为文字尺寸,并分别按照各个文字的文字位置,将对应的分隔区块绝对定位在外层DIV层中,得到文本层。上述方式,在网页中通过DIV标签分别将各个文字分装为分隔区块,且分隔区块的大小为文字尺寸,从而分别按照各个文字的文字位置,将对应的分隔区块绝对定位在外层DIV层中,得到文本层,能够在网页应用中提高获取文本层的效率。
在一个具体的实施场景中,请结合参阅图9,图9是采用DIV标签得到文本层一实施例的示意图。如图9所示,虚线框中即为外层DIV,外层DIV中间每一行为一个文字封装为分隔区块所采用的DIV标签,例如,对于第一行DIV标签,其封装的文字为“这”,background-color表示文字的背景色属性,文字“这”的背景色设置为红色,需要说明的是,为区分不同文字,尽管每一文字所设置的背景色均不同,为了便于展示附图,附图所示的背景色为经灰度处理后的颜色。仍以文字“这”为例,position表示文字的定位属性,absolute表示文字采用绝对定位,height和width分别表示分隔区块的高度和宽度,left表示文字至左侧边缘的距离,而top表示文字距上侧边缘的距离。其他文字可以以此类推,在此不再一一举例。通过对原始图像中各个文字采用如上方式封装,即可得到文本层。
在另一个实施场景中,本公开实施例也可以应用于其他场景,如双层pdf等,在此不做限定。
区别于前述实施例,通过对原始图像进行文字识别,得到原始图像中的文字和文字的属性信息,且属性信息包括文字位置和文字尺寸,从而利用文字和文字的属性信息,生成文本层,能够有利于后续图像层层叠显示于文本层上方之后,提高图像层中各个文字与文本层中对应文字的重叠度,使得两者尽可能完全重叠,进而能够有利于进一步提高文字显示效果。
请参阅图10,图10是本申请文字显示方法另一实施例的流程示意图。具体可以包括如下步骤:
步骤S101:将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并基于与屏幕分辨率匹配的缩放比例,缩放图像层。
本公开实施例中,第一数值大于预设值,且预设值表示完全不透明。此外,获取图像层的具体过程可以参阅前述公开实施例中的相关描述,在此不再赘述。
在实际应用场景中,为适应不同的屏幕分辨率(单位为px,即像素),需要将图像层进行缩放。例如,屏幕分辨率为1920*1080,而图像层分辨率高达4800*2100,为适应屏幕分辨率可以将图像层宽度缩放为1200,即缩放比例为1200/4800=0.25,从而图像层高度缩放为525。其他情况可以以此类推,在此不再一一举例。
步骤S102:对原始图像进行文字识别,得到原始图像中的文字和文字的属性信息。
本公开实施例中,属性信息可以包括:文字位置、文字尺寸、文本样式等等。具体可以参阅前述公开实施例中的相关步骤,在此不再赘述。此外,文本样式可以包括但不限于:字体、是否加粗、是否倾斜等等,在此不做限定。
步骤S103:基于缩放比例,缩放文字位置和文字尺寸。
仍以图3所示的图像层为例,如前所述,经OCR引擎识别后得到识别结果{x:40px,y:30px,width:20px,height:20px,char:“口”},在此基础上,可以按照缩放比例对文字位置进行缩放,即可以将距左侧边缘的距离(即x)缩放为:40*0.25=10,并将距上侧边缘的距离(即y)缩放为:30*0.25=7.5,此外可以按照缩放比例将文字宽度(即width)缩放为:20*0.25=5,并将文字高度(即height)缩放为:20*0.25=5。其他情况可以以此类推,在此不再一一举例。
步骤S104:分别获取包含文字的文字块,并将文字块按照缩放后的文字位置进行排布,得到文本层。
本公开实施例中,文字块的大小为缩放后的文字尺寸,此外,文本层的尺寸与缩放后的图像层相同。
在一个实施场景中,本公开实施例具体可以应用于网页,则可以采用DIV标签,分别将各个文字封装为分隔区块,且分隔区块的大小为缩放后的文字尺寸,并分别按照各个文字缩放后的文字位置,将对应的分隔区块绝对定位在外层DIV层中,得到文本层。具体过程可以参阅前述公开实施例中的相关描述,在此不再赘述。
在另一个实施场景中,本公开实施例也可以应用于其他场景,如双层pdf等,在此不做限定。
步骤S105:将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件。
本公开实施例中,图像层中各个文字与文本层中对应文字至少部分重叠。具体可以参阅前述公开实施例中的相关步骤,在此不再赘述。
区别于前述实施例,将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并基于与屏幕分辨率匹配的缩放比例,缩放图像层,从而对原始图像进行文字识别,得到原始图像中的文字和文字的属性信息,并基于缩放比例,缩放文字位置和文字尺寸,进而分别获取包含文字的文字块,并将文字块按照缩放后的文字位置进行排布,得到文本层,在此基础上再将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件,故此能够使得文字显示适应于不同屏幕分辨率。
请参阅图11,图11是本申请文字显示方法又一实施例的流程示意图。具体可以包括如下步骤:
步骤S111:将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并识别原始图像中文字,得到文本层。
本公开实施例中,第一数值大于预设值,预设值表示完全不透明。具体可以参阅前述公开实施例中的相关步骤,在此不再赘述。
步骤S112:将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件。
本公开实施例中,图像层中各个文字与文本层中对应文字至少部分重叠。具体可以参阅前述公开实施例中的相关步骤,在此不再赘述。
步骤S113:响应于用户对预设色觉障碍类别的选择指令,将图像层替换为备用层。
需要说明的是,本公开实施例中,备用层能够继承图像层原有的各种属性,例如,备用层中各个文字与文本层中对应文字至少部分重叠,且备用层也不响应鼠标事件,具体可以参考前述公开实施例中对图像层所做的各种设置,在此不再赘述。
此外,本公开实施例中,备用层为对图像层中文字的色彩经预设处理得到的,预设处理与色觉障碍类别匹配。色觉障碍类别具体可以包括但不限于:红色弱、绿色弱、全色弱、红色盲、绿色盲、全色盲等等,在此不做限定。以“红色弱”为例,预设处理可以包括以下任一者:增强红色,保持红色不变并减弱绿色和蓝色,在此不做限定。其他情况可以以此类推,在此不再一一举例。
区别于前述实施例,通过将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并识别原始图像中文字,得到文本层,从而将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件,进而响应于用户对预设色觉障碍类别的选择指令,将图像层替换为备用层,且备用层为对图像层中文字的色彩经预设处理得到的,预设处理与色觉障碍类别匹配,故能够对色觉障碍人士进行文字颜色优化处理,有利于进一步提高文字显示效果。
请参阅图12,图12是本申请电子设备120一实施例的框架示意图。电子设备120包括相互耦接的存储器121和处理器122,存储器121中存储有程序指令,处理器122用于执行程序指令以实现上述任一文字显示方法实施例中的步骤。具体地,电子设备120可以包括但不限于:手机、平板电脑、台式计算机、笔记本电脑等等,在此不做限定。
具体而言,处理器122用于控制其自身以及存储器121以实现上述任一文字显示方法实施例中的步骤。处理器122还可以称为CPU(Central Processing Unit,中央处理单元)。处理器122可能是一种集成电路芯片,具有信号的处理能力。处理器122还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器122可以由集成电路芯片共同实现。
本公开实施例中,处理器122用于将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并识别原始图像中文字,得到文本层;第一数值大于预设值,且预设值表示完全不透明;处理器122用于将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件;其中,图像层中各个文字与文本层中对应文字至少部分重叠。
上述方案,通过将原始图像中文字以外区域的透明度处理为大于预设值的第一数值,得到图像层,且预设值表示完全不透明,并识别原始图像中文字,得到文本层,在此基础上将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件,且图像层中各个文字与文本层中对应文字至少部分重叠。由于图像层设置为不响应鼠标事件,故鼠标事件能够透过图像层直接作用于文本层,且由于图像层中各个文字与文本层中对应文字至少部分重叠,故能直接通过显示于上层的图像层来选择并处理下层的文本层,而由于图像层中文字以外区域的透明度大于预设值,从而在文本层中文字被选择之后,文字选区背景色能够透过图像层而呈现,能够通过选区背景色来表示所选择的文字,且由于图像层层叠显示于文本层上方,故也能够保持图像层上文字原有清晰度。故此,能够在通过图像层保留原始图像的文字排版基础上,提高处理文本的便利性。
在一些公开实施例中,图像层与文本层尺寸相同,且图像层中各个文字的相对位置和对应文字在文本层中的相对位置相同。
区别于前述实施例,通过将图像层与文本层设置为尺寸相同,且图像层中各个文字的相对位置和对应文字在文本层中的相对位置相同,即可以直接将图像层层叠于文本层上方,且两者边缘对齐,从而使得图像层中各个文字与文本层中对应文字至少部分重叠,进而可以降低图像层和文本层层叠显示的复杂度。
在一些公开实施例中,处理器122用于对原始图像进行文字识别,得到原始图像中的文字和文字的属性信息;其中属性信息包括:文字位置、文字尺寸;处理器122用于利用文字和文字的属性信息,生成文本层。
区别于前述实施例,通过对原始图像进行文字识别,得到原始图像中的文字和文字的属性信息,且属性信息包括文字位置和文字尺寸,从而利用文字和文字的属性信息,生成文本层,能够有利于后续图像层层叠显示于文本层上方之后,提高图像层中各个文字与文本层中对应文字的重叠度,使得两者尽可能完全重叠,进而能够有利于进一步提高文字显示效果。
在一些公开实施例中,处理器122用于分别将各个文字封装为分隔区块;其中,分隔区块的大小为文字尺寸;处理器122用于分别按照各个文字的文字位置,将对应文字的分隔区块进行绝对定位,得到文本层。
区别于前述实施例,分别将各个文字分装为分隔区块,且分隔区块的大小为文字尺寸,从而分别按照各个文字的文字位置,将对应的分隔区块进行绝对定位,得到文本层,能够提高获取文本层的效率。
在一些公开实施例中,处理器122用于基于与屏幕分辨率匹配的缩放比例,缩放图像层,处理器122用于基于缩放比例,缩放文字位置和文字尺寸;处理器122用于分别获取包含文字的文字块;其中,文字块的大小为缩放后的文字尺寸;处理器122用于将文字块按照缩放后的文字位置进行排布,得到文本层。
区别于前述实施例,将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并基于与屏幕分辨率匹配的缩放比例,缩放图像层,从而对原始图像进行文字识别,得到原始图像中的文字和文字的属性信息,并基于缩放比例,缩放文字位置和文字尺寸,进而分别获取包含文字的文字块,并将文字块按照缩放后的文字位置进行排布,得到文本层,在此基础上再将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件,故此能够使得文字显示适应于不同屏幕分辨率。
在一些公开实施例中,文本层中各个文字的透明度为第二数值,且第二数值不小于第一数值。
区别于前述实施例,通过将文本层中各个文字的透明度设置为第二数值,且第二数值不小于第一数值,可以有效降低下层文本层中文字透过上层图像层的概率,提高文字可读性以及文字显示效果。
在一些公开实施例中,文本层中各个文字被选择后的透明度为第三数值,且第三数值不小于第一数值。
区别于前述实施例,通过将文本层中各个文字被选择后的透明度设置为第三数值,且第三数值不小于第一数值,可以有效降低下层文本层中文字透过上层图像层的概率,提高文字可读性以及文字显示效果。
在一些公开实施例中,处理器122用于响应于用户对预设色觉障碍类别的选择指令,将图像层替换为备用层;其中,备用层为对图像层中文字的色彩经预设处理得到的,预设处理与色觉障碍类别匹配。
区别于前述实施例,通过将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并识别原始图像中文字,得到文本层,从而将图像层层叠显示于文本层上方,并将图像层设置为不响应鼠标事件,进而响应于用户对预设色觉障碍类别的选择指令,将图像层替换为备用层,且备用层为对图像层中文字的色彩经预设处理得到的,预设处理与色觉障碍类别匹配,故能够对色觉障碍人士进行文字颜色优化处理,有利于进一步提高文字显示效果。
请参阅图13,图13是本申请存储装置130一实施例的框架示意图。存储装置130存储有能够被处理器运行的程序指令131,程序指令131用于实现上述任一文字显示方法实施例中的步骤。
上述方案,能够在通过图像层保留原始图像的文字排版基础上,提高处理文本的便利性。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (7)
1.一种文字显示方法,其特征在于,包括:
将原始图像中文字以外区域的透明度处理为第一数值,得到图像层,并识别所述原始图像中所述文字,得到文本层;其中,所述第一数值大于预设值,所述预设值表示完全不透明,所述文本层中各个所述文字的透明度为第二数值,且所述第二数值不小于所述第一数值;
将所述图像层层叠显示于所述文本层上方,并将所述图像层设置为不响应鼠标事件;其中,所述图像层中各个所述文字与所述文本层中对应所述文字至少部分重叠,所述文本层中各个所述文字被选择后的透明度为第三数值,且所述第三数值不小于所述第一数值;
响应于用户对预设色觉障碍类别的选择指令,将所述图像层替换为备用层;其中,所述备用层为对所述图像层中所述文字的色彩经预设处理得到的,所述预设处理与所述色觉障碍类别匹配。
2.根据权利要求1所述的方法,其特征在于,所述图像层与所述文本层尺寸相同,且所述图像层中各个所述文字的相对位置和对应所述文字在所述文本层中的相对位置相同。
3.根据权利要求1所述的方法,其特征在于,所述识别所述原始图像中所述文字,得到文本层,包括:
对所述原始图像进行文字识别,得到所述原始图像中的文字和所述文字的属性信息;其中所述属性信息包括:文字位置、文字尺寸;
利用所述文字和所述文字的属性信息,生成所述文本层。
4.根据权利要求3所述的方法,其特征在于,所述利用所述文字和所述文字的属性信息,生成所述文本层,包括:
分别将各个所述文字封装为分隔区块;其中,所述分隔区块的大小为所述文字尺寸;
分别按照各个所述文字的文字位置,将对应所述文字的分隔区块进行绝对定位,得到所述文本层。
5.根据权利要求1所述的方法,其特征在于,所述将原始图像中文字以外区域的透明度处理为第一数值,得到图像层之后,所述方法还包括:
基于与屏幕分辨率匹配的缩放比例,缩放所述图像层;
利用所述文字和所述文字的属性信息,生成所述文本层,包括:
基于所述缩放比例,缩放所述文字位置和所述文字尺寸;
分别获取包含所述文字的文字块;其中,所述文字块的大小为缩放后的所述文字尺寸;
将所述文字块按照缩放后的文字位置进行排布,得到所述文本层。
6.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至5任一项所述的文字显示方法。
7.一种存储装置,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至5任一项所述的文字显示验方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011529547.2A CN112667115B (zh) | 2020-12-22 | 2020-12-22 | 文字显示方法以及电子设备、存储装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011529547.2A CN112667115B (zh) | 2020-12-22 | 2020-12-22 | 文字显示方法以及电子设备、存储装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112667115A CN112667115A (zh) | 2021-04-16 |
CN112667115B true CN112667115B (zh) | 2023-07-25 |
Family
ID=75407620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011529547.2A Active CN112667115B (zh) | 2020-12-22 | 2020-12-22 | 文字显示方法以及电子设备、存储装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112667115B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111553837A (zh) * | 2020-04-28 | 2020-08-18 | 武汉理工大学 | 一种基于神经风格迁移的艺术文本图像生成方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009074974A1 (en) * | 2007-12-10 | 2009-06-18 | E-Glue Software Technologies Ltd. | System and process for producing a two-layer document, and a two-layer document produced accordingly |
CN101980133B (zh) * | 2010-10-29 | 2012-07-04 | 方正国际软件有限公司 | 双层电子文件文本选择区域偏差的检测方法和系统 |
CN102968407B (zh) * | 2011-08-31 | 2015-09-09 | 汉王科技股份有限公司 | 双层pdf文件的构造方法及装置 |
CN103714047B (zh) * | 2013-11-12 | 2017-10-10 | 北京中献电子技术开发中心 | 横向校对和输出双层pdf的方法和装置 |
US9378563B2 (en) * | 2014-02-18 | 2016-06-28 | Herbert A. Wertheim | Method for simulating the effect of viewing an image through a colored filter or ophthalmic spectacle lens |
US20160335242A1 (en) * | 2015-05-14 | 2016-11-17 | Smart Technologies Ulc | System and Method of Communicating between Interactive Systems |
CN205510304U (zh) * | 2016-02-18 | 2016-08-24 | 昆山龙腾光电有限公司 | 一种辅助色觉障碍用户图像转换的智能装置 |
CN109948137A (zh) * | 2017-12-21 | 2019-06-28 | 江苏奥博洋信息技术有限公司 | 双层pdf批量统一大小的方法 |
-
2020
- 2020-12-22 CN CN202011529547.2A patent/CN112667115B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111553837A (zh) * | 2020-04-28 | 2020-08-18 | 武汉理工大学 | 一种基于神经风格迁移的艺术文本图像生成方法 |
Non-Patent Citations (3)
Title |
---|
Transparent Text Detection and Background Recovery;Xinhao Liu;《2013 2nd IAPR Asian Conference on Pattern Recognition》;642-646 * |
基于自适应色彩聚类和上下文信息的自然场景文本检测;邹北骥;郭建京;朱承璋;杨文君;徐子雯;;电子学报(第06期);159-167 * |
采用双层PDF形式将方正书版文件制作为可检索式PDF文件;周雪莹;《编辑学报》;第24卷(第6期);592-594 * |
Also Published As
Publication number | Publication date |
---|---|
CN112667115A (zh) | 2021-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9336437B2 (en) | Segregation of handwritten information from typographic information on a document | |
KR101629062B1 (ko) | 로고가 있는 2차원코드, 로고가 있는 2차원코드 생성장치, 및 로고가 있는 2차원코드 생성방법 | |
US11823358B2 (en) | Handwritten content removing method and device and storage medium | |
US10528807B2 (en) | System and method for processing and identifying content in form documents | |
US10957086B1 (en) | Visual and digital content optimization | |
JP2013073439A (ja) | 文字認識装置及び文字認識方法 | |
CN112801084A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
US20210279516A1 (en) | Ground truth generation for image segmentation | |
CN112434555A (zh) | 键值对区域识别方法、装置、存储介质和电子设备 | |
CN112667115B (zh) | 文字显示方法以及电子设备、存储装置 | |
CN113762235A (zh) | 检测页面叠加区域的方法和装置 | |
CN116030469A (zh) | 一种处理方法、装置、设备和计算机可读存储介质 | |
CN114399623B (zh) | 一种通用答题识别方法、系统、存储介质及计算设备 | |
CN111401365B (zh) | Ocr图像自动生成方法及装置 | |
CN112101356A (zh) | 一种图片中特定文本的定位方法、装置及存储介质 | |
CN113449686A (zh) | 一种身份证造假的识别方法、装置、设备和介质 | |
CN103870793B (zh) | 纸媒广告的监测方法和装置 | |
JP2020053891A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20210303843A1 (en) | Information processing apparatus | |
CN116503721B (zh) | 身份证篡改检测方法、装置、设备及存储介质 | |
US20240087129A1 (en) | Information processing apparatus, non-transitory computer readable medium, and information processing method | |
CN117079084B (zh) | 样本图像的生成方法、装置、计算机设备和存储介质 | |
CN112185520B (zh) | 一种医疗病理报告图片的文本结构化处理系统和方法 | |
JPH0384681A (ja) | 名刺情報の入力処理方法 | |
EP4379678A1 (en) | Image processing system, image processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |