CN111079037A - 文档显示效果的评估方法、装置及计算机可读存储介质 - Google Patents
文档显示效果的评估方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111079037A CN111079037A CN201911292503.XA CN201911292503A CN111079037A CN 111079037 A CN111079037 A CN 111079037A CN 201911292503 A CN201911292503 A CN 201911292503A CN 111079037 A CN111079037 A CN 111079037A
- Authority
- CN
- China
- Prior art keywords
- image
- document
- evaluation result
- display
- text information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种文档显示效果的评估方法、装置及计算机可读存储介质,该方法包括:通过第一应用生成第一显示页面,并获取第一显示页面的第一文本信息以及第一图像;通过第二应用生成第二显示页面,并获取第二显示页面的第二文本信息以及第二图像;根据第一文本信息和第二文本信息得到文档在内容完整性上的第一评估结果;根据第一图像和第二图像,得到文档在整体显示效果上的第二评估结果以及在局部显示效果上的第三评估结果;从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果。该方案通过多维度对第一应用的文档显示效果进行评估,提高了评估的准确性。
Description
技术领域
本发明涉及信息技术领域,尤其涉及一种文档显示效果的评估方法、装置及计算机可读存储介质。
背景技术
随着互联网应用的发展,许多应用的服务提供商通过一个平台来集合不同应用的功能。比如:邮箱应用除了收发邮件外,还提供文档预览功能。用户无需将文档下载到本地,无需通过本地文档阅读软件即可浏览文档。
为了使平台集成的预览功能的预览效果能够达到专业文档阅读软件的预览效果,需要对平台的预览效果进行评估。现有预览效果的评估方法,一般采用人工检查的方式,效率较低。
故,有必要提供一种文档预览评估方法,提高预览效果评估的效率。
发明内容
本发明实施例提供一种文档显示效果的评估方法、装置及计算机可读存储介质,可以提高文档显示效果的评估方法的效率。
本发明实施例提供了一种文档显示效果的评估方法,其包括:
通过第一应用对文档进行显示,生成第一显示页面,并获取所述第一显示页面的第一文本信息以及第一图像;
通过第二应用对所述文档进行显示,生成第二显示页面,并获取所述第二显示页面的第二文本信息以及第二图像;
对所述第一文本信息和所述第二文本信息中字符匹配进行评估,得到所述文档在内容完整性上的第一评估结果;
对所述第一图像和所述第二图像的整体相似度进行评估,得到所述文档在整体显示效果上的第二评估结果,以及对第一图像和所述第二图像的局部相似度进行评估,得到所述文档在局部显示效果上的第三评估结果;
从所述第一评估结果、所述第二评估结果以及所述第三评估结果中确定目标评价结果,并输出所述目标评价结果,其中所述目标评价结果用于评估所述第一应用进行文档显示的显示效果。
本发明实施例还提供了一种文档显示效果的评估装置,其包括:
第一获取模块,用于通过第一应用对文档进行显示,生成第一显示页面,并获取所述第一显示页面的第一文本信息以及第一图像;
第二获取模块,用于通过第二应用对所述文档进行显示,生成第二显示页面,并获取所述第二显示页面的第二文本信息以及第二图像;
第一评估模块,用于对所述第一文本信息和所述第二文本信息中字符匹配进行评估,得到所述文档在内容完整性上的第一评估结果;
第二评估模块,用于对所述第一图像和所述第二图像的整体相似度进行评估,得到所述文档在整体显示效果上的第二评估结果,以及对第一图像和所述第二图像的局部相似度进行评估,得到所述文档在局部显示效果上的第三评估结果;
输出模块,用于从所述第一评估结果、所述第二评估结果以及所述第三评估结果中确定目标评价结果,并输出所述目标评价结果,其中所述目标评价结果用于评估所述第一应用进行文档显示的显示效果。
在一实施例中,所述输出模块还包括:
权重获取子模块,用于获取所述第一评估结果对应的第一权重,所述第二评估结果对应的第二权重,以及所述第三评估结果对应的第三权重;
相加子模块,用于将所述第一评估结果和所述第一权重的乘积、所述第二评估结果和所述第二权重的乘积、所述第三评估结果和所述第三权重的乘积相加,得到所述目标评价结果。
在一实施例中,所述文档显示效果的评估装置还包括:
结果获取模块,用于获取多个训练文档的打分结果;
生成模块,用于根据所述打分结果,生成所述第一权重、所述第二权重和所述第三权重。
所述第一获取模块包括:
第一获取子模块,用于获取所述第一显示页面的首页图像;
第一确定子模块,用于确定所述首页图像中相同文档内容是否具有不同的显示效果;
第一划分子模块,用于在所述首页图像中相同文档内容具有不同的显示效果时,根据所述不同的显示效果对所述首页图像进行划分,得到至少两个所述第一图像;
设置子模块,用于在所述首页图像中相同文档内容不具有不同的显示效果时,将所述首页图像设置为所述第一图像。
在一实施例中,所述第一获取模块包括:
第二获取子模块,用于获取通过所述第一应用对文档进行显示,生成所述第一显示页面的时长;
第一停止子模块,用于在通过所述第一应用对文档进行显示,生成所述第一显示页面的时长大于预设时长时,停止获取所述第一显示页面的第一文本信息以及第一图像。
在一实施例中,文档显示效果的评估装置还包括:
时长获取模块,用于通过预设接口,获取通过所述第一应用对文档进行显示,生成所述第一显示页面的预测时长;
停止显示模块,用于在所述预测时长大于预设时长时,停止通过所述第一应用对所述文档进行显示。
在一实施例中,所述第一获取模块还包括:
第二确定子模块,用于确定所述第一显示页面是否存在显示异常;
第二停止子模块,用于在所述第一显示页面存在显示异常时,停止获取所述第一显示页面的第一文本信息以及第一图像。
在一实施例中,所述第二评估模块包括:
调整子模块,用于将所述第一图像和第二图像调整至相同尺寸大小的图像,得到经过尺寸调整的第一图像和经过尺寸调整的第二图像;
第二划分子模块,用于采用相同划分方式分别对所述经过尺寸调整的第一图像和所述经过尺寸调整的第二图像进行划分,使所述第一图像划分为至少两个第一局部图像,并使所述第二图像划分为至少两个第二局部图像;
扩大子模块,用于扩大所述第二局部图像的尺寸,使所述第二局部图像包含部分邻近的第二局部图像;
第一评估子模块,用于基于所述第一局部图像和所述第二局部图像,得到所述文档在局部显示效果上的第三评估结果。
在一实施例中,所述第一评估子模块还用于:
依次获取每一个第二局部图像与对应的第一局部图像之间的直方图相似度和特征相似度;
对全部直方图相似度和全部特征相似度进行加权求和,得到所述第三评估结果。
在一实施例中,所述第二评估模块包括:
第三获取子模块,用于获取所述第一图像和所述第二图像的直方图相似得分和特征相似得分;
第二评估子模块,用于根据所述直方图相似得分和所述特征相似得分,得到所述文档在整体显示效果上的评估结果。
在一实施例中,所述第二评估子模块还用于:
对所述直方图相似得分和所述特征相似得分分别进行归一化处理;
对经归一化处理后的直方图相似得分以及经归一化处理后的特征相似得分进行加权求和,得到所述第二评估结果。
在一实施例中,所述第一评估模块包括:
第四获取子模块,用于获取所述第二文本信息中的字符总数,以及所述第一文本信息和所述第二文本信息中不匹配的字符的数目;
第三评估子模块,用于根据所述字符总数和所述不匹配的字符的数目,得到所述文档在所述内容完整性上的评估结果。
在一实施例中,所述文档显示效果的评估装置还包括:
格式获取模块,用于获取所述文档的格式类型;
分类模块,用于根据所述格式类型,对所述第一文本信息以及所述第一图像进行分类保存。
本发明实施例提供了一种服务器,其包括处理器和存储器,所述存储器存储有多条指令,所述指令适于处理器进行加载,以执行上述文档显示效果的评估方法中的步骤。
进一步的,本发明实施例还提供了一种计算机可读存储介质,其内存储有处理器可执行指令,该处理器通过执行所述指令提供如上任一的文档显示效果的评估方法。
本发明实施例的文档显示效果的评估方法、装置、服务器及计算机可读存储介质,通过第一应用对文档进行显示,生成第一显示页面,并获取第一显示页面的第一文本信息以及第一图像;通过第二应用对文档进行显示,生成第二显示页面,并获取第二显示页面的第二文本信息以及第二图像;对第一文本信息和第二文本信息中字符匹配进行评估,得到文档在内容完整性上的第一评估结果;对第一图像和第二图像的整体相似度进行评估,得到文档在整体显示效果上的第二评估结果,以及对第一图像和第二图像的局部相似度进行评估,得到文档在局部显示效果上的第三评估结果;从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果,其中目标评价结果用于评估第一应用进行文档显示的显示效果。
附图说明
下面结合附图,通过对本发明的具体实施方式详细描述,将使本发明的技术方案及其它有益效果显而易见。
图1为本发明实施例提供的文档显示效果的评估系统的场景示意图。
图2为本发明实施例提供的文档显示效果的评估方法的第一流程示意图。
图3为本发明实施例提供的文档显示效果的评估方法的第一场景示意图。
图4为本发明实施例提供的文档显示效果的评估方法的第二场景示意图。
图5为本发明实施例提供的文档显示效果的评估方法的第二流程示意图。
图6为本发明实施例提供的文档显示效果的评估方法的第三场景示意图。
图7为本发明实施例提供的文档显示效果的评估方法的第四场景示意图。
图8为本发明实施例提供的文档显示效果的评估装置的结构示意图。
图9为本发明实施例提供的第一获取模块的结构示意图。
图10为本发明实施例提供的第一评估模块的结构示意图。
图11为本发明实施例提供的第二评估模块的结构示意图。
图12为本发明实施例提供的输出模块的结构示意图。
图13为本发明实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种文档显示效果的评估系统、方法、装置及计算机可读存储介质,以下将分别进行详细说明。
请参见图1,图1为本发明实施例提供的文档显示效果的评估系统的场景示意图。该系统包括第一服务器、第二服务器以及第三服务器。其中,第一服务器、第二服务器以及第三服务器包括本地服务器和/或远程服务器等。第一应用在第一服务器中运行,第二应用在第二服务器中运行。
首先第三服务器将文档发送给第一服务器。第一服务器中的第一应用对该文档的内容进行解码后,对该文档进行显示,生成第一显示页面。然后第三服务器可以对该第一显示页面进行截图,以获取该第一显示页面的第一图像。第三服务器还可以将第一显示页面中的全部字符提取出来,得到该第一显示页面的第一文本信息。
接着第三服务器将该文档发送给第二服务器。同理的,第二服务器中的第二应用也对该文档的内容进行解码,并对该文档进行显示,生成第二显示页面。然后第三服务器也可以对该第二显示页面进行截图,以获取该第二显示页面的第二图像。第三服务器还可以将第二显示页面中的全部字符提取出来,得到该第二显示页面的第二文本信息。
然后,第三服务器评估第一文本信息中字符与第二文本信息中字符的匹配情况,得到该文档在内容完整性上的第一评估结果。其中,第一文本信息中字符与第二文本信息中字符的匹配率越高,说明该文档在第一应用中显示的内容越完整。
第三服务器还对第一图像和第二图像的整体相似度进行评估,得到文档在整体显示效果上的第二评估结果。其中,第一图像和第二图像的整体相似度越高,该文档在第一应用中显示的整体显示效果越好。
进一步的,第三服务器还对第一图像和第二图像的局部相似度进行评估,得到文档在局部显示效果上的第三评估结果。其中,第一图像和第二图像的局部相似度越高,该文档在第一应用中显示的局部显示效果越好。
第三服务器从上述第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,比如可以将上述三种评估结果进行综合考虑,以确定目标评价结果,也可以根据实际情况择其一或其二确定目标评价结果。最后,第三服务器将该目标评价结果进行输出。
在本发明实施例中,将从文档显示效果的评估装置的角度进行描述,该文档显示效果的评估装置具体可以集成在服务器中。
一种文档显示效果的评估方法,包括:通过第一应用对文档进行显示,生成第一显示页面,并获取第一显示页面的第一文本信息以及第一图像;通过第二应用对文档进行显示,生成第二显示页面,并获取第二显示页面的第二文本信息以及第二图像;对第一文本信息和第二文本信息中字符匹配进行评估,得到文档在内容完整性上的第一评估结果;对第一图像和第二图像的整体相似度进行评估,得到文档在整体显示效果上的第二评估结果,以及对第一图像和第二图像的局部相似度进行评估,得到文档在局部显示效果上的第三评估结果;从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果,其中目标评价结果用于评估第一应用进行文档显示的显示效果。
请参照图2,图2为本发明实施例提供的文档显示效果的评估方法的流程图,该方法可以包括:
步骤S101,通过第一应用对文档进行显示,生成第一显示页面,并获取第一显示页面的第一文本信息以及第一图像。
在一实施例中,文档显示效果的评估装置可以集成在该第一应用中。第一应用首先通过解析器读入文档,并对文档进行解码,然后将解码的文档以页面的形式展示给用户。其中,不同的解析器解码方式不同,同一个文档经不同解析器解码后,其显示效果不同。
具体的,如图3所示,可以将报名回执表.doc文档发送给第一应用,通过第一应用打开该报名回执表.doc文档,生成第一显示页面M1。在一实施例中,如图3所示,可以仅仅截图第一显示页面M1中与报名回执表.doc文档相关的内容,即去除第一应用自身的边框、工具栏等页面内容的干扰。在一实施例中,还可以将整个第一显示页面M1进行截图,生成第一截图,然后对该第一截图进行预处理,将第一显示页面M1中与报名回执表.doc文档无关的内容去除后,得到第一图像。
在一实施例中,在通过第一应用对文档进行显示,生成第一显示页面的过程中,可以记录生成第一显示页面的时长,如果生成第一显示页面的时长大于预设时长,则说明第一应用进行文档显示的时间过长,其显示性能较差,因此可以停止对该文档进行显示,并对该文档进行标记,以作为衡量第一应用文档显示的性能的评价标准之一。其中,预设时长可以为3-5秒等用户可接受的最长等待时长,在此不作具体限定。具体的标记方式可以将该文档的显示效果打分设置为0。
在一实施例中,在通过第一应用对文档进行显示,生成第一显示页面后,可以对第一显示页面是否存在显示异常进行判断。其中,显示异常包括:当通过第一应用对文档进行显示时,运行第一应用的服务器需要维护或者过载,造成该服务器不能对该文档进行显示,此时会返回“HTTP Error 503”的显示异常。显示异常还包括:当第一应用为浏览器时,通过在浏览器中输入文档对应的地址后,浏览器根据该地址判断是否有文档信息,如果没有文档信息,则说明输入的地址无效,因此会返回“404not found”的显示异常。为了防止上述显示异常情况对本实施例中的评估方法的干扰,可以在确定第一显示页面存在显示异常时,停止获取第一显示页面的第一文本信息以及第一图像。
在一实施例中,可以将上述生成第一显示页面的时长以及显示异常信息进行输出,以便于后续对第一应用的文档显示效果进行分析,以及提出改进建议。
以上是通过第一应用对单个文档进行显示,生成第一显示页面,并获取第一显示页面的第一文本信息以及第一图像的过程。为了提高本实施例的评估方法的准确性,可以依次对多个文档进行上述操作,在此不再赘述。每个文档获取到第一文本信息和第一图像后,可以根据该文档的文档名来命名对应的第一文本信息和第一图像。
进一步的,可以先获取文档的格式类型,比如txt、doc、docx以及wps等格式,然后根据该格式类型,对对应的第一文本信息以及第一图像进行分类保存。这样便于后续评估第一应用对不同格式类型的文档是否具有不同的显示效果。如果只是对某种格式类型的文档的显示效果较差,则可以只对该格式类型的文档的显示进行调整,以减少后续文档显示调整的工作量。
步骤S102,通过第二应用对文档进行显示,生成第二显示页面,并获取第二显示页面的第二文本信息以及第二图像。
其中,第二应用可以为专业的文档显示应用。因此,通过第二应用获取到的第二文本信息可以作为对第一文本信息进行评估的标准文本信息,第二图像可以作为对第一图像进行评估的标准图像。
具体的,如图4所示,可以将报名回执表.doc文档发送给第二应用,通过第二应用打开该报名回执表.doc文档,生成第二显示页面M2。在一实施例中,如图4所示,可以仅仅截图第二显示页面M2中与报名回执表.doc文档相关的内容,即去除第二应用自身的菜单、工具栏等页面内容的干扰。在一实施例中,还可以将整个第二显示页面M2进行截图,生成第二截图,然后对该第二截图进行预处理,将第二显示页面M2中与报名回执表.doc文档无关的内容去除后,得到第二图像。
步骤S103,对第一文本信息和第二文本信息中字符匹配进行评估,得到文档在内容完整性上的第一评估结果。
具体的,可以将第一图像中的字符全部提取出来,然后按照顺序进行排列保存,生成第一文本信息。同理的,可以将第二图像中的字符全部提取出来,然后按照顺序进行排列保存,生成第二文本信息。一般来说,如果第一文本信息和第二文本信息中字符匹配的数量越多,说明文档在第一应用中显示的内容完整性越高。
在一实施例中,在对第一文本信息和第二文本信息中字符匹配进行评估时,可以仅仅考虑第一文本信息和第二文本信息中是否具有相同的字符,而不考虑该字符的排序。举例来说,可以分别对第一文本信息和第二文本信息中的全部字符进行分类统计,结合图3所示的第一图像N1和图4所示的第二图像N2可知,第一文本信息中有一个“附”字符,两个“箱”字符,第二文本信息中有一个“附”字符,一个“箱”字符。由于,第一文本信息和第二文本信息中“附”字符的数量相同,因此可以认为二者在“附”字符上匹配,而“箱”字符的数量不同,可以认为二者在“箱”字符上不匹配。
在一实施例中,在对第一文本信息和第二文本信息中字符匹配进行评估时,不仅考虑第一文本信息和第二文本信息中是否具有相同的字符,还考虑该字符的排序。举例来说,如果“附”字符在第一文本信息中排在首位,第二文本信息中虽然也有“附”字符,但是“附”字符排在非首位,则也认为二者中的“附”字符不匹配。
步骤S104,对第一图像和第二图像的整体相似度进行评估,得到文档在整体显示效果上的第二评估结果,以及对第一图像和第二图像的局部相似度进行评估,得到文档在局部显示效果上的第三评估结果。
其中,对第一图像和第二图像的整体相似度进行评估,可以采用颜色分布法、内容特征法等方法。
其中颜色分布法可以采用直方图相似算法。图像中任何一种颜色都可以由红绿蓝三原色构成,每个图像都可以生成其对应的颜色分布直方图,如果第一图像和第二图像的直方图很接近,则可以认为第一图像和第二图像的整体相似度较高,如果第一图像和第二图像的直方图相差较远,则可以认为第一图像和第二图像的整体相似度较低。
内容特征法可以将第一图像和第二图像转换成较小的灰度图,再转换成黑白图片。然后比较第一图像和第二图像的黑白轮廓。如果第一图像和第二图像的黑白轮廓很接近,则可以认为第一图像和第二图像的整体相似度较高,如果第一图像和第二图像的黑白轮廓相差较远,则可以认为第一图像和第二图像的整体相似度较低。
步骤S105,从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果,其中目标评价结果用于评估第一应用进行文档显示的显示效果。
其中,可以根据实际情况择其一或其二确定目标评价结果。进一步的,也可以对上述第一评估结果、第二评估结果以及第三评估结果进行综合考量,以确定目标评价结果。
本发明实施例提供的文档显示效果的评估方法,通过第一应用对文档进行显示,获取到第一文本信息以及第一图像,并通过第二应用对文档进行显示,获取到第二文本信息以及第二图像。再根据第一文本信息和第二文本信息得到文档在内容完整性上的第一评估结果,根据第一图像和第二图像得到文档在整体显示效果上的第二评估结果,以及文档在局部显示效果上的第三评估结果。最后从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果。该方案通过多维度对第一应用的文档显示效果进行评估,提高了评估的准确性。
根据上述实施例描述的文档显示效果的评估方法,以下将举例作进一步说明。在本发明实施例中,将从文档显示效果的评估装置的角度进行描述,该文档显示效果的评估装置具体可以集成在服务器中。
请参照图5,图5为本发明实施例提供的文档显示效果的评估方法的另一流程图,该方法可以包括:
步骤S201,通过预设接口,获取第一应用对文档进行显示,生成第一显示页面的预测时长。
其中,该预设接口为performance接口。该接口封装了页面的性能信息,包括生成页面的时长信息。通过调用该接口,可以直接获取到第一应用对文档进行显示,生成该第一显示页面的预测时长。
在一实施例中,可以在通过第一应用对文档进行显示的过程中,调用该performance接口,获取该预测时长。如果获取到的预测时长大于预设时长,说明第一应用进行文档显示的时间过长,其显示性能较差,因此可以停止等待通过第一应用生成第一显示页面。进一步的,还可以对该文档进行标记,以作为衡量第一应用文档显示的性能的评价标准之一。其中,预设时长可以为3-5秒等用户可接受的最长等待时长,在此不作具体限定。具体的标记方式可以将该文档的显示效果打分设置为0。
在一实施例中,为了提高工作效率,以及节省系统资源,还可以在通过第一应用对文档进行显示之前,先通过performance获取预测时长。
步骤S202,判断预测时长是否大于预设时长。
判断预测时长是否大于预设时长,如果大于预设时长,则转入步骤S203;如果不大于预设时长,则转入步骤S204。
步骤S203,当预测时长大于预设时长时,停止通过第一应用对文档进行显示。
同理的,如果预测时长大于预设时长,说明第一应用进行文档显示的时间过长,其显示性能较差。因此,可以停止通过该第一应用对文档进行显示。并可以对该文档进行标记。具体的标记方式可以将该文档的显示效果打分设置为0。
步骤S204,当预测时长不大于预设时长时,通过第一应用对文档进行显示,生成第一显示页面,并获取第一显示页面的第一文本信息以及第一图像。
在一实施例中,文档显示效果的评估装置可以集成在该第一应用中。第一应用首先通过解析器读入文档,并对文档进行解码,然后将解码的文档以页面的形式展示给用户。其中,不同的解析器解码方式不同,同一个文档经不同解析器解码后,其显示效果不同。
在本实施例中,如果第一应用采用了多个解析器对文档进行解码,则对同一文档中相同文档内容进行解析时,将在第一显示页面中将呈现具有不同显示效果的文档内容。如图6所示,文档A中包括一表格,该表格中的表头包括“系列1”、“系列2”和“test3”三个项目,每个单元格中是一些数字。第一应用中采用两个解析器对该表格内容进行解码后,一个解析器使用饼图格式对该表格进行解码,一个解析器使用表格格式对该表格进行解码,则生成的第一显示页面B中包括饼图显示效果的文档内容和表格显示效果的文档内容。具体的,不同显示效果的相同文档内容并列排布在第一显示页面中。
在一实施例中,为了对第一应用进行文档显示的显示效果进行全面的评估,当第一显示页面中相同文档内容具有不同的显示效果的时,可以对第一显示页面中不同显示效果的相同文档内容分别进行截图,得到至少两个第一图像。
进一步的,当文档中包含的文档内容较多时,可以只对部分文档内容的显示效果进行分析,以减少本实施例的评估方法的工作量。具体步骤如下:
(A1)获取第一显示页面的首页图像。
(B1)确定首页图像中相同文档内容是否具有不同的显示效果。
(C1)当首页图像中相同文档内容具有不同的显示效果时,根据不同的显示效果对首页图像进行划分,得到至少两个第一图像。
(D1)当首页图像中相同文档内容不具有不同的显示效果时,将首页图像设置为第一图像。
需要说明的是,还可以获取第一显示页面的末页图像,具体可以根据文档实质内容进行选择。具体的,如图6所示,获取到第一显示页面B的首页图像后,可以确定该首页图像中与“多种坐标系格式的图表”相关的内容具有饼图以及表格图两种显示效果,因此可以划分成两个第一图像。
以上是通过第一应用对单个文档进行显示,生成第一显示页面,并获取第一显示页面的第一文本信息以及第一图像的过程。为了提高本实施例的评估方法的准确性,可以依次对多个文档进行上述操作,在此不再赘述。每个文档获取到第一文本信息和第一图像后,可以根据该文档的文档名来命名对应的第一文本信息和第一图像。
进一步的,可以先获取文档的格式类型,比如txt、doc、docx以及wps等格式,然后根据该格式类型,对对应的第一文本信息以及第一图像进行分类保存。这样便于后续评估第一应用对不同格式类型的文档是否具有不同的显示效果。如果只是对某种格式类型的文档的显示效果较差,则可以只对该格式类型的文档的显示进行调整,以减少后续文档显示调整的工作量。
步骤S205,通过第二应用对文档进行显示,生成第二显示页面,并获取第二显示页面的第二文本信息以及第二图像。
其中,第二应用可以为专业的文档显示应用。因此,通过第二应用获取到的第二文本信息可以作为对第一文本信息进行评估的标准文本信息,第二图像可以作为对第一图像进行评估的标准图像。
具体的,如图4所示,可以将报名回执表.doc文档发送给第二应用,通过第二应用打开该报名回执表.doc文档,生成第二显示页面M2。在一实施例中,如图4所示,可以仅仅截图第二显示页面M2中与报名回执表.doc文档相关的内容,即去除第二应用自身的菜单、工具栏等页面内容的干扰。在一实施例中,还可以将整个第二显示页面M2进行截图,生成第二截图,然后对该第二截图进行预处理,将第二显示页面M2中与报名回执表.doc文档无关的内容去除后,得到第二图像。
步骤S206,对第一文本信息和第二文本信息中字符匹配进行评估,得到文档在内容完整性上的第一评估结果。
一般来说,如果第一文本信息和第二文本信息中字符匹配的数量越多,说明文档在第一应用中显示的内容完整性越高。
以下详细介绍对第一文本信息和第二文本信息中字符匹配进行评估,得到文档在内容完整性上的第一评估结果的具体步骤:
(A2)获取第二文本信息中的字符总数,以及第一文本信息和第二文本信息中不匹配的字符的数目。
(B2)根据字符总数和不匹配的字符的数目,得到文档在内容完整性上的评估结果。
具体的,可以将第一图像中的字符全部提取出来,然后按照顺序进行排列保存,生成第一文本信息。同理的,可以将第二图像中的字符全部提取出来,然后按照顺序进行排列保存,生成第二文本信息。一般来说,如果第一文本信息和第二文本信息中字符匹配的数量越多,说明文档在第一应用中显示的内容完整性越高。
在一实施例中,在对第一文本信息和第二文本信息中字符匹配进行评估时,可以仅仅考虑第一文本信息和第二文本信息中是否具有相同的字符,而不考虑该字符的排序。举例来说,可以分别对第一文本信息和第二文本信息中的全部字符进行分类统计,结合图3所示的第一图像N1和图4所示的第二图像N2可知,第一文本信息中有一个“附”字符,两个“箱”字符,第二文本信息中有一个“附”字符,一个“箱”字符。由于,第一文本信息和第二文本信息中“附”字符的数量相同,因此可以认为二者在“附”字符上匹配,而“箱”字符的数量不同,可以认为二者在“箱”字符上不匹配。
在一实施例中,在对第一文本信息和第二文本信息中字符匹配进行评估时,不仅考虑第一文本信息和第二文本信息中是否具有相同的字符,还考虑该字符的排序。举例来说,如果“附”字符在第一文本信息中排在首位,第二文本信息中虽然也有“附”字符,但是“附”字符排在非首位,则也认为二者中的“附”字符不匹配。
假设第一文本信息和第二文本信息中不匹配的字符的数目为Count1,第二文本信息中的字符总数为count2。可以根据Count1和count2计算文档在内容完整性上的第一得分S1,具体计算公式如下:
当count2的值为0时,S1=100×(1-min(Count1,1))。
综上,可以将文档在内容完整性上的第一得分S1作为该文档在内容完整性上的第一评估结果。
需要说明的是,可以根据第一得分对文档、第一图像以及第一文本信息进行重命名,即可以在文档名称、第一图像名称以及第一文本信息名称里新增文档在内容完整性上的第一得分。
步骤S207,对第一图像和第二图像的整体相似度进行评估,得到文档在整体显示效果上的第二评估结果,以及对第一图像和第二图像的局部相似度进行评估,得到文档在局部显示效果上的第三评估结果。
以下根据第一图像和第二图像的直方图相似性和特征相似性,来对文档的整体显示效果进行评估,具体步骤如下:
(A3)获取第一图像和第二图像的直方图相似得分和特征相似得分;
(B3)根据直方图相似得分和特征相似得分,得到文档在整体显示效果上的评估结果。
在一实施例中,获取第一图像和第二图像的直方图相似得分的步骤如下:首先对第一图像和第二图像的像素数据进行采集,然后生成特定的直方图数据,再运用巴氏系数算法,计算出第一图像和第二图像之间的相似程度,即第一图像和第二图像的直方相似得分S直方图。其中,可以对S直方图进行归一化处理,使其取值范围在[0,1]之间,需要说明的是,S直方图取值越接近0,则表示第一图像和第二图像相似度越低,如果S直方图越接近1,则表示第一图像和第二图像相似度越高。
在一实施例中,获取第一图像和第二图像的特征相似得分S特征的步骤如下:
首先可以采用SIFT(Scale Invariant Feature Transform,尺度不变特征转换)算法或SURF(Speeded Up Robust Features,加速稳健特征)算法分别查找出第一图像中的第一特征点,以及第二图像中的第二特征点。具体的,可以首先通过sift=cv2.xfeatures2d.SIFT_create()初始化SIFT检测器对象,再通过KP1,des1=sift.detectAndCompute(queryImage,None)查找并计算出第一图像的特征点,其中KP1表示第一图像中生成的特征点,queryImage表示第一图像。接着通过KP2,des2=sift.detectAndCompute(trainingImage,None)查找并计算出第二图像的特征点,其中KP2表示第二图像中生成的特征点,trainingImage表示第二图像。最后,统计第一图像中特征点的个数kp1,以及第二图像中特征点的个数kp2,根据如下公式不仅可以计算出第一图像和第二图像的特征相似得分S特征,还可以对S特征进行归一化处理:
当kp1的个数等于0时,S特征=100×(1-min(kp2,1))。
综上,可以对上述经归一化处理后的直方相似得分S直方图和特征相似得分S特征进行加权求和,得到第二评估结果。具体的,可以采用如下公式,计算出第一图像和第二图像在整体显示效果上的第二得分S2。
S2=a1×S直方图+b1×S特征
其中a1,a2为参数,a1+b1=1,且a1,b1∈[0,1]。
需要说明的是,可以根据第二得分对文档、第一图像以及第一文本信息进行重命名,即可以在文档名称、第一图像名称以及第一文本信息名称里新增文档在整体显示效果上的第二得分。
以下详细介绍对第一图像和第二图像的局部相似度进行评估,得到文档在局部显示效果上的第三评估结果的具体步骤,包括:
(A4)将第一图像和第二图像调整至相同尺寸大小的图像,得到经过尺寸调整的第一图像和经过尺寸调整的第二图像。
(B4)采用相同划分方式分别对经过尺寸调整的第一图像和经过尺寸调整的第二图像进行划分,使第一图像划分为至少两个第一局部图像,并使第二图像划分为至少两个第二局部图像。
(C4)扩大第二局部图像的尺寸,使第二局部图像包含部分邻近的第二局部图像。
(D4)基于第一局部图像和第二局部图像,得到文档在局部显示效果上的第三评估结果。
预先将第一图像和第二图像的尺寸进行缩小或放大,使第一图像和第二图像具有相同尺寸。假设将图3中的第一图像N1以及图4中的第二图像N2调整至相同尺寸,得到经过尺寸调整的第一图像N1’和经过尺寸调整的第二图像N2’。然后如图7所示,按照预设尺寸X1*Y1将第一图像N1’划分成9个第一局部图像N11,同样按照预设尺寸X1*Y1将第二图像N2’划分成9个第一局部图像N21。接着,扩大第一局部图像N21的尺寸,使其包含部分邻近的第一局部图像N21。如图7中第一行第一列的第一局部图像N21宽度扩大X2,高度扩大Y2,则第一行第一列的第一局部图像N21包含了部分其邻近的第一行第二列的第一局部图像N21、第二行第一列的第一局部图像N21以及第二行第二列的第一局部图像N21。同理的,由于位于第二行第二列的第一局部图像N21与剩下的8个第一局部图像N21都相邻,因此第二行第二列的第一局部图像N21左右两侧都扩大了X2,上下侧都扩大了Y2。
接下来,可以依次计算每个第一局部图像和对应的第二局部图像之间的直方图相似度P直方图以及特征相似度P特征相似度,然后对全部直方图相似度P直方图以及特征相似度P特征相似度进行加权求和,得到第三评估结果。具体的,可以采用如下公式计算整个第一图像和第二图像在局部显示效果上的第三得分S3。
其中,i表示第一局部图像的个数,m为正整数,a2i+b2i=1,且a2i,b2i∈[0,1]。综上,可以将第三得分S3作为文档在局部显示效果上的第三评估结果。
需要说明的是,可以根据第三得分对文档、第一图像以及第一文本信息进行重命名,即可以在文档名称、第一图像名称以及第一文本信息名称里新增文档在局部显示效果上的第三得分。
步骤S208,从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果,其中目标评价结果用于评估第一应用进行文档显示的显示效果。
其中,可以根据实际情况择其一或其二确定目标评价结果。进一步的,也可以对上述第一评估结果、第二评估结果以及第三评估结果进行综合考量,以确定目标评价结果。
具体的,以下详细介绍从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果的具体步骤,该步骤包括:
(A5)获取所述第一评估结果对应的第一权重,所述第二评估结果对应的第二权重,以及所述第三评估结果对应的第三权重。
(B5)将所述第一评估结果和所述第一权重的乘积、所述第二评估结果和所述第二权重的乘积、所述第三评估结果和所述第三权重的乘积相加,得到所述目标评价结果。
具体的,在获取到上述第一得分S1,第二得分S2以及第三得分S3后,可以根据如下公式计算出目标得分S。
S=aS1+bS2+cS3
其中,a为第一权重,b为第二权重,c为第三权重,a+b+c=1,且a,b,c∈[0,1]。其中,a,b以及c通过对大量的训练文档进行打分,根据打分结果生成。
以下详细介绍获取第一权重、第二权重以及第三权重的详细步骤,具体包括:
(A6)获取多个训练文档的打分结果。
(B6)根据所述打分结果,生成所述第一权重、所述第二权重和所述第三权重。
具体的,可以对K×3个训练文档进行人工打分,然后每三个人工打分结果作为一组打分结果,生成K组打分结果ai=[ai1,ai2,ai3],其中,K≥i≥1,i为正整数,K为正整数。该K组打分结果组成打分结果矩阵根据上述打分结果矩阵A,对第一列的打分结果进行累加求平均值,可以计算出第一权重同理的,对第二列的打分结果进行累加求平均值,可以计算出第二权重对第三列的打分结果进行累加求平均值,可以计算出第三权重
在一实施例中,还可以根据需求和经验对上述第一权重、第二权重以及第三权重进行调整。举例来说,如果第一应用进行文档显示时,文档内容的完整性已经可以得到足够的保证,则可以降低第一权重的值。
在一实施例中,可以将文档的第一得分、第二得分、第三得分以及目标得分全部输出,然后对每一项得分进行分析统计,得到文档在不同维度上的得分差异。
在一实施例中,还可以挑选出第一得分、第二得分以及第三得分相差较大的目标文档,单独输出该目标文档的目标评价结果,并对该目标文档进行单独分析,以查找第一应用对该目标文档进行显示的效果较差的原因。
需要说明的是,可以根据目标得分对文档、第一图像以及第一文本信息进行重命名,即可以在文档名称、第一图像名称以及第一文本信息名称里新增文档目标得分。
本发明实施例提供的文档显示效果的评估方法,对第一文本信息和第二文本信息中字符匹配进行评估,得到文档在内容完整性上的第一评估结果,并使用直方图相似法和特征相似法对第一图像和第二图像的整体相似度进行评价,得到文档在整体显示效果上的第二评估结果,以及通过对第一图像和第二图像进行分割,得到文档在局部显示效果上的第三评估结果。最后再从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果。该方案通过多维度对第一应用的文档显示效果进行评估,提高了评估的准确性。
根据上述实施例所描述的方法,本实施例将从文档显示效果的评估装置的角度进一步进行描述,该文档显示效果的评估装置可以集成在服务器中。
请参照图8,图8为本发明实施例提供的文档显示效果的评估装置的结构图,该文档显示效果的评估装置30包括第一获取模块301、第二获取模块302、第一评估模块303、第二评估模块304以及输出模块305。
(1)第一获取模块301
第一获取模块301用于通过第一应用对文档进行显示,生成第一显示页面,并获取第一显示页面的第一文本信息以及第一图像。
在一实施例中,文档显示效果的评估装置30可以集成在该第一应用中。第一应用首先通过解析器读入文档,并对文档进行解码,然后将解码的文档以页面的形式展示给用户。其中,不同的解析器解码方式不同,同一个文档经不同解析器解码后,其显示效果不同。
具体的,如图3所示,第一获取模块301可以将报名回执表.doc文档发送给第一应用,通过第一应用打开该报名回执表.doc文档,生成第一显示页面M1。在一实施例中,如图3所示,第一获取模块301可以仅仅截图第一显示页面M1中与报名回执表.doc文档相关的内容,即去除第一应用自身的边框、工具栏等页面内容的干扰。在一实施例中,第一获取模块301还可以将整个第一显示页面M1进行截图,生成第一截图,然后对该第一截图进行预处理,将第一显示页面M1中与报名回执表.doc文档无关的内容去除后,得到第一图像。
在一实施例中,如图9所示,第一获取模块301包括:第一获取子模块3011、第一确定子模块3012、第一划分子模块3013以及设置子模块3014。
其中,第一获取子模块3011用于获取第一显示页面的首页图像;第一确定子模块3012用于确定首页图像中相同文档内容是否具有不同的显示效果;第一划分子模块3013用于在首页图像中相同文档内容具有不同的显示效果时,根据不同的显示效果对首页图像进行划分,得到至少两个第一图像;设置子模块3014用于在首页图像中相同文档内容不具有不同的显示效果时,将首页图像设置为第一图像。
需要说明的是,还可以获取第一显示页面的末页图像,具体可以根据文档实质内容进行选择。具体的,如图6所示,第一获取子模块3011获取到第一显示页面B的首页图像后,第一确定子模块3012可以确定该首页图像中与“多种坐标系格式的图表”相关的内容具有饼图以及表格图两种显示效果,因此第一划分子模块3013可以将该首页图像划分成两个第一图像。
在一实施例中,第一获取模块301包括:第二获取子模块3015和第一停止子模块3016。
其中,第二获取子模块3015,用于获取通过第一应用对文档进行显示,生成第一显示页面的时长;第一停止子模块3016,用于在通过第一应用对文档进行显示,生成第一显示页面的时长大于预设时长时,停止获取第一显示页面的第一文本信息以及第一图像。
如果生成第一显示页面的时长大于预设时长,则说明第一应用进行文档显示的时间过长,其显示性能较差,因此可以通过第一停止子模块3016停止对该文档进行显示,并对该文档进行标记,以作为衡量第一应用文档显示的性能的评价标准之一。其中,预设时长可以为3-5秒等用户可接受的最长等待时长,在此不作具体限定。具体的标记方式可以将该文档的显示效果打分设置为0。
在一实施例中,第一获取模块301还包括:第二确定子模块3017和第二停止子模块3018。
其中,第二确定子模块3017用于确定第一显示页面是否存在显示异常;第二停止子模块3018用于在第一显示页面存在显示异常时,停止获取第一显示页面的第一文本信息以及第一图像。
显示异常包括:当通过第一应用对文档进行显示时,运行第一应用的服务器需要维护或者过载,造成该服务器不能对该文档进行显示,此时会返回“HTTP Error 503”的显示异常。显示异常还包括:当第一应用为浏览器时,通过在浏览器中输入文档对应的地址后,浏览器根据该地址判断是否有文档信息,如果没有文档信息,则说明输入的地址无效,因此会返回“404not found”的显示异常。为了防止上述显示异常情况对本实施例中的评估方法的干扰,可以在第二确定子模块3017确定第一显示页面存在显示异常时,第二停止子模块3018停止获取第一显示页面的第一文本信息以及第一图像。
在一实施例中,可以将上述生成第一显示页面的时长以及显示异常信息进行输出,以便于后续对第一应用的文档显示效果进行分析,以及提出改进建议。
在一实施例中,文档显示效果的评估装置30还包括:时长获取模块306和停止显示模块307。
其中,时长获取模块306用于通过预设接口,获取通过第一应用对文档进行显示,生成第一显示页面的预测时长;停止显示模块307用于在预测时长大于预设时长时,停止通过第一应用对文档进行显示。
其中,该预设接口为performance接口。该接口封装了页面的性能信息,包括生成页面的时长信息。时长获取模块306通过调用该接口,可以直接获取到第一应用对文档进行显示,生成该第一显示页面的预测时长。
在一实施例中,时长获取模块306可以在通过第一应用对文档进行显示的过程中,调用该performance接口,获取该预测时长。如果时长获取模块306获取到的预测时长大于预设时长,说明第一应用进行文档显示的时间过长,其显示性能较差,因此可以停止等待通过第一应用生成第一显示页面。进一步的,还可以对该文档进行标记,以作为衡量第一应用文档显示的性能的评价标准之一。其中,预设时长可以为3-5秒等用户可接受的最长等待时长,在此不作具体限定。具体的标记方式可以将该文档的显示效果打分设置为0。
在一实施例中,为了提高工作效率,以及节省系统资源,时长获取模块306还可以在通过第一应用对文档进行显示之前,先通过performance获取预测时长。
同理的,如果预测时长大于预设时长时,说明第一应用进行文档显示的时间过长,其显示性能较差,因此停止显示模块307可以停止对该文档进行显示,并对该文档进行标记。具体的标记方式可以将该文档的显示效果打分设置为0。
在一实施例中,文档显示效果的评估装置30还包括:格式获取模块308和分类模块309。
其中,格式获取模块308用于获取文档的格式类型;分类模块309用于根据格式类型,对第一文本信息以及第一图像进行分类保存。这样便于后续评估第一应用对不同格式类型的文档是否具有不同的显示效果。如果只是对某种格式类型的文档的显示效果较差,则可以只对该格式类型的文档的显示进行调整,以减少后续文档显示调整的工作量。
(2)第二获取模块302
第二获取模块302用于通过第二应用对文档进行显示,生成第二显示页面,并获取第二显示页面的第二文本信息以及第二图像。
其中,第二应用可以为专业的文档显示应用。因此,通过第二应用获取到的第二文本信息可以作为对第一文本信息进行评估的标准文本信息,第二图像可以作为对第一图像进行评估的标准图像。
具体的,如图4所示,第二获取模块302可以将报名回执表.doc文档发送给第二应用,通过第二应用打开该报名回执表.doc文档,生成第二显示页面M2。在一实施例中,如图4所示,第二获取模块302可以仅仅截图第二显示页面M2中与报名回执表.doc文档相关的内容,即去除第二应用自身的菜单、工具栏等页面内容的干扰。在一实施例中,第二获取模块302还可以将整个第二显示页面M2进行截图,生成第二截图,然后对该第二截图进行预处理,将第二显示页面M2中与报名回执表.doc文档无关的内容去除后,得到第二图像。
(3)第一评估模块303
第一评估模块303用于对第一文本信息和第二文本信息中字符匹配进行评估,得到文档在内容完整性上的第一评估结果。
在一实施例中,如图10所示,第一评估模块303包括:第四获取子模块3031和第三评估子模块3032。
其中,第四获取子模块3031用于获取第二文本信息中的字符总数,以及第一文本信息和第二文本信息中不匹配的字符的数目;第三评估子模块3032用于根据字符总数和不匹配的字符的数目,得到文档在内容完整性上的评估结果。
具体的,第四获取子模块3031可以将第一图像中的字符全部提取出来,然后按照顺序进行排列保存,生成第一文本信息。同理的,第四获取子模块3031可以将第二图像中的字符全部提取出来,然后按照顺序进行排列保存,生成第二文本信息。一般来说,如果第一文本信息和第二文本信息中字符匹配的数量越多,说明文档在第一应用中显示的内容完整性越高。
在一实施例中,在第三评估子模块3032对第一文本信息和第二文本信息中字符匹配进行评估时,可以仅仅考虑第一文本信息和第二文本信息中是否具有相同的字符,而不考虑该字符的排序。举例来说,第四获取子模块3031可以分别对第一文本信息和第二文本信息中的全部字符进行分类统计,结合图3所示的第一图像N1和图4所示的第二图像N2可知,第一文本信息中有一个“附”字符,两个“箱”字符,第二文本信息中有一个“附”字符,一个“箱”字符。由于,第一文本信息和第二文本信息中“附”字符的数量相同,因此第三评估子模块3032可以认为二者在“附”字符上匹配,而“箱”字符的数量不同,第三评估子模块3032可以认为二者在“箱”字符上不匹配。
在一实施例中,第三评估子模块3032在对第一文本信息和第二文本信息中字符匹配进行评估时,不仅考虑第一文本信息和第二文本信息中是否具有相同的字符,还考虑该字符的排序。举例来说,如果“附”字符在第一文本信息中排在首位,第二文本信息中虽然也有“附”字符,但是“附”字符排在非首位,则第三评估子模块3032也认为二者中的“附”字符不匹配。
假设第一文本信息和第二文本信息中不匹配的字符的数目为Count1,第二文本信息中的字符总数为count2。第三评估子模块3032可以根据Count1和count2计算文档在内容完整性上的第一得分S1,具体计算公式如下:
当count2的值为0时,S1=100×(1-min(Count1,1))。
综上,可以将文档在内容完整性上的第一得分S1作为该文档在内容完整性上的第一评估结果。
需要说明的是,可以根据第一得分对文档、第一图像以及第一文本信息进行重命名,即可以在文档名称、第一图像名称以及第一文本信息名称里新增文档在内容完整性上的第一得分。
(4)第二评估模块304
第二评估模块30用于对第一图像和第二图像的整体相似度进行评估,得到文档在整体显示效果上的第二评估结果,以及对第一图像和第二图像的局部相似度进行评估,得到文档在局部显示效果上的第三评估结果。
在一实施例中,如图11所示,第二评估模块304包括:第三获取子模块3045和第二评估子模块3046。
其中,第三获取子模块3045用于获取第一图像和第二图像的直方图相似得分和特征相似得分;第二评估子模块3046用于根据直方图相似得分和特征相似得分,得到文档在整体显示效果上的评估结果。
在一实施例中,所述第二评估子模块3046还用于对所述直方图相似得分和所述特征相似得分分别进行归一化处理;对经归一化处理后的直方图相似得分以及经归一化处理后的特征相似得分进行加权求和,得到所述第二评估结果。
在一实施例中,第三获取子模块3045获取第一图像和第二图像的直方图相似得分的步骤如下:首先对第一图像和第二图像的像素数据进行采集,然后生成特定的直方图数据,再运用巴氏系数算法,计算出第一图像和第二图像之间的相似程度,即第一图像和第二图像的直方相似得分S直方图。其中,第二评估子模块3046还可以对S直方图进行归一化处理,使其取值范围在[0,1]之间,需要说明的是,S直方图取值越接近0,则表示第一图像和第二图像相似度越低,如果S直方图越接近1,则表示第一图像和第二图像相似度越高。
在一实施例中,第三获取子模块3045获取第一图像和第二图像的特征相似得分S特征的步骤如下:
首先可以采用SIFT(Scale Invariant Feature Transform,尺度不变特征转换)算法或SURF(Speeded Up Robust Features,加速稳健特征)算法分别查找出第一图像中的第一特征点,以及第二图像中的第二特征点。具体的,可以首先通过sift=cv2.xfeatures2d.SIFT_create()初始化SIFT检测器对象,再通过KP1,des1=sift.detectAndCompute(queryImage,None)查找并计算出第一图像的特征点,其中KP1表示第一图像中生成的特征点,queryImage表示第一图像。接着通过KP2,des2=sift.detectAndCompute(trainingImage,None)查找并计算出第二图像的特征点,其中KP2表示第二图像中生成的特征点,trainingImage表示第二图像。最后,统计第一图像中特征点的个数kp1,以及第二图像中特征点的个数kp2,第二评估子模块3046根据如下公式不仅可以计算出第一图像和第二图像的特征相似得分S特征,还可以对S特征进行归一化处理:
当kp1的个数等于0时,S特征=100×(1-min(kp2,1))。
综上,第二评估子模块3046可以对上述经归一化处理后的直方相似得分S直方图和特征相似得分S特征进行加权求和,得到第二评估结果。具体的,可以采用如下公式,计算出第一图像和第二图像在整体显示效果上的第二得分S2。
S2=a1×S直方图+b1×S特征
其中a1,a2为参数,a1+b1=1,且a1,b1∈[0,1]。
需要说明的是,可以根据第二得分对文档、第一图像以及第一文本信息进行重命名,即可以在文档名称、第一图像名称以及第一文本信息名称里新增文档在整体显示效果上的第二得分。
在一实施例中,第二评估模块304包括:调整子模块3041、第二划分子模块3042、扩大子模块3043以及第一评估子模块3044。
其中,调整子模块3041用于将第一图像和第二图像调整至相同尺寸大小的图像,得到经过尺寸调整的第一图像和经过尺寸调整的第二图像;第二划分子模块3042用于采用相同划分方式分别对经过尺寸调整的第一图像和经过尺寸调整的第二图像进行划分,使第一图像划分为至少两个第一局部图像,并使第二图像划分为至少两个第二局部图像;扩大子模块3043用于扩大第二局部图像的尺寸,使第二局部图像包含部分邻近的第二局部图像;第一评估子模块3044用于基于第一局部图像和第二局部图像,得到文档在局部显示效果上的第三评估结果。
在一实施例中,所述第一评估子模块3044还用于依次获取每一个第二局部图像与对应的第一局部图像之间的直方图相似度和特征相似度;对全部直方图相似度和全部特征相似度进行加权求和,得到所述第三评估结果。
调整子模块3041预先将第一图像和第二图像的尺寸进行缩小或放大,使第一图像和第二图像具有相同尺寸。假设将图3中的第一图像N1以及图4中的第二图像N2调整至相同尺寸,得到经过调整子模块3041尺寸调整的第一图像N1’和经过尺寸调整的第二图像N2’。然后如图7所示,第二划分子模块3042按照预设尺寸X1*Y1将第一图像N1’划分成9个第一局部图像N11,同样按照预设尺寸X1*Y1将第二图像N2’划分成9个第一局部图像N21。接着,扩大子模块3043扩大第一局部图像N21的尺寸,使其包含部分邻近的第一局部图像N21。如图7中第一行第一列的第一局部图像N21宽度扩大X2,高度扩大Y2,则第一行第一列的第一局部图像N21包含了部分其邻近的第一行第二列的第一局部图像N21、第二行第一列的第一局部图像N21以及第二行第二列的第一局部图像N21。同理的,由于位于第二行第二列的第一局部图像N21与剩下的8个第一局部图像N21都相邻,因此第二行第二列的第一局部图像N21左右两侧都扩大了X2,上下侧都扩大了Y2。
具体的,第一评估子模块304可以依次计算每个第一局部图像和对应的第二局部图像之间的直方图相似度P直方图以及P特征相似度,最后再计算整个第一图像和第二图像在局部显示效果上的第三得分S3。
其中,i表示第一局部图像的个数,m为正整数,a2i+b2i=1,且a2i,b2i∈[0,1]。综上,可以将第三得分S3作为文档在局部显示效果上的第三评估结果。
需要说明的是,可以根据第三得分对文档、第一图像以及第一文本信息进行重命名,即可以在文档名称、第一图像名称以及第一文本信息名称里新增文档在局部显示效果上的第三得分。
(5)输出模块305
输出模块305用于从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果,其中目标评价结果用于评估第一应用进行文档显示的显示效果。
其中,输出模块305可以根据实际情况择其一或其二确定目标评价结果。进一步的,输出模块305也可以对上述第一评估结果、第二评估结果以及第三评估结果进行综合考量,以确定目标评价结果。
在一实施例中,如图12所示,所述输出模块305包括:权重获取子模块3051和相加子模块3052。其中权重获取子模块3051用于获取所述第一评估结果对应的第一权重,所述第二评估结果对应的第二权重,以及所述第三评估结果对应的第三权重。相加子模块3052用于将所述第一评估结果和所述第一权重的乘积、所述第二评估结果和所述第二权重的乘积、所述第三评估结果和所述第三权重的乘积相加,得到所述目标评价结果。
具体的,在获取到上述第一得分S1,第二得分S2以及第三得分S3后,输出模块305可以根据如下公式计算出目标得分S。
S=aS1+bS2+cS3
其中,a为第一权重,b为第二权重,c为第三权重,a+b+c=1,且a,b,c∈[0,1]。其中,a,b以及c通过对大量的训练文档进行打分,根据打分结果生成。
在一实施例中,所述文档显示效果的评估装置30还包括结果获取模块310和生成模块311。其中,结果获取模块310用于获取多个训练文档的打分结果。生成模块311用于根据所述打分结果,生成所述第一权重、所述第二权重和所述第三权重。
具体的,可以对K×3个训练文档进行人工打分,结果获取模块310获取到人工打分结果后,使每三个人工打分结果作为一组打分结果,生成K组打分结果ai=[ai1,ai2,ai3],其中,K≥i≥1,i为正整数,K为正整数。该K组打分结果组成打分结果矩阵根据上述打分结果矩阵A,生成模块311对第一列的打分结果进行累加求平均值,可以计算出第一权重同理的,生成模块311对第二列的打分结果进行累加求平均值,可以计算出第二权重生成模块311对第三列的打分结果进行累加求平均值,可以计算出第三权重
在一实施例中,还可以根据需求和经验对上述第一权重、第二权重以及第三权重进行调整,使使用本发明实施例的评估方法的打分与人工打分尽可能接近。在一实施例中,如果第一应用进行文档显示时,文档内容的完整性已经可以得到足够的保证,则可以降低第一权重的值。
在一实施例中,输出模块305可以将文档的第一得分、第二得分、第三得分以及目标得分全部输出,然后对每一项得分进行分析统计,得到文档在不同维度上的得分差异。
在一实施例中,输出模块305还可以挑选出第一得分、第二得分以及第三得分相差较大的目标文档,单独输出该目标文档的目标评价结果,并对该目标文档进行单独分析,以查找第一应用对该目标文档进行显示的效果较差的原因。
需要说明的是,可以根据目标得分对文档、第一图像以及第一文本信息进行重命名,即可以在文档名称、第一图像名称以及第一文本信息名称里新增文档目标得分。
本发明实施例的文档显示效果的评估装置,对第一文本信息和第二文本信息中字符匹配进行评估,得到文档在内容完整性上的第一评估结果,并使用直方图相似法和特征相似法对第一图像和第二图像的整体相似度进行评价,得到文档在整体显示效果上的第二评估结果,以及通过对第一图像和第二图像进行分割,得到文档在局部显示效果上的第三评估结果。最后再从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果。该方案通过多维度对第一应用的文档显示效果进行评估,提高了评估的准确性。
相应的,本发明实施例还提供一种服务器,如图13所示,其示出了本发明实施例所涉及的服务器的结构示意图,具体来讲:
该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图13中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。比如可以存储合法关键词,还可以存储从第三方服务器中获取到的一些数据。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
服务器还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,服务器还可以包括显示单元等,在此不再赘述。具体在本实施例中,服务器中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
通过第一应用对文档进行显示,生成第一显示页面,并获取第一显示页面的第一文本信息以及第一图像;通过第二应用对文档进行显示,生成第二显示页面,并获取第二显示页面的第二文本信息以及第二图像;对第一文本信息和第二文本信息中字符匹配进行评估,得到文档在内容完整性上的第一评估结果;对第一图像和第二图像的整体相似度进行评估,得到文档在整体显示效果上的第二评估结果,以及对第一图像和第二图像的局部相似度进行评估,得到文档在局部显示效果上的第三评估结果;从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果,其中目标评价结果用于评估第一应用进行文档显示的显示效果。
该服务器可以实现本发明实施例所提供的任一种文档显示效果的评估装置所能实现的有效效果,详见前面的实施例,在此不再赘述。
本发明实施例的服务器,对第一文本信息和第二文本信息中字符匹配进行评估,得到文档在内容完整性上的第一评估结果,并使用直方图相似法和特征相似法对第一图像和第二图像的整体相似度进行评价,得到文档在整体显示效果上的第二评估结果,以及通过对第一图像和第二图像进行分割,得到文档在局部显示效果上的第三评估结果。最后再从第一评估结果、第二评估结果以及第三评估结果中确定目标评价结果,并输出目标评价结果。该方案通过多维度对第一应用的文档显示效果进行评估,提高了评估的准确性。
本文提供了实施例的各种操作。在一个实施例中的一个或多个操作可以构成一个或多个计算机可读介质上存储的计算机可读指令,其在被服务器执行时将使得计算设备执行所述操作。描述一些或所有操作的顺序不应当被解释为暗示这些操作必需是顺序相关的。本领域技术人员将理解具有本说明书的益处的可替代的排序。而且,应当理解,不是所有操作必需在本文所提供的每个实施例中存在。
而且,尽管已经相对于一个或多个实现方式示出并描述了本公开,但是本领域技术人员基于对本说明书和附图的阅读和理解将会想到等价变型和修改。本公开包括所有这样的修改和变型,并且仅由所附权利要求的范围限制。特别地关于由上述组件(例如元件、资源等)执行的各种功能,用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示),即使在结构上与执行本文所示的本公开的示范性实现方式中的功能的公开结构不等同。此外,尽管本公开的特定特征已经相对于若干实现方式中的仅一个被公开,但是这种特征可以与如可以对给定或特定应用而言是期望和有利的其他实现方式的一个或多个其他特征组合。而且,就术语“包括”、“具有”、“含有”或其变形被用在具体实施方式或权利要求中而言,这样的术语旨在以与术语“包含”相似的方式包括。
本发明实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。上述的各装置或系统,可以执行相应方法实施例中的方法。
综上所述,虽然本发明已以实施例揭露如上,实施例前的序号仅为描述方便而使用,对本发明各实施例的顺序不造成限制。并且,上述实施例并非用以限制本发明,本领域的普通技术人员,在不脱离本发明的精神和范围内,均可作各种更动与润饰,因此本发明的保护范围以权利要求界定的范围为准。
Claims (15)
1.一种文档显示效果的评估方法,其特征在于,包括:
通过第一应用对文档进行显示,生成第一显示页面,并获取所述第一显示页面的第一文本信息以及第一图像;
通过第二应用对所述文档进行显示,生成第二显示页面,并获取所述第二显示页面的第二文本信息以及第二图像;
对所述第一文本信息和所述第二文本信息中字符匹配进行评估,得到所述文档在内容完整性上的第一评估结果;
对所述第一图像和所述第二图像的整体相似度进行评估,得到所述文档在整体显示效果上的第二评估结果,以及对第一图像和所述第二图像的局部相似度进行评估,得到所述文档在局部显示效果上的第三评估结果;
从所述第一评估结果、所述第二评估结果以及所述第三评估结果中确定目标评价结果,并输出所述目标评价结果,其中所述目标评价结果用于评估所述第一应用进行文档显示的显示效果。
2.根据权利要求1所述的文档显示效果的评估方法,其特征在于,所述从所述第一评估结果、所述第二评估结果以及所述第三评估结果中确定目标评价结果,并输出所述目标评价结果,其中所述目标评价结果用于评估所述第一应用进行文档显示的显示效果步骤,包括:
获取所述第一评估结果对应的第一权重,所述第二评估结果对应的第二权重,以及所述第三评估结果对应的第三权重;
将所述第一评估结果和所述第一权重的乘积、所述第二评估结果和所述第二权重的乘积、所述第三评估结果和所述第三权重的乘积相加,得到所述目标评价结果。
3.根据权利要求2所述的文档显示效果的评估方法,其特征在于,所述获取所述第一评估结果对应的第一权重,所述第二评估结果对应的第二权重,以及所述第三评估结果对应的第三权重步骤之前,还包括:
获取多个训练文档的打分结果;
根据所述打分结果,生成所述第一权重、所述第二权重和所述第三权重。
4.根据权利要求1所述的文档显示效果的评估方法,其特征在于,所述通过第一应用对文档进行显示,生成第一显示页面,并获取所述第一显示页面的第一文本信息以及第一图像步骤,包括:
获取所述第一显示页面的首页图像;
确定所述首页图像中相同文档内容是否具有不同的显示效果;
当所述首页图像中相同文档内容具有不同的显示效果时,根据所述不同的显示效果对所述首页图像进行划分,得到至少两个所述第一图像;
当所述首页图像中相同文档内容不具有不同的显示效果时,将所述首页图像设置为所述第一图像。
5.根据权利要求1所述的文档显示效果的评估方法,其特征在于,所述通过第一应用对文档进行显示,生成第一显示页面,并获取所述第一显示页面的第一文本信息以及第一图像步骤,包括:
获取通过所述第一应用对文档进行显示,生成所述第一显示页面的时长;
当通过所述第一应用对文档进行显示,生成所述第一显示页面的时长大于预设时长时,停止获取所述第一显示页面的第一文本信息以及第一图像。
6.根据权利要求1所述的文档显示效果的评估方法,其特征在于,所述通过第一应用对文档进行显示,生成第一显示页面,并获取所述第一显示页面的第一文本信息以及第一图像步骤之前,还包括:
通过预设接口,获取通过所述第一应用对文档进行显示,生成所述第一显示页面的预测时长;
当所述预测时长大于预设时长时,停止通过所述第一应用对所述文档进行显示。
7.根据权利要求1所述的文档显示效果的评估方法,其特征在于,所述通过第一应用对文档进行显示,生成第一显示页面,并获取所述第一显示页面的第一文本信息以及第一图像步骤,还包括:
确定所述第一显示页面是否存在显示异常;
当所述第一显示页面存在显示异常时,停止获取所述第一显示页面的第一文本信息以及第一图像。
8.根据权利要求1-7任一项所述的文档显示效果的评估方法,其特征在于,所述对所述第一图像和所述第二图像的整体相似度进行评估,得到所述文档在整体显示效果上的第二评估结果,以及对第一图像和所述第二图像的局部相似度进行评估,得到所述文档在局部显示效果上的第三评估结果步骤,包括:
将所述第一图像和第二图像调整至相同尺寸大小的图像,得到经过尺寸调整的第一图像和经过尺寸调整的第二图像;
采用相同划分方式分别对所述经过尺寸调整的第一图像和所述经过尺寸调整的第二图像进行划分,使所述第一图像划分为至少两个第一局部图像,并使所述第二图像划分为至少两个第二局部图像;
扩大所述第二局部图像的尺寸,使所述第二局部图像包含部分邻近的第二局部图像;
基于所述第一局部图像和所述第二局部图像,得到所述文档在局部显示效果上的第三评估结果。
9.根据权利要求8所述文档显示效果的评估方法,其特征在于,所述基于所述第一局部图像和所述第二局部图像,得到所述文档在局部显示效果上的第三评估结果步骤,包括:
依次获取每一个第二局部图像与对应的第一局部图像之间的直方图相似度和特征相似度;
对全部直方图相似度和全部特征相似度进行加权求和,得到所述第三评估结果。
10.根据权利要求1-7任一项所述的文档显示效果的评估方法,其特征在于,所述对所述第一图像和所述第二图像的整体相似度进行评估,得到所述文档在整体显示效果上的第二评估结果,以及对第一图像和所述第二图像的局部相似度进行评估,得到所述文档在局部显示效果上的第三评估结果步骤,包括:
获取所述第一图像和所述第二图像的直方图相似得分和特征相似得分;
根据所述直方图相似得分和所述特征相似得分,得到所述文档在整体显示效果上的第二评估结果。
11.根据权利要求10所述的文档显示效果的评估方法,其特征在于,所述根据所述直方图相似得分和所述特征相似得分,得到所述文档在整体显示效果上的评估结果步骤,包括:
对所述直方图相似得分和所述特征相似得分分别进行归一化处理;
对经归一化处理后的直方图相似得分以及经归一化处理后的特征相似得分进行加权求和,得到所述第二评估结果。
12.根据权利要求1-7任一项所述的文档显示效果的评估方法,其特征在于,所述对所述第一文本信息和所述第二文本信息中字符匹配进行评估,得到所述文档在内容完整性上的第一评估结果步骤,包括:
获取所述第二文本信息中的字符总数,以及所述第一文本信息和所述第二文本信息中不匹配的字符的数目;
根据所述字符总数和所述不匹配的字符的数目,得到所述文档在所述内容完整性上的评估结果。
13.根据权利要求1-7任一项所述的文档显示效果的评估方法,其特征在于,所述通过第一应用对文档进行显示,生成第一显示页面,并获取所述第一显示页面的第一文本信息以及第一图像步骤之后,还包括:
获取所述文档的格式类型;
根据所述格式类型,对所述第一文本信息以及所述第一图像进行分类保存。
14.一种文档显示效果的评估装置,其特征在于,包括:
第一获取模块,用于通过第一应用对文档进行显示,生成第一显示页面,并获取所述第一显示页面的第一文本信息以及第一图像;
第二获取模块,用于通过第二应用对所述文档进行显示,生成第二显示页面,并获取所述第二显示页面的第二文本信息以及第二图像;
第一评估模块,用于对所述第一文本信息和所述第二文本信息中字符匹配进行评估,得到所述文档在内容完整性上的第一评估结果;
第二评估模块,用于对所述第一图像和所述第二图像的整体相似度进行评估,得到所述文档在整体显示效果上的第二评估结果,以及对第一图像和所述第二图像的局部相似度进行评估,得到所述文档在局部显示效果上的第三评估结果;
输出模块,用于从所述第一评估结果、所述第二评估结果以及所述第三评估结果中确定目标评价结果,并输出所述目标评价结果,其中所述目标评价结果用于评估所述第一应用进行文档显示的显示效果。
15.一种计算机可读存储介质,其内存储有处理器可执行指令,该处理器通过执行所述指令提供如权利要求1-13中任一的文档显示效果的评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911292503.XA CN111079037B (zh) | 2019-12-12 | 2019-12-12 | 文档显示效果的评估方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911292503.XA CN111079037B (zh) | 2019-12-12 | 2019-12-12 | 文档显示效果的评估方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111079037A true CN111079037A (zh) | 2020-04-28 |
CN111079037B CN111079037B (zh) | 2023-09-22 |
Family
ID=70314789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911292503.XA Active CN111079037B (zh) | 2019-12-12 | 2019-12-12 | 文档显示效果的评估方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111079037B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112287188A (zh) * | 2020-10-19 | 2021-01-29 | 珠海格力电器股份有限公司 | 字符切边识别方法和装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103533164A (zh) * | 2013-10-09 | 2014-01-22 | 北京奇虎科技有限公司 | 一种利用无线终端控制文档展示的方法及装置 |
CN106991084A (zh) * | 2017-03-28 | 2017-07-28 | 中国长城科技集团股份有限公司 | 一种文档评估方法及装置 |
CN107817934A (zh) * | 2017-10-31 | 2018-03-20 | 努比亚技术有限公司 | 一种信息显示方法、终端和计算机可读存储介质 |
CN107909054A (zh) * | 2017-11-30 | 2018-04-13 | 任艳 | 图片文本的相似度评价方法及装置 |
CN109446061A (zh) * | 2018-09-17 | 2019-03-08 | 平安科技(深圳)有限公司 | 一种页面检测方法、计算机可读存储介质及终端设备 |
US20190196766A1 (en) * | 2017-12-26 | 2019-06-27 | Sharp Kabushiki Kaisha | Preview display apparatus, multifunction peripheral, and preview display method |
CN110321470A (zh) * | 2019-05-23 | 2019-10-11 | 平安科技(深圳)有限公司 | 文档处理方法、装置、计算机设备和存储介质 |
-
2019
- 2019-12-12 CN CN201911292503.XA patent/CN111079037B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103533164A (zh) * | 2013-10-09 | 2014-01-22 | 北京奇虎科技有限公司 | 一种利用无线终端控制文档展示的方法及装置 |
CN106991084A (zh) * | 2017-03-28 | 2017-07-28 | 中国长城科技集团股份有限公司 | 一种文档评估方法及装置 |
CN107817934A (zh) * | 2017-10-31 | 2018-03-20 | 努比亚技术有限公司 | 一种信息显示方法、终端和计算机可读存储介质 |
CN107909054A (zh) * | 2017-11-30 | 2018-04-13 | 任艳 | 图片文本的相似度评价方法及装置 |
US20190196766A1 (en) * | 2017-12-26 | 2019-06-27 | Sharp Kabushiki Kaisha | Preview display apparatus, multifunction peripheral, and preview display method |
CN109446061A (zh) * | 2018-09-17 | 2019-03-08 | 平安科技(深圳)有限公司 | 一种页面检测方法、计算机可读存储介质及终端设备 |
CN110321470A (zh) * | 2019-05-23 | 2019-10-11 | 平安科技(深圳)有限公司 | 文档处理方法、装置、计算机设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112287188A (zh) * | 2020-10-19 | 2021-01-29 | 珠海格力电器股份有限公司 | 字符切边识别方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111079037B (zh) | 2023-09-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111031346B (zh) | 一种增强视频画质的方法和装置 | |
US7778489B1 (en) | Method and system for determining the legibility of text in an image | |
US7978922B2 (en) | Compressing images in documents | |
US8515164B2 (en) | Non-product image identification | |
WO2020151340A1 (zh) | 一种目标细胞标记方法、装置、存储介质及终端设备 | |
US8571315B2 (en) | Information processing apparatus, information processing method, and program | |
US20150149883A1 (en) | Image processing device, image processing device control method, program, and information storage medium | |
CN111079037B (zh) | 文档显示效果的评估方法、装置及计算机可读存储介质 | |
US20190332859A1 (en) | Method for identifying main picture in web page | |
US20080181524A1 (en) | Image evaluation method, apparatus, and program | |
CN112131841A (zh) | 一种文档质量评估方法及系统 | |
US11915480B2 (en) | Image processing apparatus and image processing method | |
JP2012003358A (ja) | 背景判別装置、方法及びプログラム | |
US11627278B2 (en) | High dynamic range video format detection | |
US9092694B2 (en) | Method and system for creating a digital image album | |
GB2552969A (en) | Image processing system | |
JP2011141664A (ja) | 文書比較装置、文書比較方法、及びプログラム | |
JP5083162B2 (ja) | 画像データ判定装置、画像データ判定システム、及びプログラム | |
US20220358622A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN111695556A (zh) | 网页配图的处理方法、系统、设备和存储介质 | |
US20220358683A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20230298445A1 (en) | Learning apparatus, estimation apparatus, learning method, and non-transitory storage medium | |
JP2004280433A (ja) | 画像処理装置、画像処理方法、及び画像処理プログラム | |
RU2630743C1 (ru) | Способ и устройство классификации изображений печатных копий документов и система сортировки печатных копий документов | |
CN111985311A (zh) | 一种识别手机号的方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40022180 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |