CN113435217A - 语言测试处理方法、装置及电子设备 - Google Patents
语言测试处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113435217A CN113435217A CN202110715011.8A CN202110715011A CN113435217A CN 113435217 A CN113435217 A CN 113435217A CN 202110715011 A CN202110715011 A CN 202110715011A CN 113435217 A CN113435217 A CN 113435217A
- Authority
- CN
- China
- Prior art keywords
- entry
- language
- standard translation
- interface image
- merged
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012360 testing method Methods 0.000 title claims abstract description 107
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000013519 translation Methods 0.000 claims abstract description 138
- 238000000034 method Methods 0.000 claims abstract description 67
- 238000012015 optical character recognition Methods 0.000 claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 31
- 230000015654 memory Effects 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 9
- 230000014616 translation Effects 0.000 description 119
- 238000010586 diagram Methods 0.000 description 12
- 238000001914 filtration Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012733 comparative method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013522 software testing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种语言测试处理方法、装置及电子设备。其中,该方法包括:获取第一语言的第一界面图像;采用光学字符识别OCR方法识别第一界面图像中的词条;将识别出的词条与第一语言的第一标准翻译进行比较,得到第一语言的测试结果。本发明解决了相关技术中进行语言测试处理时,出现的测试时间长、难度大的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种语言测试处理方法、装置及电子设备。
背景技术
目前App(Application,应用程序)的用户数量越来越多,用户范围越来越广。特别是智慧家居方面的App,需要接入多种智能设备,而相关设备销往多个国家和地区,需要支持多种语言,同时,App也提供了多种语言切换的功能。因此,在App测试项目中,多语言测试是重要的一部分。在进行多语言测试时,相关技术中需要测试人员切换到支持的每个语言,对比当前界面展示的内容是否正确。但是采用上述方式时,会出现测试时长与测试难度增大,且容易产生遗漏的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种语言测试处理方法、装置及电子设备,以至少解决相关技术中进行语言测试处理时,出现的测试时间长、难度大的技术问题。
根据本发明实施例的一个方面,提供了一种言测试处理方法,包括:获取第一语言的第一界面图像;采用光学字符识别OCR方法识别所述第一界面图像中的词条;将识别出的词条与所述第一语言的第一标准翻译进行比较,得到所述第一语言的测试结果。
可选地,所述将识别出的词条与所述第一语言的第一标准翻译进行比较,得到所述第一语言的测试结果,包括:对识别出的词条进行编号;针对第N个词条,查找所述第一标准翻译中是否存在所述第N个词条,其中,N>=1;在第一查找结果为所述第一标准翻译中存在所述第N个词条的情况下,记录所述第N个词条在所述第一标准翻译中的位置,直到识别出的所有词条均比较完成,得到所述第一语言的测试结果。
可选地,在查找所述第一标准翻译中是否存在所述第N个词条之后,还包括:在第一查找结果为所述第一标准翻译中不存在所述第N个词条的情况下,将所述第N个词条逐次与所述第N个词条之后预定数量个词条进行合并,得到合并词条;查找所述第一标准翻译中是否存在所述合并词条;在第二查找结果为所述第一标准翻译中存在所述合并词条的情况下,记录所述合并词条在所述第一标准翻译中的位置,以及所述合并词条的排版信息。
可选地,在所述查找所述第一标准翻译中是否存在所述合并词条之后,还包括:在第二查找结果为所述第一标准翻译中不存在所述合并词条的情况下,比较预定数量个合并词条中与所述第一标准翻译的相似度,得到相似度最大的目标合并词条;记录所述目标合并词条在所述第一标准翻译中的位置,以及所述目标合并词条的排版信息。
可选地,该方法还包括:获取第二语言的第二界面图像;采用所述OCR方法识别所述第二界面图像中的词条;将识别出的词条与所述第二语言的第二标准翻译进行比较,得到所述第二语言的测试结果,其中,所述第二标准翻译的位置与所述第一标准翻译的位置相差预定偏移量。
可选地,在采用所述OCR方法识别所述第一界面图像中的词条之前,还包括:对所述第一界面图像进行灰度处理,得到滤除干扰信息后的第一界面图像;和/或,在采用所述OCR方法识别所述第二界面图像中的词条之前,还包括:对所述第二界面图像进行灰度处理,得到滤除干扰信息后的第二界面图像。
根据本发明实施例的另一个方面,提供了一种语言测试处理装置,包括:获取模块,用于获取第一语言的第一界面图像;识别模块,用于采用光学字符识别OCR方法识别所述第一界面图像中的词条;比较模块,用于将识别出的词条与所述第一语言的第一标准翻译进行比较,得到所述第一语言的测试结果。
根据本发明实施例的另一个方面,提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现任一项所述的语言测试处理方法。
根据本发明实施例的另一个方面,提供了一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行任一项所述的语言测试处理方法。
根据本发明实施例的另一个方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现任一项所述的语言测试处理方法。
在本发明实施例中,采用光学字符识别OCR方法,将第一界面中的词条与标准翻译进行比较,达到了词条识别的目的,从而实现了正确识别出语言的技术效果,进而解决了相关技术中进行语言测试处理时,出现的测试时间长、难度大的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的语言测试处理方法;
图2是本发明可选实施方式的截图存放目录结构示意图;
图3是本发明可选实施方式的多语言标准文件模板示意图;
图4是本发明可选实施方式的多语言测试流程的流程图;
图5是本发明可选实施方式的图片处理流程的流程图;
图6是本发明可选实施方式的查找策略的流程图;
图7是本发明可选实施方式的对比策略的流程图;
图8是根据本发明实施例的语言测试处理装置的结构框图;
图9是根据一示例性实施例示出的一种终端的结构框图。
具体实施方式
根据本发明实施例,提供了一种语言测试处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的语言测试处理方法,如图1所示,该方法包括如下步骤:
步骤S102,获取第一语言的第一界面图像;
步骤S104,采用光学字符识别OCR方法识别第一界面图像中的词条;
步骤S106,将识别出的词条与第一语言的第一标准翻译进行比较,得到第一语言的测试结果。
通过上述步骤,采用光学字符识别OCR方法,将第一界面中的词条与标准翻译进行比较,达到了词条识别的目的,从而实现了正确识别出语言的技术效果,进而解决了相关技术中进行语言测试处理时,出现的测试时间长、难度大的技术问题。
作为一种可选的实施例,获取第一语言的第一界面图像,其中,第一语言可以是用户自己定义的,可以选择为多种语言,较优的,第一语言可以为用户较为熟悉的语言,以作为标准翻译,与其他语言作比较,例如,在软件测试的场景中,测试人员较为擅长英语语言,此时,可以把第一语言设置为英语。另外,第一界面图像可以是基于多种渠道获取的,即针对的测试对象可以为多种,例如,可以对网页获取第一界面图像,对应用软件获取第一界面图像,等等。获取第一界面图像的方式也可以为多种,例如,在网页中针对每个子网页界面进行人工截图,在应用软件中针对每个控件产生的新的界面进行人工截图,也可以从数据库中直接获取界面截图,等等。界面截图一般为多个,为了更好的对界面截图进行处理,可以事先对界面截图进行分类处理,例如,界面截图存放在以语言简称命名的目录下,并且所有语言下的界面截图数量和名称一致,并且所有语言目录存放在同一个根目录下,以便于更好地调用。
作为一种可选的实施例,采用光学字符识别OCR(optical characterrecognition)方法识别第一界面图像中的词条,其中,光学字符识别OCR方法,识别第一界面图像中的词条,通过检测暗、亮的模式确认图像上字符的形状,用字符识别的方法将形状翻译成文字,从而进行词条的识别。只需要在提供不同语言截图的情况下,自动解析出翻译的正确性,以及在界面中出现的排版问题,缩短了测试时间,并降低了漏测率,提高了测试效率,大大降低了测试成本。较优的,可以根据实际需求选择特定的OCR方法识别图像中的词条,提高OCR文字识别精度,避免出现干扰词的现象,以达到更好地识别效果。其中,识别第一界面图像中的词条为图像中语言中字符出现的部分。
作为一种可选的实施例,将识别出的词条与第一语言的第一标准翻译进行比较,得到第一语言的测试结果,其中,第一标准翻译可以通过多种方式获得,例如,可以规范一种以表格的形式保存的多语言翻译的标准文件格式。第一行为每个语言的简称,与存放截图的目录名称保持一致;每一列为不同的语言翻译,同一行为同一个词条的不同语言翻译。以便用于标准翻译的比较。
作为一种可选的实施例,将将识别出的词条与第一语言的第一标准翻译进行比较,得到第一语言的测试结果,包括:对识别出的词条进行编号;因为图像中,一般包括多个词条,而且同一段话翻译成不同的语言,所翻译成的词条个数不同,为了更清晰地对词条进行识别,需要对识别出的词条进行编号。对每个词条均进行查询,针对第N个词条,查找第一标准翻译中是否存在第N个词条,其中,N>=1;第一查找结果可能为第一查找结果为第一标准翻译中存在第N个词条的情况,与,在第一查找结果为第一标准翻译中不存在第N个词条的情况。其中,在第一查找结果为第一标准翻译中存在第N个词条的情况下,记录第N个词条在第一标准翻译中的位置,直到识别出的所有词条均比较完成,得到第一语言的测试结果。将所有词条比较完成,使得第一界面截图中的词条能够完整的识别,使得第一语言的测试结果更加全面。在第一查找结果为第一标准翻译中不存在第N个词条的情况下,将第N个词条逐次与第N个词条之后预定数量个词条进行合并,得到合并词条;举例说明,在英语中,两个单词组成词组后可能具有不同的含义,所以当一个词条没有在标准翻译中找到对应的翻译时,可以合并下一个词条,以找到对应的翻译,防止遗漏或者是误识别的现象发生。查找第一标准翻译中是否存在合并词条;在第二查找结果为第一标准翻译中存在合并词条的情况下,记录合并词条在第一标准翻译中的位置,以及合并词条的排版信息。其中,通过设置预定数量的词条能够保证词条不过多的合并,加大计算量,又能够保证预定数量范围内的词条可以更为真实地反映出词条的识别结果。
作为一种可选的实施例,查找第一标准翻译中是否存在合并词条之后,还包括:在第二查找结果为第一标准翻译中不存在合并词条的情况下,比较预定数量个合并词条中与第一标准翻译的相似度,得到相似度最大的目标合并词条;记录目标合并词条在第一标准翻译中的位置,以及目标合并词条的排版信息。即可以进行模糊查询,计算当前词条与第一标准翻译的相似度,将相似度结果输出到测试报告中,以供使用。在不完全匹配时,也能够以相似度这一数值的形式展现出相似程度,具有参考价值。
作为一种可选的实施例,获取第二语言的第二界面图像;采用OCR方法识别第二界面图像中的词条;将识别出的词条与第二语言的第二标准翻译进行比较,得到第二语言的测试结果,其中,第二标准翻译的位置与第一标准翻译的位置相差预定偏移量。通过将第二语言与第二标准翻译进行比较,可以得出更多不同种类语言的语言测试结果。其中,第二语言可以为除第一语言外的其他语言,第二界面图像为将语言为第一语言的第一界面图像,转换为第二语言后获得。例如可以通过上述获取第一界面图像的方式获取第二界面图像。
作为一种可选的实施例,第二标准翻译的位置与第一标准翻译的位置相差预定偏移量,以保证词条的准确性。例如,在英语中,A区域位置翻译为菜单,在标准翻译表格中的位置为(1,1),即表示第一行第一列;在泰语中,A区域位置翻译为菜单,在标准翻译表格中的位置为(1,2),即表示第一行第二列。此时,对于该词条,英语与泰语的行偏移量为0,列偏移量为1,则判断词条准确。若在日语中,A区域位置翻译为购买,在标准翻译表格中的位置为(2,3),此时,对于该词条,英语与日语的行偏移量为1,列偏移量为2,则判断词条不准确。即在本可选实施例的计算方法中,对于同一界面截图,相同位置的翻译应当是行偏移量为0,列偏移量为表格中两种语言相差的列数。能够保证在找到各语言的标准翻译后,保证翻译的准确性,避免因为个别字符的误识别或者是其他影响操作使得该词条译为具有其他含义的词条,即也能在标准翻译文件中找到,但不是应当在当前位置的词条。
作为一种可选的实施例,在采用OCR方法识别第一界面图像中的词条之前,还包括:对第一界面图像进行灰度处理,得到滤除干扰信息后的第一界面图像;和/或,在采用OCR方法识别第二界面图像中的词条之前,还包括:对第二界面图像进行灰度处理,得到滤除干扰信息后的第二界面图像。通过对图像进行灰度处理,过滤掉图像背景中的杂乱信息和干扰信息,等等。
基于上述实施例及可选实施例,提供了一种可选实施方式,下面具体说明。
在相关技术中,进行多语言测试时,需要测试人员切换到支持的每个语言,对比当前界面展示的内容是否正确。例如,人工查看App界面信息,再与标准翻译比对,或将App多语言相关的配置文件与标准文件进行比对,但都无法解决准确性低、容易遗漏的问题。由于测试人员不可能掌握所有的语种,在进行测试时,大大增加了测试时长和测试难度。对于像泰语、阿拉伯语等由特殊字符组成的语种,不仅测试难度和测试时间大大增加,而且很容易遗漏问题。另外,不同语言在对同一词条翻译后的长度也大不相同,容易导致在App界面显示时内容截断,或者排版问题。
随着图像处理相关领域的发展,OCR文字识别技术广泛应用,且特定应用的OCR文字识别技术可以有效翻译出各语言下的标准翻译。
鉴于此,本发明可选实施方式中提供了一种App多语言测试的解决方案,利用OCR文字识别技术,只需要在提供不同语言截图的情况下,自动解析出翻译的正确性,以及在界面中出现的排版问题,缩短了测试时间,并降低了漏测率,提高了测试效率,大大降低了测试成本,下面对本发明可选实施例进行详细说明。
图2是本发明可选实施方式的截图存放目录结构示意图,如图2所示,本发明可选实施方式的测试对象为各语言下的界面截图,其中,截图存放在以语言简称命名的目录下,并且所有语言下的截图数量和名称一致,所有语言目录存放在同一个根目录下。
需要说明的是,该测试对象根据APP的不同而具有不同的截图存放目录结构。
图3是本发明可选实施方式的多语言标准文件模板示意图,如图3所示,本发明可选实施方式对测试对象进行测试的标准翻译以固定格式维护在Excel表格中,其中,第一行为每个语言的简称,与存放截图的目录名称保持一致,每一列为不同的语言翻译,同一行为同一个词条的不同语言翻译。
需要说明的是,该Excel表格根据APP的不同而具有不同的表格内容。
图4是本发明可选实施方式的多语言测试流程的流程图,如图4所示,下面对本发明可选实施方式的多语言测试流程进行说明,需要说明的是,本发明可选实施方式选择测试人员熟悉的英语EN(English)目录下的图片数量和图片名称为测试标准:
S1,获取EN目录下的一张图片,对图片进行处理,其中,图5是本发明可选实施方式的图片处理流程的流程图,如图5所示,图片处理的步骤如S2-S3;
S2,对图片进行灰度处理,过滤掉图片背景中的杂乱信息和干扰信息;
S3,调用特定的OCR文字识别接口,识别图片中的词条,得到图片中的所有词条;
S4,按顺序获取一个词条,假设该词条为第N个(N>=1);
S5,进入查找策略,其中,图6是本发明可选实施方式的查找策略的流程图,如图6所示,查找策略的步骤如S6-S12;
S6,在标准翻译文件中查找是否存在此词条;
S7,若存在,保存词条在标准翻译文件中的位置信息(行号、列号)至位置列表,执行步骤S11;
S8,若不存在,合并第N个和第N+1个词条,在标准翻译文件中查找,找到后保存位置信息(匹配到的词条是由连续的两个词条合并而成,保存此排版信息),执行步骤S11;
S9,若第N个和第N+1个词条合并后未找到,则合并第N个、第N+1个和第N+2个词条,继续查找,查找成功则保存位置信息、排版信息,执行步骤S11;
S10,若第N个、第N+1个和第N+2个词条合并后仍未找到,则进行模糊匹配,计算词条N与标准翻译的相似度,记录相似度最大的位置信息;
S11,若当前图片的所有词条未查找完成,继续执行步骤S4;
S12,若当前图片的所有词条都查找完毕,根据图2中本发明可选实施方式的截图存放目录结构示意图,切换下一个语言,获取该语言下同名图片;
S13,对图片进行灰度处理,过滤掉图片背景中的杂乱信息和干扰信息;
S14,调用特定的OCR文字识别接口,识别图片中的词条,得到图片中的所有词条;
S15,进入对比策略,其中,图7是本发明可选实施方式的对比策略的流程图,如图7所示,对比策略的步骤如S17-S25;
S16,按顺序获取一个词条,假设该词条为第M个(M>=1)
S17,根据标准翻译文件,计算当前语言所在列与英语EN所在列的偏移量,则当前词条在标准文件中的位置为位置列表(步骤S7-S9中生成)中第M个位置与偏移量;
S18,根据位置信息,从标准翻译文件中获取词条的标准翻译,并与当前词条对比;
S19,对比方法:对词条进行大小写折叠后,过滤掉所有空格和标点符号,检查词条是否与标准翻译一致;
S20,若对比相同,执行步骤S24;
S21,若对比不同,则合并第M个和第M+1个词条,继续与标准翻译对比;若一致,则保存排版信息(2行合并),执行步骤S24;
S22,若合并第M个和第M+1个词条后与标准翻译不一致,则合并第M个、第M+1个和第M+2个词条后与标准翻译对比,一致,则保存排版信息(3行合并),执行步骤S24;
S23,若合并第M个、第M+1个和第M+2个词条后与标准翻译仍不一致,进入模糊匹配,计算当前词条和标准翻译的相似度,将相似度结果输出到测试报告中,供测试人员分析;
S24,若当前图片的所有词条未查找完成,继续执行步骤S16;
S25,若当前图片中所有词条对比完成,则继续执行步骤S12,切换根目录下未测试的语言继续测试;
S26,若根目录下所有语言的同名图片都测试完成,则继续执行步骤S1,开始测试下一张图片,直至所有图片测试结束,输出测试结果。
通过上述可选实施方式,可以达到至少以下几点有益效果:
(1)提出了一套适用于App多语言测试的自动化测试方案;
(2)在多语言测试中,利用OCR文字识别结合图像处理技术,解决了人工测试时间长,效率低的问题;
(3)提出了一种查找策略和对比策略,能够有效的提取词条在界面的排版信息,检测由于语言不同导致词条排版差异的问题;
(4)提出了一种模糊匹配策略,在无法获取匹配结果时,通过计算相似度的方法,反馈最大匹配度,供测试人员分析;
(5)提出了一种多语言测试中的标准翻译文件模板,在该模板下,可选定熟知的语言为标准,并通过计算偏移量的方式来动态获取其他语言的标准翻译;
(6)提出了一种在多语言测试中的词条对比方法,能够有效排除文字识别精度低、人为录入标准翻译文件错误,导致测试不通过的情况。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述语言测试处理方法的装置,图8是根据本发明实施例的语言测试处理装置的结构框图,如图8所示,该装置包括:获取模块802,识别模块804和比较模块806,下面对该装置进行详细说明。
获取模块802,用于获取第一语言的第一界面图像;识别模块804,连接于上述获取模块802,用于采用光学字符识别OCR方法识别第一界面图像中的词条;比较模块806,连接于上述识别模块804,用于将识别出的词条与第一语言的第一标准翻译进行比较,得到第一语言的测试结果。
此处需要说明的是,上述获取模块802,识别模块804和比较模块806对应于实施语言测试处理方法中的步骤S102至步骤S106,多个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。
实施例3
本公开的实施例可以提供一种电子设备,该电子设备可以是一种终端。在本实施例中,该电子设备作为一种终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述终端也可以为移动终端等终端设备。
可选地,在本实施例中,上述终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,图9是根据一示例性实施例示出的一种终端的结构框图。如图9所示,该终端可以包括:一个或多个(图中仅示出一个)处理器91、用于存储处理器可执行指令的存储器92;其中,处理器被配置为执行指令,以实现上述任一项的语言测试处理方法。
其中,存储器可用于存储软件程序以及模块,如本公开实施例中的语言测试处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的语言测试处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取第一语言的第一界面图像;采用光学字符识别OCR方法识别第一界面图像中的词条;将识别出的词条与第一语言的第一标准翻译进行比较,得到第一语言的测试结果。
可选的,上述处理器还可以执行如下步骤的程序代码:将识别出的词条与第一语言的第一标准翻译进行比较,得到第一语言的测试结果,包括:对识别出的词条进行编号;针对第N个词条,查找第一标准翻译中是否存在第N个词条,其中,N>=1;在第一查找结果为第一标准翻译中存在第N个词条的情况下,记录第N个词条在第一标准翻译中的位置,直到识别出的所有词条均比较完成,得到第一语言的测试结果。
可选的,上述处理器还可以执行如下步骤的程序代码:在查找第一标准翻译中是否存在第N个词条之后,还包括:在第一查找结果为第一标准翻译中不存在第N个词条的情况下,将第N个词条逐次与第N个词条之后预定数量个词条进行合并,得到合并词条;查找第一标准翻译中是否存在合并词条;在第二查找结果为第一标准翻译中存在合并词条的情况下,记录合并词条在第一标准翻译中的位置,以及合并词条的排版信息。
可选的,上述处理器还可以执行如下步骤的程序代码:在查找第一标准翻译中是否存在合并词条之后,还包括:在第二查找结果为第一标准翻译中不存在合并词条的情况下,比较预定数量个合并词条中与第一标准翻译的相似度,得到相似度最大的目标合并词条;记录目标合并词条在第一标准翻译中的位置,以及目标合并词条的排版信息。
可选的,上述处理器还可以执行如下步骤的程序代码:该方法还包括:获取第二语言的第二界面图像;采用OCR方法识别第二界面图像中的词条;将识别出的词条与第二语言的第二标准翻译进行比较,得到第二语言的测试结果,其中,第二标准翻译的位置与第一标准翻译的位置相差预定偏移量。
可选的,上述处理器还可以执行如下步骤的程序代码:在采用OCR方法识别第一界面图像中的词条之前,还包括:对第一界面图像进行灰度处理,得到滤除干扰信息后的第一界面图像;和/或,在采用OCR方法识别第二界面图像中的词条之前,还包括:对第二界面图像进行灰度处理,得到滤除干扰信息后的第二界面图像。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,当计算机可读存储介质中的指令由终端的处理器执行时,使得终端能够执行上述任一项的语言测试处理方法。可选地,计算机可读存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
可选地,在本实施例中,上述计算机可读存储介质可以用于保存上述实施例所提供的语言测试处理方法所执行的程序代码。
可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取第一语言的第一界面图像;采用光学字符识别OCR方法识别第一界面图像中的词条;将识别出的词条与第一语言的第一标准翻译进行比较,得到第一语言的测试结果。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:将识别出的词条与第一语言的第一标准翻译进行比较,得到第一语言的测试结果,包括:对识别出的词条进行编号;针对第N个词条,查找第一标准翻译中是否存在第N个词条,其中,N>=1;在第一查找结果为第一标准翻译中存在第N个词条的情况下,记录第N个词条在第一标准翻译中的位置,直到识别出的所有词条均比较完成,得到第一语言的测试结果。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:在查找第一标准翻译中是否存在第N个词条之后,还包括:在第一查找结果为第一标准翻译中不存在第N个词条的情况下,将第N个词条逐次与第N个词条之后预定数量个词条进行合并,得到合并词条;查找第一标准翻译中是否存在合并词条;在第二查找结果为第一标准翻译中存在合并词条的情况下,记录合并词条在第一标准翻译中的位置,以及合并词条的排版信息。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:在查找第一标准翻译中是否存在合并词条之后,还包括:在第二查找结果为第一标准翻译中不存在合并词条的情况下,比较预定数量个合并词条中与第一标准翻译的相似度,得到相似度最大的目标合并词条;记录目标合并词条在第一标准翻译中的位置,以及目标合并词条的排版信息。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:该方法还包括:获取第二语言的第二界面图像;采用OCR方法识别第二界面图像中的词条;将识别出的词条与第二语言的第二标准翻译进行比较,得到第二语言的测试结果,其中,第二标准翻译的位置与第一标准翻译的位置相差预定偏移量。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:在采用OCR方法识别第一界面图像中的词条之前,还包括:对第一界面图像进行灰度处理,得到滤除干扰信息后的第一界面图像;和/或,在采用OCR方法识别第二界面图像中的词条之前,还包括:对第二界面图像进行灰度处理,得到滤除干扰信息后的第二界面图像。
在示例性实施例中,还提供了一种计算机程序产品,当计算机程序产品中的计算机程序由电子设备的处理器执行时,使得电子设备能够执行上述任一项的语言测试处理方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种语言测试处理方法,其特征在于,包括:
获取第一语言的第一界面图像;
采用光学字符识别OCR方法识别所述第一界面图像中的词条;
将识别出的词条与所述第一语言的第一标准翻译进行比较,得到所述第一语言的测试结果。
2.根据权利要求1所述的方法,其特征在于,所述将识别出的词条与所述第一语言的第一标准翻译进行比较,得到所述第一语言的测试结果,包括:
对识别出的词条进行编号;
针对第N个词条,查找所述第一标准翻译中是否存在所述第N个词条,其中,N>=1;
在第一查找结果为所述第一标准翻译中存在所述第N个词条的情况下,记录所述第N个词条在所述第一标准翻译中的位置,直到识别出的所有词条均比较完成,得到所述第一语言的测试结果。
3.根据权利要求2所述的方法,其特征在于,在查找所述第一标准翻译中是否存在所述第N个词条之后,还包括:
在第一查找结果为所述第一标准翻译中不存在所述第N个词条的情况下,将所述第N个词条逐次与所述第N个词条之后预定数量个词条进行合并,得到合并词条;
查找所述第一标准翻译中是否存在所述合并词条;
在第二查找结果为所述第一标准翻译中存在所述合并词条的情况下,记录所述合并词条在所述第一标准翻译中的位置,以及所述合并词条的排版信息。
4.根据权利要求3所述的方法,其特征在于,在所述查找所述第一标准翻译中是否存在所述合并词条之后,还包括:
在第二查找结果为所述第一标准翻译中不存在所述合并词条的情况下,比较预定数量个合并词条中与所述第一标准翻译的相似度,得到相似度最大的目标合并词条;
记录所述目标合并词条在所述第一标准翻译中的位置,以及所述目标合并词条的排版信息。
5.根据权利要求1至4中任一项所述的方法,其特征在于,还包括:
获取第二语言的第二界面图像;
采用所述OCR方法识别所述第二界面图像中的词条;
将识别出的词条与所述第二语言的第二标准翻译进行比较,得到所述第二语言的测试结果,其中,所述第二标准翻译的位置与所述第一标准翻译的位置相差预定偏移量。
6.根据权利要求5所述的方法,其特征在于,
在采用所述OCR方法识别所述第一界面图像中的词条之前,还包括:对所述第一界面图像进行灰度处理,得到滤除干扰信息后的第一界面图像;
和/或,
在采用所述OCR方法识别所述第二界面图像中的词条之前,还包括:对所述第二界面图像进行灰度处理,得到滤除干扰信息后的第二界面图像。
7.一种语言测试处理装置,其特征在于,包括:
获取模块,用于获取第一语言的第一界面图像;
识别模块,用于采用光学字符识别OCR方法识别所述第一界面图像中的词条;
比较模块,用于将识别出的词条与所述第一语言的第一标准翻译进行比较,得到所述第一语言的测试结果。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的语言测试处理方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至6中任一项所述的语言测试处理方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的语言测试处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110715011.8A CN113435217B (zh) | 2021-06-25 | 2021-06-25 | 语言测试处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110715011.8A CN113435217B (zh) | 2021-06-25 | 2021-06-25 | 语言测试处理方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113435217A true CN113435217A (zh) | 2021-09-24 |
CN113435217B CN113435217B (zh) | 2023-12-19 |
Family
ID=77754705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110715011.8A Active CN113435217B (zh) | 2021-06-25 | 2021-06-25 | 语言测试处理方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435217B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114637845A (zh) * | 2022-03-11 | 2022-06-17 | 上海弘玑信息技术有限公司 | 模型测试方法、装置、设备和存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101702154A (zh) * | 2008-07-10 | 2010-05-05 | 三星电子株式会社 | 对基于照相机的图像中的字符进行识别和翻译的方法 |
JP2011100356A (ja) * | 2009-11-06 | 2011-05-19 | Sharp Corp | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム |
CN107797996A (zh) * | 2017-11-24 | 2018-03-13 | 中国银行股份有限公司 | 一种词条翻译方法及装置 |
CN110245606A (zh) * | 2019-06-13 | 2019-09-17 | 广东小天才科技有限公司 | 一种文本识别方法、装置、设备及存储介质 |
CN111143001A (zh) * | 2019-12-23 | 2020-05-12 | Tcl海外电子(惠州)有限公司 | 终端的语言检测方法、用户设备、存储介质及装置 |
CN111159036A (zh) * | 2019-12-28 | 2020-05-15 | 苏州浪潮智能科技有限公司 | 产品翻译功能准确性测试方法、系统、终端及存储介质 |
CN111523307A (zh) * | 2020-03-10 | 2020-08-11 | 南京晓庄学院 | 一种基于符号标记的在线翻译生词笔记生成系统 |
CN111563391A (zh) * | 2020-04-28 | 2020-08-21 | 北京金山云网络技术有限公司 | 机器翻译方法、装置及电子设备 |
CN112100063A (zh) * | 2020-08-31 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 界面语言的显示测试方法、装置、计算机设备和存储介质 |
US20210150201A1 (en) * | 2019-11-20 | 2021-05-20 | Sap Se | Positional embeddings for document processing |
-
2021
- 2021-06-25 CN CN202110715011.8A patent/CN113435217B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101702154A (zh) * | 2008-07-10 | 2010-05-05 | 三星电子株式会社 | 对基于照相机的图像中的字符进行识别和翻译的方法 |
JP2011100356A (ja) * | 2009-11-06 | 2011-05-19 | Sharp Corp | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム |
CN107797996A (zh) * | 2017-11-24 | 2018-03-13 | 中国银行股份有限公司 | 一种词条翻译方法及装置 |
CN110245606A (zh) * | 2019-06-13 | 2019-09-17 | 广东小天才科技有限公司 | 一种文本识别方法、装置、设备及存储介质 |
US20210150201A1 (en) * | 2019-11-20 | 2021-05-20 | Sap Se | Positional embeddings for document processing |
CN111143001A (zh) * | 2019-12-23 | 2020-05-12 | Tcl海外电子(惠州)有限公司 | 终端的语言检测方法、用户设备、存储介质及装置 |
CN111159036A (zh) * | 2019-12-28 | 2020-05-15 | 苏州浪潮智能科技有限公司 | 产品翻译功能准确性测试方法、系统、终端及存储介质 |
CN111523307A (zh) * | 2020-03-10 | 2020-08-11 | 南京晓庄学院 | 一种基于符号标记的在线翻译生词笔记生成系统 |
CN111563391A (zh) * | 2020-04-28 | 2020-08-21 | 北京金山云网络技术有限公司 | 机器翻译方法、装置及电子设备 |
CN112100063A (zh) * | 2020-08-31 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 界面语言的显示测试方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
黄瑾 等: "基于信息检索方法的统计翻译系统训练数据选择与优化", 《中文信息学报》, no. 2, pages 40 - 46 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114637845A (zh) * | 2022-03-11 | 2022-06-17 | 上海弘玑信息技术有限公司 | 模型测试方法、装置、设备和存储介质 |
CN114637845B (zh) * | 2022-03-11 | 2023-04-14 | 上海弘玑信息技术有限公司 | 模型测试方法、装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113435217B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108287858B (zh) | 自然语言的语义提取方法及装置 | |
US8073680B2 (en) | Language detection service | |
CN111176996A (zh) | 测试用例生成方法、装置、计算机设备及存储介质 | |
CN105843800A (zh) | 一种基于doi的语言信息展示方法及装置 | |
CN108121455B (zh) | 识别纠正方法及装置 | |
CN111367595B (zh) | 数据处理方法、程序运行方法、装置及处理设备 | |
CN113868568A (zh) | 一种网页关键字高亮方法、装置、设备及存储介质 | |
CN111198936A (zh) | 一种语音搜索方法、装置、电子设备及存储介质 | |
CN113435217B (zh) | 语言测试处理方法、装置及电子设备 | |
CN114359533A (zh) | 一种基于页面文本的页码识别方法和计算机设备 | |
JP2022055305A (ja) | テキスト要約を生成するテキスト処理方法、装置、デバイス及び記憶媒体 | |
CN111126201B (zh) | 剧本中人物识别方法及装置 | |
CN116306498B (zh) | 文字渲染方法及装置 | |
CN111046627A (zh) | 一种中文文字显示方法及系统 | |
CN117421413A (zh) | 一种问答对生成方法、装置及电子设备 | |
CN109712613B (zh) | 语义分析库更新方法、装置及电子设备 | |
CN111240962A (zh) | 测试方法、装置、计算机设备及计算机存储介质 | |
CN111241276A (zh) | 题目搜索方法、装置、设备及存储介质 | |
CN110010131B (zh) | 一种语音信息处理的方法和装置 | |
CN114220113A (zh) | 一种论文质量检测方法、装置和设备 | |
CN109783679B (zh) | 一种学习辅助方法及学习设备 | |
CN113688625A (zh) | 一种语种识别方法及装置 | |
CN111507082A (zh) | 文本处理方法和装置、存储介质和电子装置 | |
US10789245B2 (en) | Semiconductor parts search method using last alphabet deletion algorithm | |
CN112287738A (zh) | 图形控件的文本匹配方法及装置、介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |