CN112417899A - 文字翻译方法、装置、计算机设备和存储介质 - Google Patents

文字翻译方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112417899A
CN112417899A CN202011315138.2A CN202011315138A CN112417899A CN 112417899 A CN112417899 A CN 112417899A CN 202011315138 A CN202011315138 A CN 202011315138A CN 112417899 A CN112417899 A CN 112417899A
Authority
CN
China
Prior art keywords
translated
phrase
translation
interface
fails
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011315138.2A
Other languages
English (en)
Inventor
陈怡�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202011315138.2A priority Critical patent/CN112417899A/zh
Publication of CN112417899A publication Critical patent/CN112417899A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本申请涉及语言翻译领域,通过对文字信息进行分词处理后进行翻译,并对翻译失败的词组进行人工翻译以及将翻译失败的待翻译词组与翻译结果关联存储,提高了文字翻译的准确度和效率。涉及一种文字翻译方法、装置、计算机设备和存储介质,该方法包括:对在预设的翻译界面中的目标文件进行文字识别,得到目标文件对应的文字信息;对文字信息进行分词处理,得到文字信息对应的待翻译词组;对每个待翻译词组进行翻译,并提示翻译失败的待翻译词组;当检测到对翻译失败的待翻译词组的翻译操作时,根据翻译操作对翻译失败的待翻译词组进行翻译,并将翻译失败的待翻译词组与对应的翻译结果关联存储。本申请还涉及区块链技术,目标文件可存储于区块链中。

Description

文字翻译方法、装置、计算机设备和存储介质
技术领域
本申请涉及语言翻译领域,尤其涉及一种文字翻译方法、装置、计算机设备和存储介质。
背景技术
随着经济的不断发展,越来越多的企业积极开发海外市场。对于现有的产品,大多数企业倾向于采用更加低成本的方式投放到海外市场,例如对产品进行文字翻译,将翻译后的产品投放于海外市场。
现有的文字翻译方法一般是采用现有的语言包进行翻译或人工翻译。在采用现有的语言包进行翻译时,对于长段文字的翻译效果较差,并且对于一些场景中的特定意义词汇的翻译不准确。在人工翻译时,若产品的首个版本产生多个新词汇,则需要人工摘选出新增的词汇生成文档提供给翻译人员;翻译人员在根据文档进行各语言的翻译时,无法结合实际的语境,难以给出最合适的翻译结果,极大地降低翻译的准确度和效率。
因此如何提高文字翻译的准确度和效率成为亟需解决的问题。
发明内容
本申请提供了一种文字翻译方法、装置、计算机设备和存储介质,通过对文字信息进行分词处理后进行翻译,并对翻译失败的词组进行人工翻译以及将翻译失败的待翻译词组与翻译结果关联存储,有效提高了文字翻译的准确度和效率。
第一方面,本申请提供了一种文字翻译方法,所述方法包括:
对在预设的翻译界面中的目标文件进行文字识别,得到所述目标文件对应的文字信息;
对所述文字信息进行分词处理,得到所述文字信息对应的至少一个待翻译词组;
对每个所述待翻译词组进行翻译,并提示翻译失败的所述待翻译词组;
当检测到对翻译失败的所述待翻译词组的翻译操作时,根据所述翻译操作对翻译失败的所述待翻译词组进行翻译,并将翻译失败的所述待翻译词组与对应的翻译结果关联存储。
第二方面,本申请还提供了一种文字翻译装置,所述装置包括:
文字识别模块,用于对在预设的翻译界面中的目标文件进行文字识别,得到所述目标文件对应的文字信息;
分词处理模块,用于对所述文字信息进行分词处理,得到所述文字信息对应的至少一个待翻译词组;
第一词组翻译模块,用于对每个所述待翻译词组进行翻译,并提示翻译失败的所述待翻译词组;
第二词组翻译模块,用于当检测到对翻译失败的所述待翻译词组的翻译操作时,根据所述翻译操作对翻译失败的所述待翻译词组进行翻译,并将翻译失败的所述待翻译词组与对应的翻译结果关联存储。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的文字翻译方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的文字翻译方法。
本申请公开了一种文字翻译方法、装置、计算机设备和存储介质,通过对在预设的翻译界面中的目标文件进行文字识别,可以得到目标文件对应的文字信息;通过对文字信息进行分词处理,得到文字信息对应的至少一个待翻译词组;通过对每个待翻译词组进行翻译,可以实现自动翻译,提高了文字翻译的效率;通过提示翻译失败的待翻译词组,可以在检测到对翻译失败的待翻译词组的翻译操作时,根据翻译操作对翻译失败的待翻译词组进行翻译,并将翻译失败的待翻译词组与对应的翻译结果关联存储,有效提高了文字翻译的准确度。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种文字翻译方法的示意性流程图;
图2是本申请实施例提供的对文字信息进行分词处理的子步骤的示意性流程图;
图3是本申请实施例提供的一种翻译界面的示意图;
图4是本申请实施例提供的对每个待翻译词组进行翻译的子步骤的示意性流程图;
图5是本申请实施例提供的在悬浮界面显示每个待翻译词组的子步骤的示意性流程图;
图6是本申请实施例提供的一种在悬浮界面显示每个待翻译词组的示意图;
图7是本申请实施例提供的一种得到每个待翻译词组对应的翻译结果的示意图;
图8是本申请实施例提供的一种根据翻译操作对翻译失败的待翻译词组进行翻译的示意图;
图9是本申请实施例提供的一种文字翻译装置的示意性框图;
图10是本申请实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请的实施例提供了一种文字翻译方法、装置、计算机设备和存储介质。其中,该文字翻译方法可以应用于服务器或终端中,通过对文字信息进行分词处理后进行翻译,并对翻译失败的词组进行人工翻译以及将翻译失败的待翻译词组与翻译结果关联存储,有效提高了文字翻译的准确度和效率。
其中,服务器可以为独立的服务器,也可以为服务器集群。终端可以是智能手机、平板电脑、笔记本电脑以及台式电脑等电子设备。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
如图1所示,文字翻译方法包括步骤S10至步骤S40。
步骤S10、对在预设的翻译界面中的目标文件进行文字识别,得到所述目标文件对应的文字信息。
需要说明的是,本申请实施例提供的文字翻译方法可以应用于服务器或终端中的文字翻译系统中。用户可以登录文字翻译系统,并上传或从数据库中选中目标文件,由文字翻译系统自动对目标文件进行自动文字识别与文字翻译,得到目标文件对应的翻译结果。
其中,文字翻译系统预设有翻译界面,翻译界面用于加载并显示目标文件。在本申请实施例中,可以将用户上传的目标文件加载至翻译界面中,也可以根据用户的选中操作将预先存储在数据库中的目标文件加载至翻译界面中。
示例性的,目标文件可以包括但不限于页面、图片以及文本文件等等。
示例性的,目标文件可以包括至少一个。例如,可以依次将目标文件A、目标文件B以及目标文件C加载至翻译界面进行文字识别和翻译,得到目标文件A、目标文件B以及目标文件C各自对应的翻译结果。
需要强调的是,为进一步保证上述目标文件的私密和安全性,上述目标文件还可以存储于一区块链的节点中。
在一些实施例中,可以基于预设的图像文字识别算法,对在预设的翻译界面中的目标文件进行文字识别,得到目标文件对应的文字信息。
示例性的,预设的图像文字识别算法可以包括OCR(Optical CharacterRecognition,光学字符识别)算法。需要说明的是,OCR算法用于对图片、表格等文件进行分析与识别处理,以获取文字及版面信息。在本申请实施例中,可以通过OCR算法对目标文件进行文字的检测和识别,从而得到目标文件对应的文字信息。
通过基于图像文字识别算法对翻译界面中的目标文件进行文字识别,可以快速、便捷地得到目标文件对应的文字信息。
步骤S20、对所述文字信息进行分词处理,得到所述文字信息对应的至少一个待翻译词组。
需要说明的是,在根据OCR算法对目标文件进行文字识别时,有可能会将目标文件中的相邻的但位置或字体大小不同的文字合并成一段,因此需要对文字识别得到的文字信息进行分词处理;从而后续可以根据文字的实际场景进行翻译,可以有效提高了文字翻译的准确度。
请参阅图2,图2是本申请实施例提供的对文字信息进行分词处理的子步骤的示意性流程图,具体可以包括以下步骤S201和步骤S202。
步骤S201、获取所述文字信息中的每个所述语句对应的文字属性信息。
其中,文字信息可以包括至少一个语句。
示例性的,文字属性信息可以包括但不限于字体大小、背景颜色以及位置坐标等等。
在本申请实施例中,可以识别并获取每个语句在翻译界面中的字体大小、背景颜色以及位置坐标。
示例性的,文字属性信息还可以包括字体类型和字体粗细。例如,字体类型可以包括宋体、楷体以及黑体等等。
步骤S202、根据每个所述语句对应的所述文字属性信息对每个所述语句进行分词,将得到的词组作为所述文字信息对应的所述待翻译词组。
示例性的,可以根据每个语句对应的字体大小、背景颜色以及位置坐标中的其中一个或多个,对每个语句进行分词,得到每个语句对应的至少一个词组。然后将得到的词组作为文字信息对应的待翻译词组。
请参阅图3,图3是本申请实施例提供的一种翻译界面的示意图。如图3所示,对于文字信息中的语句“查看账单有退款”,由于“查看账单”对应的字体大小与“有退款”对应的字体大小不同,因此可以将语句“查看账单有退款”分成两个词组,分别为词组“查看账单”与词组“有退款”。
示例性的,如图3所示,对于文字信息中的语句“您有84积分将在30天内过期”,由于“您有84积分将在30天内过期”中的各字对应的字体大小、背景颜色均相同,且处于同一水平的位置坐标,因此可以将语句“您有84积分将在30天内过期”划分为一个词组。
在本申请实施例中,可以结合文字信息的语句的实际场景,灵活地根据每个语句对应的字体大小、背景颜色以及位置坐标中的其中一个或多个,对每个语句进行分词。此外,还可以根据语句对应的字体类型和字体粗细,实现对语句进行分词。例如,将不同字体类型的语句划分为不同的词组。
示例性的,将每个语句在分词后得到的词组,作为文字信息对应的待翻译词组。例如,词组“查看账单”、词组“有退款”以及词组“您有84积分将在30天内过期”都可以作为待翻译词组。
通过根据每个语句对应的文字属性信息对每个语句进行分词,可以快速地得到文字信息对应的待翻译词组,从而提高了文字翻译的效率。
步骤S30、对每个所述待翻译词组进行翻译,并提示翻译失败的所述待翻译词组。
需要说明的是,在得到文字信息对应的待翻译词组之后,可以对每个待翻译词组进行翻译,得到每个待翻译词组对应的翻译结果。
请参阅图4,图4是本申请实施例提供的对每个待翻译词组进行翻译的子步骤的示意性流程图,具体可以包括以下步骤S301至步骤S304。
步骤S301、显示所述翻译界面对应的悬浮界面,在所述悬浮界面显示每个所述待翻译词组。
需要说明的是,在本申请实施例中,步骤S30中对每个待翻译词组进行翻译之前,需要显示翻译界面对应的悬浮界面,以在悬浮界面显示每个待翻译词组。
示例性的,可以在翻译界面的相对上方显示悬浮界面。其中,悬浮界面的大小与翻译界面相同。需要说明的是,通过显示翻译界面对应的悬浮界面,可以在悬浮界面中显示待翻译词组,后续可以对悬浮界面中的待翻译词组进行翻译,实现可视化翻译的效果。
请参阅图5,图5是本申请实施例提供的在悬浮界面显示每个待翻译词组的子步骤的示意性流程图,具体可以包括以下步骤S3011至步骤S3013。
步骤S3011、获取每个所述待翻译词组在所述翻译界面中的第一位置坐标。
示例性的,可以在翻译界面建立直角坐标系。例如,以翻译界面的左下角为原点,翻译界面的宽为横坐标轴x,翻译界面的高为纵坐标轴y。
示例性的,获取每个待翻译词组在翻译界面的直角坐标系中的第一位置坐标。
例如,词组“查看账单”在直角坐标系中的第一位置坐标为{(20,60),(40,80)};其中,(20,60)表示词组“查看账单”的左下角,(40,80)表示词组“查看账单”的右上角。
又例如,词组“有退款”在直角坐标系中的第一位置坐标为{(50,60),(70,80)}。
步骤S3012、根据所述第一位置坐标确定每个所述待翻译词组在所述悬浮界面中的第二位置坐标。
示例性的,还可以在悬浮界面建立直角坐标系。例如,以悬浮界面的左下角为原点,悬浮界面的宽为横坐标轴x,悬浮界面的高为纵坐标轴y。
示例性的,确定每个待翻译词组在悬浮界面的直角坐标系中的第二位置坐标。在本申请实施例中,待翻译词组对应的第一位置坐标可以与第二位置坐标相同。
例如,若词组“查看账单”在翻译界面中的第一位置坐标为{(20,60),(40,80)},则可以确定词组“查看账单”在悬浮界面中的第二位置坐标也是{(20,60),(40,80)}。
步骤S3013、根据所述第二位置坐标,在所述悬浮界面显示每个所述待翻译词组。
在一些实施例中,可以根据每个待翻译词组在悬浮界面中对应的第二位置坐标,将每个待翻译词组渲染至悬浮界面,以在悬浮界面显示每个待翻译词组。示例性的,如图6所示,图6是本申请实施例提供的一种在悬浮界面显示每个待翻译词组的示意图。
需要说明的是,渲染是指各种资源或数据通过浏览器渲染引擎的解析,输出可视化的图像或网页的过程。
通过显示翻译界面对应的悬浮界面并在悬浮界面显示待翻译词组,后续可以直接对悬浮界面中的待翻译词组进行翻译并得到翻译后的悬浮界面,从而可以保存悬浮界面或对悬浮界面中的文字内容复制使用。
步骤S302、确定所述待翻译词组对应的目标语种。
在本申请实施例中,对待翻译词组进行翻译之前,需要确定待翻译词组对应的目标语种。
需要说明的是,可以在翻译界面或悬浮界面设置语种选项,用户可以通过语种选项选择需要翻译的语种。示例性的,可以根据用户的语种选中操作确定目标语种。
示例性的,语种可以包括但不限于英文、日文、德文以及韩文等等。
步骤S303、基于预设的语种与数据库之间的对应关系,根据所述目标语种确定目标数据库。
需要说明的是,可以在本地磁盘存储不同语种的数据库。例如,英文数据库、德文数据库以及韩文数据库等等。在本申请实施例中,可以预先将不同的语种与对应的数据库进行关联,从而后续可以方便地根据目标语种确定待翻译词组对应的目标数据库。
示例性的,若待翻译词组对应的目标语种为英文,则可以确定待翻译词组对应的目标数据库为英文数据库。
示例性的,若待翻译词组对应的目标语种为德文,则可以确定待翻译词组对应的目标数据库为德文数据库。
通过根据用户的语种选中操作确定目标语种,进而可以根据目标语种确定目标数据库,实现将待翻译词组翻译成不同的语言文字。
步骤S304、基于所述目标数据库,对每个所述待翻译词组进行文字匹配,得到每个所述待翻译词组对应的翻译结果。
需要说明的是,每个数据库中,存储有词组和词组对应的翻译词。其中,词组可以是中文词组,也可以是其它语言的词组。
示例性的,在英文数据库中,中文词组“产品”对应的翻译词为“product”;中文词组“借款”对应的翻译词为“loan”。示例性的,在德文数据库中,中文词组“产品”对应的翻译词为“produkte”;中文词组“借款”对应的翻译词为“anleihen”。
在本申请实施例中,可以基于目标数据库,对每个待翻译词组进行文字匹配。若待翻译词组在目标数据库中存在匹配的翻译词,则确定该待翻译词组翻译成功;若待翻译词组在目标数据库中不存在匹配的翻译词,则确定该待翻译词组翻译失败。
请参阅图7,图7是本申请实施例提供的一种得到每个待翻译词组对应的翻译结果的示意图。
示例性的,对于待翻译词组“查看账单”,若待翻译词组“查看账单”在目标数据库中存在匹配的翻译词“Check the bill”,则可以确定待翻译词组“查看账单”对应的翻译结果为“Check the bill”。
示例性的,对于待翻译词组“有退款”,若待翻译词组“有退款”在目标数据库中不存在匹配的翻译词,则可以确定待翻译词组“有退款”翻译失败。
通过根据用户的语种选中操作确定目标语种,进而可以根据目标语种确定目标数据库,实现基于目标数据库对待翻译词组进行翻译。
需要说明的是,在对每个待翻译词组进行文字匹配,得到每个待翻译词组对应的翻译结果之后,用户可以对翻译成功的待翻译词组对应的翻译结果进行修改。
在一些实施例中,基于目标数据库,对每个待翻译词组进行文字匹配,得到每个待翻译词组对应的翻译结果之后,还可以包括:若检测到对目标语种的切换操作,则根据切换操作对目标语种进行切换,得到切换后的目标语种;基于切换后的目标语种对应的目标数据库,对每个待翻译词组再次进行文字匹配,得到每个待翻译词组对应的翻译结果。
通过根据用户的切换操作,对目标语种进行切换并进行二次翻译,可以更加灵活地得到待翻译词组对应的不同语言的翻译结果。
在一些实施例中,对每个待翻译词组进行翻译之后,还可以包括:当检测到对待翻译词组对应的翻译结果的修改操作时,根据修改操作对翻译结果进行修改,得到修改后的翻译结果;根据修改后的翻译结果,对目标数据库中与待翻译词组对应的翻译词进行更新。
示例性的,可以接收用户在悬浮界面对待翻译词组对应的翻译结果的修改操作,并根据用户的修改操作对翻译结果进行修改。
通过根据用户的修改操作对翻译结果进行修改,可以实现人工对存在错误的翻译结果进行修改,有效提高翻译结果的准确度。通过根据修改后的翻译结果,对目标数据库中与待翻译词组对应的翻译词进行更新,可以使得下一次对相同的词组进行翻译时,自动进行文字匹配,保证翻译结果的一致性,从而提高了文字翻译的准确度和效率。
在一些实施例中,提示翻译失败的待翻译词组,可以包括:在悬浮界面对翻译失败的待翻译词组添加异常标记。
需要说明的是,如果待翻译词组翻译失败,说明目标数据库中没有该待翻译词组对应的翻译词,因此需要对翻译失败的待翻译词组添加异常标记,以便用户对翻译失败的待翻译词组进行人工翻译。可以理解的是,翻译失败的待翻译词组可以理解为新增的词组,即目标数据库没有录入的词组。
示例性的,如图7所示,当翻译失败的待翻译词组为“有退款”时,可以对词组“有退款”添加方框;也可以对词组“有退款”进行高亮化。当然异常标记还可以是其它形式,异常标记的具体形式在此不作限定。
通过对翻译失败的待翻译词组添加异常标记,可以更加便捷地得到新增的词组,无需人工筛选,进而减轻工作量和提高了翻译的效率。
步骤S40、当检测到对翻译失败的所述待翻译词组的翻译操作时,根据所述翻译操作对翻译失败的所述待翻译词组进行翻译,并将翻译失败的所述待翻译词组与对应的翻译结果关联存储。
在本申请实施例中,用户可以在悬浮界面对携带异常标记的待翻译词组进行人工翻译。
示例性的,当检测到用户对翻译失败的待翻译词组的翻译操作时,根据翻译操作对翻译失败的待翻译词组进行翻译,并将翻译失败的待翻译词组与对应的翻译结果关联存储至目标数据库中。
请参阅图8,图8是本申请实施例提供的一种根据翻译操作对翻译失败的待翻译词组进行翻译的示意图。如图8所示,可以根据用户的翻译操作将翻译失败的待翻译词组“有退款”翻译成“Have refundment”。
通过根据翻译操作对携带异常标记的待翻译词组进行翻译,可以便捷地录入新增的词汇,省去了人工筛选新词组的工作量和避免重复性工作,提高了翻译的效率。
需要说明的是,在本申请实施例中,在对每个待翻译词组进行文字匹配,得到每个待翻译词组对应的翻译结果之后,用户还可以保存悬浮界面中的翻译结果。此外,用户还可以在对翻译结果进行修改后或对翻译失败的待翻译词组进行翻译后,保存翻译结果。
在一些实施例中,当检测到用户对悬浮界面中的翻译结果的存储操作时,根据存储操作存储翻译结果。
示例性的,用户可以复制悬浮界面中的翻译结果,并保存到预设的文件中;用户还可以对悬浮界面进行截图,将悬浮界面的截图存储至本地数据库中。
需要强调的是,为进一步保证上述翻译结果或悬浮界面的截图的私密和安全性,上述翻译结果或悬浮界面的截图还可以存储于一区块链的节点中。
通过根据用户的存储操作对悬浮界面或翻译结果进行存储,可以后续可以方便地查看或调用悬浮界面或翻译结果。
上述实施例提供的文字翻译方法,通过基于图像文字识别算法对翻译界面中的目标文件进行文字识别,可以快速、便捷地得到目标文件对应的文字信息;通过根据每个语句对应的文字属性信息对每个语句进行分词,可以快速地得到文字信息对应的待翻译词组,从而提高了文字翻译的效率;通过显示翻译界面对应的悬浮界面并在悬浮界面显示待翻译词组,后续可以直接对悬浮界面中的待翻译词组进行翻译并得到翻译后的悬浮界面,从而可以保存悬浮界面或对悬浮界面中的文字内容复制使用;通过根据用户的语种选中操作确定目标语种,进而可以根据目标语种确定目标数据库,实现基于目标数据库对待翻译词组进行翻译;通过根据用户的修改操作对翻译结果进行修改,可以实现人工对存在错误的翻译结果进行修改,有效提高翻译结果的准确度;通过根据修改后的翻译结果,对目标数据库中与待翻译词组对应的翻译词进行更新,可以使得下一次对相同的词组进行翻译时,自动进行文字匹配,保证翻译结果的一致性,从而提高了文字翻译的准确度和效率;通过根据翻译操作对携带异常标记的待翻译词组进行翻译,可以便捷地录入新增的词汇,省去了人工筛选新词组的工作量和避免重复性工作,提高了翻译的效率;通过根据用户的存储操作对悬浮界面或翻译结果进行存储,可以后续可以方便地查看或调用悬浮界面或翻译结果。
请参阅图9,图9是本申请的实施例还提供一种文字翻译装置1000的示意性框图,该文字翻译装置用于执行前述的文字翻译方法。其中,该文字翻译装置可以配置于服务器或终端。
如图9所示,该文字翻译装置1000,包括:文字识别模块1001、分词处理模块1002、第一词组翻译模块1003和第二词组翻译模块1004。
文字识别模块1001,用于对在预设的翻译界面中的目标文件进行文字识别,得到所述目标文件对应的文字信息;
分词处理模块1002,用于对所述文字信息进行分词处理,得到所述文字信息对应的至少一个待翻译词组;
第一词组翻译模块1003,用于对每个所述待翻译词组进行翻译,并提示翻译失败的所述待翻译词组;
第二词组翻译模块1004,用于当检测到对翻译失败的所述待翻译词组的翻译操作时,根据所述翻译操作对翻译失败的所述待翻译词组进行翻译,并将翻译失败的所述待翻译词组与对应的翻译结果关联存储。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
上述的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图10所示的计算机设备上运行。
请参阅图10,图10是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器或终端。
请参阅图10,该计算机设备包括通过系统总线连接的处理器和存储器,其中,存储器可以包括非易失性存储介质和内存储器。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种文字翻译方法。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
对在预设的翻译界面中的目标文件进行文字识别,得到所述目标文件对应的文字信息;对所述文字信息进行分词处理,得到所述文字信息对应的至少一个待翻译词组;对每个所述待翻译词组进行翻译,并提示翻译失败的所述待翻译词组;当检测到对翻译失败的所述待翻译词组的翻译操作时,根据所述翻译操作对翻译失败的所述待翻译词组进行翻译,并将翻译失败的所述待翻译词组与对应的翻译结果关联存储。
在一个实施例中,所述文字信息包括至少一个语句;所述处理器在实现对所述文字信息进行分词处理,得到所述文字信息对应的至少一个待翻译词组时,用于实现:
获取所述文字信息中的每个所述语句对应的文字属性信息;根据每个所述语句对应的所述文字属性信息对每个所述语句进行分词,将得到的词组作为所述文字信息对应的所述待翻译词组;所述文字属性信息包括字体大小、背景颜色以及位置坐标。
在一个实施例中,所述处理器在实现对所述待翻译词组进行翻译之前,还用于实现:
显示所述翻译界面对应的悬浮界面,在所述悬浮界面显示每个所述待翻译词组。
在一个实施例中,所述处理器在实现对每个所述待翻译词组进行翻译时,用于实现:
确定所述待翻译词组对应的目标语种;基于预设的语种与数据库之间的对应关系,根据所述目标语种确定目标数据库;基于所述目标数据库,对每个所述待翻译词组进行文字匹配,得到每个所述待翻译词组对应的翻译结果。
在一个实施例中,所述处理器在对每个所述待翻译词组进行翻译之后,还用于实现:
当检测到对所述待翻译词组对应的所述翻译结果的修改操作时,根据所述修改操作对所述翻译结果进行修改,得到修改后的翻译结果;根据所述修改后的翻译结果,对所述目标数据库中与所述待翻译词组对应的翻译词进行更新。
在一个实施例中,所述处理器在实现在所述悬浮界面显示每个所述待翻译词组时,用于实现:
获取每个所述待翻译词组在所述翻译界面中的第一位置坐标;根据所述第一位置坐标确定每个所述待翻译词组在所述悬浮界面中的第二位置坐标;根据所述第二位置坐标,在所述悬浮界面显示每个所述待翻译词组。
在一个实施例中,所述处理器在实现提示翻译失败的所述待翻译词组时,用于实现:
在所述悬浮界面对翻译失败的所述待翻译词组添加异常标记。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项文字翻译方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字卡(Secure Digital Card,SD Card),闪存卡(Flash Card)等。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种文字翻译方法,其特征在于,包括:
对在预设的翻译界面中的目标文件进行文字识别,得到所述目标文件对应的文字信息;
对所述文字信息进行分词处理,得到所述文字信息对应的至少一个待翻译词组;
对每个所述待翻译词组进行翻译,并提示翻译失败的所述待翻译词组;
当检测到对翻译失败的所述待翻译词组的翻译操作时,根据所述翻译操作对翻译失败的所述待翻译词组进行翻译,并将翻译失败的所述待翻译词组与对应的翻译结果关联存储。
2.根据权利要求1所述的文字翻译方法,其特征在于,所述文字信息包括至少一个语句;所述对所述文字信息进行分词处理,得到所述文字信息对应的至少一个待翻译词组,包括:
获取所述文字信息中的每个所述语句对应的文字属性信息;
根据每个所述语句对应的所述文字属性信息对每个所述语句进行分词,将得到的词组作为所述文字信息对应的所述待翻译词组。
3.根据权利要求2所述的文字翻译方法,其特征在于,所述文字属性信息包括字体大小、背景颜色以及位置坐标。
4.根据权利要求1所述的文字翻译方法,其特征在于,所述对所述待翻译词组进行翻译之前,还包括:
显示所述翻译界面对应的悬浮界面,在所述悬浮界面显示每个所述待翻译词组;
所述对每个所述待翻译词组进行翻译,包括:
确定所述待翻译词组对应的目标语种;
基于预设的语种与数据库之间的对应关系,根据所述目标语种确定目标数据库;
基于所述目标数据库,对每个所述待翻译词组进行文字匹配,得到每个所述待翻译词组对应的翻译结果。
5.根据权利要求4所述的文字翻译方法,其特征在于,所述对每个所述待翻译词组进行翻译之后,还包括:
当检测到对所述待翻译词组对应的所述翻译结果的修改操作时,根据所述修改操作对所述翻译结果进行修改,得到修改后的翻译结果;
根据所述修改后的翻译结果,对所述目标数据库中与所述待翻译词组对应的翻译词进行更新。
6.根据权利要求4所述的文字翻译方法,其特征在于,所述在所述悬浮界面显示每个所述待翻译词组,包括:
获取每个所述待翻译词组在所述翻译界面中的第一位置坐标;
根据所述第一位置坐标确定每个所述待翻译词组在所述悬浮界面中的第二位置坐标;
根据所述第二位置坐标,在所述悬浮界面显示每个所述待翻译词组。
7.根据权利要求4至6中任一项所述的文字翻译方法,其特征在于,所述提示翻译失败的所述待翻译词组,包括:
在所述悬浮界面对翻译失败的所述待翻译词组添加异常标记。
8.一种文字翻译装置,其特征在于,包括:
文字识别模块,用于对在预设的翻译界面中的目标文件进行文字识别,得到所述目标文件对应的文字信息;
分词处理模块,用于对所述文字信息进行分词处理,得到所述文字信息对应的至少一个待翻译词组;
第一词组翻译模块,用于对每个所述待翻译词组进行翻译,并提示翻译失败的所述待翻译词组;
第二词组翻译模块,用于当检测到对翻译失败的所述待翻译词组的翻译操作时,根据所述翻译操作对翻译失败的所述待翻译词组进行翻译,并将翻译失败的所述待翻译词组与对应的翻译结果关联存储。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7任一项所述的文字翻译方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7任一项所述的文字翻译方法。
CN202011315138.2A 2020-11-20 2020-11-20 文字翻译方法、装置、计算机设备和存储介质 Pending CN112417899A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011315138.2A CN112417899A (zh) 2020-11-20 2020-11-20 文字翻译方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011315138.2A CN112417899A (zh) 2020-11-20 2020-11-20 文字翻译方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN112417899A true CN112417899A (zh) 2021-02-26

Family

ID=74778698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011315138.2A Pending CN112417899A (zh) 2020-11-20 2020-11-20 文字翻译方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112417899A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113609870A (zh) * 2021-07-23 2021-11-05 深圳市元征信息技术开发有限公司 翻译方法、装置、服务器及可读存储介质
CN113723052A (zh) * 2021-08-30 2021-11-30 杭州华橙软件技术有限公司 文本处理方法及装置、存储介质、电子装置
CN115484478A (zh) * 2021-05-31 2022-12-16 上海哔哩哔哩科技有限公司 字幕处理方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115484478A (zh) * 2021-05-31 2022-12-16 上海哔哩哔哩科技有限公司 字幕处理方法及装置
CN113609870A (zh) * 2021-07-23 2021-11-05 深圳市元征信息技术开发有限公司 翻译方法、装置、服务器及可读存储介质
CN113609870B (zh) * 2021-07-23 2024-06-07 深圳市元征科技股份有限公司 翻译方法、装置、服务器及可读存储介质
CN113723052A (zh) * 2021-08-30 2021-11-30 杭州华橙软件技术有限公司 文本处理方法及装置、存储介质、电子装置

Similar Documents

Publication Publication Date Title
CN112417899A (zh) 文字翻译方法、装置、计算机设备和存储介质
US11120213B2 (en) Intelligent verification of presentation of a user interface
CN105631393A (zh) 信息识别方法及装置
CN108536745B (zh) 基于Shell的数据表提取方法、终端、设备及存储介质
CN112966583A (zh) 图像处理方法、装置、计算机设备和存储介质
US11610054B1 (en) Semantically-guided template generation from image content
CN112100979A (zh) 基于电子书的排版处理方法、电子设备及存储介质
CN115687655A (zh) 一种基于pdf文档的知识图谱构建方法、系统、设备及存储介质
US8750571B2 (en) Methods of object search and recognition
CN113159013A (zh) 基于机器学习的段落识别方法、装置、计算机设备和介质
CN113673294B (zh) 文献关键信息的提取方法、装置、计算机设备和存储介质
CN116860747A (zh) 训练样本的生成方法、装置、电子设备及存储介质
US20230186212A1 (en) System, method, electronic device, and storage medium for identifying risk event based on social information
US20180330156A1 (en) Detection of caption elements in documents
CN116225956A (zh) 自动化测试方法、装置、计算机设备和存储介质
CN115761778A (zh) 一种文献重构方法、装置、设备和存储介质
CN109783134B (zh) 前端页面配置方法、装置及电子设备
CN112580334A (zh) 一种文案处理方法、装置、服务器及存储介质
CN112364640A (zh) 实体名词链接方法、装置、计算机设备和存储介质
CN112131842B (zh) 一种文档设计方法及系统
JP7430219B2 (ja) 文書情報構造化装置、文書情報構造化方法およびプログラム
CN112749294B (zh) 页面隐藏文案识别方法、装置、计算机设备和存储介质
CN113743438B (zh) 文本检测用数据集生成方法、装置和系统
US20220383023A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
CN113778434A (zh) 多语言文案管理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination