CN114282553A - 文本翻译方法、装置、电子设备以及存储介质 - Google Patents

文本翻译方法、装置、电子设备以及存储介质 Download PDF

Info

Publication number
CN114282553A
CN114282553A CN202111546414.0A CN202111546414A CN114282553A CN 114282553 A CN114282553 A CN 114282553A CN 202111546414 A CN202111546414 A CN 202111546414A CN 114282553 A CN114282553 A CN 114282553A
Authority
CN
China
Prior art keywords
text
translated
confirmed
target
texts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111546414.0A
Other languages
English (en)
Inventor
杜健森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN202111546414.0A priority Critical patent/CN114282553A/zh
Publication of CN114282553A publication Critical patent/CN114282553A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本申请公开了一种文本翻译方法、装置、电子设备以及存储介质,涉及电子设备技术领域。该方法应用于电子设备,该方法包括:获取第一待翻译文本,对第一待翻译文本进行关键词提取,获得第一待翻译文本中的目标关键词,根据目标关键词进行搜索,获得第二待翻译文本,其中,第二待翻译文本至少包括第一待翻译文本,对第二待翻译文本进行翻译,获得翻译文本。本申请通过获取第一待翻译文本中的关键词,并对关键词进行搜索获得包括第一待翻译文本的第二待翻译文本,对第二待翻译文本进行翻译获得翻译文本,从而可以简化针对长文本翻译的操作步骤,提升翻译效率。

Description

文本翻译方法、装置、电子设备以及存储介质
技术领域
本申请涉及电子设备技术领域,更具体地,涉及一种文本翻译方法、装置、电子设备以及存储介质。
背景技术
随着科学技术的发展,电子设备的使用越来越广泛,功能越来越多,已经成为人们日常生活中的必备之一。目前,可以利用电子设备进行文本的翻译,但是,翻译过程中,需要用户操作繁琐的步骤,造成用户的使用体验不佳。
发明内容
鉴于上述问题,本申请提出了一种文本翻译方法、装置、电子设备以及存储介质,以解决上述问题。
第一方面,本申请实施例提供了一种文本翻译方法,应用于电子设备,所述方法包括:获取第一待翻译文本;对所述第一待翻译文本进行关键词提取,获得所述第一待翻译文本中的目标关键词;根据所述目标关键词进行搜索,获得第二待翻译文本,其中,所述第二待翻译文本至少包括所述第一待翻译文本;对所述第二待翻译文本进行翻译,获得翻译本文。
第二方面,本申请实施例提供了一种文本翻译装置,应用于电子设备,所述装置包括:第一待翻译文本获取模块,用于获取第一待翻译文本;目标关键词获得模块,用于对所述第一待翻译文本进行关键词提取,获得所述第一待翻译文本中的目标关键词;第二待翻译文本获取模块,用于根据所述目标关键词进行搜索,获得第二待翻译文本,其中,所述第二待翻译文本至少包括所述第一待翻译文本;翻译文本获得模块,用于对所述第二待翻译文本进行翻译,获得翻译本文。
第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时所述处理器执行上述方法。
第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述方法。
本申请实施例提供的文本翻译方法、装置、电子设备以及存储介质,获取第一待翻译文本,对第一待翻译文本进行关键词提取,获得第一待翻译文本中的目标关键词,根据目标关键词进行搜索,获得第二待翻译文本,其中,第二待翻译文本至少包括第一待翻译文本,对第二待翻译文本进行翻译,获得翻译文本。本申请通过获取第一待翻译文本中的关键词,并对关键词进行搜索获得包括第一待翻译文本的第二待翻译文本,对第二待翻译文本进行翻译获得翻译文本,从而可以简化针对长文本翻译的操作步骤,提升翻译效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了本申请一实施例提供的文本翻译方法的流程示意图;
图2示出了本申请一实施例提供的文本翻译方法的流程示意图;
图3示出了本申请的图2所示的文本翻译方法的步骤S240的流程示意图;
图4示出了本申请的图3所示的文本翻译方法的步骤S242的流程示意图;
图5示出了本申请一实施例提供的文本翻译方法的流程示意图;
图6示出了本申请一实施例提供的文本翻译方法的流程示意图;
图7示出了本申请一实施例提供的文本翻译方法的流程示意图;
图8示出了本申请的图7所示的文本翻译方法的步骤S520的流程示意图;
图9示出了本申请实施例提供的文本翻译装置的模块框图;
图10示出了本申请实施例用于执行根据本申请实施例的文本翻译方法的电子设备的框图;
图11示出了本申请实施例的用于保存或者携带实现根据本申请实施例的文本翻译方法的程序代码的存储单元。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
目前,可以通过电子设备对文本进行翻译。但是,在翻译的过程中,需要用户逐一对需要翻译的文本内容进行扫描,才能获得完整的翻译内容,该过程对用户的体验不佳。并且,当所需要进行翻译的文本为长文本(内容过多)时,扫描过程极长,如果扫描过程没有能够覆盖到文本的所有内容,则最后获得的翻译文本也会出现相应的缺失,造成文本翻译错误。
针对上述问题,发明人经过长期的研究发现,并提出了本申请实施例提供的文本翻译方法、装置、电子设备以及存储介质,通过获取第一待翻译文本中的关键词,并对关键词进行搜索获得包括第一待翻译文本的第二待翻译文本,对第二待翻译文本进行翻译获得翻译文本,从而可以简化针对长文本翻译的操作步骤,提升翻译效率。其中,具体的文本翻译方法在后续的实施例中进行详细的说明。
请参阅图1,图1示出了本申请一实施例提供的文本翻译方法的流程示意图。该方法用于通过获取第一待翻译文本中的关键词,并对关键词进行搜索获得包括第一待翻译文本的第二待翻译文本,对第二待翻译文本进行翻译获得翻译文本,从而可以简化针对长文本翻译的操作步骤,提升翻译效率。在具体的实施例中,该文本翻译方法应用于如图10所示的文本翻译装置200以及配置有文本翻译装置200的电子设备100(图11)。下面将以电子设备为例,说明本实施例的具体流程,当然,可以理解的,本实施例所应用的电子设备可以包括智能手机、平板电脑、穿戴式电子设备等,在此不做限定。下面将针对图1所示的流程进行详细的阐述,所述文本翻译方法具体可以包括以下步骤:
步骤S110:获取第一待翻译文本。
在本实施例中,电子设备可以获取待翻译文本作为第一待翻译文本。其中,该第一待翻译文本可以是对应有初始语言的文本,例如,该第一待翻译文本可以为中文表示的文本,可以为英文表示的文本,可以为日文表示的文本,可以为韩文表示的文本等,在此不做限定。
作为一种方式,电子设备可以包括摄像头,则电子设备可以控制摄像头进行图像采集,并获取通过摄像头采集到的待翻译图像,对待翻译图像进行图像转文本操作获得第一待翻译文本。作为又一种方式,电子设备可以包括拾音器(如话筒),则电子设备可以控制拾音器进行语音采集,并获取通过拾音器采集到的待翻译语音,对待翻译语音进行语音转文本操作获得第一待翻译文本。作为再一种方式,电子设备可以包括通讯模块,则电子设备可以通过通讯模块从服务器,或者从其他设备获取待翻译文本作为第一待翻译文本。
在一些实施方式中,电子设备可以响应于输入的启动指令获取第一待翻译文本。例如,电子设备可以响应于输入的语音启动指令获取第一待翻译文本,电子设备可以响应于输入的触控启动指令获取第一待翻译文本等,在此不做限定。
步骤S120:对所述第一待翻译文本进行关键词提取,获得所述第一待翻译文本中的目标关键词。
在本实施例中,电子设备在获得第一待翻译文本后,则可以对第一待翻译文本进行关键词提取,获得该第一待翻译文本中的目标关键词。
在一些实施方式中,电子设备在获得第一待翻译文本后,则可以通过自然语言处理技术中的关键词提取算法,提取该第一待翻译文本中的目标关键词。作为一种可实施的方式,该关键词提取算法可以包括有监督、无监督或者半监督,其中,无监督可以适用于各种关键词提取场景;有监督和半监督相对于无监督,提取的关键词更加准确。
步骤S130:根据所述目标关键词进行搜索,获得第二待翻译文本,其中,所述第二待翻译文本至少包括所述第一待翻译文本。
在本实施例中,电子设备在获得目标关键词后,则可以根据该目标关键词进行搜索,获得该第二待翻译文本,其中,该第二待翻译文本至少包括该第一待翻译文本。作为一种方式,该第二待翻译本文可以与第一待翻译文本完全相同。作为另一种方式,该第二待翻译文本可以包括第一待翻译文本以及与第一待翻译文本不同的其他文本。
在一些实施方式中,电子设备在获得目标关键词后,则可以利用服务器对目标关键词进行搜索,在全网搜索包括该目标关键词(第一待翻译文本)的第二待翻译文本。例如,该第一待翻译文本可以为某篇文献的首页对应的文本,该目标关键词可以为该首页中的具有标识性的词组,例如,标题、作者、日期等,该第二待翻译文本可以为该某篇文献。
步骤S140:对所述第二待翻译文本进行翻译,获得翻译本文。
在本实施例中,电子设备在获得第二待翻译文本后,则可以对该第二待翻译文本进行翻译,获得翻译文本。从而所获得的翻译文本所包含的内容多余所采集的待翻译文本对应的翻译文本所包含的内容,可以实现长文本的简化操作翻译。
在一些实施方式中,电子设备可以设置有语言,其中,该电子设备所设置的语言可以表征用户所使用的语言,即,可以获取电子设备所设置的语言。例如,若电子设备所设置的语言为中文时,可以认为用户所使用的语言为中文。又例如,若电子设备所设置的语言为英文时,可以认为用户所使用的语言为英文。在本实施例中电子设备在获得第二待翻译文本时,则可以将第二待翻译文本从初始语言翻译为电子设备所设置的语言,获得翻译文本。
在一些实施方式中,电子设备在获得第二待翻译文本时,则可以显示语言选择控件,其中,该语言选择控件可以选择所要翻译的语言。在本实施例中,当检测到基于该语言选择控件所选择的目标语言时,则可以将第二待翻译文本从初始语言翻译文本目标语言,获得翻译文本。
本申请一实施例提供的文本翻译方法,获取第一待翻译文本,对第一待翻译文本进行关键词提取,获得第一待翻译文本中的目标关键词,根据目标关键词进行搜索,获得第二待翻译文本,其中,第二待翻译文本至少包括第一待翻译文本,对第二待翻译文本进行翻译,获得翻译文本。本申请通过获取第一待翻译文本中的关键词,并对关键词进行搜索获得包括第一待翻译文本的第二待翻译文本,对第二待翻译文本进行翻译获得翻译文本,从而可以简化针对长文本翻译的操作步骤,提升翻译效率。
请参阅图2,图2示出了本申请一实施例提供的文本翻译方法的流程示意图。该方法应用于上述电子设备,下面将针对图2所示的流程进行详细的阐述,所述文本翻译方法具体可以包括以下步骤:
步骤S210:获取第一待翻译文本。
步骤S220:对所述第一待翻译文本进行关键词提取,获得所述第一待翻译文本中的目标关键词。
其中,步骤S210-步骤S220的具体描述请参阅步骤S110-步骤S120,在此不再赘述。
步骤S230:根据所述目标关键词进行搜索,获得多个待确认文本。
在一些实施方式中,电子设备在获得目标关键词后,则可以根据该目标关键词进行搜索,获得多个待确认文本,其中,该多个待确认文本可以都包括该目标关键词。
作为一种可实施的方式,电子设备在根据目标关键词进行搜索时,可以获得多个搜索结果,则可以将多个搜索结果确定为多个待确定文本。作为另一种可实施的方式,电子设备在根据目标关键词进行搜索时,可以获得多个搜索结果,则可以从多个搜索结果选择部分搜索结果确定为多个待确认文本。例如,电子设备可以从多个搜索结果中选择排序在前N位的搜索结果确定为待确认文本,其中,多个搜索结果可以按照准确率从高到低的顺序进行排序,也可以按照相关率从高到低的顺序进行排序等,在此不做限定。
步骤S240:基于所述第一待翻译文本,从所述多个待确认文本中选择目标待确认文本,作为所述第二待翻译文本。
在一些实施方式中,电子设备在获得多个待确认文本后,则可以基于该第一待翻译文本,从多个待确认文本文中选择目标待确认文本作为第二待翻译文本。
作为一种可实施的方式,电子设备在获得多个待确认文本后,可以将多个待确认文本分别与第一待翻译文本进行对比,以从多个待确认文本中选择与第一待翻译文本最相关的目标待确认文本,作为第二待翻译文本。
作为又一种可实施的方式,电子设备在获得多个待确认文本后,可以将多个待确认文本分别与第一待翻译文本进行对比,以从多个待确认文本中选择完全包含该第一待翻译文本的目标待确认文本,作为第二待翻译文本。
作为再一种可实施的方式,电子设备在获得多个待确认文本后,可以将多个待确认文本在电子设备进行显示,以供用户从多个待确认文本中进行选择。其中,当检测到用户输入的针对多个待确认文本中的目标待确认文本的选择操作时,则可以将该目标待确认文本作为第二待翻译文本。
请参阅图3,图3示出了本申请的图2所示的文本翻译方法的步骤S240的流程示意图。下面将针对图3所示的流程进行详细的阐述,所述方法具体可以包括以下步骤:
步骤S241:将所述第一待翻译文本分别与所述多个待确认文本进行对比,获得对比结果。
在一些实施方式中,电子设备在获得多个待确认文本后,则可以将该第一待翻译文本分别与多个待确认文本进行对比,获得对比结果。
作为一种方式,可以将第一待翻译文本所包含的内容分别与多个待确认文本所包含的内容的信息进行对比,获得对比结果,则该对比结果可以表征该第一待翻译文本与各个待确认文本的包含关系。
作为又一种方式,可以将第一待翻译文本所包含的内容分别与多个待确认文本所包含的内容的相似性进行对比,获得对比结果,则该对比结果可以表征该第一待翻译文本与各个待确认文本的内容相似度。
作为再一种方式,可以将第一待翻译文本所包含的内容分别与多个待确认文本所包含的内容的长度进行对比,获得对比结果,则该对比结果可以表征该第一待翻译文本与各个待确认文本的内容长度关系。
步骤S242:当所述对比结果表征所述多个待确认文本中的目标待确认文本包括所述第一待翻译文本时,将所述目标待确认文本作为所述第二待翻译文本。
在一些实施方式中,当该对比结果表征该多个待确认本文中的目标待确认文本包括该第一待翻译文本时,则可以认为该目标待确认文本为该第一待翻译文本的原始文本,即该目标待确认文本为用户期望针对翻译的文本,则可以将该目标待确认文本作为第二待翻译文本。
请参阅图4,图4示出了本申请的图3所示的文本翻译方法的步骤S242的流程示意图。下面将针对图4所示的流程进行详细的阐述,所述方法具体可以包括以下步骤:
步骤S2421:当所述对比结果表征所述多个待确认文本中的至少两个待确认文本包括所述第一待翻译文本时,获取所述至少两个待确认文本各自对应的浏览参数。
在一些实施方式中,当该对比结果表征该多个待确认文本中的至少两个待确认文本包括该第一待翻译文本时,则可以认为该至少两个待确认文本中可能同时包括该第一待翻译文本的原始文本和盗版文本,因此,可以对该至少两个待确认文本进行筛选,以从至少两个待确认本中筛选出第一待翻译文本的原始文本作为第二待翻译文本,而过滤掉至少两个待确认文本中的盗版文本。
作为一种可实施的方式,当该对比结果表征该多个待确认文本中的至少两个待确认文本均包括该第一待翻译文本时,则可以获取该至少两个待确认文本各自对应的浏览参数。其中,该浏览参数可以包括浏览次数、浏览频率以及评分中的一种或多种的组合。
步骤S2422:基于所述至少两个待确认本文各自对应的浏览参数,从所述至少两个待确认文本中确定目标待确认文本,作为所述第二待翻译文本。
在本实施例中,在获得该至少两个待确认文本各自对应的浏览参数后,则可以基于该至少两个待确认文本各自对应的浏览参数,从该至少两个待确认文本中确定目标待确认文本(第一待翻译文本对应的原始文本),作为第二待翻译文本。
作为一种方式,假设浏览参数包括浏览次数。在获得该至少两个待确认文本各自对应的浏览次数后,则可以基于该至少两个待确认文本各自对应的浏览次数,将该至少两个待确认文本中浏览次数最多的待确认文本确定为目标待确认文本(第一待翻译文本对应的原始文本),作为第二待翻译文本。
作为一种方式,假设浏览参数包括浏览频率。在获得该至少两个待确认文本各自对应的浏览频率后,则可以基于该至少两个待确认文本各自对应的浏览频率,将该至少两个待确认文本中浏览频率最高的待确认文本确定为目标待确认文本(第一待翻译文本对应的原始文本),作为第二待翻译文本。
作为一种方式,假设浏览参数包括评分。在获得该至少两个待确认文本各自对应的评分后,则可以基于该至少两个待确认文本各自对应的评分,将该至少两个待确认文本中评分最高的待确认文本确定为目标待确认文本(第一待翻译文本对应的原始文本),作为第二待翻译文本。
步骤S250:对所述第二待翻译文本进行翻译,获得翻译本文。
其中,步骤S250的具体描述请参阅步骤S140,在此不再赘述。
本申请一实施例提供的文本翻译方法,获取第一待翻译文本,对第一待翻译文本进行关键词提取,获得第一待翻译文本中的目标关键词,根据目标关键词进行搜索,获得多个待确认文本,基于第一待翻译文本,从多个待确认文本中选择目标待确认文本,作为第二待翻译文本,对第二待翻译文本进行翻译,获得翻译文本。相较于图1所示的文本翻译方法,本实施例还在存在多个待确认文本时,从多个待确认文本中选取一个待确认文本作为第二待翻译文本进行翻译,从而提升所确定的第二待翻译文本的准确性,以提升翻译的准确性。
请参阅图5,图5示出了本申请一实施例提供的文本翻译方法的流程示意图。该方法应用于上述电子设备,下面将针对图5所示的流程进行详细的阐述,所述文本翻译方法具体可以包括以下步骤:
步骤S310:获取第一待翻译文本。
步骤S320:对所述第一待翻译文本进行关键词提取,获得所述第一待翻译文本中的目标关键词。
步骤S330:根据所述目标关键词进行搜索,获得第二待翻译文本,其中,所述第二待翻译文本至少包括所述第一待翻译文本。
步骤S340:对所述第二待翻译文本进行翻译,获得翻译本文。
其中,步骤S310-步骤S340的具体描述请参阅步骤S110-步骤S340,在此不再赘述。
步骤S350:将所述第二待翻译文本存储在所述电子设备的本地。
在一些实施方式中,电子设备在获得第二待翻译文本后,则可以将该第二待翻译文本存储在电子设备的本地。基于此,电子设备的本地则可以存储有该第一待翻译文本对应的原始文本,电子设备在下次需要对第一待翻译文本的原始文本进行翻译时,则可以直接从本地获取该第二待翻译文本,以提升所获取的第二待翻译文本的准确率和第二待翻译文本的获取效率。
在一些实施方式中,电子设备在获得第二待翻译文本后,可以检测该第二待翻译文本的文本大小。其中,当该第二待翻译文本的文本大小大于预设大小时,表征该第二待翻译文本所需要的存储空间较大,会占用电子设备较多的存储空间,从而造成电子设备的存储空间不足,因此,则可以不将该第二待翻译文本存储在电子设备的本地。其中,当该第二待翻译文本的文本大小不大于预设大小时,表征该第二待翻译文本所需要的存储空间较小,不会占用电子设备较多的存储空间,从而不会造成电子设备的存储空间不足,因此,则可以将该第二待翻译文本存储在电子设备的本地。
在一些实施方式中,电子设备在获得第二待翻译文本后,可以检测该电子设备的剩余存储空间。其中,当该电子设备的剩余存储空间小于预设存储空间时,表征该电子设备剩余的存储空间较少,第二待翻译文本的存储会造成电子设备的存储空间不足,因此,则可以不将该第二待翻译文本存储在电子设备的本地。其中,当该电子设备的剩余存储空间不小于预设存储空间时,表征该电子设备剩余的存储空间较多,第二待翻译文本的存储不会造成电子设备的存储空间不足,因此,则可以将该第二待翻译文本存储在电子设备的本地。
本申请一实施例提供的文本翻译方法,获取第一待翻译文本,对第一待翻译文本进行关键词提取,获得第一待翻译文本中的目标关键词,根据目标关键词进行搜索,获得第二待翻译文本,其中,第二待翻译文本至少包括第一待翻译文本,对第二待翻译文本进行翻译,获得翻译文本,将第二翻译文本存储在电子设备的本地。相较于图1所示的文本翻译方法,本实施例还在获得第二待翻译文本后,将第二待翻译文本存储在电子设备的本地,以便在下次需要相同的翻译本文时,直接从本地搜索该第二待翻译文本,提升文本搜索的效率。
请参阅图6,图6示出了本申请一实施例提供的文本翻译方法的流程示意图。该方法应用于上述电子设备,下面将针对图6所示的流程进行详细的阐述,所述文本翻译方法具体可以包括以下步骤:
步骤S410:获取第一待翻译文本。
步骤S420:对所述第一待翻译文本进行关键词提取,获得所述第一待翻译文本中的目标关键词。
其中,步骤S410-步骤S420的具体描述请参阅步骤S110-步骤S120,在此不再赘述。
步骤S430:根据所述目标关键词在所述电子设备的本地进行搜索。
在本实施例中,电子设备可以预先下载并存储有部分待翻译文本在本地,以在电子设备的本地建立待翻译文本的数据库。
在一些实施方式中,电子设备在获得目标关键词后,则可以根据该目标关键词在电子设备的本地进行搜索,以尝试从电子设备的本地基于该目标关键词进行待翻译文本的搜索确定。例如,电子设备在获得目标关键词后,则可以在电子设备的数据库中,基于该目标关键词进行搜索,以尝试从电子设备的本地基于该目标关键词进行待翻译文本的搜索确定。
步骤S440:当在所述电子设备的本地未搜索到所述第二待翻译文本时,根据所述目标关键词在与所述电子设备通信的服务器进行搜索,获得所述第二待翻译文本。
在一些实施方式中,电子设备根据目标关键词在电子设备的本地进行搜索的过程中,可以检测是否在电子设备的本地搜索到该第二待翻译文本。其中,当确定在电子设备的本地未搜索到该第二待翻译文本时,则可以表征电子设备的本地未存储有该目标关键词对应的待翻译文本,则可以根据该目标关键词在与电子设备通信的服务器进行搜索,获得该第二待翻译文本。其中,当确定在电子设备的本地搜索到该第二待翻译文本时,则可以对该第二待翻译文本进行翻译,获得翻译文本。
作为一种实施方式,当根据目标关键词在电子设备的本地未搜索到任何待翻译文档时,则可以认为在电子设备的本地未搜索到该第二待翻译文本。作为另一种实施方式,当根据目标关键词在电子设备的本地搜索到某个待翻译文档时,则可以判断该某个待翻译文档是否包括该第一待翻译文档,其中,当确定该某个待翻译文档不包括该第一待翻译文档时,则可以认为在电子设备的本地未搜索到该第二待翻译文本。
步骤S450:对所述第二待翻译文本进行翻译,获得翻译本文。
其中,步骤S450的具体描述请参阅步骤S140,在此不再赘述。
本申请一实施例提供的文本翻译方法,获取第一待翻译文本,对第一待翻译文本进行关键词提取,获得第一待翻译文本中的目标关键词,根据目标关键词在电子设备的本地进行搜索,当在电子设备的本地未搜索到第二待翻译文本时,根据目标关键词在与电子设备通信的服务器进行搜索,获得第二待翻译文本,对第二待翻译文本进行翻译,获得翻译文本。相较于图1所示的文本翻译方法,本实施例还首先在电子设备的本地进行第二待翻译文本的搜索,且在本地未搜索到时再从服务器进行第二待翻译文本的搜索,以提升文本搜索的效率和成功率。
请参阅图7,图7示出了本申请一实施例提供的文本翻译方法的流程示意图。该方法应用于上述电子设备,下面将针对图7所示的流程进行详细的阐述,所述文本翻译方法具体可以包括以下步骤:
步骤S510:控制所述摄像头进行扫描。
在本实施例中,电子设备包括摄像头。其中,该摄像头可以包括前置摄像头、后置摄像头、伸缩摄像头、旋转摄像头等,在此不做限定。
在一些实施方式中,电子设备可以通过摄像头进行图像采集,以获得扫描到的图像。其中,电子设备可以通过摄像头对需要进行翻译的文本进行图像采集,以获得该需要翻译的文本对应的图像。
作为一种方式,电子设备可以响应于用户输入的指令启动应用程序的“翻译”功能,在“翻译”功能启动时,电子设备可以开启摄像头,并通过摄像头对需要翻译的文本进行图像采集,以获得该需要翻译的文本对应的图像。
步骤S520:获取通过所述摄像头扫描到的文本,作为所述第一待翻译文本。
在一些实施方式中,电子设备获得摄像头扫描到的图像后,则可以通过图像转文本技术对扫描到的图像进行转文本处理,获得通过摄像头扫描到的文本,并将扫描到的文本作为第一待翻译文本。
作为一种方式,电子设备在获得摄像头扫描到的图像后,可以利用光学字符识别(optical character recognition,OCR)对扫描到的图像进行识别,获得通过摄像头扫描到的文本,并将扫描到的文本作为第一待翻译文本。
请参阅图8,图8示出了本申请的图7所示的文本翻译方法的步骤S520的流程示意图。下面将针对图8所示的流程进行详细的阐述,所述文本翻译方法具体可以包括以下步骤:
步骤S521:获取通过所述摄像头扫描到的文本。
在一些实施方式中,电子设备获得摄像头扫描到的图像后,则可以通过图像转文本技术对扫描到的图像进行转文本处理,获得通过摄像头扫描到的文本,并将扫描到的文本作为第一待翻译文本。
作为一种方式,电子设备在获得摄像头扫描到的图像后,可以利用光学字符识别(optical character recognition,OCR)对扫描到的图像进行识别,获得通过摄像头扫描到的文本,并将扫描到的文本作为第一待翻译文本。
步骤S522:当所述摄像头扫描到的文本包括目标信息时,将所述摄像头扫描到的文本确定为所述第一待翻译文本。
在一些实施方式中,电子设备可以预先设置并存储有目标信息,其中,该目标信息可以用于作为该摄像头扫描到的文本的判断依据。因此,在本实施例中,在获得摄像头扫描到的文本时,则可以将该摄像头扫描到的文本与目标信息进行比较,以判断该摄像头扫描到的文本中是否包括该目标信息。其中,当确定该摄像头扫描到的文本包括目标信息时,则可以认为摄像头扫描到了需要翻译的文本中较为关键的部分,即可以通过摄像头扫描到的文本进行原始文本的查找,因此,可以将摄像头扫描到的文本确定为第一待翻译文本。其中,当确定该摄像头扫描到的文本不包括目标信息时,则可以认为摄像头没有扫描到需要翻译的文本中较为关键的部分,即没有办法通过摄像头扫描到的文本进行原始文本的查找,因此,不将摄像头扫描到的文本确定为第一待翻译文本,并控制摄像头继续进行扫描。
在一些实施方式中,该目标信息包括标题、作者、日期以及重要关键词中的一种或几种的组合。
在一些实施方式中,电子设备在通过摄像头扫描的过程中,则可以判断该摄像头扫描到的文本中是否包括目标信息。其中,当确定该电子设备通过摄像头扫描到的文本中包括该目标信息时,则可以停止扫描,并将摄像头扫描到的文本确定为第一待翻译文本。其中,当确定该电子设备通过摄像头扫描到的文本中不包括该目标信息时,则可以继续扫描。
在一些实施方式中,电子设备在通过摄像头扫描的过程中,当监测到停止扫描的指令时,则可以响应于该停止扫描的指令停止扫描,并检测该已扫描到的文本中是否包括目标信息。其中,当确定该电子设备通过摄像头扫描到的文本中包括该目标信息时,则可以将该扫描到的文本确定为第一待翻译文本。其中,当确定该电子设备通过摄像头扫描到的文本中不包括该目标信息时,则可以输出指示重新扫描的提示信息。
步骤S530:对所述第一待翻译文本进行关键词提取,获得所述第一待翻译文本中的目标关键词。
步骤S540:根据所述目标关键词进行搜索,获得第二待翻译文本,其中,所述第二待翻译文本至少包括所述第一待翻译文本。
步骤S550:对所述第二待翻译文本进行翻译,获得翻译本文。
其中,步骤S530-步骤S550的具体描述请参阅步骤S120-步骤S140,在此不再赘述。
本申请一实施例提供的文本翻译方法,控制摄像头进行扫描,获取通过摄像头扫描到的文本,作为第一待翻译文本,对第一待翻译文本进行关键词提取,获得第一待翻译文本中的目标关键词,根据目标关键词进行搜索,获得第二待翻译文本,其中,第二待翻译文本中至少包括第一待翻译文本,对第二待翻译文本进行翻译,获得翻译文本。相较于图1所示的文本翻译方法,本实施例还控制摄像头进行扫描,获得摄像头扫描到的文本作为第一待翻译文本,从而提升扫描翻译的效率。
请参阅图9,图9示出了本申请实施例提供的文本翻译装置的模块框图。该文本翻译装置200应用于上述电子设备,下面将针对图9所示的框图进行阐述,所述文本翻译装置200包括:第一待翻译文本获取模块210、目标关键词获得模块220、第二待翻译文本获取模块230以及翻译文本获得模块240,其中:
第一待翻译文本获取模块210,用于获取第一待翻译文本。
进一步地,所述电子设备包括摄像头,所述第一待翻译文本获取模块210包括:扫描控制子模块和第一待翻译文本获取子模块,其中:
扫描控制子模块,用于控制所述摄像头进行扫描。
第一待翻译文本获取子模块,用于获取通过所述摄像头扫描到的文本,作为所述第一待翻译文本。
进一步地,所述第一待翻译文本获取子模块包括:文本获取单元和第一待翻译文本确定单元,其中:
文本获取单元,用于获取通过所述摄像头扫描到的文本。
第一待翻译文本确定单元,用于当所述摄像头扫描到的文本包括目标信息时,将所述摄像头扫描到的文本确定为所述第一待翻译文本。
进一步地,所述第一待翻译文本获取子模块包括:图像获取单元和第一待翻译文本获取单元,其中:
图像获取单元,用于获取通过所述摄像头扫描到的图像。
第一待翻译文本获取单元,用于通过图像转文本技术对所述摄像头扫描到的图像进行转文本处理,获得通过所述摄像头扫描到的文本,作为所述第一待翻译文本。
目标关键词获得模块220,用于对所述第一待翻译文本进行关键词提取,获得所述第一待翻译文本中的目标关键词。
第二待翻译文本获取模块230,用于根据所述目标关键词进行搜索,获得第二待翻译文本,其中,所述第二待翻译文本至少包括所述第一待翻译文本。
进一步地,所述第二待翻译文本获取模块230包括:待确认文本获得子模块和第二待翻译文本获取子模块,其中:
待确认文本获得子模块,用于根据所述目标关键词进行搜索,获得多个待确认文本。
第二待翻译文本获取子模块,用于基于所述第一待翻译文本,从所述多个待确认文本中选择目标待确认文本,作为所述第二待翻译文本。
进一步地,所述第二待翻译文本获取子模块包括:对比结果获得单元和第二待翻译文本获取单元,其中:
对比结果获得单元,用于将所述第一待翻译文本分别与所述多个待确认文本进行对比,获得对比结果。
第二待翻译文本获取单元,用于当所述对比结果表征所述多个待确认文本中的目标待确认文本包括所述第一待翻译文本时,将所述目标待确认文本作为所述第二待翻译文本。
进一步地,所述第二待翻译文本获取单元包括:浏览参数获取子单元和第二待翻译文本获取子单元,其中:
浏览参数获取子单元,用于当所述对比结果表征所述多个待确认文本中的至少两个待确认文本包括所述第一待翻译文本时,获取所述至少两个待确认文本各自对应的浏览参数。
第二待翻译文本获取子单元,用于基于所述至少两个待确认本文各自对应的浏览参数,从所述至少两个待确认文本中确定目标待确认文本,作为所述第二待翻译文本。
进一步地,所述第二待翻译文本获取模块230包括:本地搜索子模块和网络搜索子模块,其中:
本地搜索子模块,用于根据所述目标关键词在所述电子设备的本地进行搜索。
网络搜索子模块,用于当在所述电子设备的本地未搜索到所述第二待翻译文本时,根据所述目标关键词在与所述电子设备通信的服务器进行搜索,获得所述第二待翻译文本。
翻译文本获得模块240,用于对所述第二待翻译文本进行翻译,获得翻译本文。
进一步地,所述文本翻译装置200还包括:待翻译文本存储模块,其中:
待翻译文本存储模块,用于将所述第二待翻译文本存储在所述电子设备的本地。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,模块相互之间的耦合可以是电性,机械或其它形式的耦合。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
请参阅图10,其示出了本申请实施例提供的一种电子设备100的结构框图。该电子设备100可以是智能手机、平板电脑、电子书等能够运行应用程序的电子设备。本申请中的电子设备100可以包括一个或多个如下部件:处理器110、存储器120以及一个或多个应用程序,其中一个或多个应用程序可以被存储在存储器120中并被配置为由一个或多个处理器110执行,一个或多个程序配置用于执行如前述方法实施例所描述的方法。
其中,处理器110可以包括一个或者多个处理核。处理器110利用各种接口和线路连接整个电子设备100内的各个部分,通过运行或执行存储在存储器120内的指令、程序、代码集或指令集,以及调用存储在存储器120内的数据,执行电子设备100的各种功能和处理数据。可选地,处理器110可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器110可集成中央处理器(CentralProcessing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责待显示内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器110中,单独通过一块通信芯片进行实现。
存储器120可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
请参阅图11,其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质300中存储有程序代码,所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质300可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算机可读存储介质300包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质300具有执行上述方法中的任何方法步骤的程序代码310的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码310可以例如以适当形式进行压缩。
综上所述,本申请实施例提供的文本翻译方法、装置、电子设备以及存储介质,获取第一待翻译文本,对第一待翻译文本进行关键词提取,获得第一待翻译文本中的目标关键词,根据目标关键词进行搜索,获得第二待翻译文本,其中,第二待翻译文本至少包括第一待翻译文本,对第二待翻译文本进行翻译,获得翻译文本。本申请通过获取第一待翻译文本中的关键词,并对关键词进行搜索获得包括第一待翻译文本的第二待翻译文本,对第二待翻译文本进行翻译获得翻译文本,从而可以简化针对长文本翻译的操作步骤,提升翻译效率。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (11)

1.一种文本翻译方法,其特征在于,应用于电子设备,所述方法包括:
获取第一待翻译文本;
对所述第一待翻译文本进行关键词提取,获得所述第一待翻译文本中的目标关键词;
根据所述目标关键词进行搜索,获得第二待翻译文本,其中,所述第二待翻译文本至少包括所述第一待翻译文本;
对所述第二待翻译文本进行翻译,获得翻译本文。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标关键词进行搜索,获得第二待翻译文本,包括:
根据所述目标关键词进行搜索,获得多个待确认文本;
基于所述第一待翻译文本,从所述多个待确认文本中选择目标待确认文本,作为所述第二待翻译文本。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一待翻译文本,从所述多个待确认文本中选择目标待确认文本,作为所述第二待翻译文本,包括:
将所述第一待翻译文本分别与所述多个待确认文本进行对比,获得对比结果;
当所述对比结果表征所述多个待确认文本中的目标待确认文本包括所述第一待翻译文本时,将所述目标待确认文本作为所述第二待翻译文本。
4.根据权利要求3所述的方法,其特征在于,所述当所述对比结果表征所述多个待确认文本中的目标待确认文本包括所述第一待翻译文本时,将所述目标待确认文本作为所述第二待翻译文本,包括:
当所述对比结果表征所述多个待确认文本中的至少两个待确认文本包括所述第一待翻译文本时,获取所述至少两个待确认文本各自对应的浏览参数;
基于所述至少两个待确认本文各自对应的浏览参数,从所述至少两个待确认文本中确定目标待确认文本,作为所述第二待翻译文本。
5.根据权利要求1所述的方法,其特征在于,在所述根据所述目标关键词进行搜索,获得第二待翻译文本之后,还包括:
将所述第二待翻译文本存储在所述电子设备的本地。
6.根据权利要求1所述的方法,其特征在于,所述根据所述目标关键词进行搜索,获得第二待翻译文本,包括:
根据所述目标关键词在所述电子设备的本地进行搜索;
当在所述电子设备的本地未搜索到所述第二待翻译文本时,根据所述目标关键词在与所述电子设备通信的服务器进行搜索,获得所述第二待翻译文本。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述电子设备包括摄像头,所述获取第一待翻译文本,包括:
控制所述摄像头进行扫描;
获取通过所述摄像头扫描到的文本,作为所述第一待翻译文本。
8.根据权利要求7所述的方法,其特征在于,所述获取通过所述摄像头扫描到的文本,作为所述第一待翻译文本,包括:
获取通过所述摄像头扫描到的文本;
当所述摄像头扫描到的文本包括目标信息时,将所述摄像头扫描到的文本确定为所述第一待翻译文本。
9.一种文本翻译装置,其特征在于,应用于电子设备,所述装置包括:
第一待翻译文本获取模块,用于获取第一待翻译文本;
目标关键词获得模块,用于对所述第一待翻译文本进行关键词提取,获得所述第一待翻译文本中的目标关键词;
第二待翻译文本获取模块,用于根据所述目标关键词进行搜索,获得第二待翻译文本,其中,所述第二待翻译文本至少包括所述第一待翻译文本;
翻译文本获得模块,用于对所述第二待翻译文本进行翻译,获得翻译本文。
10.一种电子设备,其特征在于,包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时所述处理器执行如权利要求1-8任一项所述的方法。
11.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-8任一项所述的方法。
CN202111546414.0A 2021-12-16 2021-12-16 文本翻译方法、装置、电子设备以及存储介质 Pending CN114282553A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111546414.0A CN114282553A (zh) 2021-12-16 2021-12-16 文本翻译方法、装置、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111546414.0A CN114282553A (zh) 2021-12-16 2021-12-16 文本翻译方法、装置、电子设备以及存储介质

Publications (1)

Publication Number Publication Date
CN114282553A true CN114282553A (zh) 2022-04-05

Family

ID=80872685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111546414.0A Pending CN114282553A (zh) 2021-12-16 2021-12-16 文本翻译方法、装置、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN114282553A (zh)

Similar Documents

Publication Publication Date Title
CN109033261B (zh) 图像处理方法、装置、处理设备及其存储介质
US10282374B2 (en) System and method for feature recognition and document searching based on feature recognition
US20090300003A1 (en) Apparatus and method for supporting keyword input
KR102373884B1 (ko) 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법
CN108268438B (zh) 一种页面内容提取方法、装置以及客户端
CN112331213A (zh) 智能家居设备控制方法、装置、电子设备及存储介质
CN106708885A (zh) 一种实现搜索的方法和装置
CN112612761A (zh) 一种数据清洗方法、装置、设备及存储介质
CN112068947A (zh) 应用程序进入方法、装置、终端设备及计算机可读介质
JP5239419B2 (ja) 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造
JP4597644B2 (ja) 文字認識装置、プログラムおよび記録媒体
CN110442696B (zh) 查询处理方法及装置
CN112651248A (zh) 扫描翻译方法、装置、扫描笔及相关产品
CN114282553A (zh) 文本翻译方法、装置、电子设备以及存储介质
CN113900620B (zh) 交互方法、装置、电子设备以及存储介质
CN110661693A (zh) 促进在计算装置中执行的基于媒体的内容共享的方法、计算装置可读存储介质以及计算装置
JPH1173415A (ja) 類似文書検索装置及び類似文書検索方法
CN112417095A (zh) 语音消息处理方法和装置
CN109947947B (zh) 一种文本分类方法、装置及计算机可读存储介质
CN112307273A (zh) 信息查询方法、装置及电子设备
JP2019053461A (ja) 画像処理装置、プログラム及び画像データ
CN114201601B (zh) 舆情文本的摘要抽取方法、装置、设备及计算机存储介质
CN112837340B (zh) 属性的跟踪方法、装置、电子设备以及存储介质
CN111079593A (zh) 文本信息处理方法、装置、终端设备及存储介质
CN114049638A (zh) 图像处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination