CN111539231A - 一种翻译方法、装置、服务器及计算机可读存储介质 - Google Patents

一种翻译方法、装置、服务器及计算机可读存储介质 Download PDF

Info

Publication number
CN111539231A
CN111539231A CN202010356158.8A CN202010356158A CN111539231A CN 111539231 A CN111539231 A CN 111539231A CN 202010356158 A CN202010356158 A CN 202010356158A CN 111539231 A CN111539231 A CN 111539231A
Authority
CN
China
Prior art keywords
sentence
translation
translated
library
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010356158.8A
Other languages
English (en)
Inventor
谢玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Internet Security Software Co Ltd
Original Assignee
Beijing Kingsoft Internet Security Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Internet Security Software Co Ltd filed Critical Beijing Kingsoft Internet Security Software Co Ltd
Priority to CN202010356158.8A priority Critical patent/CN111539231A/zh
Publication of CN111539231A publication Critical patent/CN111539231A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种翻译方法、装置、服务器及计算机可读存储介质。该方法包括:接收由终端发送的翻译请求;获取翻译请求所请求翻译的待翻译文本;确定终端所属区域的区域信息;查找与区域信息具有映射关系的句级翻译库;其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文;根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。这样,可以利用该句级翻译库从句子层面对该待翻译文本进行翻译。从而,可以快速获得符合该所属区域翻译方式的、准确的翻译结果。

Description

一种翻译方法、装置、服务器及计算机可读存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及一种翻译方法、装置、服务器及计算机可读存储介质。
背景技术
目前,服务器在接收终端发送的翻译请求时,需要将该翻译请求所请求翻译的待翻译内容发送给第三方的翻译服务器进行翻译,然后再接收翻译服务器所返回的译文,之后再将译文发送给终端。其中,第三方的翻译服务器通过神经网络构建的翻译模型对待翻译内容进行翻译。
但是,该种翻译方式常常导致翻译错误,而且使得终端在较长时间后才能获得翻译结果,使得用户体验并不好。
发明内容
本发明实施例的目的在于提供一种翻译方法、装置、服务器及计算机可读存储介质,以可以利用句级翻译库从句子层面对待翻译文本进行翻译,从而可以快速获得符合终端所属区域翻译方式的、准确的翻译结果。具体技术方案如下:
第一方面,本发明实施例提供了一种翻译方法,应用于服务器,该方法可以包括:
接收由终端发送的翻译请求;
获取翻译请求所请求翻译的待翻译文本;
确定终端所属区域的区域信息;
查找与区域信息具有映射关系的句级翻译库;其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文;
根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。
可选地,根据句级翻译库,查找待翻译文本中每个待翻译句子的译文,可以包括:
查找与区域信息具有映射关系的词级纠错库;词级纠错库存储有:预设错词和预设错词对应的纠正词;
根据句级翻译库和词级纠错库,查找待翻译文本中每个待翻译句子的译文。
可选地,在一种实施例中,根据句级翻译库和词级纠错库,查找待翻译文本中每个待翻译句子的译文,可以包括:
利用待翻译文本中的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果;
当句子比对结果为比对成功时,输出比对成功的预设语句所对应的句子译文,作为待翻译句子的译文;
当句子比对结果为失败时,利用待翻译句子中的词语与预设错词比对,得到错词比对结果;
当错词比对结果为比对成功时,利用比对成功的预设错词对应的纠正词对待翻译句子进行纠错,得到新的待翻译句子;
触发利用新的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果的操作。
可选地,在另一种实施例中,根据句级翻译库和词级纠错库,查找待翻译文本中每个待翻译句子的译文,可以包括:
利用待翻译句子中的词语与词级纠错库中的预设错词比对,得到错词比对结果;
当错词比对结果为比对成功时,利用比对成功的预设错词对应的纠正词对待翻译句子进行纠错,得到新的待翻译句子;
利用新的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果;
当句子比对结果为比对成功时,输出比对成功的预设语句所对应的句子译文,作为待翻译句子的译文。
可选地,在本发明实施例中,预设语句可以包括:高频语句;其中,高频语句为在预设时间段内出现次数超过预设阈值的语句。
可选地,在本发明实施例中,该方法还可以包括:
在查找到待翻译句子的译文之后,在预设音频库中查找译文对应的译文音频;
将译文音频发送给终端。
第二方面,本发明实施例还提供了一种翻译装置,应用于服务器,该装置可以包括:
接收模块,用于接收由终端发送的翻译请求;
获取模块,用于获取翻译请求所请求翻译的待翻译文本;
确定模块,用于确定终端所属区域的区域信息;
第一查找模块,用于查找与区域信息具有映射关系的句级翻译库;其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文;
第二查找模块,用于根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。
可选地,在本发明实施例中,第二查找模块可以包括:
第一查找单元,用于查找与区域信息具有映射关系的词级纠错库;词级纠错库存储有:预设错词和预设错词对应的纠正词;
第二查找单元,用于根据句级翻译库和词级纠错库,查找待翻译文本中每个待翻译句子的译文。
可选地,在一个实施例中,第二查找单元具体可以用于:
利用待翻译文本中的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果;
当句子比对结果为比对成功时,输出比对成功的预设语句所对应的句子译文,作为待翻译句子的译文;
当句子比对结果为失败时,利用待翻译句子中的词语与预设错词比对,得到错词比对结果;
当错词比对结果为比对成功时,利用比对成功的预设错词对应的纠正词对待翻译句子进行纠错,得到新的待翻译句子;
触发利用新的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果的操作。
可选地,在另一个实施例中,第二查找单元具体可以用于:
利用待翻译句子中的词语与词级纠错库中的预设错词比对,得到错词比对结果;
当错词比对结果为比对成功时,利用比对成功的预设错词对应的纠正词对待翻译句子进行纠错,得到新的待翻译句子;
利用新的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果;
当句子比对结果为比对成功时,输出比对成功的预设语句所对应的句子译文,作为待翻译句子的译文。
可选地,在本发明实施例中,预设语句可以包括:高频语句;其中,高频语句为在预设时间段内出现次数超过预设阈值的语句。
可选地,在本发明实施例中,该装置还可以包括:
第三查找模块,用于在查找到待翻译句子的译文之后,在预设音频库中查找译文对应的译文音频;
发送模块,用于将译文音频发送给终端。
第三方面,本发明实施例提供了一种服务器,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的翻译方法的方法步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现第一方面任一所述的翻译方法的方法步骤。
第五方面,本发明实施例还提供了一种计算机程序产品,当其在服务器上运行时,使得电子设备执行:第一方面任一所述的翻译方法的方法步骤。
在本发明实施例中,服务器可以接收由终端发送的翻译请求。然后,可以获取该翻译请求所请求翻译的待翻译文件,并确定该终端所属区域的区域信息。之后,可以查找与区域信息具有映射关系的句级翻译库。其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文。之后,可以根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。
这样,可以根据终端所属区域的区域信息,查找到符合该终端所属区域翻译习惯的句级翻译库。进而,可以利用该句级翻译库从句子层面对该待翻译文本进行翻译,这样可以获得符合该区域翻译方式的且准确的翻译结果。而且,在服务器本地通过句级翻译库对一些特定的待翻译文本(如高频语句)进行翻译的方式,不需要将所有待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种翻译方法的流程图;
图2为本发明实施例提供的一种翻译装置的结构示意图;
图3为本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,服务器在接收终端发送的翻译请求时,需要将该翻译请求所请求翻译的待翻译内容发送给第三方的翻译服务器进行翻译,然后再接收翻译服务器所返回的译文,之后再将译文发送给终端。其中,第三方的翻译服务器通过神经网络构建的翻译模型对待翻译内容进行翻译。
但是,该种翻译方式常常导致翻译错误,而且使得终端在较长时间后才能获得翻译结果,使得用户体验并不好。例如,当需要将中文“我想买望远镜”翻译为泰文时,得到错误的翻译结果
Figure BDA0002473541750000061
而且需要较长时间才能获得该翻译结果。
具体地,发明人在实现本发明的过程中发现,将待翻译内容发送给第三方的翻译服务器就需要50毫秒到600毫秒,加上第三方的翻译服务器通过神经网络构建的翻译模型对待翻译内容进行翻译的翻译时长,以及返回译文的时长,使得终端用户获得翻译结果的时间最终达到了2秒以上,速度较慢。
为了解决上述问题,本发明实施例提供了一种翻译方法、装置、服务器及计算机可读存储介质。
可以理解的是,本发明实施例提供的翻译方法可以应用于服务器。其中,该服务器具体可以为提供翻译业务的业务服务器。
图1为本发明实施例提供的一种翻译方法的流程图。参见图1,本发明实施例提供的翻译方法可以包括如下步骤:
S101:接收由终端发送的翻译请求;
S102:获取翻译请求所请求翻译的待翻译文本;
S103:确定终端所属区域的区域信息;
S104:查找与区域信息具有映射关系的句级翻译库;其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文;
S105:根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。
这样,可以根据终端所属区域的区域信息,查找到符合该终端所属区域翻译习惯的句级翻译库。进而,可以利用该句级翻译库从句子层面对该待翻译文本进行翻译,这样可以获得符合该区域翻译方式的且准确的翻译结果。而且,在服务器本地通过句级翻译库对待翻译文本进行翻译的方式,不需要将所有待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度。
下面对本发明实施例提供的翻译方法进行详细说明。
S101:接收由终端发送的翻译请求;
可以理解的是,服务器可以接收终端发送的翻译请求。其中,在一种实现方式中,该翻译请求可以携带有待翻译文本和终端信息。在另一种实现方式中,该翻译请求可以携带有待翻译语音和终端信息。当然,该翻译请求也可以携带有待翻译文本或待翻译语音的访问地址和终端信息,当然并不局限于此。
该终端信息可以包括该终端所属区域的区域信息,还可以包括该终端所使用网络的网络运营商信息等等,在此不进行一一说明。其中,该区域信息具体可以为地理位置信息,也可以为网际协议地址信息,还可以为技术人员根据具体情况划分的区域的名称(例如东南亚地区),等等。
S102:获取翻译请求所请求翻译的待翻译文本;
S103:确定终端所属区域的区域信息;
可以理解的是,步骤S102和步骤S103可以同时执行。当然,步骤S102也可以在步骤S103之前执行,还可以在步骤S103之后执行,这都是合理的。
举例而言,该翻译请求可以携带有待翻译成英文的待翻译语音“卫生间在哪”和终端所属区域信息为泰国区域。那么,服务器可以确定终端所属区域的区域信息为:泰国区域。并且,可以通过语言种类识别算法识别待翻译语音“卫生间在哪”的语言种类为中文,并通过语音文本识别算法识别待翻译语音“卫生间在哪”所对应的中文文本:卫生间在哪。然后,可以将该中文文本确定为翻译请求所请求翻译的待翻译文本。
S104:查找与区域信息具有映射关系的句级翻译库;其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文;
可以理解的是,与该区域信息具有映射关系的句级翻译库是指:符合该终端所属区域翻译习惯的句级翻译库。
其中,本领域技术人员可以根据该区域信息所对应的区域的用户语言习惯,来设置预设语句和该预设语句所对应的句子译文。并且,该句子译文的语言类型与上述翻译请求所请求翻译为的目标语言类型(例如英文)相同。
具体地,句级翻译库中存储的预设语句可以包括高频语句。其中,高频语句可以是指在预设时间段内出现次数超过预设阈值的语句。而且,高频语句与终端所属区域的区域信息具有关联关系,即由于文化的不同,不同区域信息所对应的高频语句并不相同。具体地,高频语句具体可以是终端所属区域的居民的主要用语,也可以是一段特殊时期(例如在该所属区域举办运动会)频繁出现的用语。
举例而言,中国地区对应的高频语句可以包括“吃了吗”等语句。
其中,本领域技术人员可以根据具体情况设置预设阈值的数值,例如将预设阈值设置为5,当然并不局限于此。
另外,该预设语句还可以包括用户反馈语句。其中,该用户反馈语句是指:用户在使用翻译过程中所反馈的、翻译错误的语句。
例如,中国地区对应的用户反馈语句“最新疫情情况”。其中,语音文本识别算法经常将待翻译语音“最新疫情情况”识别为中文文字:最新移情情况,从而导致翻译得到的英文翻译结果错误。因而,在用户反馈该句子翻译错误之后,可以将该用户反馈语句“最新疫情情况”及其译文存储至句级翻译库中。
S105:根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。
在相关技术中,第三方的翻译服务器通常通过神经网络构建的翻译模型对待翻译内容进行翻译。其中,该翻译模型通常会将“卫生间”翻译为英文restroom或bathroom,但是在泰国地区,该地区通常将“卫生间”翻译为英文toilet。这样,就导致相关技术所得到翻译结果并不符合泰国地区的翻译习惯。
而在本发明实施例中,可以根据终端所属的区域信息,查找到符合该终端所属区域翻译习惯的句级翻译库。进而,可以利用该句级翻译库从句子层面对该待翻译文本进行翻译,这样可以快速获得符合该区域翻译方式的且准确的翻译结果。
为了可以获得更为准确的翻译结果,步骤S105具体可以包括:
S1051:查找与区域信息具有映射关系的词级纠错库;词级纠错库存储有:预设错词和预设错词对应的纠正词;
可以理解的是,与该区域信息具有映射关系的词级纠错库是指:符合该终端所属区域翻译习惯的词级纠错库。其中,本领域技术人员可以根据该区域信息所对应的区域的用户语言习惯,来设置该预设错词和该预设错词对应的纠正词。
举例而言,中国南方地区对应的词级纠错库中可以记载有预设错词“胡建”及其纠正词“福建”。
S1052:根据句级翻译库和词级纠错库,查找待翻译文本中每个待翻译句子的译文。
其中,该句级翻译库和词级纠错库可以存储在该服务器本地。这样,当服务器接收到翻译业务请求时,可以直接基于本地存储的句级翻译库和词级纠错库,来查找符合该区域翻译方式且准确的译文,使得译文更符合本地化翻译习惯。而且,不需要将待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度。
在一种实现方式中,可以先利用句级翻译库查找待翻译句子的译文,若查找到译文则直接输出。若查找不到,则再利用词级纠错库对该待翻译句子进行词语纠错。之后再利用句级翻译库查找纠错后的待翻译句子的译文,若查找到译文则直接输出,若查找不到则发送给第三方翻译服务器进行翻译。
这样,可以根据终端所属的区域信息,查找到符合该终端所属区域翻译习惯的句级翻译库。进而,可以利用该句级翻译库从句子层面对该待翻译文本进行翻译,这样可以获得符合该区域翻译方式的且准确的翻译结果。而且,在服务器本地通过句级翻译库对待翻译文本进行翻译的方式,不需要将所有待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度。
具体地,步骤S1052:根据句级翻译库和词级纠错库,查找待翻译文本中每个待翻译句子的译文,可以包括如下步骤:
S21:利用待翻译文本中的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果;其中,句子比对结果为成功时,执行步骤S22,否则执行步骤S23;
S22:输出比对成功的预设语句所对应的句子译文,作为待翻译句子的译文;
S23:利用待翻译句子中的词语与预设错词比对,得到错词比对结果;其中,错词比对结果为比对成功时,执行步骤S24~S25,否则执行步骤S26~S27;
S24:利用比对成功的预设错词对应的纠正词对待翻译句子进行纠错,得到新的待翻译句子;
S25:触发利用新的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果的操作;
可以理解的是,当步骤S25执行完毕之后,继续触发步骤S22,步骤S22执行完毕后,继续触发步骤S23,在此不做一一说明。
S26:当错词比对结果为比对失败时,将待翻译句子发送至预设翻译服务器;
其中,该预设翻译服务器可以为第三方提供的翻译服务器,当然并不局限于此。
S27:接收预设翻译服务器对待翻译句子进行翻译所得到的句子译文。
其中,通过上述方式,可以利用该句级翻译库和词级纠错库从句子层面和错词层面对该待翻译文本进行翻译。并且,当可以基于该句级翻译库和词级纠错库获得译文时,则不需要将待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度,而且还可以获得符合该终端所属区域翻译方式的且准确的翻译结果。其中,该种翻译方式,可以在30毫秒以内,甚至接近0毫秒获得译文,翻译速度较快。
另外,若无法通过句级翻译库和词级纠错库得到译文,则再通过第三方的预设翻译服务器进行翻译。
在另一种实现方式中,可以先利用词级纠错库对该待翻译句子进行词语纠错,若对待翻译句子进行了纠错得到新的待翻译句子,则再利用句级翻译库查找新的待翻译句子的译文;若不需要对待翻译句子进行纠错,则直接利用句级翻译库查找待翻译句子的译文;针对于对待翻译句子进行了纠错的情况,若能够利用句级翻译库查找新的待翻译句子的译文,则输出该译文;针对于不需要对待翻译句子进行纠错的情况,若能够利用句级翻译库查找待翻译句子的译文,则输出该译文。相应地,若无法利用句级翻译库查找到该新的待翻译句子或翻译句子的译文,则发送给第三方翻译服务器进行翻译。
具体地,步骤S1052:根据句级翻译库和词级纠错库,查找待翻译文本中每个待翻译句子的译文,可以包括如下步骤:
S31:利用待翻译句子中的词语与词级纠错库中的预设错词比对,得到错词比对结果;当错词比对结果为比对成功时,执行步骤S32~S33;
其中,当错词比对结果为比对失败时,则可以利用该待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果;当句子比对结果为比对成功时,执行步骤S34;当句子比对结果为比对失败时,将该待翻译句子发送至预设翻译服务器,并接收翻译服务器反馈的译文。
S32:利用比对成功的预设错词对应的纠正词对待翻译句子进行纠错,得到新的待翻译句子;
S33:利用新的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果;当句子比对结果为比对成功时,执行步骤S34;当句子比对结果为比对失败时,执行步骤S35;
S34:输出比对成功的预设语句所对应的句子译文,作为待翻译句子的译文;
S35:将新的待翻译句子发送至预设翻译服务器;
S36:接收预设翻译服务器对新的待翻译句子进行翻译所得到的句子译文。
其中,通过上述方式,也可以利用该句级翻译库和词级纠错库从句子层面和错词层面对该待翻译文本进行翻译。并且,当可以基于该句级翻译库和词级纠错库获得译文时,则不需要将待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度,而且还可以获得符合该终端所属区域翻译方式的且准确的翻译结果。其中,该种翻译方式,也可以在30毫秒以内,甚至接近0毫秒获得译文,翻译速度较快。
另外,若无法通过句级翻译库和词级纠错库得到译文,则再通过第三方的预设翻译服务器进行翻译。
此外,可以理解的是,服务器在查找到待翻译句子的译文之后,还可以在预设音频库中查找译文对应的译文音频;之后可以将译文音频发送给终端。这样,可以使得用户可以播放该译文音频。
其中,由于该服务器可以直接在该预设音频库中查找译文对应的译文音频,而不需要将该译文发送给第三方音频生成服务器,缩短了音频生成链路,因而可以进一步提高获得该译文音频的速度。
此外,本发明实施例提供的翻译方法还可以包括如下步骤:
S41:获得待翻译语音;
S42:识别待翻译语音所属的语言种类;
S43:将待翻译语音识别为属于该语言类型的待翻译文本;
S44:确定待翻译文本中每个待翻译句子;
S45:针对每个待翻译句子,执行如下操作:
判断高频语句中是否存在目标高频语句与该待翻译句子相同;
若存在目标高频语句,则输出该目标高频语句所对应的句子译文,作为该待翻译句子的译文;若不存在目标高频语句,判断用户反馈句中是否存在目标反馈句与该待翻译句子相同;
若存在目标反馈句,则输出该目标反馈句所对应的句子译文,作为待翻译句子的译文;若不存在目标反馈句,则判断待翻译句子中的词语是否与词级纠错库中的预设错词相同;
若与词级纠错库中的预设错词相同,利用该相同的预设错词所对应的纠正词对待翻译句子进行纠错,得到纠错后的待翻译句子,并触发判断高频语句中是否存在目标高频语句与该待翻译句子相同的操作;若与词级纠错库中的预设错词相同,将待翻译句子发送给第三方翻译服务器进行翻译,得到该待翻译句子的译文;
在得到该待翻译句子的译文之后,在预设音频库中查找所述译文对应的译文音频;若查找到该译文音频,则将该译文音频发送给终端;若未查找到该译文音频,则将该译文发送给第三方语音生成引擎,然后接收该语音生成引擎生成的针对该译文的译文音频,进而将该译文音频发送给终端。
综上,本发明实施例提供的翻译方法可以根据终端所属区域的区域信息,查找到符合该终端所属区域翻译习惯的句级翻译库和词级纠错库。进而,可以利用该句级翻译库和词级纠错库从句子层面和错词层面对该待翻译文本进行翻译,这样可以获得符合该区域翻译方式的且准确的翻译结果,即使所获得的译文更符合本地化翻译习惯。而且,在服务器本地通过句级翻译库和词级纠错库对待翻译文本进行翻译的方式,使得不需要将所有待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度。
相应于上述方法实施例,本发明实施例还提供了一种翻译装置,应用于服务器。图2为本发明实施例提供的一种翻译装置的结构示意图。参见图2,该装置可以包括:
接收模块201,用于接收由终端发送的翻译请求;
获取模块202,用于获取翻译请求所请求翻译的待翻译文本;
确定模块203,用于确定终端所属区域的区域信息;
第一查找模块204,用于查找与区域信息具有映射关系的句级翻译库;其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文;
第二查找模块205,用于根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。
应用本发明实施例提供的装置,服务器可以接收由终端发送的翻译请求。然后,可以获取该翻译请求所请求翻译的待翻译文件,并确定该终端所属区域的区域信息。之后,可以查找与区域信息具有映射关系的句级翻译库。其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文。之后,可以根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。
这样,可以根据终端所属区域的区域信息,查找到符合该终端所属区域翻译习惯的句级翻译库。进而,可以利用该句级翻译库从句子层面对该待翻译文本进行翻译,这样可以获得符合该区域翻译方式的且准确的翻译结果。而且,在服务器本地通过句级翻译库对待翻译文本进行翻译的方式,不需要将所有待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度。
可选地,在本发明实施例中,第二查找模块205可以包括:
第一查找单元,用于查找与区域信息具有映射关系的词级纠错库;词级纠错库存储有:预设错词和预设错词对应的纠正词;
第二查找单元,用于根据句级翻译库和词级纠错库,查找待翻译文本中每个待翻译句子的译文。
可选地,在一个实施例中,第二查找单元具体可以用于:
利用待翻译文本中的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果;
当句子比对结果为比对成功时,输出比对成功的预设语句所对应的句子译文,作为待翻译句子的译文;
当句子比对结果为失败时,利用待翻译句子中的词语与预设错词比对,得到错词比对结果;
当错词比对结果为比对成功时,利用比对成功的预设错词对应的纠正词对待翻译句子进行纠错,得到新的待翻译句子;
触发利用新的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果的操作。
可选地,在另一个实施例中,第二查找单元具体可以用于:
利用待翻译句子中的词语与词级纠错库中的预设错词比对,得到错词比对结果;
当错词比对结果为比对成功时,利用比对成功的预设错词对应的纠正词对待翻译句子进行纠错,得到新的待翻译句子;
利用新的待翻译句子与句级翻译库中的预设语句进行比对,得到句子比对结果;
当句子比对结果为比对成功时,输出比对成功的预设语句所对应的句子译文,作为待翻译句子的译文。
可选地,在本发明实施例中,预设语句可以包括:高频语句;其中,高频语句为在预设时间段内出现次数超过预设阈值的语句。
可选地,在本发明实施例中,该装置还可以包括:
第三查找模块,用于在查找到待翻译句子的译文之后,在预设音频库中查找译文对应的译文音频;
发送模块,用于将译文音频发送给终端。
相应于上述方法实施例,本发明实施例还提供了一种服务器,参见图3,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信;
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现上述任一翻译方法的方法步骤。
在本发明实施例中,服务器可以接收由终端发送的翻译请求。然后,可以获取该翻译请求所请求翻译的待翻译文件,并确定该终端所属区域的区域信息。之后,可以查找与区域信息具有映射关系的句级翻译库。其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文。之后,可以根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。
这样,可以根据终端所属区域的区域信息,查找到符合该终端所属区域翻译习惯的句级翻译库。进而,可以利用该句级翻译库从句子层面对该待翻译文本进行翻译,这样可以获得符合该区域翻译方式的且准确的翻译结果。而且,在服务器本地通过句级翻译库对待翻译文本进行翻译的方式,不需要将所有待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度。
相应于上述方法实施例,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一翻译方法的方法步骤。
在本发明实施例中,计算机可读存储介质内的计算机程序被处理器执行时,服务器可以接收由终端发送的翻译请求。然后,可以获取该翻译请求所请求翻译的待翻译文件,并确定该终端所属区域的区域信息。之后,可以查找与区域信息具有映射关系的句级翻译库。其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文。之后,可以根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。
这样,可以根据终端所属区域的区域信息,查找到符合该终端所属区域翻译习惯的句级翻译库。进而,可以利用该句级翻译库从句子层面对该待翻译文本进行翻译,这样可以获得符合该区域翻译方式的且准确的翻译结果。而且,在服务器本地通过句级翻译库对待翻译文本进行翻译的方式,不需要将所有待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度。
相应于上述方法实施例,本发明实施例还提供了一种计算机程序产品,当其在电子设备上运行时,使得电子设备执行:上述任一翻译方法的方法步骤。
在本发明实施例中,当计算机程序产品在服务器上运行时,服务器可以接收由终端发送的翻译请求。然后,可以获取该翻译请求所请求翻译的待翻译文件,并确定该终端所属区域的区域信息。之后,可以查找与区域信息具有映射关系的句级翻译库。其中,句级翻译库存储有:预设语句与预设语句所对应的句子译文。之后,可以根据句级翻译库,查找待翻译文本中每个待翻译句子的译文。
这样,可以根据终端所属区域的区域信息,查找到符合该终端所属区域翻译习惯的句级翻译库。进而,可以利用该句级翻译库从句子层面对该待翻译文本进行翻译,这样可以获得符合该区域翻译方式的且准确的翻译结果。而且,在服务器本地通过句级翻译库对待翻译文本进行翻译的方式,不需要将所有待翻译文本发送至预设翻译服务器进行翻译,缩短了翻译链路,提升了翻译速度。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、服务器、计算机可读存储介质和计算机程序产品而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种翻译方法,其特征在于,应用于服务器,包括:
接收由终端发送的翻译请求;
获取所述翻译请求所请求翻译的待翻译文本;
确定所述终端所属区域的区域信息;
查找与所述区域信息具有映射关系的句级翻译库;其中,所述句级翻译库存储有:预设语句与所述预设语句所对应的句子译文;
根据所述句级翻译库,查找所述待翻译文本中每个待翻译句子的译文。
2.根据权利要求1所述的方法,其特征在于,所述根据所述句级翻译库,查找所述待翻译文本中每个待翻译句子的译文,包括:
查找与所述区域信息具有映射关系的词级纠错库;所述词级纠错库存储有:预设错词和所述预设错词对应的纠正词;
根据所述句级翻译库和所述词级纠错库,查找所述待翻译文本中每个待翻译句子的译文。
3.根据权利要求2所述的方法,其特征在于,所述根据所述句级翻译库和所述词级纠错库,查找所述待翻译文本中每个待翻译句子的译文,包括:
利用所述待翻译文本中的待翻译句子与所述句级翻译库中的预设语句进行比对,得到句子比对结果;
当所述句子比对结果为比对成功时,输出比对成功的预设语句所对应的句子译文,作为所述待翻译句子的译文;
当所述句子比对结果为失败时,利用所述待翻译句子中的词语与所述预设错词比对,得到错词比对结果;
当所述错词比对结果为比对成功时,利用比对成功的预设错词对应的纠正词对所述待翻译句子进行纠错,得到新的待翻译句子;
触发利用新的待翻译句子与所述句级翻译库中的预设语句进行比对,得到句子比对结果的操作。
4.根据权利要求2所述的方法,其特征在于,所述根据所述句级翻译库和所述词级纠错库,查找所述待翻译文本中每个待翻译句子的译文,包括:
利用所述待翻译句子中的词语与所述词级纠错库中的预设错词比对,得到错词比对结果;
当所述错词比对结果为比对成功时,利用比对成功的预设错词对应的纠正词对所述待翻译句子进行纠错,得到新的待翻译句子;
利用所述新的待翻译句子与所述句级翻译库中的预设语句进行比对,得到句子比对结果;
当句子比对结果为比对成功时,输出比对成功的预设语句所对应的句子译文,作为所述待翻译句子的译文。
5.根据权利要求1所述的方法,其特征在于,所述预设语句包括:高频语句;其中,所述高频语句为在预设时间段内出现次数超过预设阈值的语句。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在查找到所述待翻译句子的译文之后,在预设音频库中查找所述译文对应的译文音频;
将所述译文音频发送给所述终端。
7.一种翻译装置,其特征在于,应用于服务器,包括:
接收模块,用于接收由终端发送的翻译请求;
获取模块,用于获取所述翻译请求所请求翻译的待翻译文本;
确定模块,用于确定所述终端所属区域的区域信息;
第一查找模块,用于查找与所述区域信息具有映射关系的句级翻译库;其中,所述句级翻译库存储有:预设语句与所述预设语句所对应的句子译文;
第二查找模块,用于根据所述句级翻译库,查找所述待翻译文本中每个待翻译句子的译文。
8.根据权利要求7所述的装置,其特征在于,所述第二查找模块包括:
第一查找单元,用于查找与所述区域信息具有映射关系的词级纠错库;所述词级纠错库存储有:预设错词和所述预设错词对应的纠正词;
第二查找单元,用于根据所述句级翻译库和所述词级纠错库,查找所述待翻译文本中每个待翻译句子的译文。
9.一种服务器,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-6任一所述的方法步骤。
CN202010356158.8A 2020-04-29 2020-04-29 一种翻译方法、装置、服务器及计算机可读存储介质 Pending CN111539231A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010356158.8A CN111539231A (zh) 2020-04-29 2020-04-29 一种翻译方法、装置、服务器及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010356158.8A CN111539231A (zh) 2020-04-29 2020-04-29 一种翻译方法、装置、服务器及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111539231A true CN111539231A (zh) 2020-08-14

Family

ID=71975283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010356158.8A Pending CN111539231A (zh) 2020-04-29 2020-04-29 一种翻译方法、装置、服务器及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111539231A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1530861A (zh) * 2003-02-24 2004-09-22 语言翻译方法及其系统
KR20090061158A (ko) * 2007-12-11 2009-06-16 한국전자통신연구원 번역 시스템에서 오류 보정 패턴을 이용한 번역 오류 수정방법 및 장치
CN102799579A (zh) * 2012-07-18 2012-11-28 西安理工大学 具有错误自诊断和自纠错功能的统计机器翻译方法
CN103871407A (zh) * 2012-12-07 2014-06-18 浦项工科大学校产学协力团 语音识别错误的纠正方法及装置
CN106021240A (zh) * 2016-04-29 2016-10-12 北京创鑫旅程网络技术有限公司 一种旅行中常用外语语句及对应场景的自动识别方法
JP2019016048A (ja) * 2017-07-04 2019-01-31 株式会社Nttドコモ 情報処理装置及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1530861A (zh) * 2003-02-24 2004-09-22 语言翻译方法及其系统
KR20090061158A (ko) * 2007-12-11 2009-06-16 한국전자통신연구원 번역 시스템에서 오류 보정 패턴을 이용한 번역 오류 수정방법 및 장치
CN102799579A (zh) * 2012-07-18 2012-11-28 西安理工大学 具有错误自诊断和自纠错功能的统计机器翻译方法
CN103871407A (zh) * 2012-12-07 2014-06-18 浦项工科大学校产学协力团 语音识别错误的纠正方法及装置
CN106021240A (zh) * 2016-04-29 2016-10-12 北京创鑫旅程网络技术有限公司 一种旅行中常用外语语句及对应场景的自动识别方法
JP2019016048A (ja) * 2017-07-04 2019-01-31 株式会社Nttドコモ 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US8762128B1 (en) Back-translation filtering
US10446146B2 (en) Learning apparatus and method
CA3065765C (en) Extracting domain-specific actions and entities in natural language commands
US11373047B2 (en) Method, system, and computer program for artificial intelligence answer
US9122674B1 (en) Use of annotations in statistical machine translation
US9442920B2 (en) Speech translation system, dictionary server, and program
US10565986B2 (en) Extracting domain-specific actions and entities in natural language commands
WO2018057427A1 (en) Syntactic re-ranking of potential transcriptions during automatic speech recognition
JP2008216341A (ja) 誤り傾向学習音声認識装置及びコンピュータプログラム
CN109948122B (zh) 输入文本的纠错方法、装置及电子设备
US20210141993A1 (en) Hyperlink processing method and apparatus
CN114678027A (zh) 语音识别结果的纠错方法、装置、终端设备及存储介质
CN111339137A (zh) 一种数据校验方法及装置
CN113961768B (zh) 敏感词检测方法、装置、计算机设备和存储介质
US20160179885A1 (en) Method and System for Enhanced Search Term Suggestion
CN113095067A (zh) 一种ocr错误纠正的方法、装置、电子设备及存储介质
CN111539231A (zh) 一种翻译方法、装置、服务器及计算机可读存储介质
CN111581344A (zh) 一种接口信息审核方法、装置、计算机设备及存储介质
US20160124941A1 (en) Translation device, translation method, and non-transitory computer readable recording medium having therein translation program
CN116013307A (zh) 一种标点预测方法、装置、设备以及计算机存储介质
US20180075136A1 (en) Method and associated processor for adaptive linkify
JP2015200860A (ja) 辞書データベース管理装置、apiサーバ、辞書データベース管理方法、及び辞書データベース管理プログラム
CN113312540A (zh) 信息处理方法、装置、设备、系统及可读存储介质
CN112363929A (zh) 系统上线方法、装置、计算机设备及存储介质
CN110007779B (zh) 输入法预测首选项的确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination