CN109145312A - 一种基于二级缓存的机器翻译方法、装置、介质和电子设备 - Google Patents

一种基于二级缓存的机器翻译方法、装置、介质和电子设备 Download PDF

Info

Publication number
CN109145312A
CN109145312A CN201810696048.9A CN201810696048A CN109145312A CN 109145312 A CN109145312 A CN 109145312A CN 201810696048 A CN201810696048 A CN 201810696048A CN 109145312 A CN109145312 A CN 109145312A
Authority
CN
China
Prior art keywords
translation
text
cache
translation result
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810696048.9A
Other languages
English (en)
Inventor
张腾飞
程国艮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese Translation Language Through Polytron Technologies Inc
Original Assignee
Chinese Translation Language Through Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese Translation Language Through Polytron Technologies Inc filed Critical Chinese Translation Language Through Polytron Technologies Inc
Priority to CN201810696048.9A priority Critical patent/CN109145312A/zh
Publication of CN109145312A publication Critical patent/CN109145312A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供了一种基于二级缓存的机器翻译方法及装置,该方法包括以下步骤:获取需要翻译文本的翻译请求;根据请求语言方向增设多级缓存,原文与译文在缓存中以键值对的形式进行存储;根据所述语言方向和所述需要翻译文本在一级缓存中进行检索,若检索到翻译结果则输出译文;若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文。本发明采用二级缓存机制。二级缓存的作用是针对一级缓存中没有检索到翻译结果的文本处理。通过将复杂语句进行切分为简单语句,在二级缓存中检索。使得本发明翻译准确、高新,能够提供复杂文本的翻译。

Description

一种基于二级缓存的机器翻译方法、装置、介质和电子设备
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种基于二级缓存的机器翻译方法、装置、介质和电子设备。
背景技术
机器翻译是用计算机来实现不同语言之间翻译的技术。被翻译的语言通常称为源语言,翻译成的结果语言称为目标语言。机器翻译即实现从源语言到目标语言转换的过程,是自然语言处理的重要研究领域之一。
目前,最新的翻译技术发展趋势是人工神经网络技术,这种翻译技术借鉴人脑的运作架构,使用复杂的算法系统选择和使用适当的翻译结果。这种最新的翻译技术不仅能够即时翻译文本和语音,而且还可以理解文字背后的深层含义,从而摆脱字面翻译的窘境,进入更深层次的意译。
现有技术中高速缓存机器翻译方法通常采用的是一级缓存的方法,通过将用户提交的翻译请求文本,进行预处理、断句和切分处理,后台文本处理服务器通过遍历切分后的单句文本,在缓存中检索是否存在已有的翻译结果,最终将翻译结果返回到WEB端服务器。
现有技术最主要的缺陷是用户提交的翻译请求文本完全依赖翻译引擎进行翻译,当用户访问量较多时,只能依靠增加硬件设备提高效率。
因此如何设计一种高新的机器翻译方法或装置,成为行业所关注的重点。
发明内容
本发明的目的在于提供一种基于二级缓存的机器翻译方法或装置,能够解决上述提到的至少一个技术问题。具体方案如下:
根据本发明的具体实施方式,第一方面,本发明提供一种基于二级缓存的机器翻译方法,该方法包括以下步骤:获取需要翻译文本的翻译请求;根据请求语言方向增设多级缓存,原文与译文在缓存中以键值对的形式进行存储;根据所述语言方向和所述需要翻译文本在一级缓存中进行检索,若检索到翻译结果则输出译文;若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文。
根据本发明的具体实施方式,优选的,所述步骤“根据请求语言方向增设多级缓存”包括:增设一级缓存和二级缓存。
根据本发明的具体实施方式,优选的,所述步骤“若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文”包括:若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器;所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式;根据所述语言方向和所述单句形式在二级缓存中进行检索;若检索到翻译结果则输出二级缓存检索结果。
根据本发明的具体实施方式,优选的,所述步骤“所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式”包括:所述文本处理服务器对所述需要翻译文本按句末标点符号进行判断,按照预设的判断符号切分为单句形式。
根据本发明的具体实施方式,优选的,所述“预设的判断符号”包括:在不存在引号的情况下,判断符号为。或!或?;或者在存在引号的情况下,判断符号为。”或!”或?”。
根据本发明的具体实施方式,优选的,所述步骤“根据所述语言方向和所述单句形式在二级缓存中进行检索”后进一步包括:在二级缓存中对单句进行循环检索,若没有检索到翻译结果则对所述需要翻译文本进行译前处理;将所述译前处理结果提交给翻译引擎进行翻译;返回引擎翻译结果后对引擎翻译结果进行译后处理并在所述二级缓存中进行存储。
根据本发明的具体实施方式,优选的,所述“译后处理”包括:对检索到的所述二级缓存检索结果与所述引擎翻译结果按照顺序进行拼接,直至获得最终的翻译结果输出译文。
根据本发明的具体实施方式,优选的,还包括步骤:将所述输出译文存储于所述一级缓存。
根据本发明的具体实施方式,第二方面,本发明提供一种基于二级缓存的机器翻译装置,包括:获取单元,用于获取需要翻译文本的翻译请求;缓存单元,用于根据请求语言方向增设多级缓存,原文与译文在缓存中以键值对的形式进行存储;检索单元,用于根据所述语言方向和所述需要翻译文本在一级缓存中进行检索,若检索到翻译结果则输出译文;若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文。
根据本发明的具体实施方式,优选的,所述缓存单元包括:增设一级缓存和二级缓存。
根据本发明的具体实施方式,优选的,所述检索单元包括:若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器;所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式;根据所述语言方向和所述单句形式在二级缓存中进行检索;若检索到翻译结果则输出二级缓存检索结果。
根据本发明的具体实施方式,优选的,所述“所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式”包括:所述文本处理服务器对所述需要翻译文本按句末标点符号进行判断,按照预设的判断符号切分为单句形式。
根据本发明的具体实施方式,优选的,所述“预设的判断符号”包括:在不存在引号的情况下,判断符号为。或!或?;或者在存在引号的情况下,判断符号为。”或!”或?”。
根据本发明的具体实施方式,优选的,所述检索单元进一步包括:在二级缓存中对单句进行循环检索,若没有检索到翻译结果则对所述需要翻译文本进行译前处理;将所述译前处理结果提交给翻译引擎进行翻译;返回引擎翻译结果后对引擎翻译结果进行译后处理并在所述二级缓存中进行存储。
根据本发明的具体实施方式,优选的,所述“译后处理”包括:对检索到的所述二级缓存检索结果与所述引擎翻译结果按照顺序进行拼接,直至获得最终的翻译结果输出译文。
根据本发明的具体实施方式,第三方面,本发明提供一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如上任一所述的机器翻译方法。
根据本发明的具体实施方式,第四方面,本发明提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上任一所述的机器翻译方法。
本发明实施例的上述方案与现有技术相比,至少具有以下有益效果:
本发明提到的缓存方法采用的是二级缓存机制的方法,一级缓存的作用主要是针对于段落级的翻译请求文本,不需要经过处理可以直接在一级缓存中通过k/v策略,在缓存中检索是否存在已有的翻译结果。二级缓存的作用是针对一级缓存中没有检索到翻译结果的文本处理。翻译准确、高新,能够提供复杂文本的翻译。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了根据本发明实施例的机器翻译方法流程图;
图2示出了根据本发明的实施例的电子设备结构示意图;
图3示出了根据本发明的实施例的电子设备连接结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本申请实施例中可能采用术语第一、第二、第三等来描述……,但这些……不应限于这些术语。这些术语仅用来将……区分开。例如,在不脱离本申请实施例范围的情况下,第一……也可以被称为第二……,类似地,第二……也可以被称为第一……。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测 (陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
下面结合附图详细说明本发明的优选实施例。
实施例1
如图1所示,根据本发明的具体实施方式,第一方面,本发明提供一种基于二级缓存的机器翻译方法,该方法包括以下步骤:
S100:获取需要翻译文本的翻译请求。
具体的,用户通过输入或导入的方式将需要翻译的翻译文本通过输入口输入机器翻译入口,提出翻译请求,并选择需要翻译的一种或多种目标语言。本发明对输入的方式不做任何限制,可以采用语音识别的方式输入,或者大篇幅的导入待翻译文本,或者实时的输入需要翻译的文本。所述机器翻译可以为进行预编译的软件程序或结合了软件程序的硬件设备。
S200:根据请求语言方向增设多级缓存,原文与译文在缓存中以键值对的形式进行存储。
具体的,选择至少一种目标语言,并作为K/V策略增设一级缓存、二级缓存等多级缓存,优选的,本发明增设一级缓存、二级缓存。每一级缓存中都将带翻译的原文于目标语言以某种对应关系进行存储。翻译时根据预编辑的对应算法查找对应的目标语言。目标语言库可以是动态调整的。通常一级缓存存储比较常规的语句,且以短句为主,或者常见的词组为主。例如,你叫什么名字?上学去。等等
S300:根据所述语言方向和所述需要翻译文本在一级缓存中进行检索,若检索到翻译结果则输出译文。
具体的,先根据所述语言方向和所述需要翻译文本在一级缓存中进行检索,因为一级缓存检索到的是常规的语句,往往不能完全满足翻译要求,将没有在一级缓存中检索到的文本进行后续的二级缓存检索。当然,如果已经检索到了合适的目标文本,则完成本次翻译,输出译文。
S400:若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文。
具体的,如上所述,多数情况并不能通过一级检索获得目标文本,而需要将为剩余待翻译文本输入到文本处理器进行数据处理。此处的文本处理器可以是包括硬件处理器的算法程序单位或者纯虚拟单元。
根据本发明的具体实施方式,优选的,所述步骤“若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文”包括:若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器;所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式或者词组形式;根据所述语言方向和所述单句形式在二级缓存中进行检索;若检索到翻译结果则输出二级缓存检索结果。切分与检索可以是并行的也可以是串行的。
根据本发明的具体实施方式,优选的,所述步骤“所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式”包括:所述文本处理服务器对所述需要翻译文本按句末标点符号进行判断,按照预设的判断符号切分为单句形式。
根据本发明的具体实施方式,优选的,所述“预设的判断符号”包括:在不存在引号的情况下,判断符号为句号、感叹号或问号,即。或!或?;或者在存在引号的情况下,判断符号为句号+引号或感叹号+ 引号或问号+引号,即。”或!”或?”。当然也可以增加相应的切分方式,把逗号、分号也划入切分标准。
根据本发明的具体实施方式,优选的,所述步骤“根据所述语言方向和所述单句形式在二级缓存中进行检索”后进一步包括:在二级缓存中对单句进行循环检索,若没有检索到翻译结果则对所述需要翻译文本进行译前处理;将所述译前处理结果提交给翻译引擎进行翻译;返回引擎翻译结果后对引擎翻译结果进行译后处理并在所述二级缓存中进行存储。
根据本发明的具体实施方式,优选的,所述“译后处理”包括:对检索到的所述二级缓存检索结果与所述引擎翻译结果按照顺序进行拼接,直至获得最终的翻译结果输出译文。
根据本发明的具体实施方式,优选的,还包括步骤:将所述输出译文存储于所述一级缓存或二级缓存。
基于本发明的实施例,可以不限于二级缓存,可以类似的增加多级缓存,进行多级拆分检索。
本发明提到的缓存方法采用的是二级缓存机制的方法,一级缓存的作用主要是针对于段落级的翻译请求文本,不需要经过处理可以直接在一级缓存中通过k/v策略,在缓存中检索是否存在已有的翻译结果。二级缓存的作用是针对一级缓存中没有检索到翻译结果的文本处理。翻译准确、高新,能够提供复杂文本的翻译。
实施例2
如图2所示,根据本发明的具体实施方式,第二方面,本发明提供一种基于二级缓存的机器翻译装置,包括:获取单元,用于获取需要翻译文本的翻译请求;缓存单元,用于根据请求语言方向增设多级缓存,原文与译文在缓存中以键值对的形式进行存储;检索单元,用于根据所述语言方向和所述需要翻译文本在一级缓存中进行检索,若检索到翻译结果则输出译文;若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文。
本实施例所述单元可以是软件程序实现的功能单元,也可以是硬件电路结构实现相应功能的物理单元,对于此不做任何限制。
根据本发明的具体实施方式,优选的,所述缓存单元包括:作为 K/V策略增设一级缓存和二级缓存。
根据本发明的具体实施方式,优选的,所述检索单元包括:若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器;所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式;根据所述语言方向和所述单句形式在二级缓存中进行检索;若检索到翻译结果则输出二级缓存检索结果。
根据本发明的具体实施方式,优选的,所述“所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式”包括:所述文本处理服务器对所述需要翻译文本按句末标点符号进行判断,按照预设的判断符号切分为单句形式。
根据本发明的具体实施方式,优选的,所述“预设的判断符号”包括:在不存在引号的情况下,判断符号为句号、感叹号或问号,即。或!或?;或者在存在引号的情况下,判断符号为句号+引号或感叹号+ 引号或问号+引号,即。”或!”或?”。当然也可以增加相应的切分方式,把逗号、分号也划入切分标准。
根据本发明的具体实施方式,优选的,所述检索单元进一步包括:在二级缓存中对单句进行循环检索,若没有检索到翻译结果则对所述需要翻译文本进行译前处理;将所述译前处理结果提交给翻译引擎进行翻译;返回引擎翻译结果后对引擎翻译结果进行译后处理并在所述二级缓存中进行存储。
根据本发明的具体实施方式,优选的,所述“译后处理”包括:对检索到的所述二级缓存检索结果与所述引擎翻译结果按照顺序进行拼接,直至获得最终的翻译结果输出译文。
本发明提到的缓存方法采用的是二级缓存机制的方法,一级缓存的作用主要是针对于段落级的翻译请求文本,不需要经过处理可以直接在一级缓存中通过k/v策略,在缓存中检索是否存在已有的翻译结果。二级缓存的作用是针对一级缓存中没有检索到翻译结果的文本处理。翻译准确、高新,能够提供复杂文本的翻译。
实施例3
如图3所示,本实施例提供一种电子设备,该设备用于机器翻译方法,所述电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取需要翻译文本的翻译请求;根据请求语言方向增设多级缓存,原文与译文在缓存中以键值对的形式进行存储;根据所述语言方向和所述需要翻译文本在一级缓存中进行检索,若检索到翻译结果则输出译文;若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文。
根据本发明的具体实施方式,优选的,所述步骤“根据请求语言方向增设多级缓存”包括:作为K/V策略增设一级缓存和二级缓存。
根据本发明的具体实施方式,优选的,所述步骤“若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文”包括:若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器;所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式;根据所述语言方向和所述单句形式在二级缓存中进行检索;若检索到翻译结果则输出二级缓存检索结果。
根据本发明的具体实施方式,优选的,所述步骤“所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式”包括:所述文本处理服务器对所述需要翻译文本按句末标点符号进行判断,按照预设的判断符号切分为单句形式。
根据本发明的具体实施方式,优选的,所述“预设的判断符号”包括:在不存在引号的情况下,判断符号为句号、感叹号或问号,即。或!或?;或者在存在引号的情况下,判断符号为句号+引号或感叹号+ 引号或问号+引号,即。”或!”或?”。当然也可以增加相应的切分方式,把逗号、分号也划入切分标准。
根据本发明的具体实施方式,优选的,所述步骤“根据所述语言方向和所述单句形式在二级缓存中进行检索”后进一步包括:在二级缓存中对单句进行循环检索,若没有检索到翻译结果则对所述需要翻译文本进行译前处理;将所述译前处理结果提交给翻译引擎进行翻译;返回引擎翻译结果后对引擎翻译结果进行译后处理并在所述二级缓存中进行存储。
根据本发明的具体实施方式,优选的,所述“译后处理”包括:对检索到的所述二级缓存检索结果与所述引擎翻译结果按照顺序进行拼接,直至获得最终的翻译结果输出译文。
根据本发明的具体实施方式,优选的,还包括步骤:将所述输出译文存储于所述一级缓存。
实施例4
本申请实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于二级缓存的机器翻译方法。
实施例5
图3是本实施例提供的一种基于二级缓存的机器翻译方法的电子设备的硬件结构示意图,如图3所示,该设备包括:
一个或多个处理器310以及存储器320,图3中以一个处理器310为例。
基于二级缓存的机器翻译方法的设备还可以包括:输入装置330和输出装置340。
处理器310、存储器320、输入装置330和输出装置340可以通过总线或者其他方式连接,图3中以通过总线连接为例。
存储器320作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的基于二级缓存的机器翻译方法对应的程序指令/模块。处理器310 通过运行存储在存储器320中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例基于二级缓存的机器翻译方法。
存储器320可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于二级缓存的机器翻译装置的使用所创建的数据等。此外,存储器320可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。
输入装置330可接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器320中,当被所述一个或者多个处理器310执行时,执行上述任意方法实施例中的基于二级缓存的机器翻译方法。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。
本发明实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MI D和 UMPC设备等,例如i Pad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置,例如电视机、车载大屏等。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (13)

1.一种基于二级缓存的机器翻译方法,其特征在于,该方法包括以下步骤:
获取需要翻译文本的翻译请求;
根据请求语言方向增设两级缓存,原文与译文在缓存中以键值对的形式进行存储;该两级缓存包括一级缓存和二级缓存;
根据所述语言方向和所述需要翻译文本在一级缓存中进行检索,若检索到翻译结果则输出译文;
若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文。
2.根据权利要求1所述的方法,其特征在于,所述步骤“若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文”包括:
若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器;
所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式;
根据所述语言方向和所述单句形式在二级缓存中进行检索;
若检索到翻译结果则输出二级缓存检索结果。
3.根据权利要求2所述的方法,其特征在于,所述步骤“所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式”包括:
所述文本处理服务器对所述需要翻译文本按句末标点符号进行判断,按照预设的判断符号切分为单句形式。
4.根据权利要求3所述的方法,其特征在于,所述“预设的判断符号”包括:
在不存在引号的情况下,判断符号为。或!或?;或者
在存在引号的情况下,判断符号为。”或!”或?”。
5.根据权利要求2-4任一所述的方法,其特征在于,所述步骤“根据所述语言方向和所述单句形式在二级缓存中进行检索”后进一步包括:
在二级缓存中对单句进行循环检索,若没有检索到翻译结果则对所述需要翻译文本进行译前处理;
将所述译前处理结果提交给翻译引擎进行翻译;
返回引擎翻译结果后对引擎翻译结果进行译后处理并在所述二级缓存中进行存储。
6.根据权利要求5所述的方法,其特征在于,所述“译后处理”包括:对检索到的所述二级缓存检索结果与所述引擎翻译结果按照顺序进行拼接,直至获得最终的翻译结果输出译文。
7.根据权利要求6所述的方法,其特征在于,还包括步骤:
将所述输出译文存储于所述一级缓存。
8.一种基于二级缓存的机器翻译装置,其特征在于,包括:
获取单元,用于获取需要翻译文本的翻译请求;
缓存单元,用于根据请求语言方向增设两级缓存,原文与译文在缓存中以键值对的形式进行存储;该两级缓存包括一级缓存和二级缓存;
检索单元,用于根据所述语言方向和所述需要翻译文本在一级缓存中进行检索,若检索到翻译结果则输出译文;若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器,直至获得最终的翻译结果输出译文。
9.根据权利要求8所述的装置,其特征在于,所述检索单元包括:若没有检索到翻译结果,则将所述需要翻译文本提交给文本处理服务器;所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式;根据所述语言方向和所述单句形式在二级缓存中进行检索;若检索到翻译结果则输出二级缓存检索结果。
10.根据权利要求19所述的装置,其特征在于,所述“所述文本处理服务器对所述需要翻译文本按语法进行切分,切分为单句形式”包括:
所述文本处理服务器对所述需要翻译文本按句末标点符号进行判断,按照预设的判断符号切分为单句形式。
11.根据权利要求10所述的装置,其特征在于,所述“预设的判断符号”包括:
在不存在引号的情况下,判断符号为。或!或?;或者
在存在引号的情况下,判断符号为。”或!”或?”。
12.根据权利要求9-11任一所述的装置,其特征在于,所述检索单元进一步包括:
在二级缓存中对单句进行循环检索,若没有检索到翻译结果则对所述需要翻译文本进行译前处理;将所述译前处理结果提交给翻译引擎进行翻译;返回引擎翻译结果后对引擎翻译结果进行译后处理并在所述二级缓存中进行存储。
13.根据权利要求12所述的装置,其特征在于,所述“译后处理”包括:对检索到的所述二级缓存检索结果与所述引擎翻译结果按照顺序进行拼接,直至获得最终的翻译结果输出译文。
CN201810696048.9A 2018-06-29 2018-06-29 一种基于二级缓存的机器翻译方法、装置、介质和电子设备 Pending CN109145312A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810696048.9A CN109145312A (zh) 2018-06-29 2018-06-29 一种基于二级缓存的机器翻译方法、装置、介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810696048.9A CN109145312A (zh) 2018-06-29 2018-06-29 一种基于二级缓存的机器翻译方法、装置、介质和电子设备

Publications (1)

Publication Number Publication Date
CN109145312A true CN109145312A (zh) 2019-01-04

Family

ID=64802435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810696048.9A Pending CN109145312A (zh) 2018-06-29 2018-06-29 一种基于二级缓存的机器翻译方法、装置、介质和电子设备

Country Status (1)

Country Link
CN (1) CN109145312A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489762A (zh) * 2019-06-26 2019-11-22 中译语通科技股份有限公司 基于神经网络机器翻译的术语翻译方法、存储介质和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102651750A (zh) * 2011-02-24 2012-08-29 阿里巴巴集团控股有限公司 一种提供网页信息的方法、系统及装置
CN103838718A (zh) * 2014-02-24 2014-06-04 武汉传神信息技术有限公司 一种翻译系统及翻译方法
CN107562736A (zh) * 2017-08-07 2018-01-09 中译语通科技(青岛)有限公司 一种基于神经元的高速缓存机器翻译方法及系统
CN107943794A (zh) * 2016-10-12 2018-04-20 阿里巴巴集团控股有限公司 一种翻译方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102651750A (zh) * 2011-02-24 2012-08-29 阿里巴巴集团控股有限公司 一种提供网页信息的方法、系统及装置
CN103838718A (zh) * 2014-02-24 2014-06-04 武汉传神信息技术有限公司 一种翻译系统及翻译方法
CN107943794A (zh) * 2016-10-12 2018-04-20 阿里巴巴集团控股有限公司 一种翻译方法及系统
CN107562736A (zh) * 2017-08-07 2018-01-09 中译语通科技(青岛)有限公司 一种基于神经元的高速缓存机器翻译方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110489762A (zh) * 2019-06-26 2019-11-22 中译语通科技股份有限公司 基于神经网络机器翻译的术语翻译方法、存储介质和装置

Similar Documents

Publication Publication Date Title
US20210232761A1 (en) Methods and systems for improving machine learning performance
US10733197B2 (en) Method and apparatus for providing information based on artificial intelligence
US11645314B2 (en) Interactive information retrieval using knowledge graphs
KR102288249B1 (ko) 정보 처리 방법, 단말기, 및 컴퓨터 저장 매체
CN109086303A (zh) 基于机器阅读理解的智能对话方法、装置、终端
CN108829893A (zh) 确定视频标签的方法、装置、存储介质和终端设备
US9766868B2 (en) Dynamic source code generation
US20170092261A1 (en) System and method for crowd-sourced data labeling
US9619209B1 (en) Dynamic source code generation
US11238050B2 (en) Method and apparatus for determining response for user input data, and medium
US10083002B2 (en) Using voice-based web navigation to conserve cellular data
CN111428010A (zh) 人机智能问答的方法和装置
US10838993B2 (en) Augment politeness in question answer systems
US20130304471A1 (en) Contextual Voice Query Dilation
CN108960574A (zh) 问答的质量确定方法、装置、服务器和存储介质
CN110334268B (zh) 一种区块链项目热词生成方法以及装置
CN107943940A (zh) 数据处理方法、介质、系统和电子设备
CN111414746A (zh) 一种匹配语句确定方法、装置、设备及存储介质
US20220365956A1 (en) Method and apparatus for generating patent summary information, and electronic device and medium
CN111428011B (zh) 词语的推荐方法、装置、设备及存储介质
CN114048288A (zh) 细粒度情感分析方法、系统、计算机设备和存储介质
CN112329429A (zh) 文本相似度学习方法、装置、设备以及存储介质
US9946765B2 (en) Building a domain knowledge and term identity using crowd sourcing
CN109145312A (zh) 一种基于二级缓存的机器翻译方法、装置、介质和电子设备
CN106339418A (zh) 一种分类纠错方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190104