CN113392653A - 翻译方法、相关装置、设备及计算机可读存储介质 - Google Patents

翻译方法、相关装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN113392653A
CN113392653A CN202011000326.6A CN202011000326A CN113392653A CN 113392653 A CN113392653 A CN 113392653A CN 202011000326 A CN202011000326 A CN 202011000326A CN 113392653 A CN113392653 A CN 113392653A
Authority
CN
China
Prior art keywords
translation
target
statement
translated
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011000326.6A
Other languages
English (en)
Inventor
徐传飞
刘刚毅
潘邵武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to PCT/CN2021/078646 priority Critical patent/WO2021179956A1/zh
Publication of CN113392653A publication Critical patent/CN113392653A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供了一种翻译方法、相关装置、设备及计算机可读存储介质,涉及人工智能领域,具体涉及自然语言处理领域,该方法包括应用于协同系统,协同系统包括Q个设备;Q个设备之间建立有通信连接;方法包括:第一设备获取待翻译文本;针对待翻译文本,第一设备确定Q个设备中每个设备各自需要翻译的目标分配结果;至少一个目标分配结果包括目标翻译语句和目标翻译语句对应的附加翻译语句;第一设备向Q个设备中每个设备分别发送各自需要翻译的目标分配结果;第一设备获取Q个设备各自对应的翻译结果,并根据Q个设备各自对应的翻译结果获取待翻译文本的目标翻译结果;输出目标翻译结果。实施本申请,可以提高翻译结果的准确性。

Description

翻译方法、相关装置、设备及计算机可读存储介质
技术领域
本申请涉及人工智能领域,尤其涉及一种翻译方法、相关装置、设备及计算机可读存储介质。
背景技术
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知推理与决策的功能。
目前,不同语种之间的信息交流已经成为信息交往中的重要组成部分,随之而来的对各种语言服务,尤其是翻译服务的需求也越来越广泛。然而目前翻译人员尤其是高端翻译人员严重紧缺,并且,翻译人员在进行翻译时,需要花费大量的时间来查询和翻译专业词汇,导致翻译的效率低以及成本高。随着人工智能技术的不断发展,越来越多的自然语言处理(Natural Language Process,NLP)任务可以采用人工智能技术来实现,例如采用人工智能技术来实现翻译任务。以机器翻译(Machine Traslation,MT)为例,机器翻译是指,利用终端设备(例如,终端设备可以包括手机、计算机等)将一种语言的语句转换成另一种语言的语句的过程。
现有技术中,通常采用单设备(例如,一个终端设备)来进行机器翻译。在翻译时,终端设备将待翻译的源文档拆分成至少一个短语,分别对每个短语进行翻译,得到每个短语对应的译文片段;之后,将每个译文片段进行拼接,从而可以得到待翻译的源文档的翻译结果。
在实现本公开的过程中,发明人在研究中发现,上述实现方式容易带来翻译结果的准确性差的问题。
发明内容
本申请提供了一种翻译方法、相关装置、设备及计算机可读存储介质,可以提高翻译结果的准确性。
第一方面,本申请实施例提供了一种翻译方法,应用于协同系统,所述协同系统包括Q个设备;所述Q个设备之间建立有通信连接;Q为大于1的正整数;所述方法包括:第一设备获取待翻译文本;针对所述待翻译文本,所述第一设备确定所述Q个设备中每个设备各自需要翻译的目标分配结果;其中,至少一个目标分配结果包括目标翻译语句和所述目标翻译语句对应的附加翻译语句;所述附加翻译语句在所述待翻译文本中的位置位于所述目标翻译语句之前;所述第一设备向所述Q个设备中每个设备分别发送各自需要翻译的目标分配结果;所述第一设备获取所述Q个设备各自对应的翻译结果,并根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果;输出所述目标翻译结果。
实施本申请实施例,由于协同系统中的每个设备各自需要翻译的目标分配结果中包括目标翻译语句和该目标翻译语句对应的附加翻译语句,保证了文本表达的流畅度,可以提高翻译结果的准确性。
在一种可能的实现方式中,所述附加翻译语句的数量为K;所述K为大于1的正整数。
在一种可能的实现方式中,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第一设备确定所述待翻译文本的目标分配结果,包括:所述第一设备获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的M个附加翻译语句;若所述第一设备通过翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度大于第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句作为所述第i目标分配结果;若所述第一设备通过所述翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度小于所述第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的M个附加翻译语句作为所述第i目标分配结果。实施本申请实施例,第一设备可以通过由目标翻译语句和目标翻译语句对应的前K个附加翻译语句构成的分配结果所对应的翻译结果和由目标翻译语句和目标翻译语句对应的前K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度来确定协同系统中的每个设备各自需要翻译的目标分配结果,由于协同系统中的每个设备各自需要翻译的目标分配结果中包括目标翻译语句和该目标翻译语句对应的附加翻译语句,保证了文本表达的流畅度,可以提高翻译结果的准确性。
在一种可能的实现方式中,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第一设备确定所述待翻译文本的目标分配结果,包括:所述第一设备获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的所有附加翻译语句;所述第一设备通过训练好的分类器确定位于所述第j目标翻译语句之前的所有附加翻译语句各自对应的分类结果,所述分类结果包括与所述第j目标翻译语句属于同一个类别,或,与所述第j目标翻译语句不属于同一个类别,将所述分类结果中与所述第j目标翻译语句属于同一个类别的附加翻译语句以及所述第j目标翻译语句作为所述第i目标分配结果;其中,所述分类器为基于至少一个样本数据集训练得到的模型,所述至少一个样本数据集包括N个类别;N为正整数。实施本申请实施例,第一设备可以通过训练好的分类器确定协同系统中的每个设备各自需要翻译的目标分配结果,由于协同系统中的每个设备各自需要翻译的目标分配结果中包括目标翻译语句和该目标翻译语句对应的附加翻译语句,保证了文本表达的流畅度,可以提高翻译结果的准确性。
在一种可能的实现方式中,所述根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果,包括:当所述Q个设备各自对应的翻译结果中存在至少两个同一个待翻译语句对应的翻译结果,剔除冗余翻译结果,以得到所述待翻译文本的目标翻译结果。实施本申请实施例,当Q个设备各自对应的翻译结果中存在至少两个同一个待翻译语句对应的翻译结果,剔除冗余翻译结果,可以避免目标翻译结果中包含冗余翻译结果,使得目标翻译结果变得简练。
第二方面,本申请实施例提供了一种翻译方法,方法应用于协同系统,所述协同系统包括Q个设备;所述Q个设备之间建立有通信连接;Q为大于1的正整数;所述方法包括:所述Q个设备中的第i设备接收第一设备发送的第i目标分配结果;其中,所述第i目标分配结果包括所述第i设备需要翻译的第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句包括各自对应的指示信息;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句为待翻译文本中的语句;所述第i设备通过翻译模型对所述第i目标分配结果进行翻译,得到所述第j目标翻译语句对应的翻译结果和所述附加翻译语句对应的翻译结果;所述第i设备将所述第j目标翻译语句对应的翻译结果发送给所述第一设备;所述第一设备用于根据所述第j目标翻译语句对应的翻译结果得到所述待翻译文本的目标翻译结果。
实施本申请实施例,Q个设备中的第i设备可以根据目标翻译语句和附加翻译语句各自对应的指示信息对其进行区分,通过翻译模型进行翻译后,可以得到目标翻译语句对应的翻译结果和附加翻译语句对应的翻译结果,之后,第i设备将目标翻译语句对应的翻译结果发送给第一设备(也即,第i设备不会将附加翻译语句对应的翻译结果发送给第一设备),以便第一设备获取待翻译文本的目标翻译结果。在这一实现方式中,即使Q个设备中的每个设备各自需要翻译的目标分配结果中出现了冗余分配结果(例如,同一个待翻译的语句被分配给了Q个设备中的不同设备进行翻译),第一设备获取到的每个设备各自对应的翻译结果中也不会存在至少两个同一个待翻译语句对应的翻译结果,此时,无需剔除冗余翻译结果,可以提高翻译的效率。
第三方面,本申请实施例提供了一种翻译装置,该翻译装置应用于协同系统,所述协同系统包括Q个设备;所述Q个设备之间建立有通信连接;Q为大于1的正整数;其中,第一设备包括:文本获取单元,用于所述第一设备获取待翻译文本;确定单元,用于针对所述待翻译文本,所述第一设备确定所述Q个设备中每个设备各自需要翻译的目标分配结果;其中,至少一个目标分配结果包括目标翻译语句和所述目标翻译语句对应的附加翻译语句;所述附加翻译语句在所述待翻译文本中的位置位于所述目标翻译语句之前;发送单元,用于向所述Q个设备中每个设备分别发送各自需要翻译的目标分配结果;处理单元,用于获取所述Q个设备各自对应的翻译结果,并根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果;输出单元,用于输出所述目标翻译结果。
实施本申请实施例,由于协同系统中的每个设备各自需要翻译的目标分配结果中包括目标翻译语句和该目标翻译语句对应的附加翻译语句,保证了文本表达的流畅度,可以提高翻译结果的准确性。
在一种可能的实现方式中,所述附加翻译语句的数量为K;所述K为大于1的正整数。
在一种可能的实现方式中,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述确定单元具体用于:获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的M个附加翻译语句;若通过翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度大于第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句作为所述第i目标分配结果;若通过所述翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度小于所述第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的M个附加翻译语句作为所述第i目标分配结果。
在一种可能的实现方式中,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述确定单元具体用于:获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的所有附加翻译语句;通过训练好的分类器确定位于所述第j目标翻译语句之前的所有附加翻译语句各自对应的分类结果,所述分类结果包括与所述第j目标翻译语句属于同一个类别,或,与所述第j目标翻译语句不属于同一个类别,将所述分类结果中与所述第j目标翻译语句属于同一个类别的附加翻译语句以及所述第j目标翻译语句作为所述第i目标分配结果;其中,所述分类器为基于至少一个样本数据集训练得到的模型,所述至少一个样本数据集包括N个类别;N为正整数。
在一种可能的实现方式中,所述处理单元,具体用于:
当所述Q个设备各自对应的翻译结果中存在至少两个同一个待翻译语句对应的翻译结果,剔除冗余翻译结果,以得到所述待翻译文本的目标翻译结果。
第四方面,本申请实施例提供了一种翻译装置,装置应用于协同系统,所述协同系统包括Q个设备;所述Q个设备之间建立有通信连接;Q为大于1的正整数;所述Q个设备的第i设备包括:
接收单元,用于接收第一设备发送的第i目标分配结果;其中,所述第i目标分配结果包括所述第i设备需要翻译的第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句包括各自对应的指示信息;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句为待翻译文本中的语句;
翻译单元,用于通过翻译模型对所述第i目标分配结果进行翻译,得到所述第j目标翻译语句对应的翻译结果和所述附加翻译语句对应的翻译结果;
发送单元,用于将所述第j目标翻译语句对应的翻译结果发送给所述第一设备;所述第一设备用于根据所述第j目标翻译语句对应的翻译结果得到所述待翻译文本的目标翻译结果。
第五方面,本申请实施例还提供一种翻译设备,该翻译设备可以包括存储器和处理器,所述存储器用于存储支持翻译设备执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第一方面的方法。
第六方面,本申请实施例还提供一种翻译设备,该翻译设备可以包括存储器和处理器,所述存储器用于存储支持翻译设备执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行上述第二方面的方法。
第七方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
第八方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第二方面的方法。
第九方面,本申请实施例还提供了一种计算机程序,所述计算机程序包括计算机软件指令,所述计算机软件指令当被计算机执行时使所述计算机执行如第一方面所述的任一种翻译方法。
第十方面,本申请实施例还提供了一种计算机程序,所述计算机程序包括计算机软件指令,所述计算机软件指令当被计算机执行时使所述计算机执行如第一方面所述的任一种翻译方法。
附图说明
图1为本申请实施例提供的一种协同系统的架构示意图;
图2a为本申请实施例提供的一种翻译方法的流程示意图;
图2b为本申请实施例提供的一种目标分配结果的分配示意图;
图2c为本申请实施例提供的一种翻译过程的示意图;
图3为本申请实施例提供的一种翻译装置的结构示意图;
图4为本申请实施例提供的一种翻译设备的结构示意图;
图5为本申请实施例提供的一种多设备协同的系统框图;
图6为本申请实施例提供的一种神经网络处理器的结构示意图;
图7为本申请实施例提供的另一种翻译装置的结构示意图;
图8为本申请实施例提供的另一种翻译设备的结构示意图。
具体实施方式
下面结合附图对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
本申请的说明书实施例和权利要求书及上述附图中的术语“第一”、“第二”、和“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。“和/或”用于表示在其所连接的两个对象之间选择一个或全部。例如“A和/或B”表示A、B或A+B。
随着互联网的高速发展带来的网络文本数据爆炸式的增长和经济全球化的发展,不同国家之间的信息交流和信息交换变得越来越频繁。同时,蓬勃发展的互联网为获取诸如英语、汉语、法语、德语和日语等各种语言形式的信息交流和信息交换提供了极大的便利。这些语言形式多样的数据给机器翻译的发展带来了很好的发展契机。本申请实施例提供的翻译方法、相关装置、设备适用于中文信息与其他语言形式的信息的互译操作,在此不做限制。下面将以中文译为英文为例对本申请实施例提供的翻译方法、相关装置、设备进行说明。
在本申请实施例中,Q个设备,其中,Q为大于1的正整数,又称多个设备,这里的“多个”,应该理解为至少2个,例如,可以为2个,也可以为3个,还可以为8个等等。
在本申请实施例中,设备是指资源丰富度大于一定阈值的设备。具体来说,设备的资源丰富度可以是指设备的能力大小。例如,设备的能力可以包括内存容量、中央处理器(Central Processing Unit/Processor,CPU)处理速度、图形处理器(GraphicsProcessing Unit,GPU)处理速度、神经网络处理器(Network ProcessingUnit,NPU)处理速度、剩余电量、计算能力、以及存储能力等等。在具体实现中,设备可以为手机、智能手机、个人数字助理(Personal Digital Assistant,PDA)、平板电脑、可穿戴设备(例如,手表,手环)、音箱、摄像头以及可以实现设备相互通信的设备等等。
在本申请实施例中,设备可以通过翻译模型对待翻译语句进行翻译。具体来说,翻译模型可以为神经网络架构Transformer模型,它是一个完全基于注意力机制(attention-based)的编码器-解码器(encoder-decoder)模型。其主要思想是将待翻译的语句(又可以称为“源语句”)经过编码器(encoder)编码成为一个向量表示,然后利用解码器(decoder)对源语句的向量表示进行解码,翻译成为其对应的译文。
为了便于更好的理解本申请实施例所描述的翻译方法,下面结合图1对本申请实施例的可能的应用场景进行简单的介绍:
应用场景一:
如图1所示,设备T1、T2、T3、T4和T5共同组成了一个协同系统,具体地,设备T1可以为智能手机A、设备T2可以为台式计算机、设备T3可以为便携式笔记本、设备T4可以为智能手机B、设备T5可以为普通音箱。在实际应用中,上述5个设备均可以响应用户发起的针对待翻译文本的翻译任务,调度协同系统中的多个设备对待翻译文本进行翻译,得到翻译结果;之后,输出该翻译结果。例如,以智能手机A为例,用户在智能手机A上可以发起针对待翻译文本的翻译任务,确定协同系统中每个设备各自需要翻译的目标分配结果;其中,至少一个目标分配结果包括目标翻译语句和目标翻译语句对应的附加翻译语句,附加翻译语句在待翻译文本中的位置位于目标翻译语句之前;然后,智能手机A向多个设备中每个设备分别发送各自需要翻译的目标分配结果,以使得每个设备通过翻译模型对目标分配结果进行翻译,得到对应的翻译结果;之后,智能手机A可以获取多个设备各自对应的翻译结果,并根据Q个设备各自对应的翻译结果获取待翻译文本的目标翻译结果,继而将该目标翻译结果输出。在这一实现方式中,一方面,由于充分利用了协同系统中的多个设备,相较于通过单设备来进行翻译而言,可以避免因字数限制导致超出部分无法翻译的情形,还可以提高翻译效率。另一方面,对协同系统中的每个设备来说,由于其分配的目标分配结果包括目标翻译语句和目标翻译语句对应的附加翻译语句,可以提高翻译结果的准确性。
需要说明的是,在一个示例中,智能手机A可以响应用户发起的针对待翻译文本的翻译请求,将待翻译文本分配给协同系统中包含智能手机A在内的所有设备进行翻译,以得到待翻译文本的翻译结果。在一个示例中,智能手机A可以响应用户发起的针对待翻译文本的翻译请求,将待翻译文本分配给协同系统中除智能手机A之外的其他设备进行翻译,以得到待翻译文本的翻译结果。
在本申请实施例中,协同系统中的多个设备可以通过分布式总线进行连接,也可以通过wifi或蓝牙进行组网,从而可以实现设备与设备之间的通信。
基于图1所示的应用场景,为了便于理解,下面先介绍在本申请实施例中,如何组建多设备构成的协同系统。在一个示例中,多设备可以包括一个主设备和多个从设备。在一个示例中,多设备可以包括多个主设备和多个从设备。
以多设备可以包括一个主设备和多个从设备为例进行阐述,在多个设备中选择主设备时,可以根据多个设备的能力大小来选择,从中选择能力大于设定好的阈值的设备作为主设备。例如,可以根据内存容量、中央处理器(Central Processing Unit/Processor,CPU)处理速度、GPU处理速度、NPU处理速度、剩余电量、以及存储能力等几个方面从多个设备中选择出能力大于设定好的阈值的设备作为主设备。例如,如图1所示,将设备TI(智能手机A)作为该协同系统的主设备。
在本申请实施例中,主设备可以向多个从设备发送组网信息。例如,如图1所示,设备T1为主设备,在一种可能的实现方式中,主设备T1可以向从设备T2、T3、T4和T5发送组网信息。在一种可能的实现方式中,主设备T1可以先向一个从设备发送组网信息,然后,再由从设备向其他从设备转发组网信息。
在本申请实施例中,组网信息用于在主设备和多个从设备之间建立协同系统,基于构建的协同系统可以得到设备资源池。
在本申请实施例中,主设备可以通过广播的形式向各个从设备发送组网信息,也就是说,该组网信息可以是主设备向各个从设备发送的广播信息。在一些实现方式中,主设备还可以通过组播的形式向各个从设备发送组网信息,也就是说,该组网信息可以是主设备向各个从设备发送的组播信息。
在本申请实施例中,在从设备接收到主设备发送的组网信息之后,如果该从设备确定加入该协同系统,那么,该从设备可以向主设备发送组网确认信息,以确认该从设备加入协同系统。
在一种可能的实现方式中,多个从设备中的每个从设备在接收到主设备发送的组网信息之后,每个从设备均向主设备发送一个组网确认信息。
在另一种可能的实现方式中,多个从设备中的某个从设备可以将接收到的其他从设备的组网确认信息通过转发的形式发送给主设备。
应理解,在实际应用中,同一局域网内的设备可以通过wifi、蓝牙等方式进行组网,得到协同系统。
那么,对于主设备来说,主设备在接收到多个从设备的组网确认信息之后,主设备可以向多个从设备发送同步对时信息,这里,该同步对时信息可以为握手信息。
之后,多个从设备中的每个从设备向主设备回复握手信息,从而可以实现协同系统中各个设备之间的初步同步。
可以理解的是,在一个示例中,在组网成功后,主设备可以将待翻译文本分配给多个从设备进行翻译,以得到待翻译文本的翻译结果。在一个示例中,在组网成功后,主设备可以将待翻译文本分配给主设备在内的多个设备进行翻译,以得到待翻译文本的翻译结果。
在本申请实施例中,从设备可以用于翻译主设备分配的目标分配结果,其中,至少一个目标分配结果包括目标翻译语句和目标翻译语句对应的附加翻译语句。之后,将翻译结果发送给主设备,以便主设备对多个从设备各自对应的翻译结果进行整理(例如,去除冗余翻译结果),得到目标翻译结果。
在本申请实施例中,对于协同系统中的从设备来说,从设备用于翻译主设备分配的目标分配结果之外,各个从设备还可以向主设备上报运行状态信息。继而,主设备可以根据各个从设备上报的运行状态信息确定各个从设备是否发生异常,在从设备(例如,第i从设备)出现异常的情况下,主设备可以向第i从设备发送清除设备信息。这里,清除设备信息用于将从设备从协同系统中清除,此时,主设备不会将目标分配结果分配给从设备进行翻译。
还应当理解的是,当协同系统中新增了其他从设备的情况下,主设备可以与新增的从设备建立通信连接,并将目标分配结果分配给新增的从设备进行翻译。
参见图2a,为本申请实施例提供的一种翻译方法的流程示意图。如图2a所示,该方法应用于协同系统,该系统中包括Q个设备,Q个设备之间建立有通信连接,其中,Q为大于1的正整数。在本方法描述过程中,以Q个设备中的第一设备为例进行阐述,该方法可以包括但不限于如下步骤:
步骤S200、第一设备获取待翻译文本。
在一个示例中,第一设备可以为Q个设备中的任意一个设备。在这种情况下,第一设备可以接收用户输入的待翻译文本,并响应用户发起的针对待翻译文本的翻译请求,然后,将待翻译文本分配给协同系统中包含第一设备在内的所有设备进行翻译。
在一个示例中,第一设备为Q个设备之外的一个设备。在这种情况下,第一设备可以接收用户输入的待翻译文本,并响应用户发起的针对待翻译文本的翻译请求,然后,将待翻译文本分配给协同系统中除第一设备之外的其他设备进行翻译。
在本申请实施例中,待翻译文本可以为同一语种的语言,也可以为不同语种的语言,本申请实施例不作具体限定。在实际应用中,待翻译文本的语种可以根据实际翻译需求进行设置。例如,当翻译模型应用于中译英的应用场景时,待翻译文本的语种可以为中文。又例如,当翻译模型应用于英译法的应用场景时,待翻译文本的语种可以为英文。又例如,当翻译模型应用于中法互译的应用场景时,待翻译文本的语种可以为中文和/或法文。
在本申请实施例中,待翻译文本可以是对用户输入的语音进行识别转换得到的文本,也可以是对用户输入的文字进行整理得到的文本,此处不作具体限定。示例性地,第一设备可以通过语音采集装置采集用户的语音,然后,对采集到的语音进行识别转换,从而可以得到待翻译文本。
步骤S202、针对所述待翻译文本,所述第一设备确定所述Q个设备中每个设备各自需要翻译的目标分配结果;其中,至少一个目标分配结果包括目标翻译语句和所述目标翻译语句对应的附加翻译语句;所述附加翻译语句在所述待翻译文本中的位置位于所述目标翻译语句之前。
在本申请实施例中,附加翻译语句的数量为K,其中,K为大于0的正整数,例如,K可以为1。又例如,K可以为2。
在本申请实施例中,第一设备在获取到待翻译文本之后,可以按照待翻译文本中包含的语句或文字段落平均分配给Q个设备中的每个设备,此外,还将附加翻译语句分配给Q个设备中的每个设备。例如,待翻译文本中包含的有8个待翻译的语句,分别为语句1、语句2、语句3、……、语句8;协同系统中包含4个设备,分别为设备1、设备2、设备3、设备4,以设备1确定这4个设备各自需要翻译的目标分配结果,其中,设备1用于获取第一目标分配结果,第一目标分配结果包括语句1和语句2;设备2用于获取第二目标分配结果,其中,第二目标分配结果包括语句3、语句4以及附加翻译语句2;设备3用于获取第三目标分配结果,其中,第三目标分配结果包括语句5、语句6以及附加翻译语句4;设备4用于获取第四目标分配结果,其中,第四目标分配结果包括语句7、语句8以及附加翻译语句6。需要说明的是,这里所例举的关于每个设备的目标分配结果只是一种示例,不应构成限定。
在本申请实施例中,目标翻译语句和附件翻译语句是指,以标点符号为断点对待翻译文本进行分句得到的语句。一般来说,标点符号可以包括逗号(,)、句号(。)、问号(?)、惊叹号(!)。在以逗号(,)为断点对待翻译文本进行分句时,得到的每个句子为不完整语句(也即:该句子中缺少一些成分)。在以句号(。)、问号(?)、惊叹号(!)对待翻译文本进行分句时,得到的每个句子为完整的语句。可以理解的是,以标点符号为断点对待翻译文本进行分句时,得到的句子中可以包括不完整的语句和/或完整的语句。
在一些实施例中,通过上述方法对待翻译文本进行分句,可以使得分句得到的每个目标翻译语句为完整的语句,分句得到的每个附加翻译语句为不完整的语句。
在一些实施例中,通过上述方法对待翻译文本进行分句,可以使得分句得到的每个目标翻译语句为完整的语句,分句得到的每个附加翻译语句为完整的语句。
在一些实施例中,通过上述方法对待翻译文本进行分句,可以使得分句得到的每个目标翻译语句为不完整的语句,分句得到的每个附加翻译语句为不完整的语句。
接下来具体阐述,在本申请中,是如何确定Q个设备中每个设备各自需要翻译的目标分配结果:
在一个示例中,目标分配结果包括第i目标分配结果,第i目标分配结果用于指示Q个设备中的第i设备对第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和第j目标翻译语句对应的附加翻译语句;针对待翻译文本,第一设备确定Q个设备中每个设备各自需要翻译的目标分配结果的实现过程可以包括:第一设备获取第j翻译子文本;其中,第j翻译子文本包括第j目标翻译语句和在待翻译文本中位于第j目标翻译语句之前的M个附加翻译语句;若所述第一设备通过翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度大于第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句作为所述第i目标分配结果;若所述第一设备通过所述翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度小于所述第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的M个附加翻译语句作为所述第i目标分配结果。
在本申请实施例中,Q个设备中的第i设备可以理解为Q个设备中的某一个设备,也可以理解为Q个设备中的任意一个设备,此处不作具体限定。
在本申请实施例中,相似度是指,两个事物之间相似的程度。具体来说,相似度可以为两个翻译结果中包含相同词的数量与两个翻译结果中包含的词的总数之间的比值。在中译英的应用场景中,以待翻译语句为“我仍然热衷于这项运动”为例,示例性地,第一设备通过翻译模型得到该待翻译语句对应的翻译结果可以为:I still love this sport;示例性地,第一设备通过翻译模型得到该待翻译语句对应的翻译结果可以为:I am still verykeen on this sport。之后,第一设备可以获取这两个翻译结果之间的相似度,具体地,该相似度为4/13。
在本申请实施例中,第一阈值可以是第一设备设置的,也可以是第一设备根据用户的需求设置的,例如,第一阈值可以为70%,等等。
举例来说,待翻译文本中包括3个语句,分别为语句1、语句2和语句3;协同系统中包含3个设备。其中,设备1用于接收第一目标分配结果,从而设备1可以通过翻译模型对第一目标分配结果进行翻译,具体地,第一目标分配结果可以包括语句1;其中,语句1为分配给设备1上的目标翻译语句,该第一目标分配结果中不包含附加翻译语句;设备2用于接收第二目标分配结果,从而设备2可以通过翻译模型对第二目标分配结果进行翻译,具体地,第二目标分配结果包括语句1和语句2;其中,语句2为分配给设备2上的目标翻译语句,语句1为附加翻译语句;设备3用于接收第三目标分配结果,从而设备3可以通过翻译模型对第三目标分配结果进行翻译。在一个示例中,第三目标分配结果可以包括语句1、语句2和语句3;其中,语句3为分配给设备3上的目标翻译语句,语句1和语句2为附加翻译语句;在一个示例中,第三目标分配结果可以包括语句2和语句3;其中,语句3为分配为设备3上的目标翻译语句,语句2为附加翻译语句。可以理解的是,对于语句3来说,其附加翻译语句的表现形态有2种,在这种情况下,第一设备可以通过翻译模型确定这两个目标分配结果各自对应的翻译结果的相似度,然后,基于相似度来确定语句3对应的附加翻译语句的数量。具体来说,第一设备通过翻译模型获取语句2和语句3(其中,语句3为目标翻译语句,语句2为附加翻译语句)对应的翻译结果(简称为翻译结果a),之后,第一设备通过翻译模型获取语句1、语句2和语句3(其中,语句3为目标翻译语句,语句1和语句2为附加翻译语句)对应的翻译结果(简称为翻译结果b),然后,确定这两个翻译结果之间的相似度,例如,该相似度为75%,若两个翻译结果之间的相似度大于第一阈值(例如,第一阈值为70%),在这种情况下,第一设备将语句2和语句3作为第三目标分配结果。具体来说,第一设备确定每个设备各自需要翻译的目标分配结果的示意图可以如图2b所示。可以理解的是,3个设备中的每个设备可以对各自需要翻译的目标分配结果进行翻译,以得到对应的翻译结果。
需要说明的是,上述举例中,语句1为分配给设备1上的目标翻译语句、语句2为分配给设备2上的目标翻译语句和语句3为分配给设备3上的目标翻译语句只是作为一种示例,不应构成限定。例如,在目标分配结果中,语句2可以为分配给设备1上的目标翻译语句,语句1可以为分配给设备2上的目标翻译语句和语句3可以为分配给设备3上的目标翻译语句。
在一个示例中,目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第一设备确定所述待翻译文本的目标分配结果,包括:所述第一设备获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的所有附加翻译语句;所述第一设备通过训练好的分类器确定位于所述第j目标翻译语句之前的所有附加翻译语句各自对应的分类结果,所述分类结果包括与所述第j目标翻译语句属于同一个类别,或,与所述第j目标翻译语句不属于同一个类别,将所述分类结果中与所述第j目标翻译语句属于同一个类别的附加翻译语句以及所述第j目标翻译语句作为所述第i目标分配结果;其中,所述分类器为基于至少一个样本数据集训练得到的模型,所述至少一个样本数据集包括N个类别;N为正整数。
在本申请实施例中,分类器,用于通过已知的训练样本数据集(其中,训练样本数据集包括训练样本对应的类别)来学习分类规则,以实现对测试样本数据集进行分类(或者预测)。具体来说,可以通过人工的方式对训练样本数据集进行标注,得到训练样本数据对应的类别。在对分类器进行训练时,可以基于至少一个样本数据集对分类器进行训练,其中,至少一个样本数据集可以包括2个类别。当通过至少一个样本数据集完成了分类器的训练之后,第一设备可以将第j目标翻译语句之前的所有附加翻译语句输入到训练好的分类器中,分类器通过提取每个附加翻译语句各自对应的特征,然后,确定提取到的每个附加翻译语句的特征与第j目标翻译语句对应的特征之间的距离是否满足设定的好的阈值(亦或者,确定每个附加翻译语句中是否与第j目标翻译语句包含有同一个事物,又或者,确定每个附加翻译语句中是否与第j目标翻译包含同一个实体,该实体可以为人名,地名等等),若满足,则第一设备确定该附加翻译语句与第j目标翻译语句属于同一个类别;若不满足,则第一设备确定该附加翻译语句与第j目标翻译语句不属于同一个类别。
在一个示例中,可以通过指示信息“0”、“1”来对附加翻译语句进行标注。示例性地,“1”用于表征该附加翻译语句与第j目标翻译语句属于同一个类别;“0”用于表征该附加语句与第j目标翻译语句不属于同一个类别。示例性地,“0”用于表征该附加翻译语句与第j目标翻译语句属于同一个类别,“1”用于表征该附加翻译语句与第j目标翻译语句不属于同一个类别。出于后续阐述的便利,在本申请实施例中,默认1”用于表征该附加翻译语句与第j目标翻译语句属于同一个类别;“0”用于表征该附加语句与第j目标翻译语句不属于同一个类别。
可以理解的是,在确定了位于第j目标翻译语句之前的所有附加翻译语句各自对应的分类结果(其中,分类结果包括与第j目标翻译语句属于同一个类别,或,与第j目标翻译语句不属于同一个类别)之后,第一设备将分类结果中与第j目标翻译语句属于同一个类别的附加翻译语句以及第j目标翻译语句作为第i目标分配结果。
举例来说,待翻译文本中包括3个语句,分别为语句1、语句2和语句3;协同系统中包含3个设备。其中,设备1用于接收第一目标分配结果,从而设备1可以通过翻译模型对第一目标分配结果进行翻译,具体地,第一目标分配结果可以包括语句1;其中,语句1为分配给设备1上的目标翻译语句,该第一目标分配结果中可以不包含附加翻译语句;设备2用于接收第二目标分配结果,从而设备2可以通过翻译模型对第二目标分配结果进行翻译,具体地,第二目标分配结果可以包括语句2;其中,语句2为分配给设备2上的目标翻译语句;设备3用于接收第三目标分配结果,从而设备3可以通过翻译模型对第三目标分配结果进行翻译,具体地,第三目标分配结果可以包括语句3;其中,语句3为分配给设备3上的目标翻译语句。以确定语句3对应的附加翻译语句为例,语句1和语句2为位于语句3之前的所有附加翻译语句,第一设备通过训练好的分类器确定语句1和语句2各自对应的分类结果,例如,语句1与语句3属于同一个类别;例如,语句2和语句3不属于同一个类别。那么,在这种情况下,第一设备确定第三目标分配结果可以包括语句2和语句3。从而,设备3可以对第三目标分配结果进行翻译,以得到对应的翻译结果。
在一个示例中,目标分配结果包括第i目标分配结果,第i目标分配结果用于指示Q个设备中的第i设备对第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和第j目标翻译语句对应的附加翻译语句;针对待翻译文本,第一设备确定Q个设备中每个设备各自需要翻译的目标分配结果的实现过程可以包括:第一设备获取第j翻译子文本;其中,第j翻译子文本包括第j目标翻译语句和在待翻译文本中位于第j目标翻译语句之前的M个附加翻译语句;若所述第一设备通过翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度大于第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句作为所述第i中间分配结果;若所述第一设备通过所述翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度小于所述第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的M个附加翻译语句作为所述第i中间分配结果。之后,第一设备通过训练好的分类器确定位于所述第j目标翻译语句之前的M个附加翻译语句各自对应的分类结果,所述分类结果包括与所述第j目标翻译语句属于同一个类别,或,与所述第j目标翻译语句不属于同一个类别,将所述分类结果中与所述第j目标翻译语句属于同一个类别的附加翻译语句以及所述第j目标翻译语句作为所述第i’中间分配结果;其中,所述分类器为基于至少一个样本数据集训练得到的模型,所述至少一个样本数据集包括N个类别;N为正整数。然后,根据第i中间分配结果和第i’中间分配结果确定第i目标分配结果。关于其具体实现,请参考前述描述,此处不多加赘述。在这一实现方式中,既考虑了在待翻译文本中与目标翻译语句距离较远的附加翻译语句,又考虑了在待翻译文本中与目标翻译语句距离较近的附件翻译语句,可以提高翻译结果的准确性。
步骤S204、第一设备向所述Q个设备中每个设备分别发送各自需要翻译的目标分配结果。
举例来说,假设待翻译文本中包括3个语句,分别为语句1、语句2和语句3;协同系统中包含3个设备;分别为设备1、设备2和设备3。假定设备1为第一设备,第一设备采用前述描述的任意一种方法确定3个设备中每个设备各自需要的目标分配结果,例如,设备1将第一目标分配结果分配给设备1,其中,第一目标分配结果包括语句1;设备1将第二目标分配结果分配给设备2,其中,第二目标分配结果语句1和语句2;设备1将第三目标分配结果分配给设备3,其中,第三目标分配结果包括语句1、语句2和语句3。那么,在这种情况下,对执行翻译工作的3个设备来说,设备1在接收到第一目标分配结果之后,可以通过翻译模型对第一目标分配结果进行翻译,得到对应的翻译结果;设备2在接收到第二目标分配结果之后,可以通过翻译模型对第二目标分配结果进行翻译,得到对应的翻译结果;设备3在接收到第三目标分配结果之后,可以通过翻译模型对第三目标分配结果进行翻译,得到对应的翻译结果。
步骤S206、所述第一设备获取所述Q个设备各自对应的翻译结果,并根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果。
当Q个设备中的每个设备完成了各自需要翻译的目标分配结果的翻译工作之后,可以将目标分配结果对应的翻译结果发送给第一设备,以便第一设备获取待翻译文本的目标分配结果。
在一个示例中,目标分配结果对应的翻译结果中可以包括目标翻译语句对应的翻译结果和附加翻译语句对应的翻译结果。当Q个设备中的每个设备各自需要翻译的目标分配结果中存在至少两个同一个待翻译语句时,例如,同一个待翻译的语句被分配给了Q个设备中的不同设备进行翻译,第一设备获取到Q个设备各自对应的翻译结果中存在至少两个同一个待翻译语句对应的翻译结果,也即:翻译结果中产生了冗余翻译结果,此时,第一设备可以剔除翻译结果中的冗余翻译结果,以得到待翻译文本的目标翻译结果。
举例来说,假设待翻译文本中包括3个语句,分别为语句1、语句2和语句3;协同系统中包含3个设备;分别为设备1、设备2和设备3。假定设备1为第一设备,第一设备采用前述描述的任意一种方法确定3个设备中每个设备各自需要的目标分配结果,例如,设备1将第一目标分配结果分配给设备1,其中,第一目标分配结果包括语句1;设备1将第二目标分配结果分配给设备2,其中,第二目标分配结果语句1和语句2;设备1将第三目标分配结果分配给设备3,其中,第三目标分配结果包括语句1、语句2和语句3。那么,在这种情况下,对执行翻译工作的3个设备来说,可以通过翻译模型获取各自需要翻译的目标分配结果对应的翻译结果。例如,设备1可以通过翻译模型得到翻译结果1,其中,翻译结果1包括语句1对应的翻译结果1A。设备2可以通过翻译模型得到翻译结果2,其中,翻译结果2包括语句1对应的翻译结果1B和语句2对应的翻译结果2A。设备3可以通过翻译模型得到翻译结果3,其中,翻译结果3包括语句1对应的翻译结果1C、语句2对应的翻译结果2B和语句3对应的翻译结果3A。可以理解的是,当第一设备在获取到这3个设备各自需要翻译的目标分配结果对应的翻译结果之后,当第一设备确定3个设备各自对应的翻译结果中存在至少两个同一个待翻译语句对应的翻译结果时,剔除冗余翻译结果,在一个示例中,待翻译文本的目标翻译结果可以包括:1A、2A和3A。在一个示例中,待翻译文本的目标翻译结果可以包括:1A、2B和3A。在一个示例中,待翻译文本的目标翻译结果可以包括:1C、2B和3A。
在一个示例中,考虑到目标翻译语句和附加翻译语句包括不同的指示信息,示例性地,该指示信息可以为标识。例如,001用于指代目标翻译语句,002用于指代附加翻译语句,那么,对于协同系统中的Q个设备来说,例如,Q个设备包括第i设备,第i设备可以根据指示信息对目标翻译语句和附加翻译语句进行区分,其中,附加翻译语句用于辅助翻译目标翻译语句,当第i设备接收到第一设备确定好的第i目标分配结果之后,第i设备通过翻译模型获取目标翻译语句和附加翻译语句的翻译结果之后,第i设备将目标翻译语句对应的翻译结果发送给第一设备(也即,第i设备不会将附加翻译语句对应的翻译结果发送给第一设备),以便第一设备获取待翻译文本的目标翻译结果。
举例来说,假设待翻译文本中包括3个语句,分别为语句1、语句2和语句3;协同系统中包含3个设备;分别为设备1、设备2和设备3。假定设备1为第一设备,第一设备采用前述描述的任意一种方法确定3个设备中每个设备各自需要的目标分配结果,例如,设备1将第一目标分配结果分配给设备1,其中,第一目标分配结果包括语句1;设备1将第二目标分配结果分配给设备2,其中,第二目标分配结果语句1和语句2;设备1将第三目标分配结果分配给设备3,其中,第三目标分配结果包括语句1、语句2和语句3。那么,在这种情况下,对执行翻译工作的3个设备来说,可以通过翻译模型获取各自需要翻译的目标分配结果对应的翻译结果。在设备通过翻译模型进行翻译时,设备可以通过指示信息对目标翻译语句和附加翻译语句进行区分,其中,附加翻译语句用于辅助翻译目标翻译语句。例如,设备1可以通过翻译模型得到翻译结果1,其中,翻译结果1包括语句1对应的翻译结果1A。设备2可以通过翻译模型得到翻译结果2,其中,翻译结果2包括语句1对应的翻译结果1B和语句2对应的翻译结果2A。设备3可以通过翻译模型得到翻译结果3,其中,翻译结果3包括语句1对应的翻译结果1C、语句2对应的翻译结果2B和语句3对应的翻译结果3A。当3个设备获取到翻译结果之后,设备1将翻译结果1A发送给设备1,设备2将翻译结果2A发送给设备1,设备3将翻译结果3A发送给设备1,当第一设备(设备1)在获取到这3个设备各自需要翻译的目标分配结果对应的翻译结果之后,得到待翻译文本对应的目标翻译结果,具体地,待翻译文本的目标翻译结果可以包括:1A、2A和3A。可以理解的是,在这一实现方式中,即使Q个设备中的每个设备各自需要翻译的目标分配结果中出现了冗余分配结果(例如,同一个待翻译的语句被分配给了Q个设备中的不同设备进行翻译),第一设备获取到的每个设备各自对应的翻译结果中也不会存在至少两个同一个待翻译语句对应的翻译结果,此时,无需剔除冗余翻译结果,可以提高翻译的效率。
下面结合具体的实例进行阐述:
待翻译文本为“根据是否要求类别之间存在显式的层次关系,层次分类方法可分为两大类。第一类方法要求类别间的层次关系是显式的,层次分类器中除根节点外的每个节点分别对应原始类别中的一个类,这在文本分类和生物系统分类等特定文本中较常见。Sllla和Freitas对这类方法进行较为详细的综述,本文不再赘述。本文主要综述第二类层次分类方法,这类方法要求类别间的层次关系是隐式的,类别标签只出现在层次分类器的叶子节点层,中间节点上对应的类别由原始类别集合的子集组成,这些子集称为元类(Mela-Class)或宏类(Main-Class)。这类方法一般用于解决不便直接标注具有显式层次关系的类别标签的分类问题,例如,图像分类。具体来说,这类层次分类方法一般利用类别标签在特征空间或语义空间中的层次关系,将多类问题进行分解,建立相应的类别层次结构,然后对分解后得到的规模较小的分类问题进行求解,分类时则依据层次结构将多个分类器的结果总和得到最终的分类结果。除特别说明外,下文所提到的层次分类方法均指第二类方法。”,如图2c所示,第一目标分配结果可以包括S1和S2(完整的语句),第一目标分配结果中不包含附加翻译语句;第二目标分配结果包括S3和S4,其对应的附加翻译语句为context1,其中,context1可以表示为“这在文本分类和生物系统分类等特定文本中较常见。”;第三目标分配结果包括S5和S6,其对应的附加翻译语句为context2,其中,context2可以表示为“这些子集称为元类(Mela-Class)或宏类(Main-Class)。”;第四目标翻译语句包括S7,其对应的附加翻译语句为context3,其中,context3可以表示为“然后对分解后得到的规模较小的分类问题进行求解,分类时则依据层次结构将多个分类器的结果总和得到最终的分类结果。”例如,设备1用于接收第一目标分配结果,从而设备1可以通过翻译模型对第一目标分配结果进行翻译,具体地,第一目标分配结果对应的翻译结果为{t1,t2};其中,t1为目标翻译语句S1的翻译结果,t2为目标翻译语句S2的翻译结果;设备2用于接收第二目标分配结果,从而设备2可以通过翻译模型对第二目标分配结果进行翻译,具体地,第二目标分配结果对应的翻译结果为{ti,t3,t4};其中,ti为附加翻译语句context1的翻译结果,t3为目标翻译语句S3的翻译结果,t4为目标翻译语句S4的翻译结果;设备3用于接收第三目标分配结果,从而设备3可以通过翻译模型对第三目标分配结果进行翻译,具体地,第三目标分配结果对应的翻译结果为{tj,t5,t6},其中,tj为附加翻译语句context2的翻译结果,t5为目标翻译语句S5的翻译结果,t6为目标翻译语句S6的翻译结果;设备4用于接收第四目标分配结果,从而设备4可以通过翻译模型对第四目标分配结果进行翻译,具体地,第四目标分配结果对应的翻译结果为{ts,t7};其中,ts为附加翻译语句context3的翻译结果,t7为目标翻译语句S7的翻译结果。在第一设备获取到上述4个设备各自对应的翻译结果之后,剔除翻译结果中的冗余翻译结果,得到目标翻译结果{t1,t2,t3,t4,t5,t6,t7}。步骤S208、输出目标翻译结果。
在一个示例中,第一设备可以通过显示屏显示该目标翻译结果。在一个示例中,第一设备可以通过语音播报装置输出该目标翻译结果。
实施本申请实施例,由于协同系统中的每个设备各自需要翻译的目标分配结果中包括目标翻译语句和该目标翻译语句对应的附加翻译语句,保证了文本表达的流畅度,可以提高翻译结果的准确性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本披露并不受所描述的动作顺序的限制,因为依据本披露,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本披露所必须的。
进一步需要说明的是,虽然图2a的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2a中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
上文结合图1-图2c对本申请实施例的翻译方法进行了详细的描述,为了便于更好地实施本申请实施例的上述方案,相应地,下面还提供用于配合实施上述方案的相关装置和设备。
参见图3,为本申请实施例提供的一种翻译装置的结构示意图,该翻译装置30应用于协同系统,协同系统中包括Q个设备,Q个设备之间建立有通信连接,Q为大于1的正整数;其中,第一设备包括:
文本获取单元300,用于所述第一设备获取待翻译文本;
确定单元302,用于针对所述待翻译文本,所述第一设备确定所述Q个设备中每个设备各自需要翻译的目标分配结果;其中,至少一个目标分配结果包括目标翻译语句和所述目标翻译语句对应的附加翻译语句;所述附加翻译语句在所述待翻译文本中的位置位于所述目标翻译语句之前;
发送单元304,用于向所述Q个设备中每个设备分别发送各自需要翻译的目标分配结果;
处理单元306,用于获取所述Q个设备各自对应的翻译结果,并根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果;
输出单元308,用于输出所述目标翻译结果。
在一种可能的实现方式中,所述附加翻译语句的数量为K;所述K为大于1的正整数。
在一种可能的实现方式中,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述确定单元302具体用于:
获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的M个附加翻译语句;
若通过翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度大于第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句作为所述第i目标分配结果;
若通过所述翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度小于所述第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的M个附加翻译语句作为所述第i目标分配结果。
在一种可能的实现方式中,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述确定单元302具体用于:
获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的所有附加翻译语句;
通过训练好的分类器确定位于所述第j目标翻译语句之前的所有附加翻译语句各自对应的分类结果,所述分类结果包括与所述第j目标翻译语句属于同一个类别,或,与所述第j目标翻译语句不属于同一个类别,将所述分类结果中与所述第j目标翻译语句属于同一个类别的附加翻译语句以及所述第j目标翻译语句作为所述第i目标分配结果;其中,所述分类器为基于至少一个样本数据集训练得到的模型,所述至少一个样本数据集包括N个类别;N为正整数。
在一种可能的实现方式中,所述处理单元306,具体用于:
当所述Q个设备各自对应的翻译结果中存在至少两个同一个待翻译语句对应的翻译结果,剔除冗余翻译结果,以得到所述待翻译文本的目标翻译结果。
实施本申请实施例,由于协同系统中的每个设备各自需要翻译的目标分配结果中包括目标翻译语句和该目标翻译语句对应的附加翻译语句,保证了文本表达的流畅度,可以提高翻译结果的准确性。
需要说明的是,上述系统中的各个装置还可以包括其他单元,各个设备、单元的具体实现可以参见上述方法实施例中相关描述,此处,不再赘述。
为了便于更好地实施本申请实施例的上述方案,本申请还对应提供了一种翻译设备,下面结合附图来进行详细说明:
如图4示出的本申请实施例提供的翻译设备的结构示意图,翻译设备40可以包括处理器401、存储器404和通信模块405,处理器401、存储器404和通信模块405可以通过总线406相互连接。存储器404可以是高速随机存储记忆体(Random Access Memory,RAM)存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器404可选的还可以是至少一个位于远离前述处理器401的存储系统。存储器404用于存储应用程序代码,可以包括操作系统、网络通信模块、用户接口模块以及数据处理程序,通信模块405用于与外部设备进行信息交互;处理器401被配置用于调用该程序代码,执行以下步骤:
获取待翻译文本;
针对所述待翻译文本,确定所述Q个设备中每个设备各自需要翻译的目标分配结果;其中,至少一个目标分配结果包括目标翻译语句和所述目标翻译语句对应的附加翻译语句;所述附加翻译语句在所述待翻译文本中的位置位于所述目标翻译语句之前;
向所述Q个设备中每个设备分别发送各自需要翻译的目标分配结果;
获取所述Q个设备各自对应的翻译结果,并根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果;
输出所述目标翻译结果。
其中,所述附加翻译语句的数量为K;所述K为大于1的正整数。
其中,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述处理器401确定所述待翻译文本的目标分配结果,包括:
获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的M个附加翻译语句;
若通过翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度大于第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句作为所述第i目标分配结果;
若通过所述翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度小于所述第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的M个附加翻译语句作为所述第i目标分配结果。
其中,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所处理器401确定所述待翻译文本的目标分配结果,包括:
获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的所有附加翻译语句;
通过训练好的分类器确定位于所述第j目标翻译语句之前的所有附加翻译语句各自对应的分类结果,所述分类结果包括与所述第j目标翻译语句属于同一个类别,或,与所述第j目标翻译语句不属于同一个类别,将所述分类结果中与所述第j目标翻译语句属于同一个类别的附加翻译语句以及所述第j目标翻译语句作为所述第i目标分配结果;其中,所述分类器为基于至少一个样本数据集训练得到的模型,所述至少一个样本数据集包括N个类别;N为正整数。
其中,所述处理器401根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果,可以包括:
当所述Q个设备各自对应的翻译结果中存在至少两个同一个待翻译语句对应的翻译结果,剔除冗余翻译结果,以得到所述待翻译文本的目标翻译结果。
需要说明的是,本申请实施例中的翻译设备40中处理器的执行步骤可参考上述各方法实施例中图2a实施例中的翻译装置运行的具体实现方式,这里不再赘述。
在具体实现中,翻译设备40可以包括移动手机、平板电脑、个人数字助理(Personal Digital Assistant,PDA)、移动互联网设备(Mobile Internet Device,MID)等各种用户可以使用的设备,本申请实施例不作具体限定。
图5是本申请实施例提供的协同系统的示意性框图。该协同系统50可以包括多个设备,例如,多个设备可以包括设备501,设备502以及设备50n。其中,设备501、设备502和设备50n的具体作用如下:
在实际应用中,该协同系统中的第一设备用于获取待翻译文本;针对所述待翻译文本,所述第一设备确定所述Q个设备中每个设备各自需要翻译的目标分配结果;其中,至少一个目标分配结果包括目标翻译语句和所述目标翻译语句对应的附加翻译语句;所述附加翻译语句在所述待翻译文本中的位置位于所述目标翻译语句之前;向所述Q个设备中每个设备分别发送各自需要翻译的目标分配结果;获取所述Q个设备各自对应的翻译结果,并根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果;输出所述目标翻译结果。
应理解,协同系统中的设备501相当于上文中的翻译装置30或者翻译设备40。
前述实施例描述了Q个设备中的每个设备通过翻译模型对每个设备各自需要翻译的目标分配结果进行翻译,具体来说,Q个设备中的每个设备通过翻译模型进行翻译时,可以在NPU中实现。此外,可以理解的是,基于至少一个样本数据集对分类器进行训练的过程以及通过训练好的分类器确定附加翻译语句与目标翻译语句是否属于同一个类别时,也可以在NPU中实现。图6为本申请实施例提供的一种神经网络处理器的结构示意图。
神经网络处理器NPU 60NPU作为协处理器挂载到主CPU(Host CPU)上,由Host CPU分配任务。NPU的核心部分为运算电路603,通过控制器604控制运算电路603提取存储器中的矩阵数据并进行乘法运算。
在一些实现中,运算电路603内部包括多个处理单元(Process Engine,PE)。在一些实现中,运算电路603是二维脉动阵列。运算电路603还可以是一维脉动阵列或者能够执行例如乘法和加法这样的数学运算的其它电子线路。在一些实现中,运算电路603是通用的矩阵处理器。
举例来说,假设有输入矩阵A,权重矩阵B,输出矩阵C。运算电路从权重存储器602中取矩阵B相应的数据,并缓存在运算电路中每一个PE上。运算电路从输入存储器601中取矩阵A数据与矩阵B进行矩阵运算,得到的矩阵的部分结果或最终结果,保存在累加器608accumulator中。
统一存储器606用于存放输入数据以及输出数据。权重数据直接通过存储单元访问控制器605Direct Memory Access Controller,DMAC被搬运到权重存储器602中。输入数据也通过DMAC被搬运到统一存储器606中。
BIU为Bus Interface Unit即,总线接口单元610,用于AXI总线与DMAC和取指存储器609Instruction Fetch Buffer的交互。
总线接口单元610(Bus Interface Unit,简称BIU),用于取指存储器609从外部存储器获取指令,还用于存储单元访问控制器605从外部存储器获取输入矩阵A或者权重矩阵B的原数据。
DMAC主要用于将外部存储器DDR中的输入数据搬运到统一存储器606或将权重数据搬运到权重存储器602中或将输入数据搬运到输入存储器601中。
向量计算单元607多个运算处理单元,在需要的情况下,对运算电路的输出做进一步处理,如向量乘,向量加,指数运算,对数运算,大小比较等等。主要用于神经网络中非卷积/FC层网络计算,如Pooling(池化),Batch Normalization(批归一化),Local ResponseNormalization(局部响应归一化)等。
在一些实现中,向量计算单元能607将经处理的输出的向量存储到统一缓存器606。例如,向量计算单元607可以将非线性函数应用到运算电路603的输出,例如累加值的向量,用以生成激活值。在一些实现中,向量计算单元607生成归一化的值、合并值,或二者均有。在一些实现中,处理过的输出的向量能够用作到运算电路603的激活输入,例如用于在神经网络中的后续层中的使用。
控制器604连接的取指存储器(instruction fetch buffer)609,用于存储控制器604使用的指令;
统一存储器606,输入存储器601,权重存储器602以及取指存储器609均为On-Chip存储器。外部存储器私有于该NPU硬件架构。
其中,神经网络架构Transformer模型中各层的运算可以由矩阵计算单元212或向量计算单元607执行。
本申请采用NPU完成目标分配结果的翻译,可以大大提高设备处理自然语言处理任务的效率。
图7为本申请实施例提供的一种翻译装置的结构示意图,该翻译装置70应用于协同系统,协同系统中包括Q个设备,Q个设备之间建立有通信连接,Q为大于1的正整数;其中,Q个设备的第i设备包括:
接收单元700,用于接收第一设备发送的第i目标分配结果;其中,所述第i目标分配结果包括所述第i设备需要翻译的第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句包括各自对应的指示信息;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句为待翻译文本中的语句;
翻译单元702,用于通过翻译模型对所述第i目标分配结果进行翻译,得到所述第j目标翻译语句对应的翻译结果和所述附加翻译语句对应的翻译结果;
发送单元704,用于将所述第j目标翻译语句对应的翻译结果发送给所述第一设备;所述第一设备用于根据所述第j目标翻译语句对应的翻译结果得到所述待翻译文本的目标翻译结果。
实施本申请实施例,Q个设备中的第i设备可以根据目标翻译语句和附加翻译语句各自对应的指示信息对其进行区分,通过翻译模型进行翻译后,可以得到目标翻译语句对应的翻译结果和附加翻译语句对应的翻译结果,之后,第i设备将目标翻译语句对应的翻译结果发送给第一设备(也即,第i设备不会将附加翻译语句对应的翻译结果发送给第一设备),以便第一设备获取待翻译文本的目标翻译结果。在这一实现方式中,即使Q个设备中的每个设备各自需要翻译的目标分配结果中出现了冗余分配结果(例如,同一个待翻译的语句被分配给了Q个设备中的不同设备进行翻译),第一设备获取到的每个设备各自对应的翻译结果中也不会存在至少两个同一个待翻译语句对应的翻译结果,此时,无需剔除冗余翻译结果,可以提高翻译的效率。
本申请还对应提供了一种翻译设备,下面结合附图来进行详细说明:
如图8示出的本申请实施例提供的翻译设备的结构示意图,该翻译设备可以具体为Q个设备中的第i设备;翻译设备80可以包括处理器801、存储器804和通信模块805,处理器801、存储器804和通信模块805可以通过总线806相互连接。存储器804可以是高速随机存储记忆体(Random Access Memory,RAM)存储器,也可以是非易失性的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器804可选的还可以是至少一个位于远离前述处理器801的存储系统。存储器804用于存储应用程序代码,可以包括操作系统、网络通信模块、用户接口模块以及数据处理程序,通信模块805用于与外部设备进行信息交互;处理器801被配置用于调用该程序代码,执行以下步骤:
接收第一设备发送的第i目标分配结果;其中,所述第i目标分配结果包括所述第i设备需要翻译的第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句包括各自对应的指示信息;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句为待翻译文本中的语句;
通过翻译模型对所述第i目标分配结果进行翻译,得到所述第j目标翻译语句对应的翻译结果和所述附加翻译语句对应的翻译结果;
将所述第j目标翻译语句对应的翻译结果发送给所述第一设备;所述第一设备用于根据所述第j目标翻译语句对应的翻译结果得到所述待翻译文本的目标翻译结果。
上述各个功能单元的具体实现可以参见前述实施例中的相关描述,本申请实施例不再赘述。
本申请实施例还提供了一种计算机存储介质,该计算机可读存储介质中存储有指令,当其在计算机或处理器上运行时,使得计算机或处理器执行上述任一个实施例所述方法中的一个或多个步骤。上述装置的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在所述计算机可读取存储介质中,基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机产品存储在计算机可读存储介质中。
上述计算机可读存储介质可以是前述实施例所述的设备的内部存储单元,例如硬盘或内存。上述计算机可读存储介质也可以是上述设备的外部存储设备,例如配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,上述计算机可读存储介质还可以既包括上述设备的内部存储单元也包括外部存储设备。上述计算机可读存储介质用于存储上述计算机程序以及上述设备所需的其他程序和数据。上述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可通过计算机程序来指令相关的硬件来完成,该计算机的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可存储程序代码的介质。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
可以理解,本领域普通技术人员可以意识到,结合本申请各个实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本领域技术人员能够领会,结合本申请各个实施例中公开描述的各种说明性逻辑框、模块和算法步骤所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施,那么各种说明性逻辑框、模块、和步骤描述的功能可作为一或多个指令或代码在计算机可读媒体上存储或传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体,或包括任何促进将计算机程序从一处传送到另一处的媒体(例如,根据通信协议)的通信媒体。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本申请中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (16)

1.一种翻译方法,其特征在于,所述方法应用于协同系统,所述协同系统包括Q个设备;所述Q个设备之间建立有通信连接;Q为大于1的正整数;所述方法包括:
第一设备获取待翻译文本;
针对所述待翻译文本,所述第一设备确定所述Q个设备中每个设备各自需要翻译的目标分配结果;其中,至少一个目标分配结果包括目标翻译语句和所述目标翻译语句对应的附加翻译语句;所述附加翻译语句在所述待翻译文本中的位置位于所述目标翻译语句之前;
所述第一设备向所述Q个设备中每个设备分别发送各自需要翻译的目标分配结果;
所述第一设备获取所述Q个设备各自对应的翻译结果,并根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果;
输出所述目标翻译结果。
2.如权利要求1所述的方法,其特征在于,所述附加翻译语句的数量为K;所述K为大于1的正整数。
3.如权利要求1或2所述的方法,其特征在于,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第一设备确定所述待翻译文本的目标分配结果,包括:
所述第一设备获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的M个附加翻译语句;
若所述第一设备通过翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度大于第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句作为所述第i目标分配结果;
若所述第一设备通过所述翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度小于所述第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的M个附加翻译语句作为所述第i目标分配结果。
4.如权利要求1或2所述的方法,其特征在于,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第一设备确定所述待翻译文本的目标分配结果,包括:
所述第一设备获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的所有附加翻译语句;
所述第一设备通过训练好的分类器确定位于所述第j目标翻译语句之前的所有附加翻译语句各自对应的分类结果,所述分类结果包括与所述第j目标翻译语句属于同一个类别,或,与所述第j目标翻译语句不属于同一个类别,将所述分类结果中与所述第j目标翻译语句属于同一个类别的附加翻译语句以及所述第j目标翻译语句作为所述第i目标分配结果;其中,所述分类器为基于至少一个样本数据集训练得到的模型,所述至少一个样本数据集包括N个类别;N为正整数。
5.如权利要求1所述的方法,其特征在于,所述根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果,包括:
当所述Q个设备各自对应的翻译结果中存在至少两个同一个待翻译语句对应的翻译结果,剔除冗余翻译结果,以得到所述待翻译文本的目标翻译结果。
6.一种翻译方法,其特征在于,所述方法应用于协同系统,所述协同系统包括Q个设备;所述Q个设备之间建立有通信连接;Q为大于1的正整数;所述方法包括:
所述Q个设备中的第i设备接收第一设备发送的第i目标分配结果;其中,所述第i目标分配结果包括所述第i设备需要翻译的第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句包括各自对应的指示信息;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句为待翻译文本中的语句;
所述第i设备通过翻译模型对所述第i目标分配结果进行翻译,得到所述第j目标翻译语句对应的翻译结果和所述附加翻译语句对应的翻译结果;
所述第i设备将所述第j目标翻译语句对应的翻译结果发送给所述第一设备;所述第一设备用于根据所述第j目标翻译语句对应的翻译结果得到所述待翻译文本的目标翻译结果。
7.一种翻译装置,其特征在于,所述装置应用于协同系统,所述协同系统包括Q个设备;所述Q个设备之间建立有通信连接;Q为大于1的正整数;其中,第一设备包括:
文本获取单元,用于所述第一设备获取待翻译文本;
确定单元,用于针对所述待翻译文本,所述第一设备确定所述Q个设备中每个设备各自需要翻译的目标分配结果;其中,至少一个目标分配结果包括目标翻译语句和所述目标翻译语句对应的附加翻译语句;所述附加翻译语句在所述待翻译文本中的位置位于所述目标翻译语句之前;
发送单元,用于向所述Q个设备中每个设备分别发送各自需要翻译的目标分配结果;
处理单元,用于获取所述Q个设备各自对应的翻译结果,并根据所述Q个设备各自对应的翻译结果获取所述待翻译文本的目标翻译结果;
输出单元,用于输出所述目标翻译结果。
8.如权利要求7所述的装置,其特征在于,所述附加翻译语句的数量为K;所述K为大于1的正整数。
9.如权利要求7或8所述的装置,其特征在于,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述确定单元具体用于:
获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的M个附加翻译语句;
若通过翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度大于第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句作为所述第i目标分配结果;
若通过所述翻译模型确定由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K个附加翻译语句构成的分配结果所对应的翻译结果与由所述第j目标翻译语句和位于所述第j目标翻译语句之前的K+1个附加翻译语句构成的分配结果所对应的翻译结果之间的相似度小于所述第一阈值,其中,所述K的取值依次从1到M-1,将所述第j目标翻译语句和位于所述第j目标翻译语句之前的M个附加翻译语句作为所述第i目标分配结果。
10.如权利要求7或8所述的装置,其特征在于,所述目标分配结果包括第i目标分配结果,所述第i目标分配结果用于指示所述Q个设备中的第i设备对所述第i目标分配结果进行翻译;第i目标分配结果包括第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述确定单元具体用于:
获取第j翻译子文本;其中,所述第j翻译子文本包括第j目标翻译语句和在所述待翻译文本中位于所述第j目标翻译语句之前的所有附加翻译语句;
通过训练好的分类器确定位于所述第j目标翻译语句之前的所有附加翻译语句各自对应的分类结果,所述分类结果包括与所述第j目标翻译语句属于同一个类别,或,与所述第j目标翻译语句不属于同一个类别,将所述分类结果中与所述第j目标翻译语句属于同一个类别的附加翻译语句以及所述第j目标翻译语句作为所述第i目标分配结果;其中,所述分类器为基于至少一个样本数据集训练得到的模型,所述至少一个样本数据集包括N个类别;N为正整数。
11.如权利要求7所述的装置,其特征在于,所述处理单元,具体用于:
当所述Q个设备各自对应的翻译结果中存在至少两个同一个待翻译语句对应的翻译结果,剔除冗余翻译结果,以得到所述待翻译文本的目标翻译结果。
12.一种翻译装置,其特征在于,所述装置应用于协同系统,所述协同系统包括Q个设备;所述Q个设备之间建立有通信连接;Q为大于1的正整数;所述Q个设备的第i设备包括:
接收单元,用于接收第一设备发送的第i目标分配结果;其中,所述第i目标分配结果包括所述第i设备需要翻译的第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句包括各自对应的指示信息;所述第j目标翻译语句和所述第j目标翻译语句对应的附加翻译语句为待翻译文本中的语句;
翻译单元,用于通过翻译模型对所述第i目标分配结果进行翻译,得到所述第j目标翻译语句对应的翻译结果和所述附加翻译语句对应的翻译结果;
发送单元,用于将所述第j目标翻译语句对应的翻译结果发送给所述第一设备;所述第一设备用于根据所述第j目标翻译语句对应的翻译结果得到所述待翻译文本的目标翻译结果。
13.一种翻译设备,其特征在于,所述翻译设备包括存储器和处理器,所述处理器执行所述存储器存储的计算机指令,使得所述计算设备执行权利要求1-5任一项所述的方法。
14.一种翻译设备,其特征在于,所述翻译设备包括存储器和处理器,所述处理器执行所述存储器存储的计算机指令,使得所述计算设备执行权利要求6所述的方法。
15.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当该计算机程序被处理器执行时实现权利要求1-5任一项所述的方法。
16.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当该计算机程序被处理器执行时实现权利要求6所述的方法。
CN202011000326.6A 2020-03-13 2020-09-21 翻译方法、相关装置、设备及计算机可读存储介质 Pending CN113392653A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/CN2021/078646 WO2021179956A1 (zh) 2020-03-13 2021-03-02 翻译方法、相关装置、设备及计算机可读存储介质

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2020101807155 2020-03-13
CN202010180715 2020-03-13

Publications (1)

Publication Number Publication Date
CN113392653A true CN113392653A (zh) 2021-09-14

Family

ID=77616469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011000326.6A Pending CN113392653A (zh) 2020-03-13 2020-09-21 翻译方法、相关装置、设备及计算机可读存储介质

Country Status (2)

Country Link
CN (1) CN113392653A (zh)
WO (1) WO2021179956A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116070646A (zh) * 2021-11-03 2023-05-05 华为终端有限公司 语言翻译方法及电子设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9262406B1 (en) * 2014-05-07 2016-02-16 Google Inc. Semantic frame identification with distributed word representations
US9436682B2 (en) * 2014-06-24 2016-09-06 Google Inc. Techniques for machine language translation of text from an image based on non-textual context information from the image
CN108475264B (zh) * 2016-08-01 2022-03-01 微软技术许可有限责任公司 机器翻译方法和装置
JP2018084952A (ja) * 2016-11-24 2018-05-31 国立研究開発法人情報通信研究機構 自動翻訳パターン学習装置、自動翻訳の前処理装置、及びコンピュータプログラム
IL252071A0 (en) * 2017-05-03 2017-07-31 Google Inc Contextual language translation
US10229195B2 (en) * 2017-06-22 2019-03-12 International Business Machines Corporation Relation extraction using co-training with distant supervision
CN107391457B (zh) * 2017-07-26 2020-10-27 成都科来软件有限公司 一种基于文本行的文档分段方法及装置
KR102516364B1 (ko) * 2018-02-12 2023-03-31 삼성전자주식회사 기계 번역 방법 및 장치
CN109598002A (zh) * 2018-11-15 2019-04-09 重庆邮电大学 基于双向循环神经网络的神经机器翻译方法和系统

Also Published As

Publication number Publication date
WO2021179956A1 (zh) 2021-09-16

Similar Documents

Publication Publication Date Title
CN112015859B (zh) 文本的知识层次抽取方法及装置、计算机设备及可读介质
CN107346336B (zh) 基于人工智能的信息处理方法和装置
CN111985229B (zh) 一种序列标注方法、装置及计算机设备
CN107480162B (zh) 基于人工智能的搜索方法、装置、设备及计算机可读存储介质
CN109726806A (zh) 信息处理方法及终端设备
CN111222305A (zh) 一种信息结构化方法和装置
CN110580308B (zh) 信息审核方法及装置、电子设备、存储介质
CN111709240A (zh) 实体关系抽取方法、装置、设备及其存储介质
EP4012564A1 (en) Data processing method, data processing device, and storage medium
CN111144120A (zh) 一种训练语句的获取方法、装置、存储介质及电子设备
CN114385780B (zh) 程序接口信息推荐方法、装置、电子设备和可读介质
CN113254684B (zh) 一种内容时效的确定方法、相关装置、设备以及存储介质
CN109947431A (zh) 一种代码生成方法、装置、设备及存储介质
CN116303537A (zh) 数据查询方法及装置、电子设备、存储介质
CN114444508A (zh) 日期识别方法、装置、可读介质及电子设备
CN113392653A (zh) 翻译方法、相关装置、设备及计算机可读存储介质
CN113408507A (zh) 基于履历文件的命名实体识别方法、装置和电子设备
CN111026849B (zh) 数据处理方法和装置
CN111274813A (zh) 语言序列标注方法、装置存储介质及计算机设备
CN116092101A (zh) 训练方法、图像识别方法、装置、设备及可读存储介质
CN112528674B (zh) 文本处理方法、模型的训练方法、装置、设备及存储介质
CN110826330B (zh) 人名识别方法及装置、计算机设备及可读存储介质
CN110334328B (zh) 基于机器学习的物品清单自动生成方法及装置
CN113139751A (zh) 基于大数据的微服务用户业务类型确定方法
CN113468258A (zh) 一种异构数据的转换方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination