一种用于辅助翻译的术语统一方法
技术领域
本发明涉及一种用于辅助翻译的术语统一方法。
背景技术
当前,大型翻译项目,由于工期短,需要多个译者同步进行翻译。而一个大型翻译项目,通常由一批对应专业领域的技术文件构成。一批技术资料,会涉及到大量的专业术语。在源语言文件中,同一个专业术语,对应同一个特定的技术概念或者客观存在的对象(例如机构名、人名、文件名、书名等)。在人工翻译过程中,同一个术语或者概念,存在多种可能的表达方法。在单人完成一个翻译任务时,由于术语多,翻译到后期不一定记得某个术语采用的是哪种译法,可能存在前后表达不统一的情况。而在多人同步翻译的时候,每个译者的译法不尽相同,造成译文整体的术语不统一,给读者造成疑惑。另一方面,同一个术语,需要每个译者都分别去查找专业词典或上网查找译法,造成了重复劳动。
现有的翻译方法包括以下两种:
(1)传统人工统稿:为确保术语统一,必须在分发给各个译者的稿件汇总后,由一个译审人员进行统稿,采用统一查找和替换的方法,统一关键术语的译法。
(2)机器辅助手段:市场上的翻译辅助软件(CAT),为术语统一提供了下列解决方案:
译前,利用程序对所有待译语句进行分析,提取出重复出现的片语表,然后由一个译审人员从中挑出术语,进行预先定义,形成术语表后,利用软件界面,在译员翻译时给出术语译法提示;
译员在使用CAT工具翻译过程中,各个译者翻译的句子都可以实时上传到服务器上。遇到相同或类似的句子,可以调出已经翻译的句子作为参考,在一定程度上有助于译法的统一;
译者遇到某个术语,可以到已经翻译完成的句子库中搜索该术语,如果已翻译完成的句子中有该术语,则列出含有该术语的所有句子的原文和译文,供译者参考。
但是以上方法有如下缺陷:
(1)译前由某个译审人员挑出术语并进行定义,在实践中并不现实。首先,译前定义术语,要求译审人员对稿件内容非常熟悉,了解各个术语的含义和译法。而实际翻译工作中,特别是在新知识、新概念层出不穷的今天,很多术语的译法,是在边翻译边理解,才慢慢获得术语的确切译法的。事先定义术语的方法,不仅需要译审人员事先花时间研究和定义术语,耽误工期,而且由于没有时间研究上下文,在术语定义错误时,会给译员在翻译时造成误导和困惑。
(2)目前市场上流行的CAT工具都能提供相似句的参考,但仅仅解决了句子层面上非常类似的的句子的统一性,并不能解决词语层面的统一性。
(3)译者主动到记忆库中查词的功能,需要译者花时间操作,如果没有查到,时间就等于白白浪费了。
以上缺陷值得解决。
发明内容
为了克服现有技术的不足,本发明提供了一种用于辅助翻译的术语统一方法,在现有语言分析处理技术的基础上,结合人工翻译本身的特点,提高了术语统一性,而且大大降低了人工翻译在术语统一上的时间成本,成本低廉,操作实施方便。
本发明技术方案如下所述:
一种用于辅助翻译的术语统一方法,该方法包括以下步骤:
(1)翻译数据信息获取:利用计算机对翻译资料进行分析对比,获取包括重复片段以及重复片段对应的重复次数的翻译数据信息,所述重复片段为在所述翻译资料中重复出现的以词为最小单位的语言单位,包括词以及由至少两个所述词组合而成的词组,所述翻译数据信息还包括组合成所述词组的相邻两个所述词的组合次数;
(2)超高频片段滤除:建立高频词语表,其中收录常用高频词,用所述高频词语表对所述重复片段进行扫描,当所述重复片段全部由常用高频词组成,则将其从所述翻译数据信息中的所述重复片段中滤除,使得获取的所述重复片段为所述翻译资料中的待翻译术语;
(3)重复片段标识设定:将所述重复片段用加粗的黑体字来标识;
(4)重复次数标识设定:当所述重复片段对应的重复次数大于或者等于3时,对不同重复次数的所述重复片段用不同级别的字体灰度来标识,重复次数为3~N次,对应的字体灰度级别为3~N级;
(5)组合次数标识设定:在所述重复片段中,当组合成所述词组的相邻两个所述词的组合次数大于或者等于3时,在不同组合次数的相邻两个所述词之间用不同级别的字符间隔来标识,组合次数为3~M次,对应的字符间隔的级别为3~M,当组合成所述词组的相邻两个所述词的组合次数小于3时,在两个所述词之间标识上截止符号;
(6)译者级别设定:对参加翻译的译者进行级别设定,参加人数为1~K人,译者级别为1~L级,K≤L;
(7)译者翻译:译者根据所述重复片段、所述重复片段的重复次数以及在所述重复片段中,组合成所述词组的相邻两个所述词的组合次数,对所述重复片段进行翻译,并作为对应该译者的参考译文;
(8)译者翻译标识设定:当参考译文的译者的级别低于翻译进行中的译者的级别,参考译文标识为低可信度底纹;当参考译文的译者的级别与翻译进行中的译者的级别相同,参考译文标识为一般可信度底纹;当参考译文的译者的级别高于翻译进行中的译者的级别,参考译文标识为高可信度底纹;
(9)翻译统稿:译者根据参考译文,并坚持选用标识有高可信度底纹的参考翻译的原则进行翻译统稿。
进一步的,所述截止符号为双斜线。
进一步的,所述字符间隔级别3~M,对应3~M个星号。
进一步的,所述低可信度底纹为黄色底纹,所述一般可信度底纹为蓝色底纹,所述高可信度底纹为绿色底纹。
根据上述结构的本发明,其有益效果在于,
(1)用加粗的黑体字标识重复片段,用字体灰度标识重复片段对应的重复次数,用字符间隔来标识重复片段中组合成词组的词之间的组合次数,简单直观,使得译者在实际句子的翻译过程中,能够更有效的进行术语定义。
(2)用不同颜色的底纹,向译者提示已有参考译文,从而在词和词组层面,为译者提供参考信息,进一步降低译者的重复劳动,提高整体工作效率,提高术语定义的统一性。
(3)对应不同级别的译者的参考译文,采用黄色、蓝色和绿色底纹标识,三种颜色分别对应低可信度、一般可信度以及高可信度,使得译者更直观的区分参考翻译的可采取性,且符合常见颜色映射含义的识别习惯,向高可信度的参考翻译看齐,更有利于术语定义的统一。
附图说明
图1为本发明所述的一种用于辅助翻译的术语统一方法的流程图。
具体实施方式
下面结合附图以及实施方式对本发明进行进一步的描述:
如图1所示,一种用于辅助翻译的术语统一方法,该方法包括以下步骤:
(1)翻译数据信息获取:利用计算机对翻译资料进行分析对比,获取包括重复片段以及重复片段对应的重复次数的翻译数据信息,所述重复片段为在所述翻译资料中重复出现的以词为最小单位的语言单位,包括词以及由至少两个所述词组合而成的词组,所述翻译数据信息还包括组合成所述词组的相邻两个所述词的组合次数;
(2)超高频片段滤除:建立高频词语表,其中收录常用高频词,用所述高频词语表对所述重复片段进行扫描,当所述重复片段全部由常用高频词组成,则将其从所述翻译数据信息中的所述重复片段中滤除,使得获取的所述重复片段为所述翻译资料中的待翻译术语;
(3)重复片段标识设定:将所述重复片段用加粗的黑体字来标识;
(4)重复次数标识设定:当所述重复片段对应的重复次数大于或者等于3时,对不同重复次数的所述重复片段用不同级别的字体灰度来标识,重复次数为3~N次,对应的字体灰度级别为3~N级;
(5)组合次数标识设定:在所述重复片段中,当组合成所述词组的相邻两个所述词的组合次数大于或者等于3时,在不同组合次数的相邻两个所述词之间用不同级别的字符间隔来标识,组合次数为3~M次,对应的字符间隔的级别为3~M,当组合成所述词组的相邻两个所述词的组合次数小于3时,在两个所述词之间标识上截止符号;
(6)译者级别设定:对参加翻译的译者进行级别设定,参加人数为1~K人,译者级别为1~L级,K≤L;
(7)译者翻译:译者根据所述重复片段、所述重复片段的重复次数以及在所述重复片段中,组合成所述词组的相邻两个所述词的组合次数,对所述重复片段进行翻译,并作为对应该译者的参考译文;
(8)译者翻译标识设定:当参考译文的译者的级别低于翻译进行中的译者的级别,参考译文标识为低可信度底纹;当参考译文的译者的级别与翻译进行中的译者的级别相同,参考译文标识为一般可信度底纹;当参考译文的译者的级别高于翻译进行中的译者的级别,参考译文标识为高可信度底纹;
(9)翻译统稿:译者根据参考译文,并坚持选用标识有高可信度底纹的参考翻译的原则进行翻译统稿。
进一步的,所述截止符号为双斜线。
进一步的,所述字符间隔级别3~M,对应3~M个星号。
进一步的,所述低可信度底纹为黄色底纹,所述一般可信度底纹为蓝色底纹,所述高可信度底纹为绿色底纹。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
上面结合附图对本发明进行了示例性的描述,显然本发明的实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围。