CN103455477B - 一种用于辅助翻译的术语统一方法 - Google Patents

一种用于辅助翻译的术语统一方法 Download PDF

Info

Publication number
CN103455477B
CN103455477B CN201310408330.XA CN201310408330A CN103455477B CN 103455477 B CN103455477 B CN 103455477B CN 201310408330 A CN201310408330 A CN 201310408330A CN 103455477 B CN103455477 B CN 103455477B
Authority
CN
China
Prior art keywords
translation
translator
repeated fragment
term
rank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310408330.XA
Other languages
English (en)
Other versions
CN103455477A (zh
Inventor
高晋愚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Langku Beijing Technology Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201310408330.XA priority Critical patent/CN103455477B/zh
Publication of CN103455477A publication Critical patent/CN103455477A/zh
Application granted granted Critical
Publication of CN103455477B publication Critical patent/CN103455477B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种用于辅助翻译的术语统一方法,该方法包括以下步骤:翻译数据信息获取、超高频片段滤除、重复片段标识设定、重复次数标识设定、组合次数标识设定、译者级别设定、译者翻译、译者翻译标识设定以及翻译统稿。本发明在现有语言分析处理技术的基础上,结合人工翻译本身的特点,利用计算机将包含有术语的重复片段提取出来,并直观的标记出重复片段、重复片段对应的次数以及重复片段中组合成词组的词之间的组合次数,使得译者对术语的翻译的统一性得到提高,并避免重复劳动,大大降低了人工翻译在术语统一上的时间成本,方法简单,便于操作实施。

Description

一种用于辅助翻译的术语统一方法
技术领域
本发明涉及一种用于辅助翻译的术语统一方法。
背景技术
当前,大型翻译项目,由于工期短,需要多个译者同步进行翻译。而一个大型翻译项目,通常由一批对应专业领域的技术文件构成。一批技术资料,会涉及到大量的专业术语。在源语言文件中,同一个专业术语,对应同一个特定的技术概念或者客观存在的对象(例如机构名、人名、文件名、书名等)。在人工翻译过程中,同一个术语或者概念,存在多种可能的表达方法。在单人完成一个翻译任务时,由于术语多,翻译到后期不一定记得某个术语采用的是哪种译法,可能存在前后表达不统一的情况。而在多人同步翻译的时候,每个译者的译法不尽相同,造成译文整体的术语不统一,给读者造成疑惑。另一方面,同一个术语,需要每个译者都分别去查找专业词典或上网查找译法,造成了重复劳动。
现有的翻译方法包括以下两种:
(1)传统人工统稿:为确保术语统一,必须在分发给各个译者的稿件汇总后,由一个译审人员进行统稿,采用统一查找和替换的方法,统一关键术语的译法。
(2)机器辅助手段:市场上的翻译辅助软件(CAT),为术语统一提供了下列解决方案:
译前,利用程序对所有待译语句进行分析,提取出重复出现的片语表,然后由一个译审人员从中挑出术语,进行预先定义,形成术语表后,利用软件界面,在译员翻译时给出术语译法提示;
译员在使用CAT工具翻译过程中,各个译者翻译的句子都可以实时上传到服务器上。遇到相同或类似的句子,可以调出已经翻译的句子作为参考,在一定程度上有助于译法的统一;
译者遇到某个术语,可以到已经翻译完成的句子库中搜索该术语,如果已翻译完成的句子中有该术语,则列出含有该术语的所有句子的原文和译文,供译者参考。
但是以上方法有如下缺陷:
(1)译前由某个译审人员挑出术语并进行定义,在实践中并不现实。首先,译前定义术语,要求译审人员对稿件内容非常熟悉,了解各个术语的含义和译法。而实际翻译工作中,特别是在新知识、新概念层出不穷的今天,很多术语的译法,是在边翻译边理解,才慢慢获得术语的确切译法的。事先定义术语的方法,不仅需要译审人员事先花时间研究和定义术语,耽误工期,而且由于没有时间研究上下文,在术语定义错误时,会给译员在翻译时造成误导和困惑。
(2)目前市场上流行的CAT工具都能提供相似句的参考,但仅仅解决了句子层面上非常类似的的句子的统一性,并不能解决词语层面的统一性。
(3)译者主动到记忆库中查词的功能,需要译者花时间操作,如果没有查到,时间就等于白白浪费了。
以上缺陷值得解决。
发明内容
为了克服现有技术的不足,本发明提供了一种用于辅助翻译的术语统一方法,在现有语言分析处理技术的基础上,结合人工翻译本身的特点,提高了术语统一性,而且大大降低了人工翻译在术语统一上的时间成本,成本低廉,操作实施方便。
本发明技术方案如下所述:
一种用于辅助翻译的术语统一方法,该方法包括以下步骤:
(1)翻译数据信息获取:利用计算机对翻译资料进行分析对比,获取包括重复片段以及重复片段对应的重复次数的翻译数据信息,所述重复片段为在所述翻译资料中重复出现的以词为最小单位的语言单位,包括词以及由至少两个所述词组合而成的词组,所述翻译数据信息还包括组合成所述词组的相邻两个所述词的组合次数;
(2)超高频片段滤除:建立高频词语表,其中收录常用高频词,用所述高频词语表对所述重复片段进行扫描,当所述重复片段全部由常用高频词组成,则将其从所述翻译数据信息中的所述重复片段中滤除,使得获取的所述重复片段为所述翻译资料中的待翻译术语;
(3)重复片段标识设定:将所述重复片段用加粗的黑体字来标识;
(4)重复次数标识设定:当所述重复片段对应的重复次数大于或者等于3时,对不同重复次数的所述重复片段用不同级别的字体灰度来标识,重复次数为3~N次,对应的字体灰度级别为3~N级;
(5)组合次数标识设定:在所述重复片段中,当组合成所述词组的相邻两个所述词的组合次数大于或者等于3时,在不同组合次数的相邻两个所述词之间用不同级别的字符间隔来标识,组合次数为3~M次,对应的字符间隔的级别为3~M,当组合成所述词组的相邻两个所述词的组合次数小于3时,在两个所述词之间标识上截止符号;
(6)译者级别设定:对参加翻译的译者进行级别设定,参加人数为1~K人,译者级别为1~L级,K≤L;
(7)译者翻译:译者根据所述重复片段、所述重复片段的重复次数以及在所述重复片段中,组合成所述词组的相邻两个所述词的组合次数,对所述重复片段进行翻译,并作为对应该译者的参考译文;
(8)译者翻译标识设定:当参考译文的译者的级别低于翻译进行中的译者的级别,参考译文标识为低可信度底纹;当参考译文的译者的级别与翻译进行中的译者的级别相同,参考译文标识为一般可信度底纹;当参考译文的译者的级别高于翻译进行中的译者的级别,参考译文标识为高可信度底纹;
(9)翻译统稿:译者根据参考译文,并坚持选用标识有高可信度底纹的参考翻译的原则进行翻译统稿。
进一步的,所述截止符号为双斜线。
进一步的,所述字符间隔级别3~M,对应3~M个星号。
进一步的,所述低可信度底纹为黄色底纹,所述一般可信度底纹为蓝色底纹,所述高可信度底纹为绿色底纹。
根据上述结构的本发明,其有益效果在于,
(1)用加粗的黑体字标识重复片段,用字体灰度标识重复片段对应的重复次数,用字符间隔来标识重复片段中组合成词组的词之间的组合次数,简单直观,使得译者在实际句子的翻译过程中,能够更有效的进行术语定义。
(2)用不同颜色的底纹,向译者提示已有参考译文,从而在词和词组层面,为译者提供参考信息,进一步降低译者的重复劳动,提高整体工作效率,提高术语定义的统一性。
(3)对应不同级别的译者的参考译文,采用黄色、蓝色和绿色底纹标识,三种颜色分别对应低可信度、一般可信度以及高可信度,使得译者更直观的区分参考翻译的可采取性,且符合常见颜色映射含义的识别习惯,向高可信度的参考翻译看齐,更有利于术语定义的统一。
附图说明
图1为本发明所述的一种用于辅助翻译的术语统一方法的流程图。
具体实施方式
下面结合附图以及实施方式对本发明进行进一步的描述:
如图1所示,一种用于辅助翻译的术语统一方法,该方法包括以下步骤:
(1)翻译数据信息获取:利用计算机对翻译资料进行分析对比,获取包括重复片段以及重复片段对应的重复次数的翻译数据信息,所述重复片段为在所述翻译资料中重复出现的以词为最小单位的语言单位,包括词以及由至少两个所述词组合而成的词组,所述翻译数据信息还包括组合成所述词组的相邻两个所述词的组合次数;
(2)超高频片段滤除:建立高频词语表,其中收录常用高频词,用所述高频词语表对所述重复片段进行扫描,当所述重复片段全部由常用高频词组成,则将其从所述翻译数据信息中的所述重复片段中滤除,使得获取的所述重复片段为所述翻译资料中的待翻译术语;
(3)重复片段标识设定:将所述重复片段用加粗的黑体字来标识;
(4)重复次数标识设定:当所述重复片段对应的重复次数大于或者等于3时,对不同重复次数的所述重复片段用不同级别的字体灰度来标识,重复次数为3~N次,对应的字体灰度级别为3~N级;
(5)组合次数标识设定:在所述重复片段中,当组合成所述词组的相邻两个所述词的组合次数大于或者等于3时,在不同组合次数的相邻两个所述词之间用不同级别的字符间隔来标识,组合次数为3~M次,对应的字符间隔的级别为3~M,当组合成所述词组的相邻两个所述词的组合次数小于3时,在两个所述词之间标识上截止符号;
(6)译者级别设定:对参加翻译的译者进行级别设定,参加人数为1~K人,译者级别为1~L级,K≤L;
(7)译者翻译:译者根据所述重复片段、所述重复片段的重复次数以及在所述重复片段中,组合成所述词组的相邻两个所述词的组合次数,对所述重复片段进行翻译,并作为对应该译者的参考译文;
(8)译者翻译标识设定:当参考译文的译者的级别低于翻译进行中的译者的级别,参考译文标识为低可信度底纹;当参考译文的译者的级别与翻译进行中的译者的级别相同,参考译文标识为一般可信度底纹;当参考译文的译者的级别高于翻译进行中的译者的级别,参考译文标识为高可信度底纹;
(9)翻译统稿:译者根据参考译文,并坚持选用标识有高可信度底纹的参考翻译的原则进行翻译统稿。
进一步的,所述截止符号为双斜线。
进一步的,所述字符间隔级别3~M,对应3~M个星号。
进一步的,所述低可信度底纹为黄色底纹,所述一般可信度底纹为蓝色底纹,所述高可信度底纹为绿色底纹。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。
上面结合附图对本发明进行了示例性的描述,显然本发明的实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围。

Claims (4)

1.一种用于辅助翻译的术语统一方法,该方法包括以下步骤:
(1)翻译数据信息获取:利用计算机对翻译资料进行分析对比,获取包括重复片段以及重复片段对应的重复次数的翻译数据信息,所述重复片段为在所述翻译资料中重复出现的以词为最小单位的语言单位,包括词以及由至少两个所述词组合而成的词组,所述翻译数据信息还包括组合成所述词组的相邻两个所述词的组合次数;
(2)超高频片段滤除:建立高频词语表,其中收录常用高频词,用所述高频词语表对所述重复片段进行扫描,当所述重复片段全部由常用高频词组成,则将其从所述翻译数据信息中的所述重复片段中滤除,使得获取的所述重复片段为所述翻译资料中的待翻译术语;
(3)重复片段标识设定:将所述重复片段用加粗的黑体字来标识;
(4)重复次数标识设定:当所述重复片段对应的重复次数大于或者等于3时,对不同重复次数的所述重复片段用不同级别的字体灰度来标识,重复次数为3~N次,对应的字体灰度级别为3~N级;
(5)组合次数标识设定:在所述重复片段中,当组合成所述词组的相邻两个所述词的组合次数大于或者等于3时,在不同组合次数的相邻两个所述词之间用不同级别的字符间隔来标识,组合次数为3~M次,对应的字符间隔的级别为3~M,当组合成所述词组的相邻两个所述词的组合次数小于3时,在两个所述词之间标识上截止符号;
(6)译者级别设定:对参加翻译的译者进行级别设定,参加人数为1~K人,译者级别为1~L级,K≤L;
(7)译者翻译:译者根据所述重复片段、所述重复片段的重复次数以及在所述重复片段中,组合成所述词组的相邻两个所述词的组合次数,对所述重复片段进行翻译,并作为对应该译者的参考译文;
(8)译者翻译标识设定:当参考译文的译者的级别低于翻译进行中的译者的级别,参考译文标识为低可信度底纹;当参考译文的译者的级别与翻译进行中的译者的级别相同,参考译文标识为一般可信度底纹;当参考译文的译者的级别高于翻译进行中的译者的级别,参考译文标识为高可信度底纹;
(9)翻译统稿:译者根据参考译文,并坚持选用标识有高可信度底纹的参考翻译的原则进行翻译统稿。
2.根据权利要求1所述的用于辅助翻译的术语统一方法,其特征在于,所述截止符号为双斜线。
3.根据权利要求1所述的用于辅助翻译的术语统一方法,其特征在于,所述字符间隔级别3~M,对应3~M个星号。
4.根据权利要求1所述的用于辅助翻译的术语统一方法,其特征在于,所述低可信度底纹为黄色底纹,所述一般可信度底纹为蓝色底纹,所述高可信度底纹为绿色底纹。
CN201310408330.XA 2013-09-09 2013-09-09 一种用于辅助翻译的术语统一方法 Active CN103455477B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310408330.XA CN103455477B (zh) 2013-09-09 2013-09-09 一种用于辅助翻译的术语统一方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310408330.XA CN103455477B (zh) 2013-09-09 2013-09-09 一种用于辅助翻译的术语统一方法

Publications (2)

Publication Number Publication Date
CN103455477A CN103455477A (zh) 2013-12-18
CN103455477B true CN103455477B (zh) 2016-04-06

Family

ID=49737862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310408330.XA Active CN103455477B (zh) 2013-09-09 2013-09-09 一种用于辅助翻译的术语统一方法

Country Status (1)

Country Link
CN (1) CN103455477B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808528B (zh) * 2016-03-04 2019-01-25 张广睿 一种文档文字的处理方法
CN108959276A (zh) * 2018-07-23 2018-12-07 传神语联网网络科技股份有限公司 一种用于翻译的术语发现方法及其系统
CN112364669B (zh) * 2020-10-14 2021-09-03 北京中科凡语科技有限公司 机器翻译译后的术语翻译方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1308748A (zh) * 1998-05-04 2001-08-15 特雷道斯股份有限公司 机器辅助翻译工具
CA2414230A1 (en) * 2000-06-26 2002-01-03 Informatica Corporation Computer method and device for transporting data
CN101034395A (zh) * 2007-03-30 2007-09-12 传神联合(北京)信息技术有限公司 一种待译文件处理系统及使用这种系统的文件处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1308748A (zh) * 1998-05-04 2001-08-15 特雷道斯股份有限公司 机器辅助翻译工具
CA2414230A1 (en) * 2000-06-26 2002-01-03 Informatica Corporation Computer method and device for transporting data
CN101034395A (zh) * 2007-03-30 2007-09-12 传神联合(北京)信息技术有限公司 一种待译文件处理系统及使用这种系统的文件处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
浅议实践中的术语管理;王华树;《中国科技术语》;20130425(第2期);11-14 *

Also Published As

Publication number Publication date
CN103455477A (zh) 2013-12-18

Similar Documents

Publication Publication Date Title
CN104133848B (zh) 藏语实体知识信息抽取方法
CN103123618B (zh) 文本相似度获取方法和装置
CN110413574B (zh) 一种自动生成代码国际化资源的方法
CN105912570B (zh) 基于隐马尔可夫模型的英文简历关键字段抽取方法
CN104951469B (zh) 优化语料库的方法和装置
CN102609408A (zh) 基于多文种文档图像识别的跨文种理解方法
CN102591612A (zh) 一种基于标点连续性的通用网页正文提取方法及其系统
CN105068990B (zh) 一种面向机器翻译的多策略英文长句分割方法
CN103970898A (zh) 一种基于多级规则库的信息提取方法及装置
CN103455477B (zh) 一种用于辅助翻译的术语统一方法
CN105701089A (zh) 一种机器翻译错词修正的后编辑处理方法
CN105760368B (zh) 一种文档文字的深度处理方法
CN101539910A (zh) 一种用于计算机辅助翻译的取句方法及其系统
CN109409248A (zh) 基于深度语义网络的语义标注方法、装置及系统
CN111627088A (zh) 一种用于数学试卷图像识别的样本自动生成方法
CN106802937A (zh) Word文档的转换方法及系统
CN105677642A (zh) 一种机器翻译语序调整方法
CN103902918A (zh) 一种从Word文档中快速提取文字格式的方法和装置
CN107436931B (zh) 网页正文抽取方法及装置
CN105740355A (zh) 基于聚集文本密度的网页正文提取方法及装置
CN104484323A (zh) 一种基于文档片段的翻译处理方法
CN105653516B (zh) 平行语料对齐的方法和装置
CN103218354A (zh) 一种在线翻译记忆交换方法和系统
CN105677718A (zh) 文字检索方法及装置
CN110362691B (zh) 一种句法树库构建系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20200915

Address after: Room 5, building 14, dormitory of steel railway chemical plant, Huimin District, Hohhot City, Inner Mongolia Autonomous Region

Patentee after: Niu Wenjing

Address before: 518112, Buji street, Longgang District, Guangdong Province, Shenzhen super garden 1-713

Patentee before: Gao Jinyu

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210326

Address after: 100079 west side of the first floor of building 7, yard 15, Jiajia garden, Fengtai District, Beijing

Patentee after: Langku (Beijing) Technology Co.,Ltd.

Address before: 010000 No.5, building 14, dormitory of steel railway chemical plant, Huimin District, Hohhot City, Inner Mongolia Autonomous Region

Patentee before: Niu Wenjing

TR01 Transfer of patent right